Welches sind die meistgenutzten Techniken zur Generierung synthetischer Daten?
Hallo zusammen,
aktuell schreibe ich eine Seminararbeit zum Thema Generierung von synthetischer Daten mit Hinblick auf medizinische Anwendungen, in der ich unter anderem die wichtigsten und meistgenutzten Techniken erklären soll, mit denen die Generierung synthetischer Daten möglich ist. Nach meiner Recherche habe ich bereits einige Identifizieren können, unter anderem VAE, GANs, SMOTE, Gaussian Mixture Model oder Bayesian Networks. Allerdings sind das nur diejenigen, die ich durch Recherche immer wieder finden konnte, es ist aber kein "wissenschaftlicher Beleg", dass diese tatsächlich die wichtigsten sind. Nach langem Suchen habe ich aber leider keine Statistik oder Erhebung gefunden, die sich darum kümmern wie häufig welche Techniken benutzt werden, damit ich auf Basis dieser meine Arbeit aufbauen kann.
Kennt jemand von euch derartige Statistiken oder Erhebungen?
Ich bedanke mich schonmal für eure Antworten!
1 Antwort
Weils mich interessiert , habe ich mal eine Suchmaschine genutzt . Und lege dir vor allem englische Suchbegriffe ans Herz
Das fand ich mit "synthetic data most used models"
pS : nur meine Meinung : ich würde keine Perfekte Liste erwarten . Geht es bei den meisten nicht auch schon um Geld ?
Versuche Experteninterviews
.
Viel Glück
.
Nochen Ps : ziemlich gruselig . Vor allem wenn ich lese , dass man eine Regressionsgerade entstanden auf realen Daten nutzen soll um synthetische Daten zu erzeugen .

Hallo Halbrecht, zunächst danke für deine Antwort! Ich habe natürlich auch schonmal das Internet durchforstet, sowohl auf Englisch wie auf Deutsch. Das Problem hieran ist, dass man halt eigentlich nur Frameworks bzw. Anbieter finde, die eben diese Frameworks benutzten. Diese Websites versuchen ja für "Amateure" das Thema verständlich zu machen, Ich allerdings muss ja die technisch/ wissenschaftliche Seite betrachten. In meiner Arbeit soll es aber konkret um die Techniken (sprich Algorithmen oder Verfahren gehen (z.B. GANs)) mit denen diese Daten generiert werden. Ich habe natürlich auch schon die gängigen Datenbanken wie Scopus oder IEEE Library durchgearbeitet, aber auch da wenig Erfolg gehabt.... dass ich eine perfekte Liste erhalte ist unwahrscheinlich, da gebe ich dir recht, aber mir ist irgendwie aufgefallen, dass jede Seite, Paper oder Artikel andere Methoden/ Techniken nennt...