Data set synthetization to improve deep learning

Ein bekannter Nachteil von Deep-Learning-Algorithmen ist der Bedarf an großen, annotierten Datensätze für Training und Bewertung. Im Falle von 2D-Bildern wird die manuelle Annotation oft nur als lästige und zeitaufwändige Aufgabe angesehen. Die Annotation von höherdimensionalen Daten wie 3D- oder 3D+t-Bildern bringt jedoch neue Schwierigkeiten mit sich. Da die 3D-Darstellung von großen Strukturen mit vielen Instanzen nicht sehr übersichtlich ist, beschränkt sich die Visualisierung und Annotation im Grunde auf 2D-Schnitte. Die zusätzlichen Dimensionen führen somit zu einem starken Anstieg der zu annotierenden Datenmenge. Außerdem ist die räumliche Erkennung von Objekten schwieriger und die Erzeugung konsistenter Objektumrisse zwischen verschiedenen Ebenen nicht machbar. Die manuelle Annotation von höherdimensionalen Daten stellt daher eine nahezu unmögliche Aufgabe dar.

Das Hauptziel des Projekts ist die Entwicklung und Verbesserung von Methoden zur Erzeugung synthetischer Bilddaten, bei denen die Annotationen von vornherein bekannt sind. Wichtige Aspekte dieser Forschung sind die Einbeziehung seltener Objektzustände und -strukturen und die Berücksichtigung biophysikalischer Kräfte. Darüber hinaus werden Methoden zur Bewertung der Qualität und physikalischen Plausibilität der synthetischen Daten entwickelt.