Methoden zur Erzeugung synthetischer Daten für eine datenschutzkonforme Nutzung

Prof. Dr. Jörg Drechsler, Institut für Arbeitsmarkt- und Berufsforschung, 5. Februar 2019, 11:30

Der zunehmende Umfang personenbezogener Daten verschärft den Zielkonflikt zwischen einer wissenschaftlichen Nutzung der Daten und den Datenschutzinteressen der Betroffenen. Bisherige Deidentifizierungsmethoden wie das Hinzufügen von Zufallswerten oder die Vergröberung reduzieren die Datenqualität und damit den Wert der Daten für einige Anwendungsfälle. Methodische und technische Entwicklungen vereinfachen heutzutage die Anwendung alternativer Verfahren auf der Basis „künstlicher“ Datensatz-Repräsentationen, für die dann für bestimmte Verfahren auch mathematische Garantien der Privatheit berechenbar werden. In diesem Forschungskolloquium präsentiert Prof. Dr. Jörg Drechsler (Institut für Arbeitsmarkt- und Berufsforschung) einen Überblick über zeitgemäße Erzeugungsmethoden synthetischer Daten, sowie deren Nutzungsmöglichkeiten und verbleibende Datenschutzrisiken.