Faktische Anonymisierung wirtschaftsstatistischer Einzeldaten

Faktische Anonymisierung wirtschaftsstatistischer Einzeldaten

Das Statistische Bundesamt bearbeitet im Auftrag des Bundesministeriums für Bildung und Forschung das Projekt "Faktische Anonymisierung wirtschaftsstatistischer Einzeldaten". Das Projekt hat das Ziel, Möglichkeiten zur faktischen Anonymisierung von Einzeldaten aus Erhebungen bei Unternehmen und Betrieben zu entwickeln. Solche Daten dürfen von den statistischen Ämtern im gesetzlich bestimmten Rahmen an die Forschung übermittelt werden. Das Projekt leistet einen Beitrag zur Grundlagenforschung. Es dient der Verbesserung der Arbeitsgrundlagen der empirisch arbeitenden Wirtschaftswissenschaft.

Im Rahmen dieses Projekts arbeiten das ZEW und das Statistische Bundesamt zusammen bei der Beurteilung der Schutzwirkung von Anonymisierungsmaßnahmen unter Berücksichtigung externer Informationsquellen.

Bei der Zusammenarbeit entwickelten das ZEW und das Statistische Bundesamt gemeinsam methodische Ansätze zum Abgleich von Dateien (record linkage) und daraus ableitbarer Re-Identifikationswahrscheinlichkeiten. Im Vordergrund steht dabei die Zuordnung von Merkmalsträgern (paarige Fälle) mittels stetiger oder diskreter Merkmalsausprägungen in den unterschiedlichen Dateien. Aus den entwickelten Methodiken wurde vom ZEW ein lauffähiges Programm zum record linkage einschließlich Dokumentation erstellt.

Das ZEW stellt Auszüge aus den beim ZEW vorhandenen Unternehmensdatenbanken (ZEW-Gründungspanel, Mannheimer Unternehmenspanel u.a.) zur Verfügung und zwar nur nutzbar für die im Rahmen dieses Projektes durchzuführenden Abgleich-Tests. Mitarbeiter des Statistischen Bundesamtes führen in den Räumen des Statistischen Bundesamtes Abgleich-Tests mit diesen Datenbanken sowie den Projektdaten der Kostenstrukturerhebung im Verarbeitenden Gewerbe durch. Die Ergebnisse dieser Abgleich-Tests einschließlich ausführlicher Beschreibung wurden von Mitarbeitern des Statistischen Bundesamtes in einem gemeinsamen Projektbericht beider Projektpartner zusammengefasst.

Mitarbeiter des ZEW und des Statistischen Bundesamtes führen Untersuchungen zur Eignung von Resampling-Verfahren für Anonymisierungen durch. Für Projektdatensätze des Statistischen Bundesamtes werden dazu von Mitarbeitern des ZEW in den Räumen des Statistischen Bundesamtes künstliche Beobachtungen direkt aus den Mikrodatensätzen generiert. Die mit dem Resampling-Verfahren erzeugten anonymisierten Datensätze werden hinsichtlich ihrer Eigenschaft zur Abbildung univariater Verteilungen und im Hinblick auf Auswirkungen auf Regressionsverfahren getestet. Die generierten probeanonymisierten Dateien werden von Mitarbeitern des ZEW gemeinsam mit dem Statistischen Bundesamt auf ihre Schutzwirkung und in Kooperation mit dem Institut für Angewandte Wirtschaftsforschung in Tübingen (IAW) bezüglich des Analysepotenzials untersucht und ausführlich dokumentiert.

Projektteam

Georg Licht

Georg Licht

Projektleitung
Research Associate

Zum Profil
Sandra Gottschalk

Sandra Gottschalk

Senior Researcher

Zum Profil
Thorsten Doherr

Thorsten Doherr

Researcher

Zum Profil
Auftraggeber/Zuwendungsgeber