Sensible Daten beantragen

Was sind sensible Variablen? 

Standardmäßig stellt das FDZ Datensätze als Scientific Use Files (SUFs) zur Verfügung. In diesen Datensätzen wurden alle Informationen aus den Originaldaten entfernt, die eine potenzielle Re-Identifikation einzelner Personen ermöglichen würden, sowie besonders schutzwürdige Angaben. Dies betrifft Informationen zur ethnischen Herkunft, politische Meinungen, religiöse oder weltanschauliche Überzeugungen, Gesundheitsdaten oder Daten zum Sexualleben oder der sexuellen Orientierung. Diese Informationen - sofern sie nicht vor der Datenübergabe an uns bereits entfernt wurden - werden von uns nicht weitergegeben. Diese Variablen erkennen Sie an einem Zusatz im Variablenlabel: "(zur Anonymisierung geleert (FDZ))".

Für sensible Variablen, die auf sinnvolle Weise so vergröbert werden können, dass eine Re-identifikation einzelner Studienteilnehmer*innen ausgeschlossen und gleichzeitig das Analysepotenzial des Datensatzes erhöht werden kann, erstellt das FDZ zusätzliche Variablen. In diesen sind die Informationen aus sensiblen Variablen auf einer höheren Aggregationsebene enthalten, so dass sie im Scientific Use File bereitgestellt werden können. D. h., wenn beispielsweise auf Variablen Merkmalsausprägungen vorliegen, die von fünf oder weniger Personen stammen, rekodieren wir diese in eine neue Variable. Typischerweise sind dies Variablen wie Herkunftsland, zu Hause gesprochene Sprache, Beruf der Eltern, Diagnose zum sonderpädagogischen Förderbedarf etc. Diese Variablen erkennen Sie ebenfalls an einem Zusatz im Variablenlabel: "(zur Anonymisierung gruppiert (FDZ))".

In den Leerdatensätzen zu unseren Studien (zu finden auf den jeweiligen Studienseiten) können Sie also bereits vor der Beantragung der Daten recherchieren, welche Variablen betroffen sind, und bei Fragen ggf. von uns beraten werden.

Wie kann ich auf sensible Variablen zugreifen?

Sensible Variablen können zum einen gemäß Ihren Wünschen von uns rekodiert werden, so dass auf ihnen keine Ausprägungen von fünf oder weniger Personen mehr enthalten sind, oder zum anderen per Fernrechnen genutzt werden (siehe unten).

In Bildungsmonitoringstudien stellt auch die Bundeslandvariable eine sensible Variable dar. Sie kann gemäß unserer Verfahrensordnung für folgende Zwecke beantragt werden: 

a) als Kovariate ausschließlich zu Kontrollzwecken

b) zum Zweck des Zuspielens von Kontextmerkmalen oder anderen Drittvariablen

c) für Vergleiche zwischen aggregierten Ländergruppen

d) zur Beschreibung der Stichprobe (z. B. Verteilung der Teilnehmer*innen über die Bundesländer und über die Schularten innerhalb von Bundesländern).

Wenn nötig, bilden wir für Datennutzende, die mit Bundeslandinformationen arbeiten möchten, Ländergruppen-Variablen, passend zur jeweiligen Fragestellung. Die gewünschte(n) Variable(n) kann/können Sie direkt in Ihrem Antragstext beschreiben. Bitte beachten Sie dabei, dass keine der Ländergruppen nur ein Bundesland enthalten darf.

Weitere Informationen zu Sonderfällen der Nutzung von Bundeslandvariablen finden Sie im Abschnitt Neuartige Ländervergleiche.

Für Analysen mit sensiblen Daten, die nicht in den Scientific Use Files (SUFs) zur Verfügung gestellt werden können, können Datennutzende das Fernrechensystem JoSuA nutzen. Dabei erhalten sie keinen direkten Zugriff auf die Daten, sondern können Befehlsyntaxen über ein Online-Portal abschicken und bekommen den Output der Befehle zurück. Bitte beachten Sie, dass Sie dennoch keine Ergebnisse für Gruppen von fünf oder weniger Personen oder einzelne Bundesländer publizieren dürfen. Das Fernrechnen über JoSuA kann von jeweils einer Person pro Projekt für 4 Monate (Verlängerung bei Bedarf möglich) genutzt werden.

Weitere Informationen zum Fernrechnen finden Sie auf unserer FAQ-Seite.

Bitte beschreiben Sie in Ihrem Datennutzungsantrag, ob und welche sensiblen Daten Sie analysieren möchten.

CR