Methodische Hinweise

Methodische Hinweise zu den einzelnen Studien finden Sie auf den entsprechenden Studienseiten. An dieser Stelle möchten wir über studienübergreifende Besonderheiten im Umgang mit unseren Daten informieren.

 

Tutorial (Replikations-)Analysen von Large Scale Assessment-Daten in R

In dem Tutorial "Replikationsanalysen mit eatRep" werden einige typische Analysen mit dem R-Paket "eatRep" beispielhaft demonstriert.

Für die Bestimmung deskriptiver Statistiken, Häufigkeitsverteilungen oder von Parametern linearer bzw. logistischer Regressionen in Datensätzen großer Schulleistungsstudien (z. B. IQB-Ländervergleich und IQB-Bildungstrend, PISA, TIMSS) sind drei Besonderheiten zu berücksichtigen:

  1. Der Datensatz stellt keine (echte) Zufallsstichprobe aus der Population dar, da die SchülerInnen nicht proportional zur Häufigkeit gezogen wurden, mit der sie in der Population vertreten sind.
  2. Die Ziehungseinheiten (sampling units) in der Stichprobe sind Klassen, keine Individuen. Da sich SchülerInnen innerhalb einer Klasse ähnlicher sind als SchülerInnen verschiedener Klassen, ist die Stichprobe homogener, als es eine echte Zufallsstichprobe gleicher Größe wäre.
  3. Die interessierenden Variablen (Kompetenzen) sind latent, d. h. nicht direkt beobachtbar. Zudem enthalten viele (auch direkt beobachtete) Variablen fehlende Werte. Die Daten sind daher imputiert.

Das R-Paket "eatRep" ermöglicht die Bestimmung von Mittelwerten, Häufigkeitsverteilungen, Perzentilen und Regressionen unter Berücksichtigung der geschachtelten und imputierten Stichprobe. Auch Trendanalysen können gerechnet werden.

Die oben genannten Besonderheiten werden im R-Paket "eatRep" wie folgt berücksichtigt:

  1. Einbeziehung von individuellen Personengewichten
  2. Replikationsmethoden (Bootstrap, Jackknife oder “Balanced repeated replicate”-Methoden)
  3. Poolen der Ergebnisse entsprechend den Regeln von Rubin (1987).