Was wir wirklich über Asylsuchende wissen Teil III

Donnerstag, 25. Februar 2016

In der letzten Woche haben wir an dieser Stelle geäußert, dass sich eine repräsentative Befragung von Flüchtlingen in Deutschland enorm schwierig gestaltet. Dies gilt es nun in den folgenden Wochen zu begründen. Zunächst muss hierfür aber geklärt werden, was denn eine repräsentative Befragung überhaupt ist. Damit beschäftigen wir uns heute. Vorweg: Um diesen Begriff gibt es weitaus mehr Missverständnisse als man womöglich glauben mag.

Der Begriff der repräsentativen Befragung ist wohl einer der Allgemeinbevölkerung geläufigsten Termini aus der empirischen Sozialforschung. Das liegt sicher daran, dass immer mehr Ergebnisse von immer mehr Umfragen berichtet werden, die alle für sich beanspruchen, repräsentativ zu sein. Dass der Begriff in der Allgemeinbevölkerung geläufig ist, schließt aber nicht aus, dass er häufig missverstanden wird. Exemplarisch habe ich dies immer wieder in der ersten Sitzung meiner Statistikveranstaltungen erfahren müssen. Auf meine Frage „Wann ist denn eine Befragung repräsentativ für die deutsche Wohnbevölkerung?“ habe ich stets die folgenden Antworten erhalten:

„Repräsentativ ist die Befragung dann, wenn an ihr viele Personen, mindestens zirka 1.000, teilgenommen haben.“
„Repräsentativ ist die Befragung, wenn diejenigen, die an ihr teilgenommen haben, in ihrer Zusammensetzung nach Alter, Geschlecht und Bildung der Bevölkerung entsprechen.“

Die erste Antwort ist ganz offenkundig Unsinn. Mindestens 1.000 Teilnehmer an einer Befragung bekommen Sie schnell zusammen, wenn Sie sich nur lange genug an Stellen mit einem hohen Menschenaufkommen postieren. Doch sind die Befragungsergebnisse bspw. von 1.000 Passanten, die innerhalb der letzten drei Tage den Frankfurter Hauptbahnhof durchquert haben, wirklich repräsentativ für die deutsche Wohnbevölkerung? Sicherlich nicht. Auch dann nicht, wenn sich die 1.000 Teilnehmer nicht nur aus Bahnhofspassanten aus Frankfurt, sondern auch aus, sagen wir, Leipzig, München und Hamburg speisen. Selbst wenn Sie versuchen, die Befragung auf Passanten aller Bahnhöfe Deutschlands auszuweiten, bleibt (neben anderen) ein zentrales Problem bestehen: Personen, die sich an Bahnhöfen aufhalten, sind vermutlich eine spezielle Gruppe, die sich von der Gesamtbevölkerung unterscheiden mag. Vermutlich werden Sie, um nur ein Beispiel zu nennen, dort auf sehr viele Berufspendler treffen.

Die zweite Antwort scheint da schon zielführender zu sein. Doch auch sie hat zwei entscheidende Schwächen: Erstens ist die Verteilung in der Gesamtbevölkerung von nur sehr wenigen Merkmalen bekannt – und wie verlässlich diese Daten sind, steht nochmals auf einem anderen Blatt. Problematischer ist jedoch, dass Sie allein auf der Basis von zwei oder drei Merkmalen zwar versuchen können, eine Struktur der Teilnehmerschaft ihrer Befragung zu realisieren, die jener in der Bevölkerung entspricht. Dies aber gewährleistet nicht, dass dies dann auch für andere Merkmale gilt, nach denen sie nicht „quotiert“ haben, z. B. das politische Interesse oder die Haushaltsgröße. Um solche Merkmale ebenfalls zu berücksichtigen, fehlt Ihnen dann wieder die Information, wie sie sich in der Bevölkerung verteilen – ein echter Zirkelschluss. Doch selbst wenn sie die Verteilung auch dieser Merkmale kennen würden, müssten Sie sich früher oder später auf die Suche nach dem 30- bis 40-jährigen Mann mit Hauptschulabschluss begeben, der über ein hohes politisches Interesse verfügt, vier Kinder hat, täglich eine überregionale Tageszeitung liest … Sie sehen: das ist nicht wirklich zielführend.

Wann aber ist denn nun eine Befragung repräsentativ? Blickt man in diverse Lehrbücher, so zeichnet sich in ihnen ein Konsens ab, wonach bei einer repräsentativen Befragung jedes Element der Grundgesamtheit die gleiche oder eine angebbare Chance hat, in die Stichprobe zu gelangen. Zentral ist dabei zweierlei: Die sogenannte Grundgesamtheit muss wohldefiniert sein und die Auswahl der Teilnehmer muss zufällig erfolgen.

Bei der Grundgesamtheit handelt es sich um jenen Personenkreis, über den Sie eine Aussage treffen möchten. Häufig ist dies die deutsche Wohnbevölkerung oder die wahlberechtigte Bevölkerung, es können aber auch die Mitglieder von Schützenvereinen oder VW-Fahrer sein. Das hängt davon ab, woran Sie interessiert sind. Wenn wir bei der deutschen Wohnbevölkerung als interessierende Grundgesamtheit bleiben, so würden wir im Idealfall über eine aktuelle Liste aller in Deutschland gemeldeten Personen verfügen, aus der wir per Zufall bspw. 1.000 Leute auswählen könnten (ohne zurücklegen). Diese Personen würden wir dann bitten, sich an der Befragung zu beteiligen. Vorausgesetzt alle machen mit (oder aber viele, die sich nicht systematisch von jenen unterscheiden, die nicht mitmachen), so genügt die Befragung von 1.000 Menschen, um zwar mit einer gewissen Fehlertoleranz, insgesamt aber doch relativ verlässlich auf die Grundgesamtheit schließen zu können, obgleich diese um ein Vielfaches größer ist. Dies gilt, da durch den zufälligen Auswahlprozess in Verbindung mit einer hinreichend großen Zahl an Ziehungen erreicht wird, dass die 1.000 ausgewählten Personen ein verkleinertes Abbild der Grundgesamtheit darstellen.

Die Stichprobengröße spielt dabei eine wichtige Rolle, da der Rückschluss auf die Grundgesamtheit umso besser gelingt, je mehr Personen gezogen werden. Wählen Sie nur wenige, bspw. 10 Personen aus, so ist die Gefahr sehr groß, dass Ihre Stichprobe verzerrte Schätzungen für die Grundgesamtheit liefert. Veranschaulichen kann man dies anhand eines Würfelexperiments: Wenn Sie einen nicht manipulierten Würfel lediglich sechs Mal würfeln, beläuft sich die erwartete Anzahl an gewürfelten Sechsen auf eins. Für die übrigen Zahlen gilt dies natürlich analog. In der Praxis wird es aber nicht so häufig vorkommen, dass sich die sechs Zahlen bei sechs Würfen exakt gleich verteilen. Je häufiger Sie aber würfeln, desto eher entspricht das Resultat der erwarteten Gleichverteilung der möglichen Wurfergebnisse. Ähnlich ist es auch bei einer Ziehung von Elementen aus der Grundgesamtheit: Je mehr Elemente Sie zufällig ziehen, desto eher entspricht die Verteilung der gezogenen Elemente jener der Grundgesamtheit.

Zusammenfassend lässt sich also sagen: Für die Realisierung einer „idealen“ repräsentativen Befragung benötigen Sie:

(1) eine klar definierte Grundgesamtheit von der
(2) eine aktuelle Liste aller Elemente vorliegt aus der
(3) per Zufall eine möglichst große Zahl an Elementen gezogen und befragt werden kann und von denen
(4) möglichst alle ausgewählten Personen sich beteiligen oder aber Teilnehmer und Nichtteilnehmer sich nicht systematisch voneinander unterscheiden (ein Aspekt, der sehr häufig vergessen wird!).

Da von der deutschen Wohnbevölkerung mangels eines zentralen Melderegisters keine solche Liste vorliegt, werden in der Praxis häufig mehrstufige Stichproben gezogen. Beim sogenannten ADM (Arbeitsgemeinschaft Deutscher Marktforschungsinstitute)-Mastersample, einer wichtigen Zufallsstichprobe in der nationalen Markt- und Meinungsforschung, werden bspw. zunächst zufällig Wahlkreise ausgewählt, ehe dann (ebenfalls per Zufall) Adressen ermittelt und schließlich (erneut auf zufälliger Basis) Haushaltsmitglieder kontaktiert werden. Das ist zwar recht umständlich, aber anders kaum machbar, da es – wie bereits erwähnt – an einer Liste von Personen fehlt, die der deutschen Wohnbevölkerung angehören.

Deutlich günstiger sieht es jedoch auf den ersten Blick aus, wenn unsere Grundgesamtheit aus Menschen besteht, die als Flüchtlinge nach Deutschland gekommen sind. Sie alle werden im Ausländerzentralregister erfasst, das somit eine optimale Grundlage für die Ziehung einer Zufallsstichprobe und damit auch für die Realisierung einer repräsentativen Befragung darstellen sollte. Doch, Sie ahnen es sicher bereits: leider gibt es dabei eine ganze Reihe von Problemen. Welche das im einzelnen sind, das erfahren Sie in der nächsten Woche an gleicher Stelle. Bis dahin wünschen wir Ihnen eine gute Zeit!