Statistik

Ich möchte aufgrund der aktuellen Debatte über Integration mal ein kleines Gedankenbeispiel zum Thema Statistiken durchspielen. Alle Zahlen sind dabei fiktiv, wirklich alle! Gehen wir mal von folgenden fiktiven Daten aus:

Wir haben eine Gruppe A von 1000 Menschen und eine Gruppe B von 1000 Menschen. Nun stellt sich heraus, dass:

Statistik1:

Nun könnten wir diese beiden Statistiken einfach gegenüberstellen und behaupten, dass Gruppe A tendentiell gebildeter ist als Gruppe B und Gruppe B vielleicht sogar zur Problemgruppe machen. So weit so gut und im Prinzip ist das auch genau das was seit Wochen über die Bildschirme flimmert und gestern auch bei den Einspielern der Sendung hart aber fair (die ich aus unterschiedlichen Gründen als unterirdisch schlecht empfand) dargestellt wurde.

Doch entfernen wir uns mal davon und nehmen in unserem Gedankenbeispiel an, dass man eine Untersuchung gemacht hat quer über die Gruppen A und B und folgendes feststellte:

Statistik2:

  1. Kinder, die in Familien aufwachsen welche zur unteren Einkommensgruppe gehören, haben eine 40% geringere Chance auf einen Schulabschluss (wenn wir die Chance aus höheren Einkommen auf 100% setzen würden, wären das also 60% Chance auf Schulabschluss).
  2. Diese Kinder haben eine um 75% verringerte Abiturquote im Vergleich zu den Kindern aus "reicheren" Familien.
  3. Aus den "reicheren" Familien machen 40% der Kinder Abitur, aus Punkt 2 folgt also, dass diese Zahl bei den sozial Schwachen 10% beträgt.

Wie gesagt alle Zahlen sind hier nur erdacht. Dabei zeigt uns die zweite Statistik, dass Kinder aus sozial schwachen Familien geringere Bildungschancen haben. Auch das flimmert schon seit Jahren über die Bildschirme (wobei es hierbei in den unterschiedlichen Bundesländern große Unterschiede gibt).

Machen wir also weitere Annahmen: Die Menschen aus Gruppe A gehören zu 15% (4.) diesen sozial schwachen Schichten an, die Menschen aus Gruppe B zu 30%. (5.)

Aus Statistik2 und den Annahmen 4 und 5 folgt für die beiden Gruppen:

Erwartungen für Gruppe A:

85% aus Gruppe A erhalten zu 100% einen Schulabschluss, das wären also 850 Leute (folgt aus 1. verknüpft mit 4.). 40% dieser Leute machen sogar Abitur, das sind also 340 Leute (folgt aus 3. verknüpft mit 4.). Von den restlichen 150 Leuten wissen wir, dass sie mit einer Wahrscheinlichkeit von 40% keinen Schulabschluss erhalten werden (folgt aus 1. verknüpft mit 4.). Das sind also 60 Leute, die am Ende ohne Abschluss dastehen. Jetzt kommen noch diejenigen von den 90 Leuten (150-60 ohne Abschluss) hinzu die Abitur machen, da erwarten wir 10% von 90 Leuten, also 9 Leute. (folgt aus 2. verknüpft mit 3. und 4.).

Zusammengefasst für Gruppe A ergibt sich also aus Statistik 2 und den Annahmen zur Gruppe A, dass wir folgendes erwarten, wenn wir die Schulabschlussquote und die Abiturquote untersuchen:

60 von 1000 Leuten erhalten keinen Schulabschluss, das entspricht 6%.
340 + 9 von 1000 Leuten machen Abitur, das entspricht 34,9%.

Erwartungen für Gruppe B:

70% aus Gruppe B erhalten zu 100% einen Schulabschluss (folgt aus 1. verknüpft mit 5.). Das sind also 700 Leute. 40% davon machen sogar Abitur, das sind also 280 Menschen. (folgt aus 3. verknüpft mit 5.) Von den restlichen 300 Leuten wissen wir, dass sie mit einer Wahrscheinlichkeit von 40% keinen Schulabschluss erhalten werden (folgt aus 1. verknüpft mit 5.). Das sind also 120 Leute. Von den übrigen 180 Leuten (300-120 ohne Abschluss) machen nun auch wieder 10% Abitur, das sind also 18 Leute (folgt aus 2. verknüpft mit 3. und 5.).

Zusammengefasst für Gruppe B ergibt sich also aus Statistik 2 und den Annahmen zur Gruppe B, dass wir folgendes erwarten, wenn wir die Schulabschlussquote und die Abiturquote untersuchen:

120 von 1000 Leuten erhalten keinen Schulabschluss, das entspricht 12%.
280 + 18 von 1000 Leuten machen Abitur, das entspricht 29,8%.

Zusammenführung:

Daraus sehen wir, dass alleine aus der Zusammensetzung der Gruppen bei Gruppe B eine doppelt so hohe Anzahl von Menschen ohne Schulabschluss erwartet werden muss. Dies liegt allerdings daran, dass in Gruppe B die sozial schwachen Schichten in unserem Modell wesentlich stärker vertreten sind und nicht daran, dass Gruppe B nur Einwanderer umfasst. Beim Abitur erwarten wir bei diesen Daten nur eine leicht verringerte Anzahl, die jedoch statistisch signifikant wäre.

Gehen wir zurück zu Statistik1. Wir hätten dort herausgefunden, dass tatsächlich doppelt so viele Menschen aus Gruppe B keinen Schulabschluss haben, wie aus Gruppe A. Genau das wäre aber die Erwartung gewesen, wenn uns Statistik2 und die Annahmen zu den Gruppen bekannt gewesen wären. Wir hätten also ein soziales Problem gefunden, nämlich, dass Kinder aus einkommensschwachen Familien geringe Bildungschancen haben. Statistik1 hätte also keine neuen Erkenntnisse zur Schulabschlussquote gebracht.

Beim Abitur haben wir einen Unterschied von 10% herausgefunden, wobei wir einen Unterschied von ca. 5% erwartet hätten. Hier könnte man nun sagen, dass es da noch weitere Gründe geben muss, wieso dieser Unterschied entstand. Statistik1 würde in diesem Fall tatsächlich einen Erkenntnisgewinn liefern, da wir die Gründe für den nicht erwarteten Unterschied untersuchen müssten. Allerdings wäre der suggerierte Unterschied von 10% nur teilweise nicht bereits vorher erklärbar gewesen, Statistik1 für sich alleine hätte das Bild zumindest verzerrt.

Fazit:

Eine Statistik ist nur etwas wert, wenn man auch genügend Daten hat. Dieses noch sehr einfache Beispiel, das nur zwei Statistiken verknüpft, zeigt schon, dass man nicht einfach eine Zahl in den Medien verbreiten kann und sich dadurch direkte Rückschlüsse auf die untersuchten Gruppen ziehen lassen. Da in verschiedenen Medien berichtet wurde, dass unter Einwanderern die Arbeitslosenquote höher ist, gehe ich davon aus, dass unter Einwanderern auch mehr sozial schwache Familien sind. Da mir nun bekannt ist, dass Kinder aus diesen Familien weniger Chancen auf Bildung haben, gehe ich davon aus, dass man bei einer Schulabschlussstatistik, die Einwanderer mit den "Eingeborenen" vergleicht auch die sozialen Hintergründe berücksichtigen muss. Das kann man tun indem man die Gruppen so wählt, dass der Faktor sozialer Hintergrund in den Gruppen ausgeglichen ist oder eben indem man, so wie ich eine Erwartungsrechnung macht und die Ergebnisse dann damit vergleicht.

Eine Statistik, die in einer Sendung über Integration präsentiert wird und die dem Zuschauer nur sagt x% derjenigen haben keinen Schulabschluss und nur y% haben Abitur halte ich für billige Propaganda und den lächerlichen Versuch eine bestimmte These durch geschickte Auswahl von Zahlen zu unterstützen.

Auch dieses Thema könnt ihr wie immer im Forum diskutieren.