There are lies, there are damned lies, and there is the statistic |
Ein Hase auf dem Feld. Pl�tzlich zwei Sch�sse. Einer geht rechts am Hasen vorbei, der andere links. Das Tier f�llt tot um. Es wurde nicht von den Kugeln erwischt, die haben ja gar nicht getroffen. Es wurde vom �Mittelwert� get�tet. Denn wenn man einmal rechts und einmal links am Hasen vorbeischie�t, ist der Hase in der Mitte statistisch gesehen tot. Was lehrt uns das Beispiel von Meister Lampe? Dass der Unterschied zwischen Statistik und Realit�t �ber Leben und Tod entscheiden kann. Wenn von zehn Patienten, die an derselben Krankheit leiden, einer stirbt, geht der Arzt ja auch nicht durchs Wartezimmer, z�hlt neun ab, und der zehnte bricht tot zusammen. Die Tatsache allein, dass eine Zahl vom Statistischen Bundesamt kommt, ist zwar nicht unweigerlich der Beweis f�r ihre Unrichtigkeit. Aber das ist gerade das Gef�hrliche an Statistiken: Die Zahlen sind absolut zutreffend, und trotzdem sagen sie nicht die Wahrheit. Da ist zum Beispiel die Geschichte mit den Mittelwerten, Statistiken lieben Mittelwerte, weil sie unendlich viele Zahlen zu einem griffigen Wert zusammenfassen: Das Durchschnittseinkommen, die durchschnittliche Lebenserwartung, der Wochendurchschnitt beim Zigarettenkonsum, der Monatsdurchschnitt beim Sex, der Jahresdurchschnitt bei den Verkehrsunf�llen. Eine feine Sache! Denkste! Mit Durchschnittswerten ist das so . Wenn man sein rechtes Bein in kochendes Wasser stellt und sein linkes in Eis, steht man statistisch gesehen in warmem Wasser, im richtigen Leben ist man ein Fall f�rs Krankenhaus, Der uns gel�ufigste Mittelwert wird gebildet, indem man alle Einzelwerte addiert und dann durch ihre Anzahl teilt. Das nennt man arithmetisches Mittel. Dank seiner gibt es so viele unvollst�ndige Kinder, denn durch die Division kommt man im Schnitt auf krumme 1,4 Kinder pro Familie. In einem Betrieb mit sechs Personen verdienen drei 2000 Euro im Monat und drei 4000 Euro, Im arithmetischen Mittel bekommt also jeder 3000 Euro. Aber was ist, wenn von den sechs Mitarbeitern einer 13 000 Euro verdient und jeder andere schlappe 1000 Euro? Oder einer kriegt 18 000 Euro und die anderen gar nichts? Auch dann sagt die Statistik, dass jeder in der Firma im Schnitt anst�ndige 3000 Euro bekommt. Eine solche Statistik ist also rechnerisch wahr, und trotzdem gibt sie die Realit�t nicht wieder. Das liegt daran, dass diese Art von Durchschnittswert nicht beachtet, wie die einzelnen Zahlen um den Mittelwert herum gestreut liegen. Ob alle in etwa gleich weit vom Durchschnitt entfernt sind oder ob eine krass nach oben ausrei�t und alte anderen ganz unten liegen�� das interessiert das arithmetische Mittel nicht die Bohne. Die Folge: Je gr��er die Ausrei�er nach oben, desto mehr wird das durchschnittliche Einkommen gesch�nt. Denn die gro�en Zahlen haben im arithmetischen Mittel nat�rlich ein extrem starkes Gewicht. Wenn also ein Arbeitgeberverband bei Tarifverhandlungen mit einem bereits hohen Durchschnittseinkommen der Arbeitnehmer argumentieren will, ist er gut beraten, das arithmetische Mittel zu ziehen: Die Spitzengeh�lter in der F�hrungsetage lassen die finanzielle Situation der Mitarbeiter besser erscheinen, als sie ist. Das arithmetische Mittel ist sozusagen eine Gehaltserh�hung f�r das Gros der Besch�ftigten, die den Chef nichts kostet. Eine andere M�glichkeit, Mittelwerte zu bestimmen, ist der so genannte Median. Dabei muss man nicht einmal rechnen. Man schreibt einfach alle Zahlen in aufsteigender Gr��e nebeneinander und schaut, welche in der Mitte steht. Wenn man drei Kindern f�nf, sechs und sieben Euro Taschengeld gibt, sieht die Reihe so aus: 5 6 7. Die Sechs steht in der Mitte, also kriegt jedes Kind im Schnitt sechs Euro. Bei einer geraden Anzahl von Zahlen (etwa 5 6 7 9) darf man einen der beiden mittleren Werte (6 oder 7) nehmen oder zwischen diesen beiden das arithmetische Mittel bilden. Der Vorteil des Medians: Ausrei�er fallen nicht so ins Gewicht. Bekommt z. B. das eine Kind statt sieben 70 Euro, sieht die Reihe so aus: 5 6 70; die mittlere Zahl, also der Median, ist weiter die Sechs. Das arithmetische Mittel (insgesamt 81 Euro geteilt durch 3) l�ge jetzt schon bei 27 Euro! Will also ein Arbeitnehmerverband beweisen, dass Angestellte und Arbeiter zu wenig verdienen, berechnet er das Durchschnittseinkommen am besten mit dem Median. Bei unserer kleinen Firma mit ihren sechs Angestellten sieht das dann so aus: Wenn einer von ihnen 13 000 Euro absahnt und alle anderen nur 1000 Euro kriegen, kommen die Arbeitgeber auf ein Durchschnittsgehalt von stattlichen 3000 Euro (arithmetisches Mittel), die Arbeitnehmer nur auf 1000 Euro (Median). 2000 Euro Unterschied�� und beide Ergebnisse sind statistisch korrekt ermittelt. So l�sst sich mit Zahlen vortrefflich Politik machen. Zuweilen kann das be�ngstigende Ausma�e annehmen, zum Beispiel wenn es um �Ausl�nderkriminalit�t� geht. Jahr f�r Jahr besagt die Statistik. dass Ausl�nder, gemessen an ihrem Anteil an der Bev�lkerung, einen �berproportional hohen Prozentsatz der verurteilten Straft�ter stellen. Die Zahl stimmt �die Realit�t ist dennoch anders. Denn mitgerechnet werden bei den Ausl�ndern auch Touristen, Durchreisende, illegal Eingewanderte, Nato Soldaten und Personen, die nur eingereist sind, um eine Straftat zu begehen. Ein weiterer verf�lschender Faktor bei dieser Rechnung: Mitgez�hlt werden auch Straftaten, die �berhaupt nur von Ausl�ndern begangen werden k�nnen: Verst��e gegen das Ausl�ndergesetz oder das Asylverfahrensgesetz. Au�erdem unterschl�gt die Rechnung, dass es nach Untersuchungen des Kriminologischen Forschungsinstituts Niedersachsen einen Zusammenhang zwischen sozialer Lage und Straff�lligkeit gibt. Diebstahl und Raub zum Beispiel werden �berwiegend von arbeitslosen m�nnlichen Jugendlichen in Gro�st�dten begangen�� die sind aber unter den Ausl�ndern �berproportional vertreten, sodass der Vergleich zwischen deutschen und ausl�ndischen Straft�tern hinkt. Kann Statistik Betrug sein? Sie kann wenn sie von der Parallelit�t zweier Tatbest�nde (Korrelation) auf eine Kausalit�t zwischen beiden (die eine Gr��e steuert die andere) schlie�t. Bekanntes Beispiel: Klapperst�rche und Geburtenrate. Nehmen wir mal an, in Schweden ist die Geburtenrate besonders hoch, ebenso die Zahl der St�rche; in einem Vergleichsort wie Berlin ist die Geburtenrate sehr niedrig, und es gibt wenig St�rche: Daraus k�nnte man schlie�en, dass die St�rche die Kinder zur Welt bringen. Tats�chlich gibt es hier und da eine gleichzeitige Zunahme von Storchen� und Kinderzahl aber beide Tatbest�nde h�ngen nicht urs�chlich miteinander zusammen, sondern sind jeder f�r sich die Folge einer dritten Gr��e: In Schweden ist es besonders l�ndlich. St�rche haben auf dem Land gr��ere �berlebenschancen, und Menschen kommen hier auf eine h�here Geburtenrate als in Gro�st�dten. Mit der Klapperstorch Logik kann man statistisch auch nachweisen, dass M�nner mit weniger Kopfhaar mehr Geld verdienen. Die Wahrheit: M�nner mit Haarschwund sind �lter, und �ltere verdienen mehr. Falsch war auch die Statistik, derzufolge Linksh�nder im Schnitt neun Jahre fr�her sterben als Rechtsh�nder. Das US Institute of Aging fand die M�ngel des Zahlenwerks heraus: Unter den alten Menschen gibt es kaum noch Linksh�nder, weil sie sich inzwischen an die rechtsh�ndig orientierte Gesellschaft angepasst haben�� diese Gruppe wurde einfach nicht mehr registriert. Zahlen verleiten oft zu Fehlschl�ssen. Eine amerikanische Zeitung hat einmal berichtet, dass es in New York sicherer ist, im Central Park zu �bernachten als in seiner Wohnung. Diese Meldung fu�te auf einer Statistik, wonach die meisten Gewaltverbrechen zu Hause passieren. Das stimmt auch�� aber nur deshalb, weil man sich zu Hause viel h�ufiger aufh�lt als in' einem Park. Man k�nnte sich ja auch weigern, sich zum Schlafen ins Bett zu legen, weil die meisten Menschen im Bett sterben. Beunruhigend auch, dass die Mehrzahl der Menschen in einem Krankenhaus das Zeitliche segnet�� sollten wir nicht mehr ins Hospital gehen? Der Denkfehler: Nicht weil sie ins Krankenhaus gehen, sterben sie , sondern weil sie krank sind, gehen sie ins Krankenhaus, wo sie an einer Krankheit auch sterben k�nnen. Der Statistiker Walter Kr�mer hat 1990 eine Boulevard Schlagzeile erfunden, die�� h�tte man sie ver�ffentlicht�� statistisch korrekt gewesen w�re: �Alarm! Bundesliga Fu�ballspieler werden keine 65 Jahre alt!� Kr�mer �Die Fu�ball Bundesliga existiert seit 1963. Die �ltesten Spieler waren damals Mitte 30 und damit 1990 unter 65. Mit anderen Worten, alle bis dato aus welchen Gr�nden auch immer verstorbenen Spieler Alkohol, Herzinfarkt, Verkehrsunfall, eben alles, was uns auch schon in jungen Jahren bedroht�� k�nnen bei ihrem Tod noch keine 65 Jahre alt gewesen sein; sie starben aber nicht an den Sp�tfolgen des Fu�ballspiels, sondern weil es in dieser Risikogruppe keine �lteren Personen gab.� Manchmal gaukeln uns vollkommen korrekte Zahlen auch etwas Falsches vor, weil wir an Rechenschw�che leiden. Vor ein paar Jahren warben amerikanische Elektrizit�tsgesellschaften f�r gute Stra�enbeleuchtung mit folgender Statistik: In den USA seien 96 Prozent der inner�rtlichen Stra�en schlecht beleuchtet, und dort w�rden 88 Prozent der Verbrechen ver�bt. Also w�rde eine gute Beleuchtung Verbrechen verhindern. Tats�chlich? Im Umkehrschluss besagt die Statistik ja wohl, dass in vier Prozent der gut beleuchteten Stra�en 12 Prozent der Verbrechen geschehen. Legt man einmal 100 Stra�en zu Grunde, bedeutet das: Bei schlechter Beleuchtung gibt es im Schnitt weniger als ein Verbrechen pro Stra�e (88 Verbrechen geteilt durch 96 Stra�en). Auf gut beleuchteten Stra�en kommt es dagegen zu drei Verbrechen pro Stra�e (12 durch 4). Die Zahlen der Elektrizit�tswerke beweisen also in Wirklichkeit genau das Gegenteil: Im Licht lebt man gef�hrlicher. Eine �hnliche T�cke ist das �Simpsonsche Paradoxon�, benannt nach einem britischen Statistiker. Es l�sst sich am besten durch ein Beispiel darstellen: Im Jahr 2001 hatte die Abteilung A einer Firma 10 Angestellte, darunter eine Frau (10 Prozent) , Abteilung B hatte 30 Mitarbeiter, darunter 15 Frauen (50 Prozent). Im Jahr 2002 wurde neues Personal eingestellt. Abteilung A z�hlt nun 120 Leute, davon 24 Frauen (20 Prozent), Abteilung B 40 Mitarbeiter, darunter 24 Frauen (60 Prozent). Der Anteil der weiblichen Angestellten hat in jeder der beiden Abteilungen zugenommen�� so gerechnet ein frauenfreundlicher Betrieb. Rechnet man aber den Frauenanteil an der gesamten Belegschaft aus, ergeben sich 40 Prozent f�r 2001�� und nur 30 Prozent f�r 2002. Die Firma steht jetzt als frauenfeindlich da. Schuld an diesem Paradoxon ist Abteilung A, die �berproportional gewachsen ist und einen gestiegenen, aber weiterhin geringen Frauenanteil hat, der das Gesamtergebnis dr�ckt. Fehlrechnungen, die das �Simpsonsche Paradoxon� nicht ber�cksichtigen, stecken z. B. in Statistiken, die behaupten, dass Frauen im Doktorexamen insgesamt h�ufiger scheitern (tats�chlich promovieren sie in fast allen Studienf�chern erfolgreicher) oder dass im Zweiten Weltkrieg die Frauenquote in fast jedem Industriezweig der USA anstieg (tats�chlich sank der Gesamtfrauenanteil). Wie eklatant Rechenschw�che Statistiken verf�lschen kann, zeigt auch folgendes Beispiel. Man findet auf der Stra�e einen 10 Eurch Schein und steckt ihn ins Portmonee zu einem 20 Euro Schein�� ein Gewinn von 50 Prozent. Dann verliert man von den 30 Euro wieder 10 Euro�� ein Verlust von 33 Prozent. Dennoch hat man ein Plus gemacht: Dem Gewinn von 50 Prozent steht ein Verlust von 33 Prozent gegen�ber�� verbleiben 17 Prozent mehr als vorher. H�bsch. Aber falsch. Der Fehler liegt darin, dass die Prozents�tze von unterschiedlichen Basiswerten errechnet wurden: erst von 20, dann von 30 Euro. Statistiken sind nat�rlich besonders dann interessant, wenn sie uns scheinbar Voraussagen f�r die Zukunft erm�glichen. Wie gro� ist die Chance, dass man das Radio anschaltet und von seinem Lieblingslied gerade noch die letzten Takte h�rt? Oder dass man im Supermarkt immer in der Kundenschlange steht, die am langsamsten vorankommt? Oder dass ein gekauftes Produkt einen Tag nach Ablauf der Garantie kaputt geht? Oder dass jemand, an den man gerade denkt, in dem Moment anruft? Oder dass man im Lotto gewinnt? Nehmen wir den Lottogewinn. Es gibt eine Menge Computerprogramme, die einem genau ausrechnen, welche Zahlen h�ufig gezogen wurden und welche statistisch gesehen wieder f�llig sind. Man kann solche Software getrost in den M�lleimer werfen�� sie ist total wertlos. Nat�rlich wei� der Computer, welche Zahlen lange nicht dran waren�� aber wei� die Lottomaschine das auch? Bei 6 aus 49 Zahlen betr�gt die Wahrscheinlichkeit, sechs Richtige zu tippen, 1:13983816, also 0,000 000 0715� mit oder ohne Computerprogramm. Die Chance, in Deutschland innerhalb eines Jahres vom Blitz get�tet zu werden, liegt bei 0,000 001�� ist also deutlich gr��er. Und was ist mit der Wahrscheinlichkeit, dass jemand anruft, an den man soeben gedacht hat? Viele, denen das passiert, werten es als Beweis f�r telepathische Kr�fte (und unterschlagen gern all die Jahre, in denen niemals ein solcher Anruf kam. In Wirklichkeitt steckt hinter diesem Ph�nomen reine Statistik. Der amerikanische Mathematiker Alexander Dewdney hat ausgerechnet: Wenn man 200 Leute kennt, t�glich an zehn von ihnen einen Gedanken verschwendet und pro Tag im Durchschnitt zwei Anrufe bekommt�� dann betr�gt die Wahrscheinlichkeit 0,05, dass jemand anruft, an den man soeben gedacht hat. Das ist deutlich mehr als die Chance auf einen Lottogewinn. Nach zehn Jahren liegt die Chance auf einen solchen Anruf schon bei 0,52�� es ist also etwas wahrscheinlicher, dass er kommt, als dass er ausbleibt. Der �telepathische� Anruf ist mithin statistisch wahrscheinlicher, als man immer denkt; der Lottogewinn hingegen statistisch unwahrscheinlicher, als man hofft. �brigens: Um falsche Statistik geht es auch bei der Aussage, dass ein zu Boden fallendes Butterbrot mit einer Wahrscheinlichkeit von 50 Prozent auf die beschmierte Seite f�llt. Ein Fernsehmoderator hatte 1991 genau 300 Scheiben in die Luft geworfen, und dabei fiel tats�chlich rund die H�lfte auf die Oberseite. Die Statistik ist trotzdem falsch, weil sie sich nicht auf geworfene Butterbrote bezieht, sondern auf Scheiben, die einfach vom Tisch fallen. F�r diesen Fall hat der britische Mathematiker Ian Steward nachgewiesen, dass statistisch gesehen ein Butterbrot mit 78 Prozent Wahrscheinlichkeit auf der Oberseite landet�� das ist weit mehr als die behaupteten 50 Prozent. Der Grund . Die Brotscheibe rotiert und hat auf dem Weg von der Tischkante zum Boden meistens nur Zeit f�r eine 180 Grad Drehung, normale Tischh�he vorausgesetzt. Diese�� im wahrsten Sinne des Wortes�� Fall Studie hat auch ergeben, dass ein drei Meter hoher Tisch das Problem verschmutzter Teppiche durch heruntergefallene belegte Brote verhindern kann. Am kritischsten sollte man Statistiken begegnen, die auf Umfragen beruhen. Schon die Auswahl der befragten Gruppe kann das Ergebnis manipulieren. Wer am Flughafen fragt: �Wie viel verdienen Sie im Monat?�, darf die Antworten nicht als repr�sentativ f�r die gesamte Bev�lkerung ausgeben, weil �berdurchschnittlich viele Gutverdienende mit dem Flugzeug reisen. Die amerikanische Milit�rregierung lie� nach dem Krieg in Deutschland den Ern�hrungszustand der Deutschen ermitteln und stellte daf�r Waagen an Bahnh�fen und �ffentlichen Pl�tzen auf� ausschlie�lich gesunde Menschen gerieten in die Stichprobe, hungernde Bettl�gerige nicht. Auch die Fragetechnik kann Statistiken verf�lschen. Fragte man Firmenchefs, ob sie etwas dagegen h�tten, wenn ihre Angestellten beim Arbeiten essen, w�rden sie wohl mit �Ja� antworten. Fragte man sie, ob sie etwas dagegen h�tten, wenn ihre Angestellten beim Essen arbeiten, w�rden sie eher mit �Nein� antworten. Eine Umfrage �ber �Abtreibung� f�llt anders aus als eine zum Thema �Schutz des ungeborenen Lebens�. Bei anderen Umfragen kann man nicht von vornherein mit ehrlichen Antworten rechnen: Duschen Sie jeden Tag? Lesen Sie gern mal ein gutes Buch? Schlagen Sie Ihre Kinder? Die amerikanische �Randomized Response� Technik gew�hrleistet hier mehr Realit�tsn�he, denn sie erm�glicht Antworten ohne Gesichtsverlust. Der Befragte zieht Fragen aus einem Stapel und antwortet mit Ja oder Nein� aber der Interviewer wei� nicht, auf welche Fragen sich die Antworten beziehen. Die Karten kommen in der Reihenfolge, in der die Fragen beantwortet wurden, auf einen Stapel; der Interviewer notiert die Ja� und Nein Antworten ebenfalls chronologisch�� hinterher f�hrt man Fragen und Antworten anonym wieder zusammen. In Amerika hatten 3,5 Prozent der befragten Eltern zum Beispiel zugegeben, dass sie ihre Kinder schlagen , mit der Randomized Response Technik kam pl�tzlich ein Wert von 15 Prozent heraus. Unscharf wird jede Statistik, wenn sie mit schwammigen Begriffen hantiert, etwa: �Ist Fliegen sicher?� Was ist mit �sicher� gemeint? Statistisch gesehen ist Fliegen sicherer als Autofahren, h�rt man immer: Auf eine Milliarde Passagierkilometer kommen im Flugverkehr nur 0,3 Tote, beim Autofahren sind es vier. Legt man in der Statistik aber nicht die zur�ckgelegten Kilometer zu Grunde, sondern die Anzahl der Reisen, sieht das Bild ganz anders aus . Auf eine Milliarde Fl�ge kommen 55 Tote, auf eine Milliarde Autofahrten 45. Deshalb muss man sich bei Statistiken zum Thema Sicherheit stets vergegenw�rtigen, ob eine Fluglinie sie aufgestellt hat oder ein Autoverband, Unklarheit dar�ber, worauf sich ein Zahlenwerk genau bezieht, war j�ngst auch die Ursache f�r die hitzige Diskussion um die Arbeitslosenstatistik. Es ist halt Definitionssache, wen man als �arbeitslos� mitz�hlt und wen nicht. W�rde man zum Beispiel alle arbeitswilligen Menschen �ber 65 Jahre einbeziehen, sch�ssen die Arbeitslosenzahlen in die H�he. Erstaunlicherweise scheint es aber auch Zahlenverk�ufer zu geben, die nicht an ihre eigenen Zahlen glauben. In den USA warb ein Energieversorger damit, dass seine neuen Gl�hlampen 200 Prozent an Energie einsparten. W�rtlich genommen w�rde das bedeuten: Die Lampe kommt nicht nur ohne Energie aus�� sie liefert auch noch weitere 100 Prozent Energie! Ein Kunde, der rechnen konnte, rief daraufhin bei dem Unternehmen an und wollte seine Kontonummer durchgeben, weil er mit der neuen Birne ja Energie ins Netz einspeise. Die Antwort: �Wir zahlen nichts!� Hier hatte wohl jemand der eigenen Statistik misstraut�� er wird gewusst haben, warum!
INTERNET ADRESSEN Statistik-Links der Universit�t K�ln: www.uni-koeln.de/themen/Statistik Statistisches Bundesamt: www.destatis.de Zentralarchiv f�r Empirische Sozialforschung: www.social-science-gesis.de/ZA/index.htm
Quelle: Andreas Séché: PM-Magazin (Juni 2002) p.83 "Haben Sie auch 1,4 Kinder?" |