Studien: Die Resultate – Statistik

„Trau keiner Statistik, die du nicht selbst gefälscht hast.“ – dieser Satz ist mindestens so falsch, wie er verbreitet ist. Statistik hat einen sehr negativen Ruf in der Gesellschaft, doch aus meiner SIcht komplett unbegründet. Denn Statistik ist ein extrem hilfreiches Mittel und kann durchaus korrekt gemacht werden.

Es gibt zwei grundsätzliche Arten der Statistik: Die deskriptive Statistik und die induktive Statistik (oder analytische Statistik). Die deskriptive Statistik ist / scheint ziemlich einfach, es sind einzig beschreibende Werte – ohne Wertung. So sind der Mittelwert, Median oder die Standardabweichung typische Werte, aber auch eine Grafik kann als deskriptive Statistik aufgefasst werden. Diese Werte sind also eher unbestritten – man wählt höchstens ungeeignete und nicht falsche Werte.

Spannender ist die analytische Statistik – hier werden primär Wahrscheinlichkeiten berechnet. Und zwar geht es meist um die Wahrscheinlichkeit, dass zwei Gruppen identisch sind – oder eben nicht. Grundsätzlich wird damit also kein Entscheid gefällt, sondern nur ein mathematischer Wert zurückgegeben. In vielen Bereichen der Wissenschaft hat sich aber ein Grenzwert etabliert, ab welchem man von einem Unterschied spricht. Oft beträgt dieser Grenzwert 5%. Das bedeutet, wenn die Wahrscheinlichkeit, dass zwei Gruppen identisch sind, unter 5% fällt, spricht man in diesem Fall davon, dass sich die Gruppen unterscheiden. In einem Beispiel folgt gleich mehr dazu.

Da man mit einer Studie beinahe nie die absolut sichere Wahrheit finden kann, muss man zu Vereinfachungen greifen. So könnte man zum Beispiel die Frage „Werden Nichtraucher und Raucher gleicht alt?“ nur dann komplett beantworten, wenn man das Alter sämtlicher Personen auf dem Planeten vergleicht (bzw. das Alter zum Todeszeitpunkt). Damit würde man gesichert die Wahrheit finden, dieser Aufwand ist aber natürlich schlicht unmöglich. Als Alternative kann man zufällig 100 Verstorbene auswählen und diese vergleichen. Mit diesem Resultat will man anschliessend abschätzen, wo die Wahrheit liegt – genau hier hilft die Statistik. Es ist also ein extrem hilfreiches Mittel, da wir so auf eine effiziente Art viel mehr Antworten finden – unter dem Risiko, dass selten auch einmal eine falsche Antwort dabei ist.

Das Beispiel

Nehmen wir an, ich gehe in ein Spielcasino und würfle gegen einen Angestellten. Beide haben je einen Würfel – wenn ich höher würfle, bekomme ich den doppelten Einsatz zurück, wenn er höher würfelt, verliere ich meinen Einsatz. Bei Unentschieden behalte ich einfach meinen Einsatz. Also eigentlich ein faires Spiel (und somit wird man dies nie in einem Casino finden). Es stellt sich die Frage: „Sind die beiden Würfel gleich oder wurden sie manipuliert?“. Ab wann soll / darf ich dem Casino also einen Vorwurf machen?

In diesem Fall gibt es eine ganz klare Wahrheit (entweder wurden die Würfel manipuliert – oder nicht). Nur kenne ich die Wahrheit nicht, darum hilft mir die Statistik. Beim ersten Wurf hat er höher gewürfelt als ich. Darf ich zu diesem Zeitpunkt bereits ein Vorwurf machen? Natürlich nicht – denn dies kann geschehen – es ist Teil des Spiels. Doch wie sieht es aus, wenn er auch beim zweiten und dritten Wurf höher würfelt als ich? Habe ich einfach Pech oder werde ich über den Tisch gezogen? Beides ist möglich, da ich die Wahrheit nicht kenne, kann ich sie lediglich abschätzen. Wenn wir in diesem Fall davon ausgehen, dass das Spiel fair ist, so würde dies in 7% der Fälle geschehen. Wenn ich also 100 mal gegen das Casino spiele, mit jeweils 3 Würfen, so würde in durchschnittlich 7 Fälle das Casino gleich in allen drei Würfen höher würfeln, als ich.

Wenn wir also das Wahrscheinlichkeits-Niveau von 5% nehmen, darf ich nach diesen drei Würfen noch keinen Vorwurf machen. Erst mit dem vierten Wurf entscheidet sich, ob ein Vorwurf berechtigt ist. Wie man hier sieht, hilft mir die Statistik, mich zu entscheiden und die Wahrheit abzuschätzen. In einem fairen Spiel wäre es sogar möglich, dass das Casino gleich zu Beginn 10 Mal hintereinander gewinnt – der Fall ist einfach sehr unwahrscheinlich und sollte eigentlich nie eintreten (nur in 1-2 Fälle, wenn man 10’000 mal gegen das Casino spielt). Somit kann man auch in diesem Fall keine absolute Gewissheit haben – der Fall ist aber so unwahrscheinlich, dass man ruhig ein Vorwurf machen kann.

Fazit

Es geht also bei der Statistik nicht darum, etwas zu fälschen – sondern eigentlich hat man einzig ein extrem komfortables Hilfsmittel zur Hand, welches das Leben viel einfacher macht. Durch falsche Anwendungen können natürlich Verfälschungen entstehen, dies ist aber in allen Bereichen des Lebens möglich und keine Eigenheit der Statistik. Der schlechte Ruf der Statistik ist aus meiner Sicht also komplett unbegründet (die Anwender hingegen stehen oft zu Recht in der Kritik – dazu später mehr).