A+ R A-

Statistik als Magie

Auch in der eher praktisch orientierten Chirurgie setzt sich zunehmend die Meinung durch, dass Handlungen häufiger erfolgreich sind, wenn wir uns bei unseren Entscheidungen eher von wissenschaftlich gesicherten Erkenntnissen leiten lassen als von unseren persönlichen Erfahrungen. Was natürlich weder ausschließt, dass vermeintlich gut gesichertes Wissen in die Irre führt, noch dass Handlungen erfolgreich sein können, die auf spekulativen Annahmen beruhen.

 
Wenn wir von Anekdoten und kleinen persönlichen Erfolgsserien absehen, dann scheint es langfristig besser zu sein, auf fundierte Kenntnisse zu setzen. So weit, so gut. Was ist aber eine fundierte wissenschaftliche Erkenntnis? Welche Rolle spielen hier moderne statistische Verfahren? Unsere akzeptierte Interpretation der Welt beruht mittlerweile fast vollständig auf statistisch gesicherten Erkenntnissen. Das erkennen wir in Zweifelsfragen daran, wie konsultierte Gutachter die Situationen und Entscheidungen bewerten.
 
Es ist schon beeindruckend, wie man andere Menschen dadurch beeindrucken kann, dass man die „statistische“ Terminologie verwendet. Der simple Gebrauch von Begriffen wie „Stichprobe“ oder „Fallzahlberechnung“ in einer Diskussion lässt alle Beteiligten vorsichtig werden. Wenn man dann noch den Satz fallen lässt: „ob hierzu wohl die Power ausreicht oder der β-Fehler nicht doch zu groß ist?“, dann kann man sich des Respekts und der Bewunderung vieler Zuhörer sicher sein. Egal, ob diese Aussagen in der Situation angebracht sind oder nicht. Sollte ein Teilnehmer noch zusätzlich darauf hinweisen, dass es sich um eine „Poisson-Verteilung“ handelt, dann ist ihm die Eigenschaft „statistischer Freak“ gewiss. 
 
Die Nicht-Wissenden sind auf jeden Fall in der deutlichen Überzahl und kennen nur eine Reaktion: Demütiges Verneigen vor den statistischen „Guru“, Niederknien vor dem Altar der Statistik, gläubiges Darbieten des Opfers und Empfangen der Gnade der wissenschaftlichen Erkenntnis. Das klingt irgendwie bekannt und nicht wünschenswert – zumindest nicht für kritische Geister. Leider ist vielen Menschen nicht bewusst, was sie dort leichtgläubig opfern. Es ist vielfach der gesunde Menschenverstand, den sie bei diesen Ritualen aufgeben.
 
Die meisten Wissenschaftler sind zwar mit einigen statistischen Ritualen vertraut, aber eben nur mit den Ritualen und nicht mit dem erforderlichen methodischen Wissen, obwohl es leicht erlernbar ist. Viele statistische Methoden oder Tests hängen ganz entscheidend von zusätzlichen mathematischen Annahmen ab, die häufig gar nicht erfüllt sind, so dass der statistische Test in die Irre führen kann. 
 
Alle statistischen Methoden definieren letztlich nur formale Kriterien und Vorgehensweisen. Und denen ist es völlig egal, ob sie auf weiße Kugeln, lila Kühen oder farbenprächtige Hobbits angewendet werden. Erfahrene Statistiker warnen immer wieder vor dieser Falle, aber nur wenige hören auf sie. Hat jemand nur Müll verfügbar, dann helfen ihm die besten Verfahren nicht, um daraus eine wohlriechende Essenz herzustellen – außer für Menschen mit einem abwegigen Geschmack. 
 
Wir erleben in der Medizin zurzeit eine Flut an systematischen Reviews bzw. Metaanalysen. Es scheint, als ob sich die gesamte medizinische Welt dazu aufgerafft hat, Inventur zu betreiben. Das gesamte medizinische Wissen soll offensichtlich aus der dunklen Tiefe der Literatur geborgen werden. Immer und immer wieder tauchen die Suchenden in die medizinische Literatur. Aber sie bringen nur Schlamm und rostiges Gelumpe ans Tageslicht. Von Gold und Juwelen ist da keine Spur. Fast jeder Review endet mit: Aufgrund der schlechten Datenlage kann keine fundierte Entscheidung getroffen werden. Fast jeder Review umfasst mittlerweile nicht nur randomisierte Studien (fraglicher Qualität), sondern es werden munter randomisierte Studien mit prospektiven und selbst retrospektiven Beobachtungen gemischt, um überhaupt irgendwelche Daten präsentieren zu können. 
 
Wenn die sehr motivierten und gut ausgerüsteten Goldsucher nur rostige Nägel gefunden haben, dann geben sie sich damit nicht zufrieden. Sie packen meistens noch stinkenden Schlamm darüber, damit der rostige Fund nicht als solcher entlarvt wird. Danach werden diese Reviews wohlverpackt mit beeindruckenden Graphiken publiziert und mit eindeutig vieldeutigen und zugleich nichtssagenden Empfehlungen garniert. Und das Schlimme ist, dass diese Reviews landauf und landab repetiert werden und als Entscheidungsgrundlage für eine „gute“ Medizin gelten sollen.
 
Warum beginnen wir nicht, „goldene“ Studien durchzuführen und diese mit Edelsteinen zu behängen? Warum produzieren wir weiterhin „eiserne“ oder nur „bronzene“ Studien mit fraglichem Wert, die im Ozean des Wissens schnell rosten oder sich auflösen? Eine Ursache mag in der großen Diskrepanz zwischen dem tatsächlichen Wissen über statistische Methoden einerseits und ihrer breite Anwendung andererseits liegen. Auf der einen Seite begegnen wir einem nicht gerechtfertigten Autoritätsglauben gegenüber „ausgeklügelter“ Statistik und auf der anderen Seite steht gleichzeitig die Ignoranz diesen Methoden gegenüber – was für ein Schlaraffenland für Betrüger und Schwindler.