Blog


Ein Grund, warum wir alle schlechte intuitive Statistiker sind

Unser Gehirn liebt Geschichten! Daher fällt es uns wahnsinnig schwer, einfache Korrelationen als das zu sehen was sie sind: Erstmal einfach nur schlichte Zusammenhänge. Ob es sich dabei um einen Ursache-Wirkungs-Zusammenhang handelt, ist eine ganz andere Frage. Und noch schwerer zu begreifen ist, dass Zusammenhänge manchmal auch rein zufällig sind oder nur durch eine weitere - nicht beachtetet - Einflussgröße enstanden sind. Oder wie war das nochmal mit den Störchen und den Babys?

Wenn wir uns unserer begrenzten Intuition in Sachen Statistik nicht bewusst sind, lassen wir uns leicht zu wirklich schlechten Entscheidungen verleiten. Und ja, richtig verstanden: Statistik umfasst nicht nur nackte Zahlen, sondern als Statistiker bzw. Analyst muss man auch immer die gesamte Geschichte dahinter betrachten! Unter zufälligen Korrelationen könnt Ihr Euch nichts vorstellen? Tyler Vigen hat auf seiner Homepage ein paar Schätze dazu gehoben.

Hier ein Beispiel von Tyler Vigens Homepage. Die Abbildung zeigt eindrucksvoll, wie gleichförmig sich die Scheidungsraten in Maine und der pro Kopf Konsum von Margarine zwischen 2000 und 2009 entwickelt haben. Der Korrelationskoeffizient (statistisches Maß für die Stärke des Zusammenhangs zweier Merkmale) beträgt 99,26%. Ein wahnsinnig hoher Wert, der auf einer rein zufälligen Korrelation beruht. Oder denkt Ihr, dass hier tatsächlich ein Ursache-Wirkungs-Zusammenhang vorliegt?

Ergebnisse der eigenen Datenanalyse sollten also immer kritisch hinterfragt werden: Sind wir hier auf eine interessante Erkenntnis gestoßen, oder lassen wir uns von zufälligen Korrelationen leichtfertig täuschen? Besonders anfällig dafür sind KI Anwendungen, die auf strukturentdeckenden Verfahren beruhen. Dort werden - ganz vereinfacht gesagt - Korrelationen in Daten gesucht und daraus dann Zusammenhänge konstruiert. Zu blöd, dass KI nicht intelligent genug ist, um es selbst zu merken, wenn sie vom Zufall getäuscht wurde.

zurück