Quantitative Methoden sind mächtige Instrumente

Nicht nur Risikomanager verwechseln gelegentlich Korrelation mit Kausalität, vernachlässigen Variabilität und Stichprobenfehler oder multiplizieren Eintrittswahrscheinlichkeit mit Schadensausmaß und vergessen dabei, dass dies nur für die Risiken gilt, die einer bestimmten Verteilung folgen (beispielsweise einer Bernoulli-Verteilung). Oder Sie unterstellen eine Normalverteilung für Risiken, die nicht normalverteilt sind. Auch bei Risikomaßen ist die Sammlung an Missverständnissen und Fehlinterpretationen lang und vielseitig. Gelegentlich wird vergessen, dass das bei Risikomanagern beliebte Risikomaß Value at Risk rein garnichts mit einem "maximalen" Verlust zu tun hat. Die Liste der Denk- und Anwendungsfehler ließe sich fast beliebig fortführen. Doch nicht nur Risikomanager sollten über ein grundlegendes Verständnis von Statistik verfügen. Jeder Zeitungsleser und -hörer sollte die wesentlichen Werkzeuge und Fallstricke der Statistik kennen. Wir sprachen mit Katharina Schüller, Diplom-Statistikerin, Statistik-Expertin bei DRadio Wissen, Lehrbeauftragte an verschiedenen Hoch- schulen und ausgezeichnet als "Statistikerin der Woche" durch die American Statistical Association.

Sie zeigt uns auf, dass Statistik eine notwendige Fähigkeit ist, um die Welt, in der wir leben, einordnen, bewer ten und verstehen zu können und um Entscheidungen unter Unsicherheit zu treffen.

Ist statistisches Denken angeboren?

Katharina Schüller: Ja, ganz sicher. Jeder von uns orientiert sich jeden Tag in einer komplexen Welt, und dazu müssen wir Daten verarbeiten und Muster erkennen: Sind das um mich herum gerade Freunde oder Feinde? Schaffe ich es noch rechtzeitig zum Zug? Reicht mein Geld für den Wochenend-Einkauf? Das ist die eine Seite des statistischen Denkens. Die andere Seite ist eine kritische Grundhaltung, mit der wir uns bewusstmachen, dass unsere alltägliche Wahrnehmung eben nicht repräsentativ ist, sondern nur einen kleinen Ausschnitt der Wirklichkeit zeigt. Es scheint so – aber es könnte auch eine andere Erklärung geben. Wir können diese kritische Grundhaltung einnehmen, es ist bloß anstrengend, und darum tun wir das nicht so gerne.

Was ist dran an der Aussage "Traue nur der Statistik, die Du selbst gefälscht hast"?

Katharina Schüller: Jede Statistik ist eine Zusammenfassung von Daten und damit eine Komprimierung der Wirklichkeit. So wie eben eine MP3- Komprimierung das Wesentliche eines Musikstücks zusammenfasst, damit man nicht so viel Speicherplatz braucht, hilft uns die Statistik, nicht immer ellenlange Datentabellen anzusehen, sondern eben einen schnellen Überblick zu kriegen. Mit Hilfe des Mittelwerts beispielsweise.
Aber bei so einer Komprimierung gehen zwangsweise Informationen verloren. Idealerweise die, die nicht so wichtig sind, aber das ist nicht unter Garantie so. Es gibt dieses schöne Beispiel, wo die Zahnärzte mit dem Median ihres Einkommens argumentieren, dass sie so wenig verdienen, und die Krankenkassen nehmen den Mittelwert und sagen, Zahnärzte verdienen viel zu viel. Weil der Mittelwert eben durch einzelne sehr hohe Werte nach oben gezogen wird. Objektiv gesehen haben beide korrekte Statistiken angeführt, aber wem soll man glauben?

In dem Buch "Statistik und Intuition" haben Sie ein Portfolio an statistischen Denkfallen aufgeführt, die Ihnen in den letzten Jahren über den Weg gelaufen sind. Was war die originellste oder unsinnigste statistische Falschinterpretation, die Ihnen am meisten in Erinnerung geblieben ist?

Katharina Schüller: Besonders lange beschäftigt hat mich ein Beispiel, das ich in mein Buch gegen Ende aufgenommen habe: Der Fall Edathy. Ein sehr fachkundig klingender Spiegel-Artikel wollte mit Hilfe des Satzes von Bayes "beweisen", dass die Ermittler statistisch auf der sicheren Seite seien, wenn sie den Schluss zögen: Wer sich legale Nacktbilder anschaut, der besitzt auch Kinderpornos. Der Spiegel-Autor vergleicht Edathy mit O. J. Simpson ("Wer seine Frau umgebracht hat, hat sie meist vorher auch schon verprügelt") und einem Bankräuber ("Wer nach einem Bankraub aus der Bank rennt, ist meist der Räuber"). Dabei übersieht er aber, dass solche Schlüsse nur gelten, wenn wir tatsächlich alle Möglichkeiten (Frau wird getötet oder nicht, Frau wurde verprügelt oder nicht, Mann ist der Mörder oder nicht) beobachten und grundsätzlich in der Wahrscheinlichkeit ihres Auftretens abschätzen können. Im Fall Edathy ist das nicht so. Weil die Staatsanwaltschaft nur auf begründeten Verdacht hin tätig wird, kann sie den Porno-Konsum unbescholtener Bürger nicht abschätzen. Anders gesagt, die Justiz nimmt keine Zufallsstichproben. Für Statistik-Fanatiker mag das bedauerlich sein, für unseren Rechtsstaat ist das ein gutes Zeichen. Ich finde diesen Fall so bedenklich, weil durch das Herumwerfen mit Fachvokabular der Anschein entsteht, man könne ja alles berechnen. Gerade in meiner Tätigkeit als Gutachterin in Strafprozessen sehe ich aber, wie schwerwiegende Folgen das im Einzelfall haben kann. Wenn in Mordfällen argumentiert wird, dass die DNA-Probe mit einer Wahrscheinlichkeit von 1 zu 1 Billion vom Beschuldigten stamme, dann stimmt meist die Berechnung auf Basis der Daten. Aber es wird häufig unterschlagen, dass die Daten selbst oft nicht ganz sauber sind, weil eben DNA ein Naturmaterial ist, weil man sie für die Analyse mit Hilfe der sogenannten PCR (Polymerase-Kettenreaktion) kopieren muss und weil dabei Fehler passieren können. Und dann sind wir wieder bei der Statistik-Kompetenz. Nur aus sauberen Daten entstehen saubere Ergebnisse, und deswegen müssen wir den Prozess von der Gewinnung der Daten bis zur letztlichen Interpretation alle Schritte kritisch beobachten.

Der indische Statistikers C.R. Rao weist darauf hin, dass sicheres Wissen in einer neuen Art des Denkens aus der Kombination von unsicherem Wissen und dem Wissen über das Ausmaß der Unsicherheit entsteht. Was sollte getan werden, um vor allem das Wissen über das Ausmaß der Unsicherheit zu erhöhen? Wie kann man "Statistisch denken" lernen?

Katharina Schüller: Statistisch denken lernen funktioniert vor allem durch Fragen. Wo kommen die Daten her? Hat jemand Interesse daran, dass die Daten nicht objektiv und repräsentativ erhoben wurden? Gab es fehlende oder unbrauchbare Daten und wie wurde damit umgegangen? Es ist beispielsweise beliebt, aber sehr kritisch zu sehen, wenn fehlende Daten einfach ignoriert werden oder durch den Mittelwert ersetzt. Im ersten Fall übersieht man dabei, dass manchmal gerade das Fehlen eine besondere Bedeutung haben kann, etwa weil Menschen mit sehr hohem oder sehr niedrigem Einkommen in Einkommensbefragungen nicht so gerne antworten. Im zweiten Fall geht Unsicherheit verloren – im Extremfall würden 99 fehlende Werte durch einen einzigen vorhandenen ersetzt. Erst wenn alle Fragen zu den Daten und ihrer Aufbereitung geklärt sind, macht es Sinn, sich mit den statistischen Methoden zu beschäftigen. Die Unsicherheit dabei ist der so genannte Modellfehler und wir könnten uns fragen, warum jemand genau diese Methode zur Analyse der Daten benutzt hat und keine Alternative. Dafür braucht es aber schon mehr Fachkenntnis. Im Alltagsleben hilft es schon sehr viel weiter, nicht nur Pressemitteilungen zu lesen, sondern möglichst die zugrundeliegende Studie. Wenigstens die Zusammenfassung und die kritische Diskussion am Ende. Und wenn ein Ergebnis einer Studie sensationell klingt, dann werde ich in der Regel erst einmal skeptisch.

Predictive Analytics ist eine der neuen Säue, die aktuell durchs Big-Data-Dorf getrieben wird. Welches Potenzial verbirgt sich ihrer Meinung nach in den großen Datenbergen? Wo stecken die Gefahren, die wir auf dem Radar haben sollten?

Katharina Schüller: Daten, das "Öl des 21. Jahrhunderts", sprudeln inzwischen überall reichlich – und kosten dazu fast nichts mehr. Dennoch halte ich diese Datenberge zugleich für über- und unterbewertet. Diese Daten sind unterbewertet, weil unzählige datengenerierende Systeme gigantische Mengen von Bits und Bytes produzieren. Das Meiste davon bleibt ungenutzt, weil sich offenbar viele damit zufriedengeben, dass man die Daten ja hat.

So einfach ist es nicht. Diese Daten sind gleichzeitig überbewertet, weil zwar alle Welt euphorisch von der "Macht der Daten" spricht. Aber kaum jemand ist sich im Klaren, wo die Grenzen dieser Macht liegen. Denn: Der Großteil der Daten ist weder verknüpft noch organisiert. Deswegen kann er nicht, zumindest nicht ohne Weiteres, in Wissen verwandelt werden. Daten sind eben nur der erste Schritt, das Rohöl, aber wir müssen sie bereinigen und dadurch in Informationen verwandeln – den Treibstoff. Dieser Treibstoff muss in die Tankstelle und von dort in die Autos; das geschieht, indem wir Daten zu Wissen verknüpfen. Und schließlich wollen wir nicht bloß eine Probefahrt machen, sondern das Auto dauerhaft nutzen; das wäre Handlungsmacht. Dafür muss man das Wissen anwenden, also ein organisatorisches (und gegebenenfalls rechtliches) Umfeld schaffen, um neue Geschäftsmodelle aus Daten umsetzen zu können. Vielleicht brauchen wir sogar neue Verkehrsregeln, um Mobilität für alle zu bekommen. Das betrifft die Auswirkungen auf die Zivilgesellschaft, und da sind viele offene Fragen. Wem gehören eigentlich die Daten und wie schützen wir gerade die, die sich nicht wehren können, vor Missbrauch? Kürzlich hat jemand davon geschwärmt, dass in Zukunft alle kostenlos U-Bahn fahren könnten, wenn sie dafür Werbung auf ihrem Handy ansehen würden. Konsequent zu Ende gedacht heißt das aber für die Menschen, die sich die schönen beworbenen Dinge nicht leisten können: Ihr müsst leider zu Fuß gehen. Wollen wir das? Mastercard hat sich patentieren lassen, dass sie aus Kreditkarten-Daten Größe und Gewicht der Kunden schätzen und an Fluggesellschaften verkaufen. Die können uns dann individuelle Preise machen, umso teurer, je schwerer wir sind, oder uns vielleicht sogar das Ticket verweigern. Wollen wir das? Über solche Fragen müssen wir jetzt nachdenken und nicht erst in Zukunft; da sehe ich die großen Gefahren: Dass wir uns viel mit Technologien beschäftigen aber kaum mit der Abschätzung ihrer Folgen.

Gelegentlich trifft man Risikomanager, die davon überzeugt sind, dass für das Management von Risiken ein Blatt Papier und ein Bleistift ausreichen. Welche Relevanz spielen Statistik und quantitative Methoden im Risikomanagement von Unternehmen?

Katharina Schüller: Statistik und quantitative Methoden sind sehr mächtige Instrumente, die meiner Erfahrung nach oft noch viel zu wenig genutzt werden. Gerade das sich stark entwickelnde Gebiet der Visual Analytics, in dem Visualisierungsverfahren genutzt werden, um Daten und Zusammenhänge zwischen diesen Daten sichtbar zu machen, halte ich für extrem hilfreich. Damit wird Statistik lebendig und wir können, insbesondere in der Kombination mit Simulationen, unmittelbar sehen, wie sich bestimmte Entscheidungen auswirken. Das ist besonders nützlich, weil ich immer wieder erlebe, dass sich Führungskräfte viel leichter überzeugen lassen, wenn sie etwas tatsächlich sehen und nicht nur die nüchternen Ergebnisse unverständlicher Formeln präsentiert bekommen. Wir konnten aus der Kombination einer klassischen statistischen Methode, der generalisierten Regressionsanalyse, mit anschaulichen Visualisierungen und einem Simulationstool ein sehr spannendes Projekt am Frankfurter Flughafen durchführen. Es ging da um die Frage, wie man die Flugzeuge optimal positioniert, damit die Passagiere am Flughafen möglichst viel einkaufen. Am Ende war nicht nur eine Aussage möglich, welche erstaunlichen Potenziale in der Positionierung liegen, sondern auch, wie stark sich welche Restriktionen und möglichen Entwicklungen, etwa zukünftige Währungsschwankungen, auf das Ergebnis auswirken.

Sie haben vier Kinder. Vermittelt die Schule Kompetenzen in grundlegender Statistik und Mathematik, um "statistisches Denken" zu fördern?

Katharina Schüller: Wenn ich mir meine Kinder so anschaue, dann kriegen die das ganz gut hin. Ich war beispielsweise sehr stolz, als mir meine Tochter Valentina von einer Radiosendung erzählte: Es ging um die Frage, ob man schon einmal Zivilcourage gezeigt habe, und nur ein kleiner Prozentsatz der Befragten hat das bejaht. Sie meinte dazu, dass die Antwort nichts wert sei, solange man nicht wisse, wieviel Prozent schon einmal in einer Situation waren, die Zivilcourage erfordert hätte. Aber das zeigt eben, dass eine Beobachtung alleine noch keine Schlüsse erlaubt, und so kann ich auch nicht sagen, ob meine Kinder das statistische Denken in der Schule lernen, oder weil wir so viel darüber sprechen. Ich glaube, kritisches Denken und Hinterfragen wird in der Schule durchaus vermittelt, bloß nicht im Zusammenhang mit Mathematik und Statistik. Da gibt es ja immer eine "richtige" Antwort und genau das sollten wir eigentlich in Frage stellen lernen.

Über welche Kompetenzen im Kontext Statistik sollten Risikomanager verfügen?

Katharina Schüller: Ein Risikomanager sollte natürlich das Handwerkszeug beherrschen, das in gängigen Statistik-Kursen vermittelt wird: Was ist eine Normalverteilung, wie berechne ich eine Varianz und so weiter. Idealerweise kommt dazu noch ein Grundverständnis neuerer Verfahren aus dem Data Mining: Entscheidungsbäume beispielsweise oder Neuronale Netze. Aber viel entscheidender ist meiner Meinung nach eine Vorstellung davon, in welcher Situation welche Methode geeignet ist und wann es vielleicht keine so gute Idee ist, sie einzusetzen, weil sie zu Trugschlüssen führen könnte. Das hängt wiederum stark mit einem Verständnis für die Daten ab, und dazu muss ein Risikomanager mit den Menschen reden, die die datengenerierenden Prozesse verstehen. Wie entstehen eigentlich die Renditen in meinem neuen Finanzprodukt? Welche Märkte beeinflussen sich wie stark? Welche Rolle spielt die Preisgestaltung für die Bereitschaft meiner Kunden, mein Produkt zu kaufen? So merkwürdig das klingen mag, ich glaube, ein guter Risikomanager muss das können, was ein guter Statistiker auch beherrschen sollte: Kommunizieren.

[Die Fragen stellte Frank Romeike, Chefredakteur des Kompetenzportals RiskNET]

Katharina Schüller, geboren 1977 in Rosenheim. Studium der Psychologie an der TU Dresden, Studium der Statistik an der LMU München, Promotionsstudium an der TU Dortmund, Stipendiatin der Bayerischen EliteAkademie und des Nobelpreisträgerkomitees Lindau. Sie gründete im Jahr 2003 das Unternehmen STAT-UP Statistical Consulting & Data Science in München, das mit Niederlassungen in Madrid und London europaweit für Unternehmen, Forschungsinstitute und die Öffentliche Hand tätig ist. Der Öffentlichkeit bekannt ist sie durch regelmäßige Radio- und Fernsehbeiträge sowie Fach- und populärwissenschaftliche Publikationen.

Katharina Schüller wurde im Internationalen Jahr der Statistik von der American Statistical Association als "Statistikerin der Woche" vorgestellt, ist Lehrbeauftragte an verschiedenen Hochschulen und als Expertin für Digitalisierung und Data Analytics zudem Mitglied des Beirats der Deutschen Bank und des Beirats von Burda Forward. Ihr Buch "Statistik und Intuition: Alltagsbeispiele kritisch hinterfragt" erschien im Januar 2016 bei Springer.

[Das Interview ist erstmalig in Ausgabe 03/2017 der Zeitschrift RISIKO MANAGER im FIRM Special veröffentlicht worden.]