Immer wieder lässt sich den Medienberichterstattungen entnehmen, dass der durchschnittliche Arbeitnehmer – nicht nur in den Vereinigten Staaten – inflationsbereinigt weniger und weniger verdient. Und tatsächlich sind die US-Reallöhne in allen Ausbildungsgruppen zwischen dem Jahr 2000 und 2013 gefallen: Schulabbrecher verloren 7,9 % und High School-Absolventen ohne College-Abschluss 4,7 % an Realeinkommen. Aber auch höhere Abschlüsse schützen nicht automatisch vor niedrigerem Einkommen. Der durchschnittliche College-Absolvent musste Lohneinbußen von 7,6 % hinnehmen, und Absolventen, die mindestens einen Bachelor-Abschluss vorzuweisen haben, verdienen heute ebenfalls 1,2 % weniger als 2000.1
Betrachtet man allerdings die durchschnittliche Reallohnentwicklung des Arbeitnehmers in den Vereinigten Staaten insgesamt, so stellt man fest, dass dieser heute tatsächlich 0,9 % mehr verdient als im Jahr 2000. Aber wie kann das sein? In jeder Ausbildungsgruppe sind die mittleren Reallöhne – teilweise drastisch – gefallen, aber insgesamt gestiegen. Das wirkt auf den ersten Blick wirklich paradox. Denkt man einen Moment darüber nach, dann ist eine erste Erklärung schnell gefunden: Die Größen der Gruppen haben sich über die letzten 13 Jahre verändert. Es gibt heute deutlich mehr (meist gut verdienende) Absolventen einer Hochschule und gleichzeitig weniger (meist eher schlecht entlohnte) Arbeitnehmer ohne weiterführenden Abschluss. Die Verschiebung zwischen den Ausbildungsgruppen führt also zu der Steigung der Einkommen im Mittel bei fallenden Einkommen je Gruppe. Auch wenn die Erklärung hier nicht allzu kompliziert ist, so können die nackten Mittelwerte durchaus schnell zu voreiligen Schlüssen führen, wenn man sich des Phänomens nicht bewusst ist. Und gerade in politischen Diskussionen kann – je nach Stoßrichtung der Argumentation – die Auswahl der Mittelwerte der Einzelgruppen oder des Gesamtmittels durchaus überzeugend wirken und zu sehr unterschiedlichen Implikationen führen.
Dass ein Trend, der in jeder Teilgruppe zu beobachten ist, verschwindet, wenn die Teilgruppen zusammengefasst werden, ist in der Statistik wohlbekannt und wird meist unter dem Namen „Simpson Paradoxon“ behandelt. Die Erklärung liegt in aller Regel in einem nicht-erfassten Einflussfaktor, in dem obigen Beispiel etwa in der Änderung der Gruppengrößen durch einen deutlich größeren Anteil an Personen mit hohen Abschlüssen und einem geringeren Anteil an Personen mit geringen Abschlüssen. Um zu einer sinnvollen Interpretation zu gelangen, ist die Identifizierung solcher nicht-erfasster Einflussfaktoren unerlässlich. Und nicht immer liegen diese so klar auf der Hand wie im genannten Beispiel und es bedarf oft guter Kenntnis über die Sache, um sie identifizieren zu können.
Um zu illustrieren, wie viele inhaltliche Facetten dieses Phänomen ganz natürlich aufweist, seien noch zwei weitere Beispiele aus den USA genannt. Das erste schließt sich direkt an das Einführungsbeispiel an. Ein ganz ähnlicher Effekt wie bei den Einkommen ist auch bei den Arbeitslosenquoten zu beobachten: Wie im Blog des Wall-Street Journal2 im Jahr 2009 berichtet, lag damals die Oktober-Arbeitslosenquote in den USA bei 10,2 %, verglichen mit 10,9 % in der Rezessionszeit 1982. Insgesamt waren die Auswirkungen der Finanzmarktkrise also weniger spürbar als Anfang der 1980er Jahre. Trotzdem ist in jeder Bildungsgruppe (College-Absolventen, High-School-Absolventen, Schulabbrecher) die Arbeitslosenquote höher als 1982. Die Erklärung ist wieder in der Veränderung der Bildungsgruppen über die Zeit zu finden.
Außerdem wird in den USA momentan viel und hitzig über das „wirtschaftliche Modell Texas“ diskutiert, besonders im Vergleich zu dem nahe gelegenen Kalifornien. Auch hier werden häufig von unterschiedlicher Seite unterschiedliche Zahlen verwendet, deren Zusammenhang sich erst erschließt, wenn man das Simpson-Paradoxon bedenkt. Ein gutes Beispiel ist die Diskussion um die Löhne. Viele der Arbeitsplätze in Texas gelten als niedrig bezahlt. Und in der Tat lag der durchschnittliche Stundenlohn 2011 mit 11,20 US-$ deutlich niedriger als 12,50 $ im US-Durchschnitt. Dies führt zu der Beschreibung von Texas als Niedriglohnland. Ein etwas differenzierteres Bild entsteht bei der Einbeziehung eines versteckten Faktors, der in Texas deutlich anders ausgeprägt ist als in den restlichen USA, nämlich die ethnische Zusammensetzung: In Texas leben nur 45 % Weiße im Vergleich zu einer Quote von 64 % USA-weit. Dafür ist die Quote der Hispano-Amerikaner mit 38 % im Vergleich zu 16 % deutlich höher. In den gesamten Vereinigten Staaten lässt sich beobachten, dass das Einkommen deutlich mit der ethnischen Herkunft korreliert. Vergleicht man nun die Stundenlöhne der einzelnen Gruppen, so ergibt sich ein deutlich anderes Bild: In jeder Gruppe liegt der Stundenlohn höher als der US-Durchschnitt. Das Durchschnittseinkommen der Weißen liegt bei 17,10 $ (US-weit 16,50), das der Farbigen bei 15,10 $ (im Vergleich zu 14,30 $ US-weit) und auch die Hispano-Amerikaner verdienen mit 12,60 $ im Schnitt 50 Cent mehr als im US-Mittel. Man kann diese Zahlen nun politisch sehr unterschiedlich interpretieren. Klar ist aber, dass auch hier die Kenntnis des Simpson-Paradoxons eine  differenzierte Interpretation ermöglicht.
Die dargestellten Beispiele für das Simpson-Paradoxon repräsentieren in gewisser Weise einen Extremfall: Obwohl in allen Teilgruppen ein Trend in die eine Richtung erkennbar ist, liegt insgesamt ein Trend in die andere Richtung vor. Aber auch wenn diese auf den ersten Blick paradoxe Situation nicht vorliegt, ist bei der Interpretation von Gesamtmittelwerten und Mittelwerten in Untergruppen Vorsicht geboten, denn das gleiche Prinzip kann auch hier wirken. Gut erkennbar ist das momentan bei der Diskussion um den Gender Pay Gap. Dabei taucht immer wieder die Zahl auf, dass Frauen in Deutschland im Schnitt 22% weniger verdienen als Männer. Dies stimmt auch. Differenziert man allerdings nach Teilgruppen, so fällt die Gehaltsdifferenz jeweils deutlich geringer aus. Betrachtet man etwa den Durchschnittsverdienst von Männern und Frauen in Teilzeit miteinander, so ist die Gehaltsdifferenz nur 4%, bei Männern und Frauen in Vollzeit 17%. In beiden Teilgruppen ist der Gehaltsunterschied also geringer als insgesamt. Die Erklärung ist wieder, dass deutlich mehr Frauen in Teilzeit arbeiten. Dies ist also auch als eine schwache Version des Simpson-Paradoxons zu interpretieren. In einer genaueren Analyse kann man nun noch weitere Faktoren mit einbeziehen und Vergleiche in spezifischeren Teilgruppen anstellen, um tatsächlich genauer zu ergründen, welchen direkten Einfluss das Geschlecht auf das Gehalt hat und welche Gehaltsunterschiede eher durch weitere Faktoren zu erklären sind. Eine solche Analyse hat etwa das Statistische Bundesamt anlässlich des Equal Pay Day am 21. März 2014 veröffentlicht.3 Das Ergebnis zeigt, dass unter Berücksichtigung unterschiedlicher Branchen und Berufe, Arbeitsplatzanforderungen hinsichtlich Führung und Qualifikation sowie Dienstalter und Beschäftigungsumfang der bereinigte Gender Pay Gap bei lediglich 7% liegt. Man mag diesen Unterschied als spitzfindig abtun, aber inhaltlich ist er gewichtig: Ganz offensichtlich ist das Hauptproblem weniger, dass Frauen für gleiche Arbeit direkt wegen ihres Geschlechts weniger Geld erhalten, sondern vielmehr, dass für Frauen nicht die gleichen Chancen wie für Männer auf bessere Positionen auf dem Arbeitsmarkt gegeben sind.
Die aufgeführten Beispiele zeigen, dass bei der Bewertung von Effekten im Mittel die Suche nach möglichen vernachlässigten Faktoren für ein vollständiges Bild nötig ist. Dabei ist festzuhalten, dass sich diese Notwendigkeit einer über den Mittelwertvergleich hinausgehenden Analyse direkt aus dem Wissen über das Simpson Paradoxon ergibt.
1US-Bureau of Labor Statistics, entnommen aus http://www.nytimes.com/interactive/2013/04/26/business/Widening-Inequality-In-Wages.html?ref=economy und http://economix.blogs.nytimes.com/2013/05/01/can-every-group-be-worse-than-average-yes/
- Achtung Statistik
Ungleiche Verteilung - 15. April 2017 - Achtung Statistik
Murphys Gesetz - 10. September 2016 - Achtung Statistik
Die „Irrsinn-Formel“ - 17. Juli 2016
Das ist eine schöne Beschreibung.
Allerdings ist der „Fehler“ dabei nicht das Simpsons-Paradoxon, sondern die Bewertung der absoluten Zahlen.
Wenn ich dir 99% Rabatt auf den OVP eines brandneuen Ferrari gebe, damit du meinen Opel kaufst…ist das dann ein Schnäppchen? 😉
Mathe rettet nicht alles…