Nein, wir haben nicht eintausend Leute befragt. Wir haben noch nicht einmal ein Telefonstudio oder eine Adressdatenbank. Trotzdem werden wir in den kommenden Wochen mehr Spannendes über Wahlumfragen erzählen als es die etablierten Meinungsforscher und Medien für gewöhnlich tun. Seit mehr als 20 Jahren befragen forsa, Infratest dimap und die Forschungsgruppe Wahlen regelmäßig die Deutschen nach ihren politischen Interessen. Hinzu kommen Allensbach, TNS Emnid, YouGov und GMS, die ähnliche Fragen einmal im Monat stellen.
Die deutsche Meinungsforschung hat dabei eine große Stärke und eine Schwäche. Was sie wirklich gut kann, ist repräsentative Wahlumfragen durchführen. Hut ab, wenn man sich die vergangenen Wahlen anschaut, wie nah da die meisten Institute am Ergebnis lagen. Was die Institute leider nicht so gut können: Die Daten verständlich erläutern und alles aus ihnen herausholen. Das überlassen sie Medien und nehmen dabei zum einen auch in Kauf, dass Unklarheiten entstehen. Vielleicht liegt es daran, dass die Institute mit ihren Wahlumfragen allesamt kein Geld verdienen müssen, oder daran, dass sie mit dem öffentlich-rechtlichen Rundfunk zusammenarbeiten, aber Innovationen sind hier echte Mangelware.
Und genau da setzt die Analyse der "WiWo-Wahlsager" an. Auf Basis der wöchentlich bzw. monatlich erhobenen Daten führen wir zusätzliche Auswertungen durch - und sind uns ziemlich sicher, dass wir so mehr Genauigkeit und interessantere Informationen gewinnen können als die großen Meinungsforschungsinstitute. Aber damit keine Missverständnisse aufkommen: Das alles geht nur, weil es deren Daten gibt.
Zum einen erstellen wir eine aggregierte Sonntagsfrage, wir nennen sie die "Master-Projektion". Wir glauben, dass sie am Ende näher an der Realität liegen wird als die Werte der Institute. Denn unsere Projektion baut auf diesen auf und macht sie besser: Aus den existierenden Umfragedaten bilden wir einen Mittelwert, dann gewichten wir die Werte der einzelnen Institute anhand der Exaktheit ihrer jeweils letzten Prognosen vor den vergangenen vier Bundestagswahlen. So erhalten wir eigene Werte, die das Beste aus den guten Umfragewerten herausfiltert. Laut Nate Silver, einem US-Wahlblogger ("Fivethirtyeight"), von dem wir einige unserer Ideen abgekupfert haben, sollten wir damit im besten Fall zwanzig Prozent besser als die einzelnen Institute abschneiden.
Sieg und Niederlage
Bei den Sonntagsfragen kann das natürlich keiner überprüfen, weil nächsten Sonntag keine Wahl stattfindet, spätestens bei der Wahl aber wird sich der Wert dieser Aussage erweisen. Aus zwei Gründen könnte dieser Erfolg dennoch nicht eintreten. Erstens: Eine einzelne Umfrage kann immer besser abschneiden als der Mittelwert, man weiß allerdings vorher nie ob das der Fall ist und die Umfrage welchen Instituts das sein wird - deshalb sollte der gewichtete Mittelwert meistens besser abschneiden. Zweitens: Sollten alle Umfragen eine gleichartige Fehlerquelle in sich bergen, von der wir nichts wissen, würden auch wir diesem Fehler unterliegen. Wir sollten der schnellste in der Herde sein, aber wenn die ganze Herde falschliegt, dann stürzen wir mit ins Elend.
Wir wollen aber nicht nur mehr aus den Daten der Institute machen, wir wollen auch ehrlich sagen, wo die Grenzen von Umfragen liegen. Denn an dieser Stelle lassen die Institute zu, dass ihre Werte zu wörtlich genommen werden. Sie veröffentlichen ihre Ergebnisse als sogenannte Punktschätzungen, zum Beispiel: CDU 38,5 Prozent. Klar, das lässt sich besser verkaufen, doch ihre Daten geben das gar nicht her. Wie alle Statistiker unterliegen auch die Meinungsforscher einer Reihe von Fehlerquellen und insbesondere dem Zufallsfehler. Will heißen: Wenn man ein und dieselbe Untersuchung mehrmals durchführt, wird nicht in allen Fällen exakt das gleiche herauskommen. Vielmehr streuen die Ergebnisse rund um einen mittleren Schätzwert. Wir werden deshalb die sogenannten Konfidenzintervalle mit veröffentlichen. Das sieht dann zwar nicht mehr so schön eindeutig aus, bei einem mittleren Schätzwert von beispielsweise 4,5 Prozent für die FDP sind Aussagen wie "FDP schafft es nicht mehr ins Parlament" dann nur noch sehr eingeschränkt möglich. Dafür lassen die Intervalle eine zutreffende Aussage zu: "Mit einer Wahrscheinlichkeit von 95 Prozent würde das Wahlergebnis der FDP momentan zwischen 3,1 und 5,9 Prozent liegen." Die meisten Institute geben zwar Fehlermargen an, in den Medienberichten über Umfrageergebnisse spielen diese aber meistens keine oder nur eine untergeordnete Rolle.
Die vermeintlichen Punktschätzungen fallen den Instituten immer dann auf die Füße, wenn die Wahl besonders knapp verläuft. Durch die Punktschätzungen vermitteln sie den Eindruck, eine Aussage über Sieg und Niederlage treffen zu können. Auch wenn sie im Sinne des Konfidenzintervalls am Ende des Wahlabends völlig richtig liegen, haben sie dann scheinbar auf das falsche Pferd gesetzt. Bestes Beispiel dafür war die jüngste Niedersachsen-Wahl: Selbst nach den ersten Hochrechnungen war noch unklar, wer gewinnen würde. Wie soll da eine Umfrage zehn Tage vorher richtig liegen?
Politische Wahrscheinlichkeiten
Die Bedeutung des Konfidenzintervalls zeigt, dass es eigentlich eine ganz andere Größe gibt, die im Prognosegeschäft interessant ist - die in Deutschland bisher aber keine Rolle spielt: die Wahrscheinlichkeit. Deshalb stellen wir Umfragen erstmals in Form von Wahrscheinlichkeiten für verschiedene Koalitionsoptionen dar, eine Form die bisher völlig unüblich ist.
Dabei hat sie gerade in Verhältniswahlsystemen wie dem deutschen viel Charme: Welchen Leser interessiert schon wirklich, ob die SPD 26, 28, oder 30 Prozent holt? Am Ende wollen alle wissen, wer regieren kann. Deshalb berechnen wir auf Basis der wöchentlichen Master-Projektion Koalitionswahrscheinlichkeiten für alle theoretisch denkbaren und halbwegs wahrscheinlichen Varianten. Grün-Gelb fällt aus Gründen der mikroskopisch geringen statistischen Wahrscheinlichkeit weg, schwarz-dunkelrot aufgrund der inhaltlichen Distanz (politische Wahrscheinlichkeit).
In inhaltlichen Fragen werden wir ansonsten aber großzügig sein: Auch eine Ampelkoalition kommt nach den Aussagen der Parteien derzeit politisch nicht in Frage, sie ist aber nicht so abstrus, dass die Wahrscheinlichkeit nicht trotzdem interessant wäre.
Mithilfe der Wahrscheinlichkeiten und der Analyse verschiedenster Daten aus der Vergangenheit über Wählerverhalten und Einstellungen zu inhaltlichen Themen wollen wir diese Kolumne außerdem dafür nutzen, im Laufe des Wahlkampfs statistische Phänomene zu erklären und aktuelle Entwicklungen richtig einzuschätzen.
Werfen wir zum Schluss einen kurzen Blick auf die aktuellen Wahrscheinlichkeiten. Dass eine große Koalition und auch eine – von den beteiligten Parteien nicht angestrebte – schwarz-grüne Koalition mit einer Mehrheit rechnen könnten, wenn bereits am Sonntag Bundestagswahl wäre, dürfte nicht allzu sehr überraschen. Interessant ist vor allem, dass die Chancen im Moment sowohl für eine rot-grüne als auch für eine schwarz-gelbe Mehrheit gering sind. In der nächsten Kolumne werden wir allerdings zeigen, wie viel sich bis zur Wahl noch ändern kann und wie schnell sich die Wahrscheinlichkeiten für die Koalitionen verändern können.