Bildung Der Testwahn der Bildungsforscher

Die empirische Bildungsforschung macht Stimmung in eigener Sache. Die Politik soll noch mehr Geld ins Testen statt ins Lernen stecken. Dabei sind die Methoden mehr als zweifelhaft. Ein Gastbeitrag des Didaktik-Professors Hans Peter Klein.

  • Teilen per:
  • Teilen per:
Objekte der empirischen Bildungsforschung: Schüler in der Grundschule

Der Zeitpunkt war optimal. Gerade hatte die Bundeskanzlerin am Wochenende verkündet, dass Bildung ein Schwerpunkt der Investitionen der künftigen Bundesregierung sein solle. Und nun trafen sich zu Wochenanfang in Frankfurt die Vertreter einer Disziplin, die von diesen Investitionen besonders zu profitieren hofft. Alles was Rang und Namen hat in der so genannten „empirischen Bildungsforschung“, kam zum Jahreskolloquium des DFG-Schwerpunktprogramms „Kompetenzmodelle zur Erfassung individueller Lernergebnisse und zur Bilanzierung von Bildungsprozessen“. Das Ziel dieser Veranstaltung war, die Öffentlichkeit und vor allem die politischen Entscheidungsträger darauf einzuschwören, weiterhin und verstärkt Geld in die Vermessung von so genannten Kompetenzen von Schülern zu stecken, da angeblich nur sie die aktuellen Herausforderungen im Bildungssystem bewältigen könnten. Um diesem Anliegen Nachdruck zu verleihen, wurde sogar extra ein neues „Bildungspolitisches Forum“ aus der Taufe gehoben. Kritiker der Kompetenzmodelle der empirischen Bildungsforschung waren nicht eingeladen. 

Kompetenzstufenmodelle – der heilige Gral der empirischen Bildungsforschung

Das Konzept der Kompetenzerfassung, das auch der am Dienstag präsentierten PIAAC-Studie der OECD zugrunde liegt, war schon 2003 zentraler Bestandteil bei der Erstellung der nationalen Bildungsstandards und wird als Voraussetzung verkauft für den gewünschten kompetenzorientierten Unterricht, der als das Non-Plus-Ultra der neuen Bildungsoffensive angepriesen wurde. Das Messen von Schülerkompetenzen ist seither der heilige Gral der Bildungsforschung. Die Individualisierung von Unterricht sei dadurch nun problemlos möglich und zwar unabhängig von der Klassenstärke.

Solche Heilsversprechungen kommen in der Politik gut an. Dreistellige Millionenbeträge flossen seitdem in die Erforschung von Kompetenzmodellen. Dazu musste aber erst passend gemacht werden, was nicht passte.

Die in der Schulpraxis über Jahrzehnte bewährten drei Anforderungsbereiche aus der Einheitlichen Prüfungsanforderung in der Abiturprüfung (EPA) wurden verworfen, da sie für Test- und Messzwecke wegen ihrer Komplexität ungeeignet waren. Die Anforderung „Komplexere Fragestellungen auf der Grundlage von Kenntnissen und Konzepten planmäßig und konstruktiv bearbeiten“ kann beispielsweise in einer metrischen Skala nach PISA nicht abgebildet werden, da hier vielfältige kognitive Leistungen und die Komplexität der Inhalte einfließen. Die Anforderungsbereiche der EPA haben ausdrücklich keine Stufung von Kompetenzen vorgesehen, da ein breiter wissenschaftlicher Konsens sie grundsätzlich für nicht messbar hält. Doch die empirischen Bildungsforscher glauben, das ändern zu können.

Im Wunderland der Kompetenzmessung

Was wirklich hinter Lernmythen steckt
Bloß nicht mit den Fingern rechnen Quelle: Fotolia
Eine Lehrerin schreibt mit Kreide an die Tafel Quelle: dpa
Schüler mit dem Smartphone auf dem Schulhof Quelle: dpa
Fehler helfen beim LernenWer sich beim Lernen häufig verhaspelt und die Lösung raten muss, lernt trotzdem was. Eine kanadische Studie hat gezeigt, dass die Gedächtnisleistung sogar von den Fehlern profitiert. Dies gilt allerdings nur, wenn die Raterei nicht völlig ins Kraut schießt, sondern nur knapp an der richtigen Lösung vorbei ist. Wer häufig fast richtige Vermutungen anstellt, dem helfen diese wie kleine Brücken beim Erinnern an die korrekte Information. Diesen Vorteil konnten die Forscher sowohl bei jüngeren als auch bei älteren Probanden feststellen. Wer sich selbst herantastet, profitiert davon also mehr, als wenn ihm die richtige Antwort vorgesagt wird. Quelle: Fotolia
Texte wiederholt zu lesen, heißt viel zu lernen Quelle: dpa
Gelerntes erzählen, hilft es sich zu merken Quelle: AP
Hochbegabte sind LernüberfliegerWer einen ungewöhnlich hohen IQ hat, ist in der Schule noch lange kein Überflieger. Weil viele Hochbegabte in der Schule unterfordert sind, markieren sie den Klassenclown und bekommen entsprechend schlechte Noten. Quelle: Fotolia

Zweifellos messbar sind nur die Ergebnisse von Kompetenzen, also die Performanzen. Dies dürfte auch jedem Laien mehr als logisch erscheinen. Wenn beispielsweise die Leichtathletin Ariane Friedrich 2,10 Meter hochspringt, kann man zweifelsfrei die „Performance“ mit einem Metermaß messen. Niemand würde aber auf die Idee kommen, die vielfältigen dahinter liegenden Kompetenzen, wie Trainingsfleiß, Trainingsprogramm, Motivation, Konzentrationsfähigkeit, physische und psychische Stabilität, Wettkampfhärte, Siegeswille und viele mehr messen zu wollen und dann auch noch in Stufen einzuteilen. Genau dies versucht die empirische Bildungsforschung aber nun an Schulen mit Aufgabenstellungen, die den Leistungsstand der Schüler punktgenau abbilden sollen, um ihn gezielt verbessern zu können.

Für die Konzeption von derartigen Kompetenzstufenmodellen kommt nun erschwerend hinzu, dass in den Bildungsstandards von 2004 für alle Fächer gleich mehrere Kompetenzbereiche festgelegt wurden, die die Grundlage des derzeitigen Unterrichts an den Schulen bilden. In den Naturwissenschaften sind das: Fachwissen, Erkenntnisgewinnung, Kommunikation und Bewertung. Diese sind in ihrer Komplexität aber ebenfalls nicht messbar. Und weil das so ist, zerlegt die empirische Bildungsforschung sie in weitere Teilkompetenzbereiche, die ihrerseits wiederum in zahlreiche Kompetenzaspekte untergliedert sind wie „Fragestellung“, „Hypothese“, „Untersuchungsdesign“ und „Datenauswertung“. Erst diese kleinsten Kompetenzhäppchen wurden dann in fünf „Kompetenzstufen“ messbar gemacht. 

Wie kommt man aber nun zu diesen Kompetenzstufen? Eine Pilotstudie sollte das Wunder vollbringen: Schülern wurden Aufgaben gestellt, die dann entsprechend der Lösungshäufigkeit in fünf Stufen eingeteilt wurden. Haben 95 Prozent der Schüler eine Aufgabe gelöst, muss sie relativ einfach gewesen sein, haben nur 25 Prozent sie gelöst, entsprechend schwieriger.

Bei der Erstellung von Kompetenzstufen trat weiterhin die Schwierigkeit auf, die genaue Grenze zwischen den Kompetenzstufen nicht näher zu kennen. Diese Stufengrenzen werden nun in einem Konsensverfahren ermittelt, da selbst die daran beteiligten Experten keine übereinstimmenden Zuordnungen treffen konnten. Auch die zu jeder Stufe gehörenden Kompetenzbeschreibungen – der Schüler kann dieses und jenes – werden im Konsens ersonnen.

Die Kompetenzstufenmodelle sind also alles andere als gottgegeben und ihre Erstellung ist in der Wissenschaft mehr als umstritten. Es sind rein technokratische Konstrukte, die in erster Linie messtechnischen Vorgaben folgen, keinesfalls aber die Vielfalt der Lösungsmöglichkeiten berücksichtigen, die nicht vorhersehbar sind. Handelt es sich um didaktisch sinnvolle komplexe Aufgaben, die dem Schüler unterschiedliche, auch nicht vorhersehbare Lösungsmöglichkeiten bieten, messen sie diese Aufgaben unscharf. Man kann noch nicht einmal sagen, was sie überhaupt genau messen -  Lesekompetenz, Alltagswissenskompetenz oder die Kompetenz, derartige Aufgabenformate lösen zu können.  Die eindimensionalen „Kompetenzhäppchen-Aufgaben“ jedenfalls sind trivial und lassen jeden Bildungsanspruch vermissen.

Schüler als Objekte technokratischer Konstrukte

Viele der Aufgaben sind nach dem PISA Prinzip aufgebaut: Die Texte und Grafiken der Aufgaben enthalten weitgehend schon die Antworten. Um die höchste Kompetenzstufe zu erreichen, genügt teilweise also Lesekompetenz, manchmal auch das Ankreuzen des richtigen Kästchens bei Multiple Choice Aufgaben. Hat der Schüler das Kreuz an der richtigen Stelle gemacht, gehen die Tester davon aus, dass der Schüler entsprechend ihren eigenen Gedankengängen beim Erstellen der Aufgabe das zugrunde liegende Wissen verstanden, analysiert, und bewertet hat. In Wahrheit hat der Schüler aber nur ein Kästchen angekreuzt, manchmal bei nur einer vorgegebenen, teilweise nicht mal halbwegs angemessenen Alternative. Oft sind Aufgaben nur deshalb einer hohen Kompetenzstufe zugeordnet, weil die Aufgabentexte kompliziert, teilweise verwirrend formuliert sind und in den Pilotstudien nur zu einer geringen Lösungshäufigkeit führen. Die Kompetenzstufen entsprechen in diesen Fällen keinesfalls dem inhaltlichen Schwierigkeitsgrad. 

Man muss sich fragen, wie diese Vermessungstechnokratie beispielsweise in den Sprachen funktionieren soll. Analysen und Interpretationen von Texten stellen gerade dann hervorragende Leistungen dar, wenn nicht vorhersehbare, kreative und innovative Lösungen gefunden werden, die eben nicht mit psychometrischen Verfahren messbar sind. Aber auch in den Naturwissenschaften wird die Wirkung langfristig verheerend sein: Wenn Querdenken nicht mehr gefördert wird, nur weil es vom Messinstrumentarium der Empiriker nicht erfasst werden kann, wird es keine Innovationen mehr geben. Schlimmer noch: Die Fähigkeit zur praktische Durchführung von grundlegenden naturwissenschaftlichen Untersuchungen, wie beispielsweise das Mikroskopieren von Zellen, kann mit solchen Tests überhaupt nicht erfasst werden.

Der Lehrer als Handlanger der empirischen Bildungsforschung

Verheerend ist auch die Botschaft der empirischen Bildungsforschung an die Lehrer. Was sollen sie davon halten, wenn sie demnächst zum Handlanger der empirischen Bildungsforschung degradiert werden, indem sie nur noch Arbeitsblätter aus den Ihnen übermittelten Kompetenzstufenaufgabenpools an ihre Schüler austeilen und sie wieder einsammeln, um dann mit Aufgaben vom nächsten „Kompetenzstapel“ ihre  Schüler zu beglücken und anschließend zur Auswertung an die Empiriker weiterzuleiten. Sie werden zum Diagnostiker. Aber von was? Sicherlich nicht vom Lernen und Verstehen von Inhalten, von Bildung und Wissen ganz zu schweigen.

Diese Art von papierdidaktischem pseudo-naturwissenschaftlichem Unterricht fällt allen Lehrenden in Schulen und Hochschulen in den Rücken, die bei Jugendlichen Begeisterung für Naturwissenschaften erzeugen wollen - durch praxisrelevante Darstellungen, Erfahrungen, Experimente und Exkursionen unter Berücksichtigung des Verständnisses der zugrunde liegenden Fachinhalte.

Man kann jedem verantwortungsbewussten Lehrer nur raten, sich genau zu überlegen, ob er seine Schüler an einem solchen Testwahn teilnehmen lässt. Der Chemie-Didaktiker Hans Jürgen Schmidt stellte schon nach der vernichtenden Analyse einer PISA Aufgabe zum Ozon in der MNU-Zeitschrift schon 2004 fest: „Wer an einer empirischen Untersuchung junge Menschen beteiligt, ist besonders verpflichtet sicherzustellen, dass sie keinen Schaden nehmen“.

© Handelsblatt GmbH – Alle Rechte vorbehalten. Nutzungsrechte erwerben?
Zur Startseite
-0%1%2%3%4%5%6%7%8%9%10%11%12%13%14%15%16%17%18%19%20%21%22%23%24%25%26%27%28%29%30%31%32%33%34%35%36%37%38%39%40%41%42%43%44%45%46%47%48%49%50%51%52%53%54%55%56%57%58%59%60%61%62%63%64%65%66%67%68%69%70%71%72%73%74%75%76%77%78%79%80%81%82%83%84%85%86%87%88%89%90%91%92%93%94%95%96%97%98%99%100%