In dieser Zeit, da die Geschichtsdidaktik also das empirische Wagnis in beiderlei Gestalt, der methodischen Anverwandlung wie der facheigenen Profilierung, auf sich genommen hat, sollte die theoretische Rückversicherung stete Begleiterscheinung sein. Diese wird hier diesmal von der Feststellung ausgehen, wie sehr wir angesichts des Booms der evidenzbasierten Lehr-Lern-Forschung als Forscherinnen und Forscher nicht nur, aber eben auch bei der Konzeption von Empirie in einer Zwangsjacke stecken. Denn die Ursituation aller empirischen Forschung in den nach wie vor »verstehenden« Geisteswissenschaften stellt sich dar, wie Ludwig Wittgenstein sie einmal beschrieb:
»Es ist für unsere Untersuchung wesentlich, dass wir nichts Neues mit ihr lernen wollen. Wir wollen etwas verstehen, was schon offen vor unseren Augen liegt. Denn das scheinen wir, in irgendeinem Sinn, nicht zu verstehen.«
(Wittgenstein zusf. zit. nach Wrabel, 1998, 65 f., Hervorhebungen im Original)
Richtig betrachtet, liegt darin die Crux oder die Herausforderung unseres Strebens: nicht die passenden Fragen zu stellen, Methoden zu beherrschen, nach Resultat, Anschluss und Transfer zu suchen – das ist alles auch von Belang, kommt aber später. Zuerst geht es um die Ideologien der Untersuchung, das heißt um das Verhältnis unseres forschenden Tuns zu uns selbst (und eben nicht zu den anderen, die wir vom Erfolg der Forschung erst überzeugen wollen). Es geht darum, einen Bedingungszusammenhang zwischen Mentalität und Messung ehrlich zu erzählen. Drei der dafür nötigen Grundeinstellungen, Marken auf dem Weg zu valider Erkenntnis, sollen im Folgenden benannt werden. Sie seien wie folgt überschrieben:
1.Maß halten,
2.reflexiv bleiben,
3.nützlich sein.
1Maß halten
Geschichtslernen sei schwerer als Mathematik. – So lauteten Aussagen von Schülerinnen und Schülern sowie auch Meldungen von Zeitschriften, als in den 1990er-Jahren in Großbritannien das National Curriculum for History mit einiger Konsequenz und dem ganzen Zubehör auf ein narratives Verständnis von Geschichte umgestellt wurde. Denis Shemilt beschrieb, wenn man recht liest, fast genussvoll, wie die jungen Lernenden, bisher an die Verkündung und Wiederholung feststehender historischer Wahrheiten gewöhnt, sich von nun an abstrampeln konnten, wie sie wollten: Nie würden sie gemäß den geänderten Voraussetzungen ein hinreichendes Lernergebnis erreichen:
»First we say that there is no single right answer to the really significant questions in history and that pupils must work out for themselves. Then we say: ›But not any answer will do. Some answers are indefensible even if no one answer is clearly right! And some admissible answers are not as good as other admissible answers.‹ Pupils then spend considerable time and effort learning how to determine which answers and accounts are better than others. If they succeed we say: ›But even though some accounts are better because more valid or coherent or parsimonious than others, there is no one best account, since we find it useful to vary questions, assumptions and perspectives.« (Shemilt, 2000, 98)
Ob unter solchen Bedingungen Ranke, Nipperdey, die Mommsens hätten Historiker werden wollen? Denn in der Tat: Heute gehen wir mit einiger Leichtigkeit davon aus, dass bereits Siebt-, ja Fünftklässler »Geschichte« als »sprachlich verfasste« »Konstruktion« oder, im Lautwert geheimnisvoller noch, »Konstrukt« in einer Art durchschauen sollen, wie dies vor fünfzig, geschweige vor hundertfünfzig Jahren noch kaum einem Fachmann geläufig gewesen ist: Dass ein Unterschied zwischen Quelle und Darstellung gemacht werden soll, ist als Erkenntnisprinzip abseits von frühen Außenseitern wie Droysen noch kaum ein halbes Jahrhundert alt. Die Standortgebundenheit von Geschichtsschreibung als conditio sine qua non wurde die längste Zeit eben nicht, wie heute, entweder resigniert oder aber stolz (an-)erkannt, sondern als durch Kritik auszumerzender Mangel eingestuft. Dass schließlich Geschichtsschreiberinnen und Geschichtsschreiber Erzählerinnen und Erzähler von möglichst vielen Geschichten sind oder sein sollten, von Geschichten mit argumentativen und diskursiven Anteilen, noch dazu well-written narratives, ist zumindest in Deutschland immer noch gar nicht Konsens. Es soll aber, zumal unter dem Leitstern der narrativen Kompetenz, das Maß historischen Lernens in der Schule sein. Freilich führt zur empirischen Erforschung dieser Grundeinstellung kein direkter Weg.
Eher gilt weiterhin die Bedingtheit, Beschränktheit und Kleinigkeit der in den entsprechenden fachlichen Studien verfolgten Fragen bzw. der verwertbaren Resultate. Jedoch ist Häme in Nachfolge alter, jetzt sprichwörtlich gewordener Abqualifizierungen etwa eines »Fingerhuts« von Erkenntnis durch »Fliegenbeinzählen« ganz fehl am Platze. Denn liest man die in den oben erwähnten Überblickswerken aufmarschierenden Studien chronologisch, synoptisch und im Zusammenhang, scheint es tatsächlich so, dass die eingeschlagene Richtung die eines Strebens nach immer größerer Systematisierung, nach Anschlussfähigkeit zu möglichst vielen Seiten, nach Komplettierung eines Bildes ist. Insofern überrascht nicht, dass häufig Fachtagungen unter überaus allgemeinen Titeln veranstaltet werden wie »Geschichtsdidaktik empirisch«, oder »Geschichtsunterricht« und dass das sogar – cum grano salis – funktioniert. Größe entsteht hier also durch Addition und Summen, nicht unbedingt den ausschweifenden Entwurf oder das visionäre Programm.
Letzteres gibt es jedoch auch. Es kann so überbordend sein, dass das eigentliche Schulfach sogar überschritten und historisches Denken bzw. Lernen nicht nur im Unterricht, sondern überall in der Gesellschaft abgebildet bzw. modelliert werden mag. Damit sind diese Konzepte noch größer als das ohnehin ja schon große PISA-Projekt, das sich freilich bislang nicht auf das Fach Geschichte erstreckt und das, bei allem, was man ihm an Gigantomanie vorwerfen kann – die gerade zu jener Schieflage geführt hat, welche im Namen antizipiert wurde –, dem Grundsatz nach nur auf Messungen von dem beruhen sollte, was üblicherweise Schulstoff in den betreffenden Fächern ist. Selbstverständlich kann an dieser Stelle die HiTCH-Studie (»Historical Thinking – Competencies in History«, Trautwein et al., 2017),4 ein veritables large-scale assessment, nicht außer Acht gelassen werden. In ihrem Umfang, ihrem Anspruch – eng verknüpft mit dem Kompetenzstrukturmodell der FUER-Gruppe unter Waltraud Schreiber – ist sie imponierend. Ihr methodischer Aufbau (Design, mehrfache Qualitätskontrolle, Pilotierung, Haupterhebung usw.) ist schlechterdings unangreifbar. Die nach Subgruppen differenzierten Befunde müssen wie stets noch weiter geprüft und gewogen werden, wobei allerdings das Urteil nur auf einem Indizienprozess beruhen kann (die entwickelten Testaufgaben bzw. Items werden nur exemplarisch veröffentlicht). An dem umfangreichen Projektbericht stimmt indessen nachdenklich, dass die Entwicklung dieses Instruments für die Validierung eines historischen Kompetenztests auf die Konstruktion eines, bei aller behaupteten Zuverlässigkeit der »dahinter stehenden Theorie« (Trautwein et al., 2017, 117), recht ominösen »Generalfaktors« historische Kompetenz angewiesen ist, der aufgrund seiner nicht mehr steigerbaren Verallgemeinerung womöglich nur noch wenig Erklärungs- oder Bezeichnungskraft besitzt (Trautwein et al., 2017, 95).5 Diese stupende Grundsätzlichkeit des Zugriffs, wo es doch eigentlich, wie gesagt, um eine eng umgrenzte intellektuelle Operation, noch dazu in einem beschränkten öffentlichen Raum (Schule), geht bzw. gehen sollte, wirft Fragen auf, denn er ist ja gepaart mit der praktischen Notwendigkeit, einen nicht zu langen, nicht zu umfangreichen Fragebogen (hier »Testheft«) für die Erprobung eben jener »Generalkompetenz« zu entwerfen. Das passt nur schwer zusammen. – Was den Menschen im Grundsatz, gänzlich oder in mental basierten Teilbereichen wie der Fähigkeit, zu lieben, zu streben, zu gestalten oder zu trauern, ausmacht, haben Schriftstellerinnen und Schriftsteller seit Generationen im dichterischen Experiment zu ergründen versucht; gelungen ist dies bisher nicht, was begrüßt werden soll, da sonst ja die Produktion von Literatur, Theater, Film einzustellen wäre. Wie aber soll