Den sprachtheoretischen Hintergrund von gebrauchsbasierten Spracherwerbstheorien bildet die Auffassung, dass in Bezug auf die mentale Repräsentation unserer Sprachfähigkeit die mentale Grammatik (der L1) aufs Engste mit dem mentalen Lexikon verknüpft ist. Modelliert wird dies als Konstruktionsgrammatik.
Konstruktionsgrammatiker:innen wie Lakoff (1987), Goldberg (1995, 2006) oder Croft (2001) gehen davon aus, dass sich die Struktur einer Sprache vollständig durch Form-Bedeutungspaare, sogenannte Konstruktionen, beschreiben lässt, beispielsweise:
1. | Uhr / ‚Instrument zur Zeitmessung‘ |
2. | Vtransitiv-bar → X ist V-bar / ‚X kann man V-en.‘ |
(z. B.: V = mach- → X ist machbar. / X kann man machen.) | |
3. | Form: [[NPNom] [V] [NPDat] [NPAkk]] / ‚Übertragung eines Besitzverhältnisses’ |
(z. B.: Die alte Dame gibt dem Gärtner einen Brief.) |
Die Beispiele illustrieren, dass sich der Konstruktionsbegriff auf alle linguistischen Beschreibungsebenen bezieht, so etwa in (1) die Ebene der Lexeme, die Ebene von Morphemverknüpfungen (Wortbildungsstruktur (2) und Flexionsstruktur), die Ebene der syntaktischen Struktur von Phrasen und Sätzen (3).
Konstruktionen sind auch kombinierbar: In dem Beispielsatz unter (3) manifestiert sich nicht nur eine Gesamtkonstruktion zur Übertragung eines Besitzverhältnisses; [die alte Dame] ist auch für sich betrachtet eine Nominalphrasenkonstruktion mit ‚Artikel – Adjektiv – Nomen‘ im Nominativ, die wiederum aus drei einfachen Konstruktionen bzw. Lexemen (die, alte, Dame) besteht.
In der Modellierung von kognitivem Sprachwissen in einer Konstruktionsgrammatik wird für das abstrakte grammatische Muster (das SchemaSchema) keine mentale Repräsentation unabhängig von der Abstraktionsbasis der lexikalischen Einheiten angenommen. Entsprechend geht der gebrauchsbasierte Spracherwerbsansatz davon aus, dass die Musterfindung und das Erkennen einer Konstruktion stets bei den konkreten Äußerungen auf Inhaltsebene beginnen.
Für die sich nur langsam entfaltenden AbstraktionsprozesseAbstraktionsprozesse ist ein erster Schritt wesentlich: Kinder erwerben komplexe sprachliche Ausdrücke und Konstruktionen ihrer L1 zunächst in Form von sprachlichen Gestalten ‒ d. h. in größeren, unanalysierten Einheiten, als ChunksChunks (siehe den nächsten Abschnitt, Kap. 3.3). Leitend ist der Inhalt, also die Bedeutung eines Chunks und wie man mit ihm in einer Kommunikationssituation agieren kann. Hypothesen über die Form der Konstruktion, d. h. über den Strukturaufbau und das zugrundeliegende grammatische Muster des Chunks, welches sich auch in anderen Ausdrücken findet und sich für die Bildung neuer Ausdrücke nutzen lässt – solche Generalisierungen werden erst nach Aneignung einer kritischen Massekritische Masse memorierter Ausdrücke unterschiedlicher Komplexität initiiert (vgl. Tomasello 2003, 2006).
Das bedeutet: Um ein Muster zu erkennen, braucht es eine Basis an zahlreichen gleichen, aber auch leicht variierenden Äußerungen. Dies macht die Art und Quantität des Inputs zu einer wesentlichen Größe im Erwerbsprozess.
Eine zentrale Frage, die sich in diesem Kontext stellt, ist, in welchem Verhältnis Wiederholung und Variation stehen müssen, damit der Erwerb optimal verläuft. Wesentlich ist in diesem Zusammenhang die Unterscheidung zwischen TokenfrequenzTokenfrequenz (der Vorkommenshäufigkeit eines konkreten Elements) und TypefrequenzTypefrequenz (dem Vorkommen von verschiedenen Vertretern eines zugrunde liegenden Musters). Beide FrequenztypenFrequenztypen lassen sich auf allen sprachlichen Ebenen ermitteln (Bryant 2012a: 195): So gilt beispielsweise für die Domäne der dynamischen lokalen Verben, dass die Typefrequenz von Fortbewegungsverben (gehen, fahren, kriechen, schleichen, schlendern, rennen, sprinten, fliegen, …) in den meisten Kontexten höher ist als die von kausativen Positionsverben (setzen, stellen, legen, stecken, …). Und innerhalb der Fortbewegungsverben ist gehen der Vertreter mit der höchsten Tokenfrequenz. Wie ist der Input nun optimal anzureichern? Angenommen, das Erwerbsziel ist ‚Fortbewegungsverben + rein‘. Ist es für den Erwerbsprozess günstiger, nur den Hauptrepräsentanten (als prototypischen Vertreter) der Fortbewegungsverben in hoher Tokenfrequenz anzubieten, vgl. (1), oder sollte man die Typefrequenz lancieren, vgl. (2), oder entspricht eine Kombination aus hoher Tokenfrequenz beim Prototypen und moderater Typefrequenz, (vgl. (3)), dem optimalen Input?
(1) | reingehen, reingehen, reingehen, reingehen, reingehen, reingehen, reingehen, reingehen |
(2) | reingehen, reinlaufen, reinrennen, reinfahren, reinschleichen, reinspringen, reinstolpern, reinstürzen |
(3) | reingehen, reingehen, reingehen, reingehen, |
reinlaufen, reinfahren, reinschleichen, reinspringen |
Casenhiser & Goldberg (2005) haben (anhand anderer Konstruktionen einer zu lernenden Kunstsprache) gezeigt, dass (3) das ideale Angebot für die Lernenden darstellt. Warum?
Eine hohe Tokenfrequenz führt zur Verankerung/Einschleifung, indem sie starke Gedächtnisspuren hinterlässt, während die Variation der Types zur Abstraktion führt. (Tomasello 2003, zitiert in Behrens 2009: 399; eigene Übersetzung)
Durch die hohe Tokenfrequenz wird eine solide Ankerstruktur gelegt, die Wiedererkennen ermöglicht. Durch die Typefrequenz wird die Analogiebildung und Musterfindung angeregt. Mangelt es in sensiblen Erwerbsphasen an Types, kommt es zur FossilisierungFossilisierung der AnkerstrukturAnkerstruktur. Dieser Effekt zeigt sich beispielsweise bei einigen DaZ-Lernenden, wenn sie als einziges Fortbewegungsverb gehen verwenden oder bei statischer Lokalisierung nur sein gebrauchen. Dem ist mit rechtzeitiger TypevarianzTypevarianz beizukommen (Bryant 2012a: 195).
Laut Casenhiser & Goldberg (2005) entspricht das Token-/Type-Frequenzmuster 4+/1-1-1-1 von (3) in etwa dem elterlichen Input, und zwar sprachübergreifend (u.a. Cameron-Faulkner et al. 2003). Ein solches Muster, bei dem ein Type oder einige wenige Types in hoher Tokenfrequenz vorkommen, während die anderen Types in deutlich niedrigerer Frequenz auftreten, nennt man aufgrund der ungleichen Verteilung skewed (‚schief‘, ‚verzerrt‘). Diese Art von Input gilt als typisch für die kindgerichtete Sprache im L1-Erwerb und wird auch als begünstigend im L2-Erwerb erachtet (u.a. Bybee 2008).
Die empirische Evidenz für den gesteuerten L2-Erwerb ist jedoch widersprüchlich (siehe Madlener 2015, 2016). In ihrer eigenen Unterrichtsstudie, die Madlener mit erwachsenen Deutschlernenden auf B2-Sprachniveau unter verschiedenen Inputbedingungen durchgeführt hat, konnten die Lernenden nicht vom ‚schiefen‘ Frequenzmuster profitieren, aber von einer niedrigen Typefrequenz bei hoher Tokenfrequenz eines jeden Types. Daraus ableitend, empfiehlt Madlener, dass Sprachlehrbücher die Typefrequenz am Anfang des Aneignungsprozesses eines Musters eher sparsam dosieren sollten:
Zukünftige Lehrwerke für Deutsch als Zweitsprache sollten daher grundsätzlich Inputfluten bereitstellen, um die Chancen für beiläufiges Grammatiklernen konsequent zu erhöhen. Darüber hinaus zeigt unsere Studie, dass der Erfolg des beiläufigen Grammatiklernens aus Inputfluten mit geringerer lexikalischer Dichte (d. h. reduzierter Typefrequenz) zunimmt. Dies deutet darauf hin, dass man den Lernenden die Möglichkeit geben sollte, neue Muster im Input mit niedriger Typefrequenz zu erkennen, bevor sie dazu gedrängt werden, eine größere Vielfalt an lexikalischen Konkretisierungen für die Zielkonstruktion zu entdecken. Es sollte daher vermieden werden, dass die Lernenden gleichzeitig mit dem Erwerb eines neuen Musters auch neues Vokabular lernen, da dies zu einer kognitiven Überlastung führt. Daher sollte