Die Annahme einer direkten Interaktion zwischen der Syntax und der Prosodie ist unter anderem auf die Wortstellungstypologie zurückzuführen, die Sprachen je nach Abfolge des Subjekts und des Verbs in zwei Gruppen einteilt (cf. Harlig/Bardovi-Harlig 1988, 129):
Typ A: S vor V, mit den Subtypen A1: SVO und A2: SOV
Typ B: V vor S
Das grundlegende Kriterium, auf dem diese Klassifikation basiert, ist in der Regel die Frequenz der syntaktischen Muster.1 (cf. Dryer 1995, 105) Als syntaktisch unmarkierter Satztyp gilt dementsprechend ein aktiver affirmativer Deklarativsatz.2 (cf. Givón 1979, 87) In weiterer Folge wurde versucht, einen Zusammenhang zwischen der Abfolge der Konstituenten im Satz und den jeweiligen Akzentuierungsmustern der Sprachen herzustellen. (cf. Harlig/Bardovi-Harlig 1988, 130) Dezső (1978, 6) etwa brachte SVO-Sprachen mit postverbalem stress und SOV-Sprachen mit präverbalem stress in Verbindung. Daraus resultierte schnell die Einschätzung, es handle sich weniger um reine Korrelationen als vielmehr um einen kausalen Zusammenhang, wonach die Position des Akzents durch die Wortstellung bedingt sei. Das kann jedoch alleine schon deshalb nicht der Fall sein, da Sprachen existieren, die zwei verschiedene unmarkierte Abfolgen (en. split word order), aber nur ein Akzentuierungsmuster aufweisen. So zeichnet sich etwa das Ungarische durch präverbalen stress bei beiden Basisabfolgen SOV und SVO aus.3 (cf. Harlig/Bardovi-Harlig 1988, 142)
Ein Durchbruch in der Analyse des Zusammenspiels der beiden Ebenen ist für viele durch die Erkenntnis gelungen, auf welche Art und Weise die syntaktische Struktur von Sätzen deren prosodische Realisierung beeinflusst. Dies geschieht nach heutiger Auffassung durch ein Mapping der morphosyntaktischen Einheiten zu unterschiedlich großen prosodischen Einheiten, wodurch prosodische Hierarchien entstehen.
Wie aus der jeweiligen syntaktischen Struktur eine bestimmte prosodische Phrasierung abgeleitet werden kann, ist Gegenstand zahlreicher konkurrierender Theorien, die entweder die (syntaktischen) Konstituenten einer Äußerung oder deren Ränder als Grundlage des Mapping heranziehen.4 (cf. Féry 2010b, 272–273) Die Annahme von Intonationsphrasen (IP) sowie von phonologischen/prosodischen Wörtern (pw/ω) als Resultate des Mapping ist heute relativ unumstritten. Weniger Konsens herrscht in der Frage, welche und wie viele Ebenen dazwischen anzunehmen sind und wie diese bezeichnet werden sollen. (cf. Féry 2010b, 272) Meist wird von einer Zwischenstufe, der phonologischen/prosodischen Phrase (pp/φ), ausgegangen. Notwendige Voraussetzung für diese Einheit ist nach allgemeiner Auffassung das Vorhandensein eines Pitch-Akzents. (cf. Féry 2010b, 273) Als weitere Einheiten unterhalb des prosodischen Wortes werden, wie in Abbildung 14 dargestellt, der Fuß (F) und die Silbe (σ) angenommen.5
Abb. 14: Prosodische Hierarchien (Hall 2000, 313)
Die Feststellung, dass Sätze wie (37)–(38) existieren, die aus oberflächensyntaktischer Sicht vergleichbar sind, aber in unterschiedlichen Phrasierungen resultieren, hat in der Folge zu der Hypothese geführt, dass die Tiefenstruktur für die Phrasierung verantwortlich ist.
(37) | dt. | [[Moritz]pp [hat in Stuttgart übernachtet]pp]IP. |
(38) | dt. | [[Moritz]pp [hat in Stuttgart]pp [gesungen]pp]IP. (Féry 2010b, 274–275) |
Nach Hartmann (2007) muss sowohl zwischen Phrasenköpfen und Komplementen als auch zwischen Argumenten und Adjunkten unterschieden werden. In einem pragmatisch neutralen Satz bilden die (internen) Argumente zusammen mit ihren Köpfen eine prosodische Phrase. Adjunkte bilden hingegen stets eine eigene Phrase.6 (cf. Hartmann 2007, 224) Damit kann auch die unterschiedliche Phrasierung der oben angeführten deutschen Beispielsätze, in denen die Präpositionalphrase einmal als Argument (37) und einmal als Adjunkt (38) fungiert, erklärt werden. (cf. Féry 2010b, 274)
Unterschiedliche Phrasierungen sind im Deutschen auch in Sätzen mit intransitiven Verben zu beobachten. Sofern man wiederum die Präsenz eines Pitch-Akzents als Bedingung für eine prosodische Phrase annimmt, weisen Äußerungen mit inergativen Verben, wie jene in (39), zwei prosodische Phrasen auf, Strukturen mit unakkusativen Verben, wie die in (40), nur eine. (cf. Féry 2010b, 273–274)
(39) | dt. | [[Ein JUNGE]pp [TANZT]pp]IP. |
(40) | dt. | [Die DIVA ist gestorben]pp/IP. (Féry 2010b, 274) |
Ein Einfluss auf die Phrasierung ist schließlich auch auf die Informationsstruktur zurückzuführen, und zwar insofern, als informationsstrukturelle Kategorien wie Fokus die Akzentstruktur einer Äußerung modifizieren, was – wie die Gegenüberstellung der Sequenzen (41) und (42) zeigt – wiederum Veränderungen hinsichtlich der Phrasierung implizieren kann.7 (cf. Féry 2010b, 275)
(41) | en. | (What happened?) – [[MAX]pp [stole a CHICKEN]pp]IP. |
(42) | en. | (Who stole a chicken?) – [MAX stole a chicken]pp/IP. (Féry 2010b, 275) |
Féry (2010b) schlägt vor, die Auswirkungen der Syntax auf die Prosodie von jenen der Informationsstruktur klar zu trennen. Während die Phrasierung allein von der Syntax ausgehe, werde die Präsenz und die Höhe von Pitch-Akzenten, wie in Kapitel 3.2 beschrieben, durch die Informationsstruktur bestimmt. Die Autorin setzt für die Annahme von prosodischen Phrasen dementsprechend nicht das Vorhandensein eines Pitch-Akzents voraus.8 Die Antworten in (41) und (42) weisen für Féry folglich immer die Phrasierung von (41) auf.9 (cf. Féry 2010b, 275) Damit steht Férys Ansatz in Kontrast zu anderen Modellen, nach denen sowohl die Syntax als auch die Informationsstruktur vergleichbare Auswirkungen auf die Phrasierung haben.10 (cf. Féry/Ishihara 2010, 44)
Wie Féry in einem früheren Beitrag anmerkt, ist aber auch die Präsenz von Pitch-Akzenten nicht nur von der Informationsstruktur abhängig. Für Féry und Krifka (2008) muss zuerst die phonologische Struktur des Satzes den Akzent erlauben. Ist das der Fall, ist der Akzent das präferierte Mittel zur Markierung von Fokus und Topik. (cf. Féry/Krifka 2008, 11) Auch Verfahren wie die Topikalisierung führt Féry (im Deutschen) primär auf prosodische Gründe zurück. Die Versetzung einer Konstituente an den Satzbeginn diene in erster Linie dazu, den no-clash constraint zu erfüllen, der zwei benachbarte Akzente verbietet, und erst in zweiter Linie dazu, die Konstituente mit einer ansteigenden Intonation zu versehen, um ihre Rolle als Topik zu kennzeichnen.11 (cf. Féry 2007, 69–70)
In einem anderen Beitrag stellt Féry (2010a), wie bereits in Kapitel 3.2 erwähnt wurde, den direkten Zusammenhang zwischen spezifischen Konturen und informationsstrukturellen Kategorien gänzlich in Frage: „Allerdings sind mit einem Blick auf die Fakten die Beziehungen zwischen Topik, Fokus oder Gegebenheit und speziellen Konturen bestenfalls als instabil zu nennen, und meiner Meinung nach nicht haltbar.“ (Féry 2010a, 9–10) Für die Autorin hängt demnach auch die Akzentuierung von Elementen weniger von ihren informationsstrukturellen Funktionen, sondern eher von der Position der Konstituenten im Satz ab.12 (cf. Féry 2010a, 9) Féry führt den Beispielsatz (43) an, in dem der erste Fokus, der der Autorin zufolge nicht unbedingt ein Topik ist, eine steigende, der zweite eine fallende Kontur aufweist. (cf. Féry 2010a, 10)
(43) | dt. |
(Wer hat wen gesehen?)
|