2. Zur Situation der Gesprochenen-Sprache-Forschung in Portugal und Brasilien
Im Folgenden skizziere ich meine Einschätzung der Forschungslage zur gesprochenen Sprache in Portugal und Brasilien. Dazu gehört die Darstellung von zentralen Forschungszentren und Projekten in Portugal und Brasilien, sowie eine Beschreibung von Tendenzen, Schwerpunkten und Desideraten, die sich in der mir bekannten Forschungsliteratur zum Thema benennen lassen. Gemessen an diesem hohen Anspruch – eine entsprechende umfassende Recherche und Beschreibung bedürfte eines eigenen Projekts und Veröffentlichung – möchte ich den zusammenfassenden und vorläufigen Charakter der folgenden Ausführungen herausstellen.
In Relation zu den die übrigen Teilen dieses Buches handelt es sich bei diesem Kapitel um einen ‚Exkurs‘. In ihm wird ein Thema erörtert, das eigentlich außerhalb des restlichen, ‚systematischen‘ Teil dieses Buches steht.
In Portugal ist das Centro de Línguas da Universidade de Lisboa1 (CLUL) die wichtigste Institution, die sich u.a. mit der Erforschung der gesprochenen Sprache beschäftigt. Besonders hinsichtlich der Zurverfügungstellung von geeigneten Korpora und Transkriptionen bietet dieses Zentrum eine gute Ausgangsposition für weiterführende Forschungen zum gesprochenen Portugiesisch. Die Korpora, von denen ich im Folgenden einige vorstelle, zeichnen sich durch ihren Umfang und durch ihre teilweise ‚On-line‘ Verfügbarkeit aus:
(a) 1987 wurde das Korpus „Português Fundamental. Métodos e Documentos“ veröffentlicht, das insgesamt 140 transkribierte Interviews enthält. Das zugrunde liegende Projekt datiert zurück auf 1970, in einer Zeit, in der es der Leitung des renommierten Sprachwissenschaftlers Luís Filipe Lindley Cintra unterstand. Es hatte sich zum Ziel gesetzt, spontan gesprochene Alltagsgespräche aufzunehmen und zu transkribieren. Im Zuge dieses Projekts wurden zwischen 1971 und 1974 insgesamt 1800 Gespräche aufgenommen. Von diesen wurden schließlich 1400 ausgewählt und transkribiert. Sie bilden das genannten ‚Corpus Português Fundamental = PF‘. Als Grundlage für alle Interviews diente eine Reihe von Standardfragen, die allen Gewährspersonen gestellt wurden. Bacelar do Nascimento et al. veröffentlichten aus diesem Material 1987 schließlich ein Buch mit 140 transkribierten Interviews, zu dem auch ein ‚On-line‘ Zugang besteht2. Es handelt sich um „transcrições “3 mit einigen Zusatzinformationen zu den beteiligten Gewährpersonen wie ‚Geschlecht‘ und ‚Herkunft‘. Eine neue Version des Korpus steht unentgeltlich im Catálogo da ELRA4 zur Verfügung. Sie umfasst Audiofiles im WAV-Format und einfache orthographische Transkriptionen im TXT- und HTML-Format.
(b) 2001 erschien auf CD-ROM das Korpus „Português Falado – Documentos Autênticos: Gravações Áudio em transcrições alinhadas (Instituto Camões 1995 bis 1997)5. Es waren die portugiesischen Sprachwissenschaftler Malaca Casteleiro und Maria F. Bacelar do Nascimento, unter deren Leitung dieses Projekt organisiert wurde. Das Ziel bestand darin, einen kleinen aber repräsentativen Korpus zusammenzustellen, um eine Grundlage für weitere Studien zum gesprochenen Portugiesisch in allen Regionen der Welt, in denen Portugiesisch gesprochen wird, zu erhalten. Aus den ursprünglich im Laufe dieses Projektes unter Beteiligung von 94 Gewährspersonen gesammelten Daten wurde eine Reihe von Transskripten ausgewählt, die das gesprochene Portugiesisch in Portugal, Brasilien und den ehemaligen portugiesischen Kolonien in Afrika (Angola, die Kapverden, São Tomé, Príncipe und Mozambique) repräsentiert. Auch Sprachproben aus Goa, Macau und Osttimor wurden nachträglich diesem Korpus hinzugefügt. Die Kennzeichnung dieses Korpus mittels des Attributs transcrições alinhadas besagt, dass dieses Korpus Angaben zu Pausen, Unterbrechungen wie Räuspern, unverständlichen Wiederholungen und außerhalb des eigentlichen sprachlichen Codes liegenden Lauten etc. mit einschließt. Aber wie bereits bei den ‚PF-Transkriptionen‘ wurden umgangssprachliche oder phonetisch bedingte Varianten und Abweichungen ‚geglättet‘ und der Standardorthographie angepasst. Um diese Varianten identifizieren zu können, ist eine zusätzliche Konsultation der vorhandenen Audiofiles notwendig. Wie bereits beim ‚PF-Korpus‘ steht auch eine neue Version dieses Korpus unentgeltlich im Catálogo da ELRA6 zur Verfügung. Sie umfasst Audiofiles im WAV-Format und einfache orthographische Transkriptionen im TXT- und HTML-Format.
(c) Die Phase der Datenerhebung und Auswertung und zum „Corpus de diálogo etiquetado de Português Europeu“ (Coral), die von Isabel Trancoso et al. geplant und durchgeführt wurde7, fällt in die Jahre von 1997 bis 1999. Es wurden 32 Dialoge unter Beteiligung von 16 Gesprächspersonen aufgenommen. Das entsprechende Korpus kann in Form von fünf ‚CD-ROM‘ erworben werden. Das vorrangige Ziel bestand wie so oft bei portugiesischen Forschungsprojekten zur gesprochenen Sprache in einer Untersuchung ihrer phonetischen und phonologischen Besonderheiten: „A tarefa de especificação dos elementos do mapa teve em conta, fundamentalmente, aspectos da fonética e fonologia cujo estudo é prioritário no contexto da fala espontânea em Português Europeu“ (cf. Seite 1 der in der ‚Fußnote 31‘ angegebenen Quelle). Worauf diese Priorität beruht, wird allerdings weder näher begründet noch vorab in einer Phase epistemologischer Reflexion diskutiert. Erwähnenswert ist die Zusammenarbeit verschiedener Institutionen bei diesem Projekt, zu denen das CLUL (Centro de Linguística da Universidade de Lisboa), die FLUL (Faculdade de Letras de Lisboa), die FCSH – UNL (Faculdade de Ciências Sociais e Humanas da Universidade Nova de Lisboa) sowie das INESC (Instituto de Engenharia de Sistemas e Computadores) gehörten. Angesichts der in dieser Studie vorgegebenen Untersuchungsziele scheint es im Kontext der vorliegenden Arbeit allerdings nicht erforderlich, dieses Projekt eingehender zu beschreiben.
(d) Das nächste Projekt und das auf seiner Grundlage zusammengestellte Korpus ist das ‚C-ORAL-ROM-Korpus‘, mit der ausführlichen Bezeichnung „Integrated Reference Corpora for Spoken Romance Languages“8. Das Material zu diesem Projekt, das Aufnahmen und Transkriptionen des Portugiesischen, Französischen, Spanischen und Italienischen enthält und sich zum Ziel die Untersuchung der gesprochenen Alltagssprache romanischer Sprachen gesetzt hat, ist mitsamt der erzielten Ergebnisse über den Handel als Buch und in Form von acht DVD (‚DVD 5 und 6‘ zum Portugiesischen) zu beziehen. Weil eine detailliertere Beschreibung dieses Korpus, dem ich die in diesem Buch benutzten Beispielsäußerungen entnommen habe, im folgenden ‚Kapitel 3‘ folgt, verzichte ich an dieser Stelle auf die Angabe weiterer Einzelheiten.
(e) Beim Korpus ‚REDIP‘ (Rede de Difusão Internacional do Português: rádio, televisão e imprensa) handelt es sich um eine dem Sprachgebrauch in portugiesischen Medien gewidmete Sammlung von Transkriptionen sowohl des mündlichen als auch schriftlichen Portugiesisch. Das zugrunde liegende Projekt geht auf eine Initiative des „Instituto de Linguística Teórica e Computacional (ILTEC)“ in Zusammenarbeit mit der “Universidade Aberta“ zurück, und das resultierende Korpus umfasst 330000 Wörter aus sechs Themenbereichen: Aktuelle Nachrichten, Wissenschaft, Kultur, Wirtschaft und spontane Meinungskundgebung9.
(f) Das Korpus mit den der weitaus größten Zahl von Einträgen ist das sogenannte ‚Mike-Davies-Korpus‘10 mit der genauen Bezeichnung O corpus do Português, das über die vergleichsweise gigantische Zahl von 450 Millionen Wörtern aus verschiedenen Textsorten und historischen Epochen verfügt. Hinzu kommt rund eine Billionen Belege (!) aus dem Bereich der ‚Neuen Medien‘ mit Varianten des gesprochenen kontinentalen und brasilianischen Portugiesisch. Dieses ‚Online-Korpus‘ erlaubt es, im Zusammenhang mit den erfragten Begriffen auch die zugehörigen Kontexte einzusehen.
Was die Projekte anbelangt, die auf der Grundlage der oben genannten Korpora durchgeführt wurden, noch laufen bzw. sich zurzeit in ihren Anfangsphasen befinden, scheint mir das Zitat oben unter Gliederungspunkt (c) sehr aufschlussreich zu sein. Es macht deutlich, was portugiesische Sprachwissenschaftler fast wie selbstverständlich als Ziel einer wissenschaftlichen Auseinandersetzung mit ihrer gesprochenen Sprache verstehen. Nach einer Recherche zu abgeschlossenen