Standardsprache zwischen Norm und Praxis. Группа авторов. Читать онлайн. Newlib. NEWLIB.NET

Автор: Группа авторов
Издательство: Bookwire
Серия: Basler Studien zur deutschen Sprache und Literatur
Жанр произведения: Документальная литература
Год издания: 0
isbn: 9783772000249
Скачать книгу
OberösterreichÖsterreich SüdostKärnten, SteiermarkÖsterreich OstWien, Niederösterreich, BurgenlandSchweizgesamtOstbelgiengesamtLiechtensteingesamtLuxemburggesamtSüdtirolgesamt

      Tab. 1: (derzeitige) Einteilung der deutschsprachigen Regionen in Areale im ‚Variantengrammatik‘-Projekt

      Eine pluriareale innerschweizerische Gliederung kann bislang nicht (statistisch) bestätigt werden;2 die areale Grundgliederung wurde entsprechend im Projektverlauf angepasst. Dadurch, dass die Sitze der jeweiligen Zeitungen als Metadaten erhoben wurden, sind von Fall zu Fall sogar noch kleinräumigere Einteilungen möglich (etwa, wenn die Zeitungen aus Altbayern – also nur einem Teil des Areals Deutschland Südost – und Österreich einen ähnlichen Sprachgebrauch aufwiesen). Der Vorteil dieser Vorgehensweise ist evident: Nationale Grenzziehungen im plurizentrischen Sinne sind dank der Annotation der jeweiligen Ländernamen weiterhin möglich, aber solche Grenzziehungen sollen nur noch dort zum Einsatz kommen, wo sie tatsächlich quantitativ nachweisbar sind. Dass dabei bisher ‚nur‘ die Schweizer Areale (ursprünglich unterschied das Projektteam in West, Ost und Süd) wieder zusammengefasst worden sind, lässt an dieser Stelle bereits erahnen, dass die pluriareale Anlage für Deutschland und Österreich bisher der Empirie angemessener scheint. (Dazu gleich mehr, wenn es um einzelne Phänomene geht.) Abschließend hierzu sei noch thematisiert, dass auch die ‚regionalen‘ Einteilungen mehrheitlich geopolitische sind, sich nämlich an Bundesländern und Bezirken orientieren. Man kann dies mit einer radikalen Auslegung des pluriarealen Ansatzes durchaus kritisieren und stattdessen rigoros historische und dialektale Sprachräume als Areale fordern (wobei sich auch diese ja ebenfalls bereits in historischen politischen Einheiten ausgeprägt haben können). Bedenkt man jedoch, dass Standarddeutsch (v.a. in Deutschland) zu einem beträchtlichen Teil in föderalen Schulstrukturen vermittelt wird, sich zudem (v.a. in Österreich) kulturelle Schranken mit kleineren politischen decken können (z.B. im Falle des Salzburger Pinzgaus, der anders als das übrige Salzburger Land sprachlich-kulturell eher dem Westen Österreichs zuzuordnen ist) und außerdem die Verbreitung der Printversionen der herangezogenen Zeitungen mit kommunalen oder Landesgrenzen zusammenfallen kann (v.a. bei ehemaligen DDR-Bezirks-Zeitungen, die heute als Regionalzeitungen weiterbestehen3), macht eine Einteilung nach Bundesländern und Bezirken durchaus Sinn.

      Die Texte, einzelne Online-Zeitungsartikel, wurden sowohl nach den außersprachlichen Metadaten (Zeitung, Areal [‚Sektor‘], Land) wie auch linguistischen Aspekten (pos-Tagging, rfpos-Tagging, Satz- und Teilsatztagging, sowie Tagging nach dem topologischen Modell) automatisch annotiert. Mittels der Plattform CQPweb kann nun das gesamte Datenmaterial digital per Suchmaschine durchsucht werden, als Suchsyntax dienen reguläre Ausdrücke (was auch Platzhalter- und Zeichenabstand-Operatoren miteinschließt).

      Abb. 3: Screenshot CQPweb (Abfrage für feminines Genus bei [E-]Mail)4

      Um areale Varianten identifizieren zu können, wurde eine Datenbank erstellt, in der Hinweise auf bestehende areale Variation aus Gegenwartsgrammatiken und Stilratgebern gesammelt wurden. Diese mutmaßlichen bestehenden arealen Varianten wurden zunächst per Suchsyntax gesucht. Die Belege für Varianten werden dabei strikt nach ihrer Frequenz beurteilt. Das heißt: Standarddeutsch definiert sich nach diesem Ansatz nicht explizit, aber faktisch vorrangig nach Frequenz – was nicht frequent genug ist, kann zwar auch standarddeutsch sein, wird jedoch nicht von der ‚Variantengrammatik‘ beschrieben. Da die ‚Variantengrammatik‘ nur areale Varianten beschreiben möchte, die häufig genug sind, um sich mit ihrer Verwendung in einem bestimmten Areal möglichst unauffällig zu äußern, fallen also niederfrequente Varianten einem Frequenz-Bias ‚zum Opfer‘.

      Die Festlegung beschreibenswerter Varianten fußt auf statistischen Tests wie dem Chi-Quadrat-Test. Bei hohen Belegzahlen (bei über 500 Belegen) werden bspw. Stichproben von 20 % der Belege gezogen und per Hand ausgezählt. Darüber hinaus berücksichtigt die ‚Variantengrammatik‘ Fehlerquoten beim Tagging (i.d.R. liegen diese bei 2 % und weniger). Für die folgende Darstellung sind v.a. die Verbalisierungen relevant, mit denen die ‚Variantengrammatik‘ für einzelne Varianten arbeitet:

‚mehrheitlich verwendet‘:51 %+ der Variable
‚gebräuchlich‘:21–50 % der Variable
‚kommt (selten) vor‘:5–20 % der Variable
‚sporadisch‘:<5 % der Variable

      Dabei ist ein Punkt essenziell: Falls nicht genügend absolute Belege, nämlich mindestens 10, für die Varianten einer Variable (oder für eine Variante ohne klar zu benennende Gegenvariante[en]) innerhalb eines Sektors zu finden sind, oder falls sich die Gegenüberstellung der Varianten als statistisch nicht signifikant herausstellt, wird die gesamte Variable als nicht untersuchbar bzw. nicht darstellbar bewertet. Die absolute Marke der 10 Belege wird auch bei Phänomenen vermerkt, die in anderen Arealen genügend Belege erreichen. D.h., falls dennoch in einem bestimmten Sektor für die Varianten weniger als 10 Belege vorliegen, werden diese Ergebnisse mit ‚(u.S.)‘ (‚unter Schwellenwert‘) markiert. Ohne einen solchen Hinweis darf der Leser davon ausgehen, dass die absoluten Belegzahlen höher liegen. ‚(u.S.)‘-Ergebnisse werden zudem nur sekundär in die Interpretation arealer Gegebenheiten miteinbezogen. Die Angabe ‚(k.B.)‘ drückt aus, dass sich in einem Sektor ‚keine Belege‘ für die gesamte Variable finden, in anderen Arealen aber sehr wohl. Alle Tests, Schwellenwerte und Bezeichnungen wurden im Projektverlauf erarbeitet und anschließend in der Praxis erprobt, es handelt sich also nicht um vorher festgelegte Vorgaben.

      Die von der ‚Variantengrammatik‘ verfolgte quantitative Methodik zur Beschreibung des Standarddeutschen ist sicherlich diskutabel. Immerhin ist es jedoch die m.W. erste größere ihrer Art, die gänzlich auf statistisch-korpuslinguistischen Verfahren basiert und zudem nicht mit a-priori-Klassifizierungen arbeitet, sondern mit einer im Verlaufe des Projekts erarbeiteten und angepassten, darum hinreichend getesteten Methodik.

      4. Grammatische Fallbeispiele

      In diesem Kapitel präsentiere ich einige grammatische Phänomene, die areal im Standarddeutschen variieren. Ich habe diese zum einen danach ausgewählt, ob die Ergebnisse bereits hinreichend ausgewertet waren, zum anderen habe ich versucht, möglichst aus unterschiedlichen grammatischen Bereichen Beispiele zu zeigen: aus der Flexionsmorphologie (Pluralbildung mit -e vs. -s am Beispiel Balkon), aus der Morphosyntax (Genusvariation am Beispiel [E-]Mail), aus der Wortbildung (Adverbienbildung -Ø vs. -s am Beispiel durchweg-) und nicht zuletzt aus der Syntax (Trennbarkeit von Verben, hier widerspiegeln). Alle Ergebnisse sind als statistisch signifikant getestet. Die Treffer sind fast ausnahmslos grammatisch eindeutig, d.h. nicht ambig (mit einer durchschnittlichen Quote von ‚false positives‘ unter 2 %), die Treffer sind – wo dies vom Aufwand her möglich war – teilweise alle zusätzlich per Hand einzeln überprüft (z.B. sind bei 4.1 die Belege für Balkons so verifiziert), mindestens aber 20 % der Treffer.

      4.1. Variation der Pluralbildung: Balkon

      Bei einigen Wörtern kann die Bildung des Plurals areal im Standarddeutschen variieren. Der Gebrauch des -e-Plurals kann dabei dem des -s-Plurals gegenüberstehen, so z.B. bei den aus dem Französischen entlehnten Substantiven Balkon, Ballon und Karton (vgl. auch im VWB, Ammon et al. 2004: 44–45). Ich behandle hier nur den Fall Balkon; bei Ballon und Karton können areale Präferenzen zwar ähnlich, aber schwächer zum Vorschein kommen als bei Balkon. Die Beschreibung des VWBs lässt erwarten, dass der Plural Balkone eher im Süden des Sprachgebiets gebraucht wird, wohingegen Balkons eher im Norden verwendet wird, analog zu den Aussprachepräferenzen [bal’koːn] im Süden und [bal’kɔŋ] und [bal’kõː] im Norden (vgl. Ammon et al. 2004: 44–45).

      Für Balkon als Simplex wie als Grundwort (Determinativum) einer Komposition liegen 219 Fälle von Plural auf -s vor (Balkons/