Internetadressen. Das kleine Maus-Icon am Rand kennzeichnet Verweise
Wie in der Linguistik üblich und deshalb nicht noch einmal anhand von Symbolen erläutert, kennzeichnen einem Satz vorangestellte Fragezeichen eine zumeist semantische Markiertheit. Konzeptualisierungen sind mit Kapitälchen hervorgehoben, Großbuchstaben markieren Ergebnisse von Schlussfolgerungsprozessen.
Sie werden in diesem Buch eine Vielzahl von authentischen sprachlichen Beispielen finden, zur Kennzeichnung der Quelle im Fließtext haben wir auf Kurzzitate zurückgegriffen, d. h. dass auch die Internetadressen nur verkürzt angegeben wurden. Im Anhang dieses Buches finden Sie ein Quellenverzeichnis für die in der Arbeit verwendeten sprachlichen Belege, sofern sie nicht aus zugangsbeschränkten (privaten) Profilseiten stammen. Diese Quellenangaben sind jeweils der Beispielnummer zugeordnet, unter der sie im Fließtext erscheinen. Aus Datenschutzgründen sind bei Daten aus privaten Profilseiten alle Urheber*innen anonymisiert. Wenn innerhalb von sprachlichen Belegen Klarnamen (Vor- und Zunamen) auftauchten, die nicht veröffentlicht werden dürfen, wurden diese durch XYZ ersetzt.
Zur Illustration einiger weniger Annahmen wurden auch Beispiele konstruiert, diese sind dann daran zu erkennen, dass keine Quelle angegeben ist oder in der Quellenangabe darauf verwiesen wird, dass es sich um ein zu Veranschaulichungszwecken modifiziertes Beispiel handelt. Phänomene wie orthographische oder grammatische Fehler oder außergewöhnliche Schreibweisen treten so häufig auf, dass die Leserlichkeit gestört worden wäre, hätten wir sie jedes Mal mit einem [sic!] gekennzeichnet.
Unser DankWir danken Tillman Bub, Karin Burger, Bernd Villhauer und Celestina Filbrandt vom Narr-Verlag nicht nur für die vertrauensvolle, äußerst angenehme und vor allem konstruktive Zusammenarbeit, sondern auch für ihre Aufgeschlossenheit, ihre Geduld und Flexibilität.
Unsere Studierenden Toivo Glatz, Jonas Nölle, Isabella Knapp, Gerrit Kotzur, Julia Schirnhofer, Carina Stöckler und Alexander Zahrer gaben uns hilfreiche Rückmeldungen und stellten ihre Argusaugen zur Verfügung, ein großes Dankeschön dafür.
Unseren beiden wunderbaren Chefs, Monika Schwarz-Friesel und Paul R. Portmann-Tselikas, danken wir ebenso für die moralische und inhaltlich sehr wertvolle Unterstützung wie Thomas Wischnowski und Hildegard Weidacher-Gruber. Unseren Familien und Freunden können wir ohnehin gar nicht genug danken. Sie mussten über Monate zwei im kreativen Schreibprozess Befindliche ertragen. Obgleich sich noch Stoff für eine Fortsetzung auf unseren Schreibtischen stapelt, bleibt dieses Weihnachten der Rechner aus. Versprochen.
Berlin und Graz, im November 2013 Konstanze Marx, Georg Weidacher
1 Methoden der Internetlinguistik
Lässt sich das WWW als Datenpool für sprachliche Belege nutzen?
Welche Datenerhebungsmethoden gibt es?
Wie sind Internetquellen zu zitieren und zu bibliographierenbibliographieren?
1.1 Das Internet als Datenpool
Das World Wide Web (WWWWWW) ist ein für Sprachwissenschaftler*innen geradezu unerschöpflicher Datenpool, der sich zudem kontinuierlich neu generiert. Wissenschaftliche Fachtexte, journalistische Artikel, Kommentare von Leser*innen, virtuelle Plaudereien, Zeugnisse sozialer Kontaktpflege, Blogs oder Tweets sind gerade einmal den sprichwörtlichen Mausklick entfernt. Expert*innen und Lai*innen, Jugendliche und Erwachsene, politisch Motivierte, Spaßorientierte, Gelangweilte oder Wütende geben ihr Wissen und/oder ihre Überzeugungen preis, wollen sich unterhalten oder nutzen das quasi-öffentliche Forum, um ihren Gefühlen Ausdruck zu verleihen.
Bevor sich Web 1.0 und Web 2.0 etablierten, mussten spontan produzierte Sprachdaten mit viel Aufwand erhoben und mühsam transkribiert werden. Insbesondere dank zahlreicher Social-Media-Anwendungen (wie Facebook, YouTube, Twitter, Tumblr, Nutzer- und Diskussionsforen etc.) scheinen sich die Zugänglichkeitsbedingungen für Sprachdaten erheblich verbessert zu haben. Selbst E-Mail-Anbieter binden Kommentarfunktionen in ihre Nachrichtenportale ein. Das heißt, dass das Abfragen der E-Mails nicht nur damit verbunden werden kann, auf schnellem Wege neueste Informationen zu erhalten. Nutzer*innen können sich zudem gleich zu den im Nachrichtenportal präsentierten Inhalten äußern und liefern damit jede Menge sprachliches Material.
Auf diese Weise werden verschiedene Textsorten, wie Artikel, Nachrichtentexte oder Nutzerkommentare, deren Form und Inhalt für spezifische linguistische Fragestellungen relevant sein kann, relativ unproblematisch und mit wenig Zeitaufwand verfügbar. So scheint es unkompliziert, Zugang zu diesen sprachlichen Daten zu erhalten. Dennoch gestaltet sich die Korpusgenerierung schwierig. Das liegt auch daran, dass Nutzer nach wie vor anonym (in Foren oder Nutzerkommentaren) und/oder unter Scheinidentitäten (auf Twitter, Instagram und teilweise auch auf Facebook) agieren. Zwar trägt das sicherlich zum Abbau von Hemmungen bei und begünstigt, dass sprachliche Daten überhaupt entstehen und „veröffentlicht“ werden, es birgt aber auch methodische Nachteile: Erstens, ohne technische Hilfsmittel können die Urheber*innen der Texte kaum ermittelt werden, insbesondere in den Fällen, in denen sich die „Kommentator*innen“ Pseudonyme (vgl. dazu auch den Abschnitt zu Nicknames) geben. Zweitens kann die Situation, in der der Text entstanden ist, nicht kontrolliert werden, so dass keine Aussagen darüber getroffen werden können, ob es sich beispielsweise um eine spontan produzierte Äußerung handelt oder ob der*die Verfasser*in des Kommentars seinen*ihren Text vorformuliert hat bevor er*sie ihn „veröffentlichte“. Eine dritte Schwierigkeit ergibt sich mit der Frage, inwieweit andere (und das schließt (Sprach-)Wissenschaftler*innen ein) überhaupt berechtigt sind, diese Daten für ihre Zwecke zu nutzen.
1.2 Aber wem gehören die Daten?
Im Umgang mit den Daten aus dem WWW drängt sich die Auffassung geradezu auf, dass die Daten, die hier veröffentlicht werden, jedem und jeder gehören. Sie sind zugänglich, ihre Urheber*innen haben sie „veröffentlicht“ und damit einem Publikum zur Verfügung gestellt. Keine anderen Merkmale aber treffen auf Informationen zu, die in Büchern veröffentlicht worden sind. Sie sind ebenfalls frei lesbar, ihre Vervielfältigung und Weiterverwendung ist jedoch gesetzlich geregelt. So entspricht es nicht der seriösen Forschungspraxis, Daten aus einem Buch schlicht zu übernehmen, ohne das zu kennzeichnen und auf den*die Autor*in zu verweisen. Die wenigsten wissen jedoch, dass auch für die Verwendung von Daten aus dem WWW eindeutige und verbindliche juristische Vorgaben zu beachten sind.
Es ist grundsätzlich davon auszugehen, dass „veröffentlichte“ Daten dem*der Urheber*in gehören und damit unter das Urheberrecht1 fallen. In vielen Fällen sind also die Daten, die im Internet kursieren, gesetzlich bis 70 Jahre nach dem Tod des Urhebers/der Urheberin geschützt. Auch bei kleineren, einfachen Texten ist im Zweifel von einer sogenannten Schöpfungshöhe auszugehen, d. h. dass das „Werk“ – und darunter fallen dann auch internetbasierte (Kommunikations)beiträge – als geschützt gilt.