4 Korpus und Methodik
In der vorliegenden Studie wird ein digitales Korpus aus vollständigen Enzyklopädieartikeln in der Korpusarchitektur CQPwebCQPweb1 aufgebaut, womit die Treffer nach Fach, Medium, Zeit und Sprache des jeweiligen Korpus ausgewertet werden können. Mithilfe der Simple-Query-SyntaxSimple-Query-Syntax oder der CQP-SyntaxCQP-Syntax lassen sich sowohl Wortformen (Tokens), Wortarten (part of speech, kurz POS) als auch Grundformen (Lemma) abfragen. Zudem bietet diese Architektur eine Reihe von korpuslinguistischen Analyseverfahren, die von relativen Häufigkeiten bis zum statistischen Vergleich von Korpora reichen.
4.1 Forschungsdesign
Vor dem Hintergrund der theoretischen Ausführungen zu Diskurstraditionen und zu deren Veränderungen in Wikipedia stellen sich die folgenden Fragen: Inwiefern unterscheiden sich Wikipediaartikel von Printartikeln? Auf welche weiteren Faktoren neben dem Medium sind Unterschiede zwischen einzelnen Enzyklopädieartikeln zurückzuführen? Der bisherige Forschungsstand stützt sich auf Ergebnisse aus einzelnen Studien, die an einer unterschiedlichen Auswahl von Artikeln durchgeführt worden sind und deswegen Aufschluss über verschiedene Aspekte der Fragestellung geben. Die vorliegende Studie erstellt ergänzend zu den bisherigen Studien ein Korpus aus insgesamt 120 Enzyklopädieartikeln, die einander nach einheitlichen Kriterien gegenübergestellt werden. Ein solches Kriterium ist die Sprache, in der die Artikel abgefasst sind. Die meisten der bisherigen Studien untersuchen die englische Sprachversion der Wikipedia und vergleichen diese beispielsweise mit englischen Printenzyklopädien wie der Britannica (cf. Elia 2008; Giles 2005) oder der Columbia Encyclopedia (cf. Emigh/Herring 2005). Im vorliegenden Korpus wird der Schwerpunkt auf romanischsprachige Artikel gelegt. Ein Korpus französischsprachiger Artikel wird mit einem Korpus italienischsprachiger Artikel verglichen. In jedem Sprachkorpus werden Artikel aus national bedeutenden Printenzyklopädien den WikipediaartikelnWikipediaartikel der jeweiligen Sprachversion gegenübergestellt. Darüber hinaus werden einige Merkmale nach Werk ausgezählt, wobei die Entstehungszeit der Werke berücksichtigt wird und das Korpus so zusammengestellt ist, dass sowohl im französischen als auch im italienischen Korpus Artikel aus Printenzyklopädien der 70er, der 90er bis 2000er Jahre und Artikel aus der Wikipediaversion von 2015 enthalten sind. Zusätzlich wird die Zugehörigkeit der Artikel zu einem der vier Fächer Chemie, Geografie, Medizin und Wirtschaft berücksichtigt und es werden Korpora der einzelnen Fächer miteinander verglichen. Die WikipediaartikelWikipediaartikel im vorliegenden Korpus sind Artikel, die sich nicht mehr im Entwurfsstadium befinden. Sie decken bekannte Themen aus den genannten vier Fachgebieten ab und sind somit mit den gleichnamigen Einträgen in den Printenzyklopädien vergleichbar. Zudem ist zu erwarten, dass die Artikel zu wichtigen wissenschaftlichen Inhalten relativ normgerecht verfasst sind, weswegen Abweichungen und Innovationen hier ein noch größeres Gewicht zukommt als in Artikeln zu Themen aus der Freizeit oder zu aktuellen Ereignissen.
An den ausgewählten Artikeln wird überprüft, welche Auswirkungen die Faktoren Sprache, Medium, zeitliche Entstehung und fachliche Zugehörigkeit auf textinterne Merkmale haben. Die Artikel werden hinsichtlich ihres Inhalts, des Grads der FachsprachlichkeitFachsprachlichkeit, der NeutralitätNeutralität der Sprache und Merkmalen informeller SchriftlichkeitSchriftlichkeit– informelle analysiert.
Forschungsdesign
Diese Analysekriterien erweitern das Spektrum der in vorherigen Studien untersuchten Aspekte. Die zu analysierenden Kriterien werden zum einen aus den traditionellen Vorgaben der Diskurstradition EnzyklopädieartikelEnzyklopädieartikel abgeleitet, zum anderen werden aber genau jene Merkmale auch in der Wikipediagemeinschaft diskutiert und finden ihren Niederschlag in Stilblättern und Normen. So sind die enzyklopädische Relevanz von Inhalten, der fachliche Schwierigkeitsgrad eines Artikels, die Neutralität der Darstellung und auch die sprachliche Korrektheit eines Artikels immer wieder Gegenstand von Auseinandersetzungen. Es ist deswegen interessant, wie die traditionellen Enzyklopädien mit diesen Fragen umgehen, und ob sich in Wikipedia unterschiedliche Konventionen in einzelnen Sprachversionen herausbilden, oder ob es Konvergenzerscheinungen zwischen den Sprachversionen gibt. Letztendlich soll die Veränderung diskurstraditioneller Merkmale von den PrintartikelnPrintartikel hin zu den WikipediaartikelnWikipediaartikel nachvollzogen und vor dem Hintergrund der genannten Einflussfaktoren verortet werden.
Конец ознакомительного фрагмента.
Текст предоставлен ООО «ЛитРес».
Прочитайте эту книгу целиком, купив полную легальную версию на ЛитРес.
Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.