Deskriptive Statistik verstehen. Christian FG Schendera. Читать онлайн. Newlib. NEWLIB.NET

Автор: Christian FG Schendera
Издательство: Bookwire
Серия:
Жанр произведения: Математика
Год издания: 0
isbn: 9783846339695
Скачать книгу
sinnfrei, weil es dem Berechnen eines Durchschnittswerts aus Spielernamen entspräche.

      Exkurs ◄

      Wie lässt sich am besten in einen Abschnitt zum Ordinalniveau einführen? Man macht es spannend! Wie lautete die zentrale Aussage zum Nominalniveau? Jede Datenspalte besitzt auf jeden Fall das Nominalniveau. Spannend ist also an dieser Stelle: Welches andere Messniveau besitzt eine Datenspalte noch? Der nächstmögliche „Kandidat“ wäre das Ordinalniveau. Ist das wirklich so einfach…?

      ■ Definition: Messungen auf einer Ordinalskala liegen dann vor, wenn neben Gleichheit / Verschiedenheit (Eigenschaft der Nominalskala) zusätzlich größer / kleiner-Relationen feststellbar sind. Sobald Werte in einer Rangfolge angeordnet werden können, z.B. nach Erfolgen, Geschwindigkeit, Mengen, Größe, Stärke usw., handelt es sich um ordinalskalierte Daten. Die Abstände zwischen den einzelnen Rängen müssen nicht notwendigerweise gleich sein (Äquidistanz). Der absolute Abstand zwischen den Rängen ist für die Definition nicht wichtig, oft aber für die Analyse und Interpretation.

      ■ Mögliche Aussagen: Größer-/kleiner-Relation: Zwei (oder mehr) einzelne (Gruppen von) Merkmalsträger(n) haben ein größeres, kleineres oder auch ein gleich großes Merkmal.

      ■ Beispiele: Merkmal: Bundesligen, Werte: 1. Liga, 2. Liga, 3. Liga usw.; Merkmal: Bundesliga, Werte: 1. Rang, 2. Rang, 3. Rang usw.; Merkmal: Sportliche (Miss-)Erfolge, Werte: Champions League (CL) Teilnahme, CL Qualifikation, UEFA Cup, „Mittelfeld“, Relegation, Abstieg.

      ■ Transformation: streng monoton steigend.

      ■ Mögliche Maße: Lagemaße: Minimum, Maximum, Median (bei einer ungeraden Zahl an Abstufungen beobachtet), Quantile, Modus. Streumaße: Spannweite ohne R, Interquartils ab stand, Quantildifferenzen.

      ■ Zulässige Rechenoperation: f (Anzahl, frequency) bzw. Prozentanteile. Es wird besonders auf die ausführlichen Hinweise unter „Mathematische Transformationen“ und „Kodierungen“ verwiesen.

      ■ Besonderes: Ranking Scales: Ranking von Ligen, Teams, Spielern (MVP); Rating Scales: Rating von Finanzprodukten („AAA“, „AA+“, „AA“ usw. (z.B. S&P), Bonität von Schuldnern, Schulnoten („sehr gut“, „gut“ etc.), Zustimmung („sehr“, „überwiegend“ usw.).

      Welche Spalten aus der Bundesligatabelle enthalten Daten auf Ordinalniveau? Das Kriterium, das zu erfüllen ist, lautet: Kategorien, die verschieden sind und sich in eine Rangreihe bringen lassen. Einfach ist es bei der Spalte „Platz“. Anhand der möglichen Aussage lässt sich der Schluss ziehen: Jeder der Plätze nimmt im Vergleich zu allen anderen einen besseren und/oder auch einen schlechteren Rang in der Tabelle ein. Der 1. Platz ist z.B. besser als der 2. Platz und 3. Platz usw., der 2. Platz ist z.B. besser als der 3. und 4. Platz usw. (jedoch schlechter als der 1. Platz) usw. Die Spalte „Platz“ besitzt auch ein Ordinalniveau. Wie sieht es mit der Spalte „Verein“ aus? Die Qualität der Vereinsnamen ist unterschiedlich („1. FC Köln“ ist nun einmal ein anderer Vereinsname als z.B. „Borussia Mönchengladbach“), sie lässt sich aber nicht in eine Rangfolge bringen (die unterschiedlichen Ränge der Vereine werden durch die Spalte „Platz“ ausgedrückt). Die Spalte „Verein“ besitzt also nur das Nominalniveau, aber nicht das Ordinalniveau. Ob die Spalte „Platz“ auch das Intervallniveau besitzt, wird im nächsten Abschnitt diskutiert. Die Spalten „Spiele“, „S“, „U“, „N“, „Diff“ und „Pkt“ sind jeweils auf dem Ordinalniveau (mindestens!); es ist die Aussage möglich: Jeder der 16 Werte über Spiele, Siege, Unentschieden, Niederlagen, Tordifferenz oder Punkte ist im Vergleich zu den jeweils anderen Werten größer, kleiner oder z.T. auch gleich. Interessant ist nun die Spalte „Tore“, sie beschreibt genau betrachtet das Verhältnis aus den geschossenen bzw. kassierten Toren. Um uns die Arbeit zu erleichtern, betrachten wir einfach zwei gleiche Differenzwerte, nämlich die Tordifferenz von -4 bei Hannover 96 und Mainz 05, und bewegen uns von dort zu den Torverhältnissen. Bei Hannover 96 finden wir 41:45 Tore, bei Mainz 05 dagegen 47:51. Die Torverhältnisse sind also verschieden, so gesehen können wir keine eindeutige größer/kleiner-Relation für die Spalte „Tore“ festhalten. Man könnte sich jetzt umständlich mit Zusatzannahmen behelfen, dass die Anzahl der geschossenen Tore wichtiger sei usw. Wir aber machen es unkompliziert: Die Spalte „Tore“ enthält keine „richtigen“ Zahlen, sondern Zahlenpaare, die wir weiterhin auf das Nominalniveau beschränken. Mit der Aussage „ungleich“ sind 41:45 bzw. 47:51 eindeutig differenziert, nämlich als ungleiche Abfolge von Zeichen („gleich“ i.S.e. Ergebnisses einer Rechenoperation haben wir per definitionem ausgeschlossen). An dieser Stelle können wir ein Zwischenfazit treffen: „Verein“ und „Tore“ beschränken sich auf das Nominalniveau. Spannend wird es nun für die übrigen Daten: Welche Spalte besitzt auch das Intervallniveau?

      ► Exkurs: Besondere Hinweise

      ■ Rating / Ranking Scales: Bei Ordinalskalen wird zwischen Rating und Ranking Scales unterschieden (Lorenz, 1992, 12ff.). Bei Ranking Scales wird eine diskrete Anzahl von Objekten anhand eines Kriteriums bzw. der Intensität eines Merkmals in eine Rangfolge gebracht. Beispiele für Ranking Scales sind z.B. Ligen (1. Liga, 2. Liga, 3. Liga usw.), Teams (1. Platz, 2. Platz usw.), Spieler (wichtigster Spieler, MVP). Bei Rating Scales wird anhand einer Berechnungsvorschrift eine Prüfung und Bewertung („Rating“) vorgenommen und ein Punktwert vergeben, der letztlich über den Rang entscheidet. Beispiele für Rating Scales sind z.B. Ratings von Finanzprodukten („AAA“, „AA+“, „AA“ usw. (z.B. Standard & Poor’s), Bonität von Schuldnern („uneingeschränkt kreditwürdig“, „eingeschränkt kreditwürdig“, „nicht kreditwürdig“, Schulnoten („sehr gut“, „gut“ etc.), Zustimmung („sehr“, „überwiegend“ usw.).

      ■ Mathematische Transformationen I: Differenzen? Bei Ordinalskalen ist man oft bereits versucht, mathematische Operationen, wie z.B. Differenzen, zu bilden. Nehmen wir der Plakativität halber an, wir wollen zwischen den Rängen „Champions League (CL) Teilnahme“ und „UEFA Cup“ eine mathematische Differenz gemäß der Logik B – A = C bilden? Ja! wird jemand rufen, in der CL geht es um mehr Geld! Die Differenz ist sozusagen der Unterschied im (auch!) materiellen Anreiz. Leider nein, muss man dem entgegenhalten: Denn: Mit diesem Einwand wurde flugs die Einheit der Differenz gewechselt: Waren es in der ursprünglichen Formulierung unterschiedlich bedeutsame sportliche Erfolge, wechselt der Einwand auf eine monetäre Einheit, z.B. Euro, und diese sind mindestens auf dem Intervallniveau (auf denen tatsächliche Differenzen zulässig sind). Eine Differenz aus zwei ordinalen, qualitativ verschiedenen Rängen zu bilden, ist üblicherweise sehr sehr schwierig herzuleiten bzw. zu interpretieren. Ein Sinn einer mathematischen Differenz aus den ordinalen Rängen „Champions League (CL) Teilnahme“ und „UEFA Cup“ erschließt sich z.B. nicht.

      ■ Mathematische Transformationen II: Quotienten? Zulässige Operationen sind f (Anzahl, frequency) bzw. Prozentanteile. Aus mathematischer Sicht sind bei der Ordinalskala nur mathematische Transformationen zulässig, die nicht die Abfolge der bezeichneten Objekte ändern. Die Bildung von Differenzen, Quotienten, Summen oder Mittelwerten mittels Ordinalskalen ist methodisch gesehen nicht sinnvoll und kann u.U. sogar irreführend sein. Dazu ein kleines Beispiel mit Schulnoten (ja, Schulnoten sind auf der Ordinalskala!) von vier Schüler-Innen A, B, C und D: Haben A und D dieselbe Schulnote, z.B. „1“ [„sehr gut“], so haben sie auch dieselbe Leistung gezeigt (gleiche Zahl = gleiche Qualität [auf derselben Stufe]). Hat B z.B. „2“ [„gut“], eine kleinere Schulnote wie C, „3“ [„befriedigend“], so hat B eine bessere als C gezeigt (ungleiche Zahlen = Qualität in unterschiedlichen Abstufungen; je kleiner die Zahl, desto besser die Qualität). Wird versucht, aus den qualitativen Rangurteilen eine Differenz zu bilden, z.B. „sehr gut“ – „gut“ bzw. „gut“ – „befriedigend“, so ist es nicht möglich, eine Aussage über den präzisen Leistungsunterschied abzuleiten (keine Differenz möglich; dies würde Äquidistanz voraussetzen). Daraus folgt, dass auch