Beispiel
Der Ausgang eines Fußballspiels kann als Sieg, Unentschieden oder Niederlage beschrieben werden, also z.B. auf Ordinalniveau. Der Ausgang eines Fußballspiels kann aber auch in Tordifferenzen gemessen werden, z.B. +2, 0, -1. Es liegt auf der Hand, dass die Mannschaft, die mehr Tore geschossen hat, auch den Sieg davongetragen hat. Allerdings sind Tordifferenzen auf Intervallniveau und erlauben damit mehr (ggf. auch inhaltlich andere) Information auszudrücken.
■ Sind die Daten noch nicht erhoben, gelten folgende Daumenregeln für das Erheben von Daten. Generell gilt: Idealerweise sollten die Daten auf einem möglichst hohen Skalenniveau erhoben werden. Anstelle von Sieg, Unentschieden oder Niederlage könnte z.B. der Ausgang eines Fußballspiels in Tordifferenzen gemessen werden.
[1] | Falls Kausalrelationen modelliert werden sollen, so sollten v.a. die abhängigen Variablen auf einem möglichst hohen Skalenniveau gemessen werden. |
[2] | Falls Kausalrelationen modelliert werden sollen und die abhängigen Variablen sind kategorial skaliert, so sollte sichergestellt sein, dass v.a. die relevanten Ausprägungen gemessen werden. |
[3] | Ein hohes Skalenniveau kann mittels Operationen des Daten-Managements (vgl. Schendera, 2005, 2004) technisch unkompliziert auf ein niedrigeres Skalenniveau vereinfacht werden (da es dieses ja enthält), allerdings immer begleitet von den Risiken des Informationsverlusts bzw. der Informationsverzerrung (vgl. Schendera, 2010, 14–15); umgekehrt bedarf es sehr überzeugender Argumente, ein niedrigeres Skalenniveau auf ein höheres Niveau anzuheben. |
■ Während und nach dem Messen sollte gewährleistet sein, dass die Daten möglichst zuverlässig, also fehlerfrei, erhoben wurden. Für die Diskussion der Genauigkeit von Messungen und ihrer Verallgemeinerbarkeit gibt es mehrere, eher technische Begriffe, die im Folgenden erläutert werden sollen.
► Beispiele
Eindeutigkeit: Das Messergebnis ist eindeutig. Wird z.B. der Ausgang eines Fußballspiels protokolliert, so sollte „Unentschieden“ tatsächlich dafür stehen, dass keine der beiden Mannschaften gewonnen hat (und z.B. nicht dafür, dass man nicht weiß, welche). „Unentschieden“ in einer zweiten, völlig anderen Bedeutung…
Genauigkeit: Das Messergebnis ist möglichst genau. Auch sollte z.B. der Ausgang eines Fußballspiels (Sieg, Unentschieden, Niederlage) möglichst genau gemessen werden, z.B. in Toren, z.B. +2, 0, -1. Was natürlich nicht passieren sollte, ist, dass man anstelle von +2 dann -2 Tore protokolliert (sog. Protokollfehler). Man sagt auch: Die Güte einer Messung ist möglichst hoch. Die Güte (Genauigkeit) kann dabei in Reliabilität und Validität differenziert werden.
Objektivität: Das Messergebnis ist objektiv. Der Ausgang eines Fußballspiels sollte z.B. unabhängig davon gemessen werden, ob man Fan des einen oder anderen Teams ist. Nur weil die eigene Mannschaft z.B. sich wacker, aber vielleicht vergeblich gegen einen glänzend aufgelegten Gegner schlägt (vielleicht sogar in einem ausverkauften Auswärtsspiel), bedeutet dies nicht, dass damit dem Gegner in der Messung der verdiente Sieg unterschlagen werden darf.
Reliabilität (Zuverlässigkeit, Wiederholbarkeit): Das Messinstrument kommt bei wiederholten Durchgängen immer zum selben Ergebnis. Eine Torkamera wird eine bestimmte Ballposition, auch wenn sie mehrfach vorkommt, immer genau daraufhin beurteilen können, ob der Ball vor, auf oder hinter der Linie war. Das Messinstrument und die Messung sind hoch zuverlässig.
Validität (Richtigkeit, Gültigkeit): Das Messinstrument misst das, was es messen soll. Torkameras sind z.B. eine Messmethode und wurden speziell dafür entwickelt, zu erfassen, ob ein Ball hinter der Linie war oder nicht. Torkameras sind damit als Messmethode in Bezug auf die Beurteilung, ob ein Ball vor, auf oder hinter der Linie war, hoch valide. Das Messinstrument und damit die Messung sind hoch valide. Was für Schiedsrichter aus dem oft schnellen und unübersichtlichen Spielgeschehen heraus nicht im selben Maße gelten kann. Was für manche allerdings wiederum den Charme des Spiels ausmacht… Torkameras sind allerdings nicht valide in Bezug auf die Beurteilung, ob dem Tor ein Regelverstoß voranging (Abseits, Foul usw.). Dafür wurden sie aber auch nicht entwickelt… Daran schließt sich nun eine Differenzierung in interne und externe Validität an, nämlich die Schlussfolgerungen anhand der erzielten Ergebnisse.
Die interne Validität drückt z.B. aus, ob die Messung für die eigentliche Fragestellung gültig ist. Der Ausgang eines Fußballspiels (Sieg, Unentschieden, Niederlage) sollte möglichst so gemessen werden, dass vom Ergebnis her auch auf das untersuchte Konstrukt zurückgeschlossen werden kann. Aus der Differenz geschossener Tore kann z.B. auf Sieg usw. geschlossen werden. Tore sind also eine gültige Messung dafür, wer dieses Spiel (nicht) gewonnen hat. Mit Konstrukten wie z.B. Passgenauigkeit, Zweikampfstärke oder Stadiongröße wäre dieser Schluss nicht richtig bzw. gültig. Die externe Validität drückt dagegen aus, ob die Messung an der Stichprobe auf die Grundgesamtheit verallgemeinert werden kann. Ein Ergebnis kann z.B. dann verallgemeinert werden, wenn die Stichprobe alle Merkmale einer repräsentativen Zufallsstichprobe aufweist, oder wenn die Stichprobe z.B. die Grundgesamtheit ist, z.B. bei einer Vollerhebung. Man stelle sich die Frage, ob und wann es Sinn macht, Messungen mit geringer interner Validität auf externe Validität zu prüfen.
Werden sich u.a. Ali Daei, Pelé, Lionel Messi, Gerd Müller, Uwe Seeler oder Zlatan Ibrahimović wundern, dass sie in einem Buch zur deskriptiven Statistik erwähnt werden (vgl. Gisler, 2013)? Vermutlich nicht. Objektivität: Der Ball ist hinter der Linie. Torkamera, Schiedsrichter, Zuschauer, und auch der Gegner sind sich einig. Die Güte von Torschützen wird mittels zwei weiterer Kriterien beurteilt: Hohe Validität (Gültigkeit, Richtigkeit) bedeutet, dass ein Torjäger bei jedem Schuss ins Tor trifft, also bei jedem Versuch einen Treffer erzielt. Hohe Validität bedeutet allerdings nicht, dass ein Torjäger den Schuss dabei immer an dieselbe Stelle platzieren muss. Der Ball landet manchmal in der linken oberen Torecke, manchmal in der Mitte, knapp unter der Latte usw. Hauptsache, er ist drin… Würde ein Torjäger dagegen immer an dieselbe Stelle im Tor treffen, sozusagen als „Markenzeichen“, wäre dies gleichzeitig auch eine hohe Reliabilität (Zuverlässigkeit, Präzision). Hohe Validität und hohe Reliabilität machen zusammen die Güte eines Torjägers aus. Einen Spieler, der immer das Tor verfehlt, und das auch noch in alle Himmelsrichtungen, kann man alleine wegen seiner geringen Validität und Reliabilität kaum als Torjäger bezeichnen. Besser sieht es bei Spielern aus, die ziemlich reliabel auf den Punkt zielen, manchmal eben doch nicht genau genug („knapp vorbei“) und manchmal doch. Beim Elfmeter schadet eine etwas reduzierte Reliabilität nicht (der Torhüter muss ja wirklich nicht genau wissen, wohin sie zielen werden), beim Messen allerdings schon. Da will man das Ausmaß zufälliger Fehler so gering wie möglich halten. Hauptsache, es wird überwiegend ins Tor getroffen, der systematische Fehler ist also so gering wie möglich. Was haben wir gelernt? Hohe Güte: Hohe Reliabilität (=geringer zufälliger Fehler, =Präzision) + hohe Validität (=geringer systematischer Fehler, =Richtigkeit).
Für die Fußballfans unter uns
Hohe Reliabilität („immer auf den Punkt“) + hohe Validität („immer ins Tor“) = hohe Genauigkeit.
Objektivität: „eindeutig hinter der Linie“.
Mit diesen abschließenden Ausführungen