Wissenschaftliche Maßnahmen: Zuverlässigkeit und Gültigkeit

Die Messung ist ein wichtiger Bestandteil des wissenschaftlichen Prozesses. Die Schlüsselaspekte für die Qualität wissenschaftlicher Maßnahmen sind Zuverlässigkeit und Gültigkeit.

Die Zuverlässigkeit ist ein Maß für die interne Konsistenz und Stabilität eines Messgeräts.

Die Gültigkeit gibt uns einen Hinweis darauf, ob das Messgerät misst, was es behauptet.

Interne Konsistenz ist der Grad, in dem die Elemente oder Fragen der Maßnahme dasselbe Konstrukt konsistent bewerten. Jede Frage sollte darauf abzielen, dasselbe zu messen. Die interne Konsistenz wird häufig mit Cronbachs Alpha gemessen - einer Superkorrelation aller Elemente auf der Skala. Wenn die Punktzahl 0,70 oder höher ist, ist die Messung akzeptabel. 0,80 oder höher ist jedoch vorzuziehen. Es ist auch wichtig, den Kontext zu berücksichtigen, wenn die Bewertung berücksichtigt wird, die die interne Konsistenz widerspiegelt.

Die Stabilität wird häufig durch Test- / Wiederholungszuverlässigkeit gemessen. Dieselbe Person macht zweimal denselben Test und die Ergebnisse jedes Tests werden verglichen. Eine hohe Korrelation zwischen den beiden Testergebnissen impliziert, dass der Test zuverlässig ist. In den meisten Fällen wird eine Korrelation von mindestens 0,70 als akzeptabel angesehen. Dies ist jedoch eine allgemeine Richtlinie und kein statistischer Test.

Die Interrater-Zuverlässigkeit ist ein weiterer Zuverlässigkeitskoeffizient, der manchmal zur Beurteilung der Zuverlässigkeit verwendet wird. Mit Interrater-Zuverlässigkeit machen verschiedene Richter oder Bewerter (zwei oder mehr) Beobachtungen, zeichnen ihre Ergebnisse auf und vergleichen dann ihre Beobachtungen. Wenn die Bewerter zuverlässig sind, sollte der Prozentsatz der Übereinstimmung hoch sein.

Wenn wir fragen, ob eine Maßnahme gültig ist, fragen wir, ob sie misst, was soll. Die Gültigkeit ist ein Urteil, das auf gesammelten Daten basiert, kein statistischer Test. Es gibt zwei Hauptmethoden, um die Gültigkeit zu bestimmen: vorhandene Maßnahmen und bekannte Gruppenunterschiede.

Der Test für vorhandene Maßnahmen bestimmt, ob die neue Maßnahme mit vorhandenen relevanten gültigen Maßnahmen korreliert. Die neue Maßnahme sollte Maßnahmen ähneln, die mit bereits etablierten gültigen Messgeräten aufgezeichnet wurden.

Bekannte Gruppenunterschiede bestimmen, ob das neue Maß zwischen bekannten Gruppenunterschieden unterscheidet. Ein Beispiel für bekannte Gruppenunterschiede ist zu sehen, wenn verschiedene Gruppen das gleiche Maß erhalten und unterschiedliche Ergebnisse erwartet werden. Wenn Sie beispielsweise Demokraten und Republikanern einen Test zur Beurteilung der Stärke bestimmter politischer Ansichten geben würden, würden Sie erwarten, dass sie unterschiedlich abschneiden. Ihre Ansichten unterscheiden sich in vielen Fragen erheblich. Wenn diese beiden Gruppen erwartungsgemäß unterschiedlich abschneiden, können wir sagen, dass die Messung die Gültigkeit anzeigt - die Messung dessen, was sie zu messen behauptet.

Bei der Entwicklung neuer Messgeräte muss unbedingt deren Zuverlässigkeit und Gültigkeit berücksichtigt werden. Eine Maßnahme kann zuverlässig und ungültig sein. Eine gültige Maßnahme ist jedoch immer eine verlässliche Maßnahme.

!-- GDPR -->