Der Hypothesentest ist ein mathematisches Verfahren, um die Gültigkeit bzw. Ungültigkeit einer (statistischen) Aussage zu belegen. Das Ziel ist dabei zu prüfen, ob eine vermutete Wahrscheinlichkeit, die Hypothese, als wahr angenommen werden kann oder ob sie verworfen werden muss. Der Hypothesentest funktioniert grob unterteilt folgendermaßen:
Zuerst einmal zur Klärung, es gibt drei “Arten” von Hypothesentests, nämlich den zweiseitigen Hypothesentest und einseitigen Hypothesentest. Einseitige Hypothesentests sind der linksseitige (der Ablehnungsbereich der Nullhypothese liegt links vom Annahmebereich) und der rechtsseitige (der Ablehnungsbereich der Nullhypothese liegt rechts vom Annahmebereich) Hypothesentest. Beim zweiseitigen Hypothesentest wird der Ablehnungsbereich zweigeteilt und liegt teilweise links, teilweise rechts vom Annahmebereich. Erwähnt sei noch, dass die Begriffe Signifikanzniveau und Irrtumswahrscheinlichkeit gleich sind.
In der Regel verwendet man die einseitigen Tests, denn es liegt eigentlich immer eine Vermutung, in welcher Richtung die Nullhypothese “abweichen” könnte.
Zweiseitiger Test
H0: Die Notendurchschnitt von Prüfungen in Englisch und Mathematik ist gleich.
H1: Die Notendurchschnitt von Mathematik ist anders (also besser oder schlechter) als der von Englisch.
Einseitiger Test
H0: Die Notendurchschnitt von Prüfungen in Englisch und Mathematik ist gleich.
H1: Die Notendurchschnitt von Mathematik ist besser als der von Englisch (rechtsseitiger Test)
oder
H1: Die Notendurchschnitt von Mathematik ist schlechter als der von Englisch (linksseitiger Test)
Zuerst einmal wird die sog. Nullhypothese H0 aufgestellt. Dabei handelt es sich um die behauptete Wahrscheinlichkeit, also der Wahrscheinlichkeit, die in der entsprechenden Aufgabe vorliegt (z.B. bei einem Münzwurf erscheint “Zahl” mit einer Wahrscheinlichkeit von 0,5 (50%)).
Anschließend muss bestimmt werden, welcher Hypothesentest vorliegt, ein linksseitiger, ein rechtsseitiger oder ein beidseitiger Hypothesentest. Die Frage lässt sich mit der These “was will ich überhaupt beweisen” lösen (man testet etwas um, etwas zeigen zu können, z.B. dass die Wahrscheinlichkeit höher als 0,5 liegt, die Wahrscheinlichkeit kleiner als 0,5 ist oder die Wahrscheinlichkeit nicht 0,5 ist).
Tip: behaupte ich beispielsweise, dass die Wahrscheinlichkeit (H1) größer als 0,5 ist, schreibt man H1 > 0,5, dabei kann man das Größerzeichen (>) auch als Pfeilspitze sehen, die hierbei nach rechts zeigt. Man kann so (über eine Eselsbrücke) ableiten, dass es sich um einen rechtsseitigen Hypothesentest handelt.
Somit hat man bereits die Nullhypothese H0 und die Alternativhypothese H1 aufgestellt und die Art des Hypothesentest bestimmt.
Als nächstes bestimmt man das Signifikanzniveau, den Annahmebereich und den Ablehnungsbereich. Dazu benötigt man die Anzahl bzw. Umfang der Stichprobe.
Festlegung des Signifikanzniveaus, bedeutet, man gibt einem Fehler an, dem man zugesteht, z.B. 5%.
Ist kein Signifikanzniveau angegeben (es wird kein Fehler zugestanden), ist die Bestimmung des Annahmebereichs und des Ablehnungsbereiches relativ einfach. Man multipliziert die Wahrscheinlichkeit mit dem Umfang der Stichprobe, alle Zahlen unter (bzw. mit dieser Zahl) diesem Wert sind der Annahmebereich, und Zahlen über diesem Wert bilden den Ablehnungsbereich.
Hat man ein Signifikanzniveau, so muss man den Annahme- und Ablehnungsbereich berechnen, dazu benötigt man eine Tabelle mit der Binomialverteilung. Dadurch ändern sich Annahme- und Ablehnungsbereich. Nimmt man beispielsweise ein Signifikanzniveau (oder auch Irrtumswahrscheinlichkeit) von 5% an, so gilt SN < 0,05. Nun muss aber noch berücksichtigt werden, ob es sich um einem rechtsseitigen oder linksseiten Hypothesentest handelt. Bei einem linksseitingen Hypothesentest liegt der Ablehnungsbereich links und der Annahmebereich rechts, bei einem rechtsseitigen Hypothesentest liegt der Annahmebereich links und der Ablehnungsbereich rechts.
Zuletzt wird das Ergebnis aus der Stichprobe mit dem Annahmebereich bzw. Ablehnungsbereich vergleichen und abgeleitet, ob die Nullhypothese verworfen werden muss oder nicht.
Beispiel
Ein Glühbirnenhersteller garantiert, dass der Anteil an defekten Glühbirnen höchstens 10% beträgt. Der Käufer findet unter 100 Glühbirnen 15 defekt Glühbirnen. Kann der Käufer auf einem Signifikanzniveau vor 5% (d.h. es wird ein Fehler von 5% zugestanden, also mit 95% Sicherheit) daraus schließen, dass der Anteil an defekten Glühbirnen größer als 10% ist?
Aus dem Ergebnis des Hypothesentest lassen sich mehrere Ergebnisse ableiten: Die Nullhypothese ist richtig oder falsch. Des Weiteren kann man zwei Arten von Fehlern unterscheiden:
Die Nullhypothese ist eine Vermutung, die sich auf die Berechnung einer Stichprobe bezieht und statistisch überprüft wird. Sie enthält meistens das Gleichheitszeichen (=).
Die Alternativhypothese, auch Gegenhypothese genannt, ist das Gegenteil der Nullhypothese. Sie wird angenommen, wenn die Nullhypothese verworfen wird.
Die Nullhypothese wird verworfen, wenn der Wert in der Stichprobe statistisch signifikant von dem erwarteten Wert abweicht. Dies hängt von der Festlegung des Signifikanzniveaus ab.
Fehler erster Art, auch α-Fehler genannt, tritt auf, wenn die Nullhypothese fälschlicherweise abgelehnt wird, obwohl sie in Wirklichkeit richtig ist.
Ein Fehler zweiter Art, oder β-Fehler, tritt auf, wenn die Nullhypothese fälschlicherweise beibehalten wird, obwohl sie in Wirklichkeit falsch ist.
Der p-Wert ist die Wahrscheinlichkeit, eine genauso extreme oder extremere Beobachtung zu machen, wenn die Nullhypothese wahr ist.
Das Signifikanzniveau ist eine vorher festgelegte Wahrscheinlichkeit, bei der die Nullhypothese verworfen wird. Es wird meistens auf 5% oder 1% gesetzt.
Bei einem einseitigen Test verwerfen wir die Nullhypothese, wenn der p-Wert kleiner als das festgelegte Signifikanzniveau ist und die Abweichung in die erwartete Richtung geht.
Bei einem zweiseitigen Test verwerfen wir die Nullhypothese, wenn der p-Wert kleiner als das Signifikanzniveau geteilt durch zwei ist und die Abweichung in die erwartete Richtung geht.
Die Teststärke ist die Fähigkeit eines Tests, die Nullhypothese richtig zu verwerfen, wenn sie falsch ist. Es ist die Wahrscheinlichkeit dafür, den Fehler zweiter Art nicht zu machen.