30 Tage kostenlos testen:
Mehr Spaß am Lernen.

Überzeugen Sie sich von der Qualität unserer Inhalte.

Signifikanztest – Testen von Hypothesen 06:53 min

Textversion des Videos

Transkript Signifikanztest – Testen von Hypothesen

Heute zeige ich Dir, was ein Signifikanztest ist. Damit das Thema nicht zäh wie Kaugummi ist, werden wir den Signifikanztest an einem Beispiel kennenlernen. Darin wird es um den Marktanteil der Kaugummimarke GUM gehen. Wenn Du den Alternativtest schon kennst und anwenden kannst, fehlt Dir nicht mehr viel, um auch mit dem Signifikanztest umgehen zu können. Beim Alternativtest gibt es über eine statistische Gesamtheit zwei Hypothesen. Diese Hypothesen sind Vermutungen über den Wert von Wahrscheinlichkeiten. Man hat zwei sich gegenseitig ausschließende Wahrscheinlichkeiten und möchte sich nach einer Entscheidungsregel für eine der beiden Hypothesen entscheiden. Sehr häufig hat man aber nur eine Vermutung über den Wert von p, die durch einen sogenannten Signifikanztest entweder bestätigt oder widerlegt werden soll. Wenn man die Alternativhypothese p < p1 oder p > p1 untersucht, spricht man von einem einseitigen Signifikanztest. Wenn man den gesamten Verwerfungsbereich der Nullhypothese ansieht mit p ≠ p1, spricht man vom zweiseitigen Signifikanztest. Im Folgenden schauen wir uns den einseitigen Signifikanztest an. Die Kaugummimarke GUM hatte letztes Jahr einen Marktanteil von 20%. Der Hersteller von GUM möchte wissen, ob der Marktanteil in diesem Jahr gestiegen ist. Dazu führt er eine Befragung durch. Es werden 200 Personen, die regelmäßig Kaugummi kauen, gefragt, ob sie die Marke GUM kaufen würden. Der Hersteller legt fest: Wenn mehr als 50 Befragte GUM kaufen würden, so geht er davon aus, dass sich der Marktanteil erhöht hat. Die Frage ist nun: Wie hoch ist die Wahrscheinlichkeit, dass der Hersteller denkt, der Marktanteil habe sich erhöht, obwohl das eigentlich nicht stimmt. Also der Fehler 1. Art. Um diese Irrtumswahrscheinlichkeit berechnen zu können, müssen wir zunächst den Signifikanztest formulieren. Beim Signifikanztest geht man bei der Nullhypothese davon aus, das sich nichts verändert hat. Die Nullhypothese ist also p = 0,2. Die Alternativhypothese lautet dann: Der Marktanteil von GUM ist gestiegen, also p > 0,2. Die Nullhypothese ist eine einfache Hypothese. Das heißt, dass sie nur aus einem Wahrscheinlichkeitswert besteht. Die Alternativhypothese ist eine zusammengesetzte Hypothese. Sie besteht aus unendlich vielen Werten für p zwischen 0,2 und 1. Im Gegensatz zum Alternativtest gibt es beim Signifikanztest also keinen konkreten Wert für die Alternativhypothese. Die Prüfgröße x ist die Anzahl der Befragten, die GUM kaufen würden. Der Hersteller verwirft die Hypothese, wenn mehr als 50 Befragte GUM kaufen würden. Die Entscheidungsregel lautet also: Ist X ≤ 50, so wird H0 angenommen. Es wird also angenommen, dass der Marktanteil von GUM nicht gestiegen ist. Ist X > 50, so wird H0 verworfen. Der Hersteller geht dann davon aus, dass der Marktanteil gestiegen ist. Die kritische Zahl k ist in unserem Beispiel also 50. Wir möchten nun wissen, wie wahrscheinlich es ist, dass der Marktanteil nicht gestiegen ist, obwohl die Umfrage ergeben hat, dass der Marktanteil gestiegen ist. Dies ist der Fehler 1. Art α. Die Prüfgröße X ist die Anzahl der Befragten, die GUM kaufen würden. Wenn die Nullhypothese zutrifft, ist X binomialverteilt n = 200 und p = 0,2. Der Fehler 1. Art α wird beim Signifikanztest auch als Signifikanzniveau bezeichnet. Für den Fehler 1. Art müssen wir die Wahrscheinlichkeit α = P(X<50) berechnen. Das machen wir mit der Gegenwahrscheinlichkeit 1 - P(X≤50). Die Wahrscheinlichkeit P(X≤50) kannst Du in einer Tabelle der kumulierten Binomialverteilung entnehmen. Sie beträgt etwa 0,9655. Das Signifikanzniveau beziehungsweise α beträgt also ungefähr 0,0345 oder 3,45%. Was ist mit dem Fehler 2. Art β? Wie wahrscheinlich ist es, dass der Marktanteil gestiegen ist, obwohl die Umfrage ergeben hat, dass der Marktanteil gleich geblieben ist? Die Alternativhypothese ist aus unendlich vielen Werten für p zusammengesetzt. Die Wahrscheinlichkeit p ist also nicht genau bekannt. In unserem Beispiel wissen wir nur, das p > 0,2 ist, wenn H1 zutrifft. Der Fehler 2. Art hängt aber von dieser Wahrscheinlichkeit ab. Die Abhängigkeit des Fehlers 2. Art von der Wahrscheinlichkeit können wir in einer Tabelle verdeutlichen. Dort stellen wir die verschiedenen Wahrscheinlichkeiten für die Alternativhypothese den entsprechenden Fehlern 2. Art β gegenüber. β kannst Du jeweils einer Tabelle mit kumulierten Binomialverteilung entnehmen. Ist p zum Beispiel 0,25, so ist β 53,79%. Für p = 0,3 ist β entsprechend 6,95%. Und für p = 0,35 ist β = 0,15%. Du siehst, β ist umso größer, je dichter die Wahrscheinlichkeiten der beiden Hypothesen beieinander liegen. Damit sind wir am Ende dieses Videos. Hast Du jetzt auch den plötzlichen Drang, einen Kaugummi zu kauen? Hoffentlich sehen wir uns bald wieder. Bis dahin wünsche ich Dir viel Freude an der Mathematik.

Signifikanztest – Testen von Hypothesen Übung

Du möchtest dein gelerntes Wissen anwenden? Mit den Aufgaben zum Video Signifikanztest – Testen von Hypothesen kannst du es wiederholen und üben.

  • Stelle die Hypothesen $H_0$ und $H_1$ mit ihren Wahrscheinlichkeiten auf.

    Tipps

    Beim Signifikanztest geht man bei der Nullhypothese davon aus, dass sich nichts verändert hat.

    $H_1$ ist eine einseitige zusammengesetzte Hypothese und besitzt unendlich viele Werte für $p$ zwischen $p_{H_0}$ und $1$.

    Lösung

    In diesem Beispiel muss man zwei Hypothesen formulieren, die sich gegenseitig ausschließen, da sie nicht zur selben Zeit gültig sein können.

    Da man beim Signifikanztest davon ausgeht, dass sich bei der Nullhypothese nichts ändert, übernehmen wir hier die Aussage aus dem Text:

    $H_0:$ Der Marktanteil ist gleich geblieben.

    Hier verwenden wir als Wahrscheinlichkeit den genannten Marktanteil von $20~\%$ des Vorjahres, also $p=0,2$.

    Die Alternativhypothese ist in diesem Fall der zu überprüfende Sachverhalt, dass der Marktanteil gestiegen sein könnte:

    $H_1:$ Der Marktanteil ist gestiegen.

    Hier muss die Wahrscheinlichkeit bzw. der Marktanteil größer sein als bei $H_0$ und darf nicht denselben Wert einnehmen. Daher gilt $p>0,2$. Es gilt explizit nicht $p\ge 0,2$, da sonst auch $0,2$ - wie in $H_0$ - in Frage käme, was aber nicht passieren darf.

  • Ermittle die Wahrscheinlichkeit, die benötigt wird, um einen $\beta$-Fehler zu berechnen.

    Tipps

    Die Hypothesen lauten:

    • $H_0:$ Der Marktanteil bleibt gleich ($p=0,2$)
    • $H_1:$ Der Marktanteil steigt ($p>0,2$)

    Fehler zweiter Art:

    $H_0$ wird akzeptiert, obwohl $H_1$ stimmt.

    $H_1$ ist eine zusammengesetzte Hypothese.

    Lösung

    Da es sich bei $H_1$ um eine zusammengesetzte Hypothese handelt, ist diese Wahrscheinlichkeit bei einem Signifikanztest nicht genau bekannt (im Gegensatz zu einem Alternativtest).

    Mit $p>0,2$ kommt jede Wahrscheinlichkeit zwischen $20~\%$ und $100~\%$ in Frage und für jede ändert sich die Wahrscheinlichkeit für den Fehler zweiter Art.

    Da der Fehler zweiter Art also von $p$ abhängt, kann man $\beta$ jeweils einer kumulierten Tabelle für verschiedene $p$ entnehmen.

    Du kannst den Fehler zweiter Art also mit jeder Wahrscheinlichkeit über $p=0,2$ berechnen, er wird nur immer verschieden groß sein.

    Je dichter dieses $p$ am $p$ für $H_0$ liegt, desto höher wird auch die Wahrscheinlichkeit eines Fehlers zweiter Art.

  • Bestimme $n$, $k$ und die Wahrscheinlichkeit für einen $\alpha$-Fehler.

    Tipps

    Fehler erster Art:

    Die Wahrscheinlichkeit dafür, dass die Umfrage ergibt, der Marktanteil sei gestiegen, obwohl dem nicht so ist ($H_0$ wird fälschlicherweise verworfen).

    $\Large{\alpha=P(X>50)=1-P(X\le 50)}$

    Du findest die Wahrscheinlichkeit für die Berechnung von $\alpha$ in einer kumulierten Wahrscheinlichkeitstabelle mit $n=200$ und $p=0,2$.

    Lösung

    Der Umfang des Tests ist in diesem Fall die Anzahl der befragten Personen $n=200$.

    Der Hersteller wird, wenn mehr als $50$ von ihnen zufrieden sind, davon ausgehen, dass der Marktanteil gestiegen ist.

    $X\le 50:H_0$ wird angenommen.

    $X>50:H_1$ wird angenommen.

    Damit ist die kritische Zahl für diesen Test $k=50$.

    Die Wahrscheinlichkeit eines Fehlers erster Art, also dass $H_1$ angenommen wird, obwohl $H_0$ stimmt, beträgt also $P(X>50)$.

    Da du diese Art von Wahrscheinlichkeiten in keiner kumulierten Tabelle findest, rechnen wir mit der Gegenwahrscheinlichkeit. Um alle Wahrscheinlichkeiten für $k$ über $50$ zu ermitteln, ziehen wir alle Wahrscheinlichkeiten für $k$ bis $50$ von $1$ ab.

    $\alpha=1-P(X\le 50)$

    Diese Wahrscheinlichkeit kannst du einer kumulierten Tabelle für $n=200$ und $p=0,2$ entnehmen.

    $\begin{align} \alpha &=1-0,9655\\ \alpha &=0,0345\\ \alpha &=3,45~\%\\ \end{align}$

  • Erstelle eine kumulierte Wahrscheinlichkeitstabelle, um $\alpha$ zu ermitteln.

    Tipps

    Eine kumulierte (aufaddierte) Wahrscheinlichkeitstabelle ist so aufgebaut.

    Genaue Wahrscheinlichkeiten berechnest du mit dieser Formel.

    $\alpha=1-P(X\le 5)$

    Lösung

    Hier musst du Schritt für Schritt vorgehen. Um eine kumulierte Wahrscheinlichkeitstabelle zu erstellen, muss man wissen, wie diese aufgebaut sind:

    $\begin{array}{c|l} k & P(k) \\ \hline 0 & P(0) \\ 1 & P(0) + P(1) \\ 2 & P(0) + P(1) + P(2) \\ \vdots & \vdots \end{array}$

    In jeder Zeile wird die genaue Wahrscheinlichkeit für dieses $k$ mit den genauen Wahrscheinlichkeiten der letzten Zeilen addiert. Kumuliert bedeutet auch so viel wie aufaddiert.

    Genaue Wahrscheinlichkeiten kannst du mit dieser Formel berechnen:

    $P(X=k)=\binom{n}{k} \cdot p^k \cdot (1-p)^{n-k}$

    So ist zum Beispiel die Wahrscheinlichkeit für $k=0$:

    $P(X=0)=\binom{100}{0} \cdot (0,05)^0 \cdot (0,95)^{100}=0,0059$

    Hier siehst du die Einzelwahrscheinlichkeiten aufgelistet:

    $\begin{array}{c|c} k & P(k) \\ \hline 0 & 0,0059 \\ 1 & 0,0312 \\ 2 & 0,0812 \\ 3 & 0,1396 \\ 4 & 0,1781 \\ 5 & 0,1800 \end{array}$

    Aufaddiert ergibt sich die kumulierte Tabelle (Bild).

    Der Fehler erster Art, also dass man annimmt, mehr Wähler zu haben, obwohl dem nicht so ist, ergibt sich, wenn mehr als fünf der Befragten zu der Partei stehen.

    $\begin{align} \alpha & =P(X>5)\\ \alpha & =1-P(X\le 5)\\ \alpha & =1-0,6160\\ \alpha & =0,384\\ \alpha & =38,4~\%\\ \end{align}$

  • Entscheide, welche der Hypothesen und Wahrscheinlichkeiten zutreffen.

    Tipps

    Beim Signifikanztest wird in der Nullhypothese immer davon ausgegangen, dass sich nichts ändert.

    Die Alternativhypothese darf in der Wahrscheinlichkeit keine Überschneidung mit der Nullhypothese haben.

    Ob die Wahrscheinlichkeit der Alternativhypothese größer oder kleiner als die Wahrscheinlichkeit der Nullhypothese ist, ergibt sich aus dem Ziel der Untersuchung.

    Lösung

    Da man beim Signifikanztest immer davon ausgeht, dass sich in der Nullhypothese nichts an der vorherigen Beobachtung (Annahme, Behauptung,...) geändert hat, können wir als Nullhypothese formulieren:

    $H_0:$ Die Fehlerrate ist gleich geblieben.

    Die Wahrscheinlichkeit hierfür ist die Fehlerrate des Vorgängermodells, also $p=0,1$.

    Da sich die Hypothesen gegenseitig ausschließen müssen, geht man bei der Alternativhypothese davon aus, dass die Fehlerrate gestiegen ist:

    $H_1:$ Die Fehlerrate ist gestiegen.

    Die Wahrscheinlichkeit hierfür muss größer und ungleich der von $H_0$ sein, also wählen wir $p>0,1$.

  • Gib ein $n$, ein $k$ und die Wahrscheinlichkeit für $\alpha$ an.

    Tipps

    Fehler erster Art: Der Hersteller würde die Wagen zurückrufen, obwohl sich die Fehlerrate gar nicht erhöht hat.

    Für $P(X\le 5)$ akzeptiert der Hersteller die Nullhypothese.

    Für $P(X > 5)$ akzeptiert der Hersteller die Alternativhypothese.

    $\alpha=1-P(X\le 5)$

    Der Auszug einer kumulierten Wahrscheinlichkeitstabelle für $n=50$ und $p=0,1$:

    Lösung

    Der Umfang der Stichprobe ist in diesem Fall die Anzahl der Wagen, die der Hersteller untersuchen will. Daher gilt $n=50$.

    Da er, sollte bei mehr als $5$ Wagen der bekannte Fehler auftreten, alle Modelle zurückrufen lassen wird, ist die kritische Zahl $k=5$.

    Für $P(X>5)$ wird er also $H_1$ akzeptieren. Doch wie groß ist die Wahrscheinlichkeit, dabei einen Fehler erster Art zu begehen, also zu glauben, es gäbe mehr fehlerhafte Wagen, obwohl dies nicht der Fall ist?

    Dazu benötigt man eine kumulierte Wahrscheinlichkeitstabelle mit $n=50$ und $p=0,1$.

    Die Wahrscheinlichkeit, dass die Prüfgröße $X$ größer ist als fünf, können wir nicht aus der Tabelle entnehmen, zumindest nicht direkt. Wir können aber die Gegenwahrscheinlichkeit, also dass die Prüfgröße zwischen $0$ und $5$ liegt, berechnen:

    $\begin{align} \alpha & =1-P(X\le 5)\\ \alpha & =1-0,6161\\ \alpha & =0,3839\\ \alpha & =38,39~\%\\ \end{align}$

    Dieser Test ist relativ ungünstig für den Hersteller, da er zu fast $40~\%$ einen Fehler erster Art begeht, also sehr wahrscheinlich die Wagen zurückruft, obwohl die Fehlerrate nicht gestiegen ist.

    Mit größerem $k$ würde diese Irrtumswahrscheinlichkeit immer weiter sinken.