30 Tage kostenlos testen:
Mehr Spaß am Lernen.

Überzeugen Sie sich von der Qualität unserer Inhalte.

Testen von Hypothesen – Grundbegriffe des Hypothesentestens 09:11 min

Textversion des Videos

Transkript Testen von Hypothesen – Grundbegriffe des Hypothesentestens

Hallo und herzlich willkommen. Mein Name ist Jonathan und ich heute nehme dich mit in die wunderbare Welt der Mathematik. Du weißt ja schon, was ein Hypothesentest ist. In diesem Video möchte ich dir beibringen, welche fachlichen Grundbegriffe du dazu kennen solltest. Diese Grundbegriffe wollen wir uns an einem Beispiel anschauen. Ein Obstverkäufer hat eine sehr große Ladung von Bananenkisten bekommen. Um deren Verkaufspreis festzulegen, möchte er wissen, ob die Banane in den Kisten erste oder zweite Wahl sind. Für Bananen gilt die Norm, dass sie mindestens 14 Zentimeter lang sein sollten. Ein Teil der Kisten stammt auch Ecuador und ist erste Wahl. Hier sind 20 Prozent der Bananen kürzer als 14 Zentimeter. Der andere Teil der Kisten stammt aus Indien und ist zweite Wahl. Hier sind jedoch 40 Prozent der Bananen zu kurz. Bei der Lieferung ist jedoch etwas schiefgelaufen und der Obstverkäufer kann nicht mehr unterscheiden, welche Kisten erste oder zweite Wahl sind. Um mit absoluter Sicherheit sagen zu können, ob die Bananen in einer Kiste erste oder zweite Wahl sind, müsste der Verkaufe alle Bananen vermessen. Weil dies ein immenser Aufwand ist, entnimmt er einer Kiste eine Stichprobe. Mit deren Hilfe kann er entscheiden, welche der beiden Alternativen er für richtig hält. Beim Hypothesentest ist die statistische Gesamtheit die Menge aller Einheiten, die man betrachtet. Hier sind das also alle Bananenkisten. Über diese Gesamtheit gibt es zwei Hypothesen. Die Nullhypothese h0 und die Alternativhypothese h1. Entweder sind 20 Prozent zu kurz, das ist die Nullhypothese, mit p=0,2. Oder es sind 40 Prozent zu kurz, das ist die Alternativhypothese, mit p=0,4. Diese sind Vermutungen über ein Merkmal, hier die Länge der Bananen der Grundgesamtheit. Diese schließen sich gegenseitig aus. Es kann nur eine von beiden zutreffen. Die Entscheidung für eine der beiden Hypothesen wird anhand einer Stichprobe gefällt. Der Verkäufer in unserem Beispiel entnimmt einer Kiste eine Stichprobe von n = 30 Bananen. Und vermisst diese. Die Anzahl der zu kurzen Bananen in dieser Stichprobe ist die sogenannte Prüfgröße. Diese ist eine Zufallsvariable x, die das Ergebnis der Stichprobe wiedergibt. In diesem Fall wäre das die Anzahl der zu kurzen Bananen. In diesem Beispiel links, wären sechs zu klein. Die Entscheidung für einer der beiden Hypothesen hängt von dieser Prüfgröße ab. Zurück zu den Bananen. Der Verkäufer muss zunächst eine Entscheidungsregel festlegen. Diese legt fest, wann die Nullhypothese oder die Alternativhypothese angenommen oder verworfen werden. Der Verkäufer legt fest: wenn in der Stichprobe höchstens sechs Bananen zu kurz sind, verkauft er sie als erste Wahl. Wenn mehr als sechs Bananen zu kurz sind, verkauft er sie als zweite Wahl. Ich fertige einen Zahlenstrahl an und markiere die Bereiche, in denen sich der Verkäufer für die eine oder andere Hypothese entscheidet. Die Entscheidungsregel legt zwei Bereiche fest. Dieser Bereich heißt Annahmebereich von h0 und Verwerfungsbereich von h1. Weil die Entscheidung für die Nullhypothese und gegen die Alternativhypothese fällt. Der andere Bereich heißt Verwerfungsbereich von h0 und Annahmebereich von h1, weil die Nullhypothese in diesem Bereich verworfen und die Alternativhypothese angenommen wird. Die Zahl bis zu der eine Hypothese angenommen oder verworfen wird, heißt kritische Zahl k. In unserem Beispiel ist die kritische Zahl k = 6. Die Entscheidungsregel sorgt dafür, dass man sich für die eine der beiden Hypothesen entscheiden muss. Allerdings gibt es keine Sicherheit, dass diese Entscheidung richtig ist. Es gibt zwei mögliche Fehlentscheidungen. Verwirft man die Nullhypothese, obwohl sie richtig ist, spricht man von einem Fehler erster Art, Alpha. Unserem Obstverkäufer würde dies zum Beispiel passieren, wenn in der Stichprobe sieben zu kurze Bananen sind, in der gesamten Kiste aber eigentlich nur 20 Prozent zu kurze Bananen und damit erste Wahl Bananen sind. Wenn die Nullhypothese angenommen wird, obwohl die Alternativhypothese eigentlich zutrifft, spricht man vom Fehler zweiter Art, Beta. Dem Obstverkäufer würde das zum Beispiel passieren, wenn tatsächlich 40 Prozent der Bananen zu kurz, in der Stichprobe aber nur vier davon sind. Die beiden Wahrscheinlichkeiten Alpha und Beta werden Irrtumswahrscheinlichkeiten genannt. Die Irrtumswahrscheinlichkeiten sagen etwas über die Güte des Hypothesentests aus. Je kleiner die Irrtumswahrscheinlichkeiten sind, umso besser ist der Test. Bei der Konstruktion wird darauf geachtet, dass einer der beiden Fehler, oder auch beide möglichst klein sind. Das hängt von der Entscheidungsregel ab. Dies können wir uns an unserem Beispiel mit den Bananen verdeutlichen. Unsere Zufallsgröße X, die Anzahl der zu kurzen Bananen in der Stichprobe ist binomial verteilt. Sind die Bananen tatsächlich erste Wahl, so sind die Parameter n = 30 und p = 0,2. Sind die Bananen zweite Wahl, so sind die Parameter n = 30 und p = 0,4. Ist die kritische Zahl, wie im Beispiel, gleich sechs, so lassen sich die Irrtumswahrscheinlichkeiten so berechnen. Der rote Bereich im linken Histogramm ist der Fehler erster Art. Also die Wahrscheinlichkeit die Nullhypothese zu verwerfen, obwohl sie eigentlich zutrifft. Diese Wahrscheinlichkeit ist zum Fehler zweiter Art sehr hoch. Es ist recht wahrscheinlich, dass der Verkäufer die Bananen als zweite Wahl verkauft, wenn sie eigentlich erste Wahl sind. Dass er sie als erste Wahl verkauft, obwohl sie eigentlich zweite Wahl sind, ist dagegen eher unwahrscheinlich. Mithilfe einer Tabelle der kumulierten Binomialverteilung kannst du die Irrtumswahrscheinlichkeiten bestimmen. In unserem Beispiel ist Alpha = 39,3 % und Beta = 1,72 %. Diese Werte sind gut für den Kunden. Da er für die vermeintlich zweite Wahl Bananen, die aber eigentlich erste Wahl Bananen sind, weniger Geld bezahlt. Möchte der Verkäufer zum Beispiel seinen Profit erhöhen, so könnte er die kritische Zahl verändern. Er könnte zum Beispiel sagen, dass er die Bananen erst als zweite Wahl anbietet, wenn mehr als neun Bananen in der Stichprobe zu kurz sind. Die kritische Zahl k ist dann neun. Der Bereich in denen die Hypothesen angenommen oder verworfen werden ändern sich dann. Der Fehler erster Art sinkt dann auf 6,1 Prozent und der Fehler zweiter Art steigt auf 17,6 Prozent. Wie du siehst wird der Fehler erster Art kleiner und der Fehler zweiter Art wird größer. Das wäre für die Kunden schlechter, da es dann wahrscheinlicher ist, dass sie Bananen kaufen, die zweite Wahl sind, sie aber den Preis für erste Wahl Bananen bezahlen müssen. Du siehst also die kritische zahl k und damit die Entscheidungsregel haben einen großen Einfluss auf die Irrtumswahrscheinlichkeiten. Herzlichen Glückwunsch. Du kennst jetzt alle wichtigen Begriffe zum Thema Hypothesentest. Hast du auch Hunger auf Bananen bekommen? Mein Name ist Jonathan, hoffentlich sehen wir uns bald wieder. Bis dahin wünsche ich dir viel Freude an der Mathematik.

Testen von Hypothesen – Grundbegriffe des Hypothesentestens Übung

Du möchtest dein gelerntes Wissen anwenden? Mit den Aufgaben zum Video Testen von Hypothesen – Grundbegriffe des Hypothesentestens kannst du es wiederholen und üben.

  • Gib die Grundbegriffe des Hypothesentests wieder.

    Tipps

    Den Fehler erster und zweiter Art sind ihre Wahrscheinlichkeiten $\alpha$ und $\beta$ zugeordnet.

    Verändert man die kritische Zahl, ändert sich auch die Entscheidungsregel und somit auch die Irrtumwahrscheinlichkeiten.

    Lösung

    In der Stochastik werden alle Objekte innerhalb eines Hypothesentests als statistische Gesamtheit bezeichnet, da man hier die Eigenschaften aller Objekte mit Hilfe einer Stichprobe festlegen will.

    Dazu stellt man zwei Hypothesen auf:

    • $H_0$ ist die Nullhypothese und
    • $H_1$ die Alternativhypothese
    Diese schließen sich gegenseitig aus; es kann also immer nur eine von beiden richtig sein.

    Wenn man seine Stichprobe entnommen hat, formuliert man eine Entscheidungsregel, nach der man sich für eine der beiden Hypothesen entscheidet.

    Innerhalb dieser Regel benennt man eine kritische Zahl $k$, nach der man entscheidet, welche Hypothese angenommen bzw. verworfen wird.

    Natürlich kann man bei der Annahme einer Hypothese auch einen Fehler begehen.

    Dies liefert die Irrtumswahrscheinlichkeiten $\alpha$ und $\beta$:

    • Fehler 1. Art (mit Wahrscheinilchkeit $\alpha$): Hier wird die Nullhypothese verworfen, obwohl sie eigentlich stimmt.
    • Fehler 2. Art (mit Wahrscheinlichkeit $\beta$): Hier wird die Alternativhypothese verworfen, obwohl sie eigentlich stimmt.
  • Fasse die Grundbegriffe des Hypothesentests zusammen.

    Tipps

    Mit einer Prüfgröße testet man seine Hypothese. Sie entstammt der Stichprobe, also einem Teil der zu bewertenden Objekte.

    Mit Wahrscheinlichkeit $\alpha$ bzw. $\beta$ wird die Nullhypothese bzw. Alternativhypothese verworfen, obwohl sie eigentlich gestimmt hätte.

    Lösung

    Fassen wir wichtige Begriffe an dem Beispiel mit dem Bananenhändler zusammen. Der wird mit Bananen erster bzw. zweiter Wahl beliefert, bei denen $20~\%$ bzw. $40~\%$ zu kurz sind.

    Die gesamten Bananen sind hier die statistische Gesamtheit. Diese Objekte möchte er mit Hilfe einer Stichprobe bewerten. Sie ist also nur ein Auszug bzw. Teil des Ganzen.

    Mit ihrer Hilfe will er seine Hypothesen testen.

    Dazu stellt er eine Nullhypothese $H_0$ und eine Alternativhypothese $H_1$ auf, die beide nicht zur selben Zeit gültig sein können.

    $H_0$ bezieht sich hier auf den Fall, dass die Bananen einer Kiste erster Wahl entstammen. Bei $H_1$ sind es Bananen einer Kiste zweiter Wahl.

    Die Wahrscheinlichkeit ergibt sich aus dem Anteil $p$ zu kurzer Bananen:

    $H_0:p=0,2$ und $H_1:p=0,4$

    Welche er davon verwirft und welche er ablehnt, hängt von der kritischen Zahl $k$ ab. So kann er zwei Fehler begehen.

    Wenn er $H_0$ verwirft und $H_1$ annimmt, obwohl die Nullhypothese stimmt, spricht man vom Fehler erster Art mit Irrtumswahrscheinlichkeit $\alpha$. So würde ein Fehler erster Art bedeuten, dass er eine Kiste mit Bananen erster Wahl versehentlich als zweite Wahl anbietet.

    Wenn der $H_1$ verwirft und $H_0$ annimmt, obwohl die Alternativhypothese stimmt, spricht man vom Fehler zweiter Art mit Irrtumswahrscheinlichkeit $\beta$. Bei einem Fehler zweiter Art würde er Bananen zweiter Wahl fälschlicherweise als Bananen erster Wahl anbieten.

  • Berechne die Irrtumswahrscheinlichkeiten.

    Tipps

    Du findest die Wahrscheinlichkeiten in einer kumulierten Tabelle:

    • Die Wahrscheinlichkeit für einen Fehler erster Art ist $\alpha =P(X\geq k)=1-P(X \le k)$ für eine binomialverteilte Zufallsgröße mit Parameter $n=30$ und $p=0,2$.
    • Die Wahrscheinlichkeit für einen Fehler zweiter Art ist $\beta =P(X \le k)$ für eine binomialverteilte Zufallsgröße mit Parameter $n=30$ und $p=0,4$.

    Der Auszug einer Tabelle für $n=30$ und $p=0,2$, falls $X$ binomialverteilt ist mit Parametern n und p:

    Der Auszug einer Tabelle für $n=30$ und $p=0,4$, falls $X$ binomialverteilt ist mit Parametern n und p:

    Aus der ersten Tabelle musst du den Wert $P(X >k)$ berechnen und aus der zweiten Tabelle den Wert $P(X\leq k)$ ablesen.

    Lösung

    Die Nullhypothese ist $H_0:~p=0,2$. Die Alternativhypothese ist $H_1:~p=0,4$. Wir entnehmen eine Stichprobe in der Größe $n=30$. Gesucht sind Irrtumwahrscheinlichkeiten auf eine Nachkommastelle gerundet für die kritische Zahl $k=6$.

    Die Wahrscheinlichkeiten für Fehler erster oder zweiter Art lassen sich aus Tabellen für kumulierte Wahrscheinlichkeiten ablesen bzw. errechnen.

    Hierbei musst du beachten, wo dein Annahme- und Verwerfungsbereich liegt.

    In diesem Beispiel liegt der Annahmebereich beim Fehler erster Art zwischen $0$ und $6$. Wir begehen also einen Fehler erster Art, wenn unsere kritische Zahl $k=6$ überschritten wird, also wenn gilt $P(X>6)$.

    So einen Wert finden wir in der Tabelle nicht. Daher ziehen wir einfach den die Wahrscheinlichkeit des Annahmebereiches von 1 ab, um so die Wahrscheinlichkeit zu erhalten, irgendwo im Ablehnungsbereich für $H_0$ zu landen und somit einen Fehler erster Art zu begehen.

    Wir brauchen dazu eine Tabelle mit $n=30$ und $p=0,2$:

    $\begin{array}{c|c} l & P(X\leq l) \\ \hline 4 & 0,2552 \\ 5 & 0,4275 \\ 6 & 0,6070 \\ 7 & 0,7608 \end{array}$

    Der Fehler erster Art können wir also mit $\alpha=1-P(X \le 6) = 1-0,6070 = 0,393 = 39,3\%$ berechnen.

    Beim Fehler zweiter Art versuchen wir herauszufinden, mit welcher Wahrscheinlichkeit $H_1$ verworfen wird, obwohl diese Hypothese stimmt. Wir brauchen also die gesamte Wahrscheinlichkeit des Verwerfungsbereiches von $H_1$ und dieser liegt zwischen $0$ und $6$.

    Wir brauchen also eine Tabelle mit $n=30$ und $p=0,4$

    $\begin{array}{c|c} l & P(X\leq l) \\ \hline 4 & 0,0015 \\ 5 & 0,0057 \\ 6 & 0,0172 \\ 7 & 0,0435 \end{array}$

    und können dort die Irrtumswahrscheinlichkeit $\beta=P(X \le 6) = 0,0172 = 1,7\%$ ablesen.

  • Berechne die Irrtumswahrscheinlichkeit mit Hilfe der kulmulierten Wahrscheinlichkeiten.

    Tipps

    Es gilt $\Large{P(X=k)=\binom{n}{k} \cdot p^k \cdot (1-p)^{n-k}}$.

    Wie ist $p$ zu wählen?

    So setzt sich die kumulierten (aufaddierten) Wahrscheinlichkeiten zusammen.

    Beim Fehler zweiter Art entscheidet man sich für $H_0$, obwohl $H_1$ eigentlich richtig wäre.

    Du musst also $p=0,2$ annehmen.

    Lösung

    Erinnern wir uns zunächst daran, was ein Fehler zweiter Art bedeutet. Wir verwerfen $H_1$, obwohl diese Hypothese eigentlich stimmt. Daher müssen wir auch mit den Werten von $H_1$ rechnen. Die Wahrscheinlichkeit in der Stichprobe einen zu kurzen Bleistift zu erwischen, liegt demnach bei $p=0,2$. Für die konkrete Situation bedeutet ein Fehler zweiter Art: Das Unternehmen behält die Stifte, obwohl viel zu viele davon zu kurz für den geplanten Werbeslogan wären.

    Als Umfang der Stichprobe haben wir $n=50$ gegeben.

    Um nun zu ermitteln, wie groß die Wahrscheinlichkeit ist, beim Prüfen der Stichprobe fälschlicherweise im Annahmebereich von $H_0$ zu liegen, obwohl $H_1$ stimmt, brauchen wir eine kumulierte Wahrscheinlichkeitstabelle (siehe Bild).

    Diese ergibt sich folgendermaßen:

    Man beginnt mit dem genauen Wert (auf vier Nachkommastellen gerundet) für $l=0$. Diesen trägt man direkt ein. Danach der genaue Wert für $l=1$ addiert mit dem Wert für $l=0$. Diesen trägt man dann auch ein. Du kannst dir den Aufbau so vorstellen:

    $\begin{array}{c|l} l & P(X\leq l) \\ \hline 0 & P(0) \\ 1 & P(0) + P(1) \\ 2 & P(0) + P(1) +P(2) \\ \vdots & \vdots \end{array}$

    Diese genauen Werte ermittelst du mit Hilfe der Formel für die Binomialverteilung:

    $P(X=l)=\binom{n}{l} \cdot p^l \cdot (1-p)^{n-l}$

    So zum Beispiel der Wert für $l=3$:

    $P(X=3)=\binom{50}{3} \cdot 0,2^3 \cdot 0,8^{47}\approx 0,0044$

    Die Wahrscheinlichkeit $\beta$ für einen Fehler zweiter findest du direkt in der Tabelle. Denn sie steht bei $l=6$: $\beta =10,34~\%$.

  • Bestimme die Nullhypothese und die Alternativhypothese.

    Tipps

    Der Fehler zweiter Art besteht darin, dass wir uns für $H_0$ entscheiden, obwohl $H_1$ richtig ist.

    In unserem Beispiel bedeutet das: Wir entscheiden uns leider für den günstigen Preis, obwohl der teure Preis angemessen wäre.

    Es ist $\frac{1}{7}\approx 0,14$.

    Lösung

    Die Hypothesen bereits formuliert sind, dass der Fehler zweiter Art darin besteht, dass der Baumarkt die teuren Glühbirnen für den günstigen Preis weiterverkauft.

    Wir erinnern uns, dass der Fehler erster Art darin besteht, dass wir uns für $H_0$ entscheiden, obwohl $H_1$ richtig ist. In unserem Szenario entscheiden wir uns leider für den günstigen Preis, obwohl der teure Preis angemessen wäre.

    Die Wahrscheinlichkeit, die zur Nullhypothese $H_0$ gehört, ist im Text gegeben. Denn in Kartons mit billigen Glühbirnen sind ein Siebtel defekt.

    Daher ist die Wahrscheinlichkeit, eine kaputte Glühbirne zu erwischen bei billigen Kisten $p=\frac{1}{7} \approx 0,14$. Wir formulieren die Nullhypothese $H_0$: $p=0,14$.

    Als Alternativhypothese kommt nur noch die Wahrscheinlichkeit in Frage, dass hochwertigen Glühbirnen vorliegen. Beide Hypothesen schließen sich gegenseitig aus, das bedeutet, dass eine Kiste entweder teure oder billige Ware enthält - nie aber beides zur selben Zeit.

    Bei einer teuren Kiste sollen nur drei von $100$ Birnen defekt sein, daher liegt die Wahrscheinlichkeit, beim Greifen in eine teure Kiste eine defekte Birne zu erwischen, nur bei $p=\frac{3}{100} = 0,03$. Die Alternativhypothese ist also $H_1$: $p=0,03$.

  • Bestimme die Irrtumswahrscheinlichkeiten $\alpha$ und $\beta$.

    Tipps

    Ein Auszug einer kumulierten Wahrscheinlichkeitstabelle für $n=25$ und $p=0,05$:

    Ein Auszug einer kumulierten Wahrscheinlichkeitstabelle für $n=25$ und $p=0,15$:

    Die kritische Zahl $k=3$ bedeutet, dass er die Lieferung reklamieren wird, sobald er mehr als drei kaputte Flaschen in einer Kiste findet.

    Lösung

    Mit Hilfe der Stichprobe versucht der Händler nun herauszufinden, welches Unternehmen ihm die Kisten geliefert hat und ob er die Palette behält oder reklamiert.

    In einer Kiste sind $25$ Flaschen, also haben wir $n=25$. Der Anteil kaputter Flaschen wird mit $p$ bezeichnet. Unsere Hypothesen sind bereits gegeben:

    $H_0:$ $p=0,05$

    $H_1:$ $p=0,15$

    Als kritische Zahl wählte der Händler $k=3$. Wenn also in einer Kiste drei oder weniger Flaschen kaputt sind, behält er die Palette. Bei mehr kaputten Flaschen wird er sie reklamieren.

    Beginnen wir mit dem Fehler erster Art. Was, wenn er die Palette reklamiert, obwohl sie in Ordnung ist? Das passiert nur, wenn mehr als drei Flaschen kaputt sind. Wir suchen also

    $\alpha=P(X>3)$

    Die kumulierten Wahrscheinlichkeitstabelle mit $n=25$ und $p=0,05$ ist:

    $\begin{array}{c|c} l & P(X\leq l) \\ \hline 2 & 0,8729 \\ 3 & 0,9659 \\ 4 & 0,9928 \\ 5 & 0,9988 \end{array}$

    Die Irrtumwahrscheinlichkeit für einen Fehler erster Art ist also $\alpha=1-P(X\le 3) = 1 - 0,9659 = 0,0341 = 3,41\%$.

    Nun zum Fehler zweiter Art. Dazu muss er die Lieferung behalten, obwohl sie eigentlich ein Fall für eine Reklamation gewesen wäre. Er würde also in einer Kiste aus einer zu reklamierenden Palette drei oder weniger kaputte Flaschen finden.

    Die kumulierte Wahrscheinlichkeitstabelle mit $n=25$ und $p=0,15$ ist:

    $\begin{array}{c|c} l & P(X\leq l) \\ \hline 2 & 0,2537 \\ 3 & 0,4711 \\ 4 & 0,6821 \\ 5 & 0,8385 \end{array}$

    Die Irrtumwahrscheinlichkeit für einen Fehler zweiter Art ist also $\beta=P(X\le 3) = 0,4711 = 47,11\%$.

    Die Wahrscheinlichkeit für diesen Fehler ist sehr hoch, was äußerst ungünstig für den Händler wäre. Er müsste seine kritische Zahl anders wählen. Bei zum Beispiel $k=2$ würde sich die Wahrscheinlichkeit eines Fehlers zweiter Art fast halbieren.