30 Tage kostenlos testen

Überzeugen Sie sich von der Qualität unserer Inhalte.

Hypothesentest – Einführung (2)

Bewertung

Ø 5.0 / 2 Bewertungen

Die Autor/-innen
Avatar
Martin Wabnik
Hypothesentest – Einführung (2)
lernst du in der 11. Klasse - 12. Klasse - 13. Klasse

Beschreibung Hypothesentest – Einführung (2)

Um einen Hypothesentest durchführen zu können, brauchen wir einen Zufallsversuch, ein Ereignis E und eine Hypothese, z.B. die Hypothese, dass die Wahrscheinlichkeit P(E) des Ereignisses E gleich p ist. Wir führen den Zufallsversuch dann mehrmals durch und vergleichen die so entstandene relative Häufigkeit h von E mit der hypothetischen Wahrscheinlichkeit p. Wenn wir den Zufallsversuch durchführen, tritt das Ereignis E entweder ein oder nicht. So gesehen haben wir einen Bernoulli-Versuch. Führen wir den Zufallsversuch n-mal durch, haben wir eine Bernoulli-Kette der Länge n. Jedes Ergebnis dieser Bernoulli-Kette ist ein n-Tupel mit den Einträgen "E" oder "nicht E". Wir können eine Zufallsgröße X definieren, die jedem Ergebnis die Anzahl der E's (auch genannt: Anzahl der Erfolge) zuordnet. Diese Zufallsgröße ist binomialverteilt, weil die Wahrscheinlichkeiten der Ereignisse "X=k" (zu dem Ereignis X=3 beispielsweise gehören alle Ergebnisse, in denen das Ereignis E genau dreimal vorkommt) mit einer bestimmten Formel berechnet werden kann (die im Video gezeigt wird). Zu jedem Hypothesentest existiert eine solche binomialverteilte Zufallsgröße X. Wir verwenden die Wahrscheinlichkeitsverteilungen solcher binomialverteilten Zufallsgrößen, um festzulegen, unter welchen Umständen wir die Hypothese annehmen oder ablehnen wollen.

Hypothesentest – Einführung (2) Übung

Du möchtest dein gelerntes Wissen anwenden? Mit den Aufgaben zum Video Hypothesentest – Einführung (2) kannst du es wiederholen und üben.
  • Gib die Reihenfolge der Begriffe an.

    Tipps

    Die hier passende Reihenfolge deckt sich vermutlich mit der zeitlichen Reihenfolge, in der du die Begriffe kennengelernt hast.

    Meistens steht das Einfachere vor dem Komplexeren.

    Das Ziel der Modellierung eines Hypothesentests ist, zu wissen, unter welchen Umständen die Hypothese abgelehnt werden soll.

    Lösung

    Soll ein Hypothesentest entworfen – also modelliert – werden, ist als Erstes zu klären, welcher Bernoulli-Versuch diesem Test zugrunde liegen soll. Soll z. B. herausgefunden werden, ob $70 \%$ der Deutschen gerne Schokolade essen, könnten Menschen gefragt werden, ob sie gerne Schokolade essen. Die Befragung eines Einzelnen, der auf die Frage „Essen Sie gerne Schokolade?“ mit „Ja“ oder „Nein“ antworten kann, ist dann der Bernoulli-Versuch, mit dem alles beginnt.

    Als Nächstes wird festgelegt, wie oft dieser Bernoulli-Versuch durchgeführt werden soll. Damit ist dann auch klar, wie lang die Bernoulli-Kette ist und was als Ergebnis gilt. Werden z. B. $50$ Menschen gefragt, ob sie gerne Schokolade essen und sollen diese Menschen nur entweder mit „Ja“ oder „Nein“ antworten, sind die Ergebnisse $50$er-Tupel mit den Einträgen „Ja“ und/oder „Nein“.

    Erst jetzt, da nun feststeht, was ein Ergebnis ist, kann die Zufallsgröße definiert werden, denn eine Zufallsgröße ist ja eine Funktion, die den Ergebnissen eines Zufallsversuchs Zahlen zuordnet.

    Ordnet diese Zufallsgröße den Ergebnissen deren Anzahlen der Erfolge zu, können die Wahrscheinlichkeiten der Werte der Zufallsgröße mit der Bernoulli-Formel berechnet werden. Die Erfolgswahrscheinlichkeit richtet sich dabei nach der Hypothese. Wollen wir z. B. feststellen, ob $70 \%$ der Deutschen gerne Schokolade essen, ist die Erfolgswahrscheinlichkeit gleich $0,7$.

    Errechnet man nun die Wahrscheinlichkeiten aller Werte der Zufallsgröße, erhält man eine Wahrscheinlichkeitsverteilung. Da die Wahrscheinlichkeiten mit der Bernoulli-Formel berechnet werden, ist unsere Zufallsgröße eine binomialverteilte Zufallsgröße, deren Wahrscheinlichkeitsverteilung dann einfach Binomialverteilung heißt.

    Nun können auch die Bereiche der Binomialverteilung angegeben werden, die die Ablehnbereiche sein sollen. Wie groß diese Bereiche sind, richtet sich nach dem Signifikanzniveau.

  • Gib an, in welcher Reihenfolge ein Hypothesentest welche Fragen beantwortet.

    Tipps

    Die Beantwortung der vorherigen Frage ist meistens die Voraussetzung zur Beantwortung der darauf folgenden Frage.

    Wählt man zufällig eine Person aus und stellt ihr eine Frage, die mit „Ja“ oder „Nein“ beantwortbar ist, kann das als ein Zufallsversuch gesehen werden, der nur zwei mögliche Ausgänge hat.

    Lösung

    Wollen wir einen Hypothesentest modellieren und wollen wir dazu eine Umfrage durchführen, überlegen wir uns als Erstes, was wir die Menschen fragen wollen. Es sollen nur zwei verschiedene Antworten zugelassen werden, wobei wir auch festlegen, welche Antwort als „Erfolg“ gewertet werden soll. Damit haben wir dann definiert, welcher der dem Test zugrunde liegende Bernoulli-Versuch ist.

    Danach legen wir fest, wie viele Menschen wir befragen möchten, womit wir dann auch die Länge der Bernoulli-Kette kennen. Nun kennen wir auch die Ergebnisse unseres Zufallsversuchs. Befragen wir z. B. $100$ Menschen, sind unsere Ergebnisse $100$er-Tupel.

    Jetzt können wir die Zufallsgröße $X$ definieren, die den Ergebnissen Zahlen – nämlich die Anzahlen der Erfolge in den Ergebnissen – zuordnet. Die Werte der Zufallsgröße sind dann die Zahlen, denen wir Wahrscheinlichkeiten zuordnen wollen.

    Eine solche Zufallsgröße ist binomialverteilt, weil wir die Wahrscheinlichkeiten der Werte der Zufallsgröße mit der Bernoulli-Formel berechnen können. Für $p$ setzen wir in die Bernoulli-Formel die Erfolgswahrscheinlichkeit ein, die wir hypothetisch annehmen.

    Die Liste mit allen möglichen Werten der Zufallsgröße nebst ihren Wahrscheinlichkeiten ist die Wahrscheinlichkeitsverteilung der Zufallsgröße. Da unsere Zufallsgröße binomialverteilt ist, heißt die Wahrscheinlichkeitsverteilung Binomialverteilung.

    Nun können wir auch festlegen, welche Bereiche der Binomialverteilung Ablehnbereiche sein sollen. Um die Ablehnbereiche genau bestimmen zu können, brauchen wir noch das Signifikanzniveau.

  • Erläutere, warum Hypothesentests in der Schule behandelt werden.

    Tipps

    In einer sehr häufig in diesem Zusammenhang vorkommenden Aufgabe geht es darum, für eine Firma, die Schrauben herstellt, einen Hypothesentest zu entwerfen, mit dem festgestellt werden kann, ob die Maße der Schrauben im vorgeschriebenen Toleranzbereich sind.

    Es mag aus der Sicht eines Schülers verlockend sein, eine gestellte Aufgabe lösen zu können, ohne sie verstanden zu haben. Unterrichtet wird das aber eigentlich nicht.

    Nur jemandem, der sich mit einer Sache nicht so gut auskennt, lässt sich ein X für ein U vormachen.

    Lösung

    Auch wenn die Aufgabe, in der es um eine Firma geht, die Schrauben herstellt, oft vorkommt, ist es nicht das Ziel unseres Bildungssystems, SchraubenberaterInnen zu erzeugen. Diese Aufgabe wird gestellt, weil sie – verglichen mit anderen Aufgaben – einfach und lehrreich ist.

    Es wird oft die Frage gestellt, wozu man Mathematik braucht. Um die Frage beantworten zu können, sollte erst im Groben geklärt werden, was Mathematik eigentlich ist. Versteht man unter „Mathematik“, einen willkürlichen Aufgabentext nach Schlüsselwörtern zu durchsuchen, um dann ein auswendig gelerntes Lösungsverfahren abzuspulen, ist die Antwort klar: Nein, das braucht niemand.

    Auch wenn es immer wieder behauptet wird, stimmt es trotzdem nicht: Es ist nicht möglich, Hypothesentests so einzusetzen, dass sie den eigenen Interessen dienen und die anderer hintertreiben. Sollte die eigene Meinung „bestätigt“ werden, geschieht dies aufgrund eines Hypothesentests nur dann, wenn die Stichprobe eben zur eigenen Meinung passt.

    Behandeln wir Hypothesentests im Schulunterricht, schauen wir uns immer wieder die Wahrscheinlichkeitsverteilungen von binomialverteilten Zufallsgrößen an. Damit können wir ein gutes Gefühl dafür bekommen, welche Stichproben wie wahrscheinlich sind, falls eine bestimmte Erfolgswahrscheinlichkeit vorliegt.

    Mit diesem Wissen kann man sich dann ein Verfahren überlegen, mit dem man statistische Ergebnisse beurteilen möchte.

    Im Alltag sind viele Entscheidungen zu treffen, die – wenn überhaupt – nur statistisch zu begründen sind. Z. B.: Soll ich noch Auto fahren oder ist mir das Risiko, dabei getötet zu werden, zu hoch? Soll ich Jura studieren, obwohl ich weiß, dass die Arbeitslosigkeit unter Juristen ziemlich hoch ist? Wie gefährlich ist es, rotes Fleisch zu essen und wie weit sind daraus folgende Krankheiten statistisch belegbar? Soll ich mein Kind impfen lassen (wobei es schwere gesundheitliche Schäden aufgrund von Impfkomplikationen erleiden könnte) oder nicht (wobei es durch die Krankheit, gegen die es dann nicht geimpft ist, schwere gesundheitliche Schäden erleiden könnte)?

    In unserem täglichen Leben haben wir oft keine Zeit, uns in die meist sehr komplexe Materie hinter solchen Entscheidungen einzuarbeiten und die entsprechenden Studien wissenschaftlich auszuwerten. Hat man aber ein gutes Gefühl für Wahrscheinlichkeiten und die Vertrauenswürdigkeit von Testmethoden, kommt man sehr schnell an verlässliche Informationen, aufgrund derer eine begründete Entscheidung möglich ist.

  • Beschreibe den Fall, in dem ein Hypothesentest angewendet werden kann.

    Tipps

    Hat man eine Stichprobe, gibt es viele Methoden, welche auf diese anwendbar sind – unter den genannten Möglichkeiten ist aber nur eine ein Hypothesentest.

    Ist eine Hypothese abzulehnen, können oft auch mehrere Hypothesen abgelehnt werden; trotzdem ist die Grundlage eines Hypothesentests immer nur eine einzige Hypothese.

    Führen wir einen Hypothesentest durch, vergleichen wir ein Stichprobenergebnis mit einer Aussage. Weichen beide zu sehr voneinander ab, wird die Aussage verworfen.

    Lösung

    Der Anteil der Erfolge in der Grundgesamtheit ist die Wahrscheinlichkeit, beim zufälligen Ziehen eines Elements aus der Grundgesamtheit eines mit der Eigenschaft $E$ zu ziehen. Führen wir einen Hypothesentest durch, wollen wir etwas über diese Erfolgswahrscheinlichkeit wissen.

    Wir gehen davon aus, dass der Anteil der Erfolge in der Grundgesamtheit gleich $p_{_G}$ sei. Dann berechnen wir die Wahrscheinlichkeit, mit der eine Stichprobe mit der relativen (Erfolgs-)Häufigkeit $h$ zustande kommt.

    Wollen wir die Erfolgswahrscheinlichkeit schätzen, verwenden wir Schätzfunktionen (die manchmal auch einfach Schätzer genannt werden). Z. B. können wir einer Grundgesamtheit die relative Häufigkeit $h$ der Erfolge in der Stichprobe zuordnen. $h$ ist dann der Schätzwert für $p_{_G}$.

    Wollen wir wissen, welche Hypothesen zur Stichprobe passen, führen wir den Schluss von der Stichprobe auf die Grundgesamtheit durch. Alle Hypothesen, die wir bei gegebener Stichprobe einen Hypothesentest durchführend abgelehnt haben, wären dann die nicht-passenden Hypothesen und alle anderen sind die passenden.

    Es ist zwar möglich, an einem geeigneten Modell (bedingte Wahrscheinlichkeit) die Wahrscheinlichkeit zu bestimmen, mit der eine Stichprobe aus einer bestimmten Grundgesamtheit gezogen wurde – aber nicht mit einem Hypothesentest.

    In der Praxis wird selten nur eine einzige Methode verwendet, denn das, was an der Durchführung statistischer Untersuchungen teuer ist, ist das Gewinnen der Stichprobe. Hat man dann eine Stichprobe vorliegen, ist es ein Leichtes, mit verschiedenen Methoden viele Daten aus ihr zu erzeugen.

  • Beschreibe die Durchführung eines bestimmten Hypothesentests.

    Tipps

    Es beginnt alles mit einem Zufallsversuch, der nur zwei mögliche Ergebnisse hat.

    Voraussetzung für jeden Begriff ist der vorhergehende Begriff – außer beim ersten Begriff natürlich.

    Lösung

    Genau genommen ist nicht die Befragung einer Person, sondern deren zufällige Auswahl der dem Hypothesentest zugrundeliegende Zufallsversuch. Da eine solche Person nur mit zwei verschiedenen Ergebnissen reagieren darf – nämlich mit „Kann frei reden“ oder „Besser vorsichtig sein“ – ist dieser Zufallsversuch ein Bernoulli-Versuch.

    Führt man mehrere Zufallsversuche hintereinander aus, erhält man eine Bernoulli-Kette. (Damit jeder Bernoulli-Versuch die gleiche Wahrscheinlichkeit hat, verzichten wir auf die übliche Gepflogenheit, Personen nicht mehrmals zu befragen.) In unserem Fall hat diese Bernoulli-Kette eine Länge von $120$, denn es sollen $120$ Personen befragt werden. Die gesamte Bernoulli-Kette sehen wir nun als einen einzigen Zufallsversuch, dessen Ergebnisse $120$er-Tupel sind.

    Da wir nun die Ergebnisse haben, können wir die Zufallsgröße $X$ definieren, die jedem Ergebnis $e$ dessen Anzahl von Erfolgen zuordnet.

    $X(e) \rightarrow \text{Anzahl der Erfolge}$

    Mit der Bernoulli-Formel

    $P(X=k)= {n \choose k} \cdot p^k \cdot (1-p)^{n-k}$

    können wir die Wahrscheinlichkeiten der verschiedenen Erfolgsanzahlen berechnen. $n$ ist in unserem Fall gleich $120$ und $p$ ist die hypothetische Erfolgswahrscheinlichkeit $0,63$. Also erhalten wir:

    $P(X=k)= {120 \choose k} \cdot 0,63^k \cdot (1-0,63)^{120-k}$

    Alle möglichen Werte $k \in {0; \, 1;\, 2; \, ... \, ;120}$ der Zufallsgröße $X$ zusammen mit den zugehörigen Wahrscheinlichkeiten bilden die Wahrscheinlichkeitsverteilung von $X$. Da die Wahrscheinlichkeiten mit der Bernoulli-Formel berechnet werden können, handelt es sich um eine Binomialverteilung.

    Wenn wir jetzt noch das Signifikanzniveau (welches im Aufgabentext nicht genannt wurde) kennen würden, könnten wir den genauen Ablehnbereich bestimmen.

  • Erkläre, wie die Wahrscheinlichkeit einer Grundgesamtheit berechnet werden kann.

    Tipps

    Das Zeichen $\sum$ (griechisch groß Sigma) ist das Summenzeichen. Z. B. ist

    $\sum_{n=1}^4 n^2= 1^2+2^2+3^2+4^2$

    Jedes $10$er-Tupel hat die gleiche Wahrscheinlichkeit, gezogen zu werden.

    Es ist nach einer bedingten Wahrscheinlichkeit gefragt.

    Lösung

    Es gibt $6^{10}$ Möglilchkeiten, $10$ Kugeln mit Zurücklegen und mit Reihenfolge aus einem Behälter mit $6$ Kugeln zu ziehen.

    Es gibt $5^{8} \cdot 1^{2}$ Möglichkeiten, erst acht rote und dann zwei gelbe Kugeln aus einem Behälter mit nur einer gelben und fünf roten Kugeln zu ziehen. Und es gibt ${ 10 \choose 8}$ Möglichkeiten, acht rote und zwei gelbe Kugeln auf zehn Positionen zu verteilen. Im Ganzen sind das also ${ 10 \choose 8} \cdot 5^{8} \cdot 1^{2}$ Möglichkeiten, acht rote und zwei gelbe Kugeln aus $B_1$ zu ziehen.

    Mit genau zwei gelben Kugeln in $B_2$ sind es ${ 10 \choose 8} \cdot 4^{8} \cdot 2^{2}$ Möglichkeiten.

    Mit genau drei gelben Kugeln in $B_3$ sind es ${ 10 \choose 8} \cdot 3^{8} \cdot 3^{2}$ Möglichkeiten.

    Mit genau vier gelben Kugeln in $B_4$ sind es ${ 10 \choose 8} \cdot 2^{5} \cdot 4^{2}$ Möglichkeiten.

    Mit genau fünf gelben Kugeln in $B_5$ sind es ${ 10 \choose 8} \cdot 1^{5} \cdot 5^{2}$ Möglichkeiten.

    Die Summe all dieser Möglichkeiten ist ${\sum_{n=1}^5} {10 \choose 8} \cdot n^{8} \cdot (6-n)^{2}=32\,217\,255$.

    Um die Wahrscheinlichkeit, dass ein $10$er-Tupel mit acht roten Kugeln aus $B_1$ gezogen wurde, zu berechnen, teilt man die Anzahl der Möglichkeiten für ein solches $10$er-Tupel aus $B_1$ durch die Anzahl aller Möglichkeiten, ein solches $10$er-Tupel zu ziehen.

    Also: $\frac{17578125}{32217255} \approx 0,5456$

    Dieses Ergebnis deckt sich mit unserem Alltags-Wahrscheinlichkeitsempfinden. Wir wissen: Die meisten Stichproben mit vielen roten Kugeln kommen aus Grundgesamtheiten mit vielen roten Kugeln. Hat man also eine Stichprobe mit vielen roten Kugeln gezogen, ist die (nicht nur gefühlte) Wahrscheinlichkeit groß, dass die Stichprobe aus einer Grundgesamtheit mit vielen roten Kugeln gezogen wurde.

    Dieses Verfahren lässt sich nicht nur auf ein paar Behälter mit roten und gelben Kugeln anwenden, sondern auch auf die Situation, dass eine Umfrage unter allen $83 000 000$ Deutschen gemacht wird. Da die Zahlen dabei recht unübersichtlich werden, hilft man sich mit der Likelihood-Funktion. Um die entsprechenden Wahrscheinlichkeiten zu bestimmen, vergleicht man dann Flächen unter dem Funktionsgraphen dieser Funktion.

30 Tage kostenlos testen
Mit Spaß Noten verbessern
und vollen Zugriff erhalten auf

10.834

Lernvideos

44.304

Übungen

38.945

Arbeitsblätter

24h

Hilfe von Lehrer/
-innen

running yeti

Inhalte für alle Fächer und Klassenstufen.

Von Expert/-innen erstellt und angepasst an die Lehrpläne der Bundesländer.

30 Tage kostenlos testen

Testphase jederzeit online beenden