sofatutor 30 Tage
kostenlos ausprobieren

Videos & Übungen für alle Fächer & Klassenstufen

Hypothesentest – Signifikanz und Irrtumswahrscheinlichkeit

Bewertung

Ø 3.8 / 5 Bewertungen

Die Autor/-innen
Avatar
Team Entdeckungsreise

Hypothesentest – Signifikanz und Irrtumswahrscheinlichkeit

lernst du in der 11. Klasse - 12. Klasse - 13. Klasse

Beschreibung Hypothesentest – Signifikanz und Irrtumswahrscheinlichkeit

Wie kann man eine statistische Aussage über alle Schüler in Deutschland treffen, ohne jeden einzelnen zu befragen? Anstelle der Grundgesamtheit betrachtet man nur eine Stichprobe. Doch wie groß muss die Stichprobe sein, um von der Stichprobe auf die Grundgesamtheit schließen zu können? Ist die Stichprobe zu klein, so kann keine sichere Aussage getroffen werden. Solchen Fragen und Problemen stellt man sich in der beurteilenden Statistik. Dabei werden einige Elemente der beschreibenden Statistik und der Wahrscheinlichkeitsrechnung vorausgesetzt. Anhand des Ergebnisses eines Versuchs soll im Hypothesentest eine zuvor gestellte Hypothese geprüft werden. Die Irrtumswahrscheinlichkeit wird vorgegeben. Hypothesentests mit einer Irrtumswahrscheinlichkeit von 5% nennt man signifikant.

Transkript Hypothesentest – Signifikanz und Irrtumswahrscheinlichkeit

In diesem Film werden einige der Grundprobleme der beurteilenden Statistik behandelt. Stellen wir uns vor, der Elektronikkonzern Tomato möchte eine neues Smartphone auf den Markt bringen, ein sehr teures Produkt. Daher will man bei Tomato schon vorab in Erfahrung bringen, wie viele Menschen in Deutschland so ein Gerät kaufen würden. Natürlich können dazu nicht zig Millionen Menschen befragt werden. Also werden nur 3000 ausgewählte Personen von Tomato angerufen. Die Menge aller möglichen Käufer, vereinfacht alle volljährigen Einwohner Deutschlands, stellt hier die sogenannte Grundgesamtheit dar. Die 3000 Personen, die tatsächlich angerufen werden, sind die Stichprobe. Das Grundproblem bei dieser Vorgehensweise ist nun: Ab welcher Teilnehmerzahl und mit welcher Sicherheit oder Unsicherheit kann man von einer Stichprobe auf die Grundgesamtheit schließen? Mit solchen Fragen beschäftigt sich die beurteilende Statistik. Sie setzt die beschreibende Statistik und einige Elemente der Wahrscheinlichkeitsrechnung voraus. Ehe wir uns aber um die Sorgen der Firma Tomato kümmern, vereinfachen wir die Problematik in einem Modell. Diese Urne enthält vorgeblich gleich viele weiße und schwarze Kugeln. Für eine Überprüfung dieser Angabe durch einfaches Nachzählen sind jedoch viel zu viele Kugeln in der Urne. Die Kugeln stellen in ihrer vorgegebenen, aber ungeprüften Aufteilung in Schwarz und Weiß nun die Grundgesamtheit dar. Jetzt wird eine Stichprobe entnommen. Tatsächlich wird ein Bernoulli-Prozess gestartet. Es wird zehnmal je eine Kugel gezogen, die immer wieder in die Urne zurückgelegt wird. Anhand des Ergebnisses soll die Hypothese überprüft werden, dass sich in der Urne 50% weiße und 50% schwarze Kugeln befinden. Daher wird ein solcher Versuch Hypothesentest genannt. Vor Versuchsbeginn wird definiert, welches Ergebnis erwartet wird. Wenn jeweils die Hälfte der Kugeln weiß und schwarz sind und zehnmal gezogen wird, sollten weiß und schwarz gleich oft gezogen werden, also je fünfmal. Die Wahrscheinlichkeit für weiß und für schwarz liegt bei jeder Ziehung bei 0,5. Das Produkt aus der Anzahl der Ziehungen und der Trefferwahrscheinlichkeit für jeden einzelnen Zug schließlich ist der Erwartungswert. Hier liegt er bei 0,5•10, also 5. Jetzt wird tatsächlich zehnmal eine Kugel gezogen. Das Ergebnis: sechsmal ist die Kugel weiß, viermal schwarz. Wie ist dieses Ergebnis zu bewerten? Sind die Kugeln doch eher im Verhältnis 60 zu 40 verteilt? Hier kann nun die Formel für die Trefferwahrscheinlichkeiten bei Bernoulli-Versuchen zu Hilfe genommen werden. Unter der Hypothese, dass jeweils 50% der Kugeln weiß und 50% schwarz sind, liegt danach die Wahrscheinlichkeit bei zehn Zügen sechsmal weiß zu ziehen, bei genau 20,5%. Mit Hilfe der Formel für die Wahrscheinlichkeit bei Bernoulli-Versuchen können wir ausrechnen, mit welcher Wahrscheinlichkeit jedes mögliche Ergebnis auftritt und dies grafisch darstellen. Wir sehen, dass die möglichen Ergebnisse sich um den Erwartungswert herum gruppieren. Die Wahrscheinlichkeit, genau den Erwartungswert, also Fünf zu erhalten, ist jedoch nur wenig größer als die für das Ergebnis Sechs, nämlich 24,6%. Eine sichere Aussage über die Verteilung der Kugeln in der Urne ist damit noch nicht möglich. Die Stichprobe ist einfach zu klein. Um ein schärferes Ergebnis zu erhalten, wird die Stichgruppe daher vergrößert. Es wird 100 mal gezogen, 45 mal davon weiß. Die Wahrscheinlichkeit dafür: 4,8%. Die Wahrscheinlichkeit, exakt den Erwartungswert, also 50 zu erreichen, knapp acht Prozent. Wir kommen einen Schritt weiter, wenn wir uns wieder die Verteilung der möglichen Trefferwahrscheinlichkeiten ansehen. Nur interessiert uns jetzt nicht mehr, wie groß die Wahrscheinlichkeit ist, genau eine bestimmte Anzahl weißer oder schwarzer Kugeln zu ziehen. Wir wollen wissen, wie groß die Wahrscheinlichkeit ist, dass die Ergebnisse der Ziehung in einem bestimmten Bereich liegen. Die Wahrscheinlichkeit, dass die Anzahl weißer Kugeln im Bereich von 40 bis 60 liegt, ist die Summe aller Einzelwahrscheinlichkeiten für diesen Fall. Hier sind dies 95,4%. Für alle anderen Verteilungsmöglichkeiten bleibt gerade einmal eine Wahrscheinlichkeit von 4,6% übrig. Das bedeutet im Umkehrschluss: Wenn wir bei 100 Zügen 40 bis 60 weiße Kugeln ziehen, können wir mit einer Wahrscheinlichkeit von 95,4% davon ausgehen, dass gleich viele weiße wie schwarze Kugeln in der Urne sind. In 4,6% der Fälle irren wir uns dagegen. Darum sind diese 4,6% auch die Irrtumswahrscheinlichkeit. Offenbar hängt der Bereich, in dem die Treffer erwartet werden dürfen, von der Größe der Stichprobe und ihrer Streuung ab. Für diese Streuung gibt es eine Maßzahl, die Standardabweichung. Diese hängt wiederum mit der Größe der Stichprobe zusammen. Für die Standardabweichung verwendet man den kleinen griechischen Buchstaben σ. Es gilt: Bei n Bernoulli-Versuchen mit der Trefferwahrscheinlichkeit 0,5 liegen 95% der Treffer in einem „zwei mal σ“-großen Intervall, jeweils rechts und links vom Erwartungswert. In der beurteilenden Statistik hat es sich eingebürgert, die Irrtumswahrscheinlichkeit vorzugeben. Daraus wird dann der Bereich bestimmt, in dem die Treffer liegen dürfen, um der Hypothese zuzustimmen. Erst dann wird der eigentliche Test durchgeführt. Bei einer Irrtumswahrscheinlichkeit von fünf Prozent und n Versuchen ist der Bereich, in dem wir die Hypothese akzeptieren, folglich das „2 σ"-Intervall um den Erwartungswert herum. Einen Hypothesentest mit einer Irrtumswahrscheinlichkeit von fünf Prozent nennt man „signifikant“. Wird dieses Intervall in Abhängigkeit von der Größe der Stichprobe grafisch dargestellt, zeigt sich, wie sich das Intervall mit zunehmender Stichprobengröße immer mehr verengt. Dies ist der 95%-Signifikanztrichter. In der statistischen Praxis gibt es noch weitere Standard-Irrtumswahrscheinlichkeiten. Zum Beispiel ein Prozent für sogenannte „sehr signifikante“ Tests. Und 0,1% für „hochsignifikante“ Tests. In diesen Fällen sind die Signifikanztrichter schmaler. Und schließlich gibt es auch Standardabweichungsintervalle für andere Trefferwahrscheinlichkeiten als 0,5. Übrigens, die Firma Tomato hat festgestellt, dass mit einer Irrtumswahrscheinlichkeit von einem Prozent das neue Smartphone weniger als 1000-mal verkauft werden würde. Das ergab sich schon daraus, dass unter den 3000 Befragten kein einziger Interesse an dem Gerät hatte. Die Entwicklung wurde sofort gestoppt.

Hypothesentest – Signifikanz und Irrtumswahrscheinlichkeit Übung

Du möchtest dein gelerntes Wissen anwenden? Mit den Aufgaben zum Video Hypothesentest – Signifikanz und Irrtumswahrscheinlichkeit kannst du es wiederholen und üben.
  • Gib die Ergebnisse des Hypothesentests wieder.

    Tipps

    Die Wahrscheinlichkeit bei Bernoulli-Versuchen wird wie folgt berechnet:

    • $p_k=p^k\cdot (1-p)^{n-k}\cdot \binom{n}{k}$

    Die Menge aller Kugeln stellt hier die sogenannte Grundgesamtheit dar. Die $10$ gezogenen Kugeln sind die Stichprobe.

    Der Erwartungswert für die Anzahl schwarzer Kugeln wird wie folgt berechnet:

    • $p_{\text{schwarz}}\cdot n$
    Dabei ist $n$ die Anzahl der Kugeln der Stichprobe.

    Lösung

    Wir gehen davon aus, dass sich in der Urne $50\%$ weiße und $50\%$ schwarze Kugeln befinden. Damit nehmen wir die folgenden Erfolgswahrscheinlichkeiten an:

    • $p_{\text{schwarz}}=0,5$
    • $p_{\text{weiß}}=0,5$
    Der Erwartungswert für die Anzahl schwarzer Kugeln entspricht dem Produkt aus der Erfolgswahrscheinlichkeit und der Anzahl der Kugeln der Stichprobe:

    • $p_{\text{schwarz}}\cdot n=0,5\cdot 10=5$
    Das erwartete Ergebnis ist also: $5$ schwarze und $5$ weiße Kugeln.

    Es werden jedoch $4$ schwarze und $6$ weiße Kugeln gezogen. Wie ist dieses Ergebnis zu bewerten? Sind die Kugeln doch eher im Verhältnis $60$ zu $40$ verteilt?

    Hierzu wird die Trefferwahrscheinlichkeit dafür, dass genau $6$ Kugeln einer Farbe gezogen werden, berechnet:

    • Die Wahrscheinlichkeit bei Bernoulli-Versuchen wird wie folgt berechnet:
    • $p_6=0,5^6\cdot (1-0,5)^{10-6}\cdot \binom{10}{6}\approx 0,205$
    Die Wahrscheinlichkeit dafür, genau den Erwartungswert zu ziehen, beträgt:

    • $p_5=0,5^5\cdot (1-0,5)^{10-5}\cdot \binom{10}{5}\approx 0,246$
    Diese Wahrscheinlichkeit ist nur wenig größer.

    Eine sichere Aussage über die Verteilung der Kugeln in der Urne ist damit nicht möglich. Um ein schärferes Ergebnis zu erhalten, muss die Stichgruppe vergrößert werden.

  • Definiere die Begriffe zu Hypothesentests.

    Tipps

    Wenn aus einer Urne $100$ mal eine Kugel mit Zurücklegen gezogen wird, so beschreibt die $100$ die Stichprobe.

    Die Anzahl aller Kugeln in der Urne ist die Grundgesamtheit.

    Lösung

    Es soll in Erfahrung gebracht werden, wie viele Menschen in Deutschland ein Smartphone kaufen würden. Natürlich können dazu nicht Millionen Menschen befragt werden. Also werden nur $3000$ ausgewählte Personen angerufen.

    • „Die Menge aller möglichen Käufer ist die Grundgesamtheit.“ Das könnten zum Beispiel alle volljährigen Einwohner Deutschlands sein.
    • „Die $3000$ Personen, die angerufen werden, sind die Stichprobe.“ Je mehr Personen angerufen werden, desto besser kann man von der Stichprobe auf die Grundgesamtheit schließen.
    • „Wenn wir mit einer Wahrscheinlichkeit von $95,4\%$ davon ausgehen können, dass unsere Hypothese stimmt, dann sind $4,6\%$ die Irrtumswahrscheinlichkeit.“ Wenn wir mit einer Wahrscheinlichkeit von $95,4\%$ davon ausgehen können, dass unsere Hypothese stimmt, dann würden wir uns in $4,6\%$ der Fälle irren. Darum nennt man diesen Anteil Irrtumswahrscheinlichkeit.
    • „Der Bereich, in dem die Treffer erwartet werden dürfen, hängt von der Stichprobengröße und Streuung ab. Die Maßzahl für die Streuung ist die Standardabweichung.“
  • Zeige die Formeln, mit denen der Bereich ermittelt wird, in dem die Treffer liegen dürfen, um der jeweiligen Hypothese mit $5\%$ Irrtumswahrscheinlichkeit zuzustimmen

    Tipps

    Bei einer Irrtumswahrscheinlichkeit von $5\%$ ist der Bereich, in dem wir die Hypothese akzeptieren, das „$2\sigma$“-Intervall um den Erwartungswert herum.

    Lösung

    Bei einer Irrtumswahrscheinlichkeit von $5\%$ ist der Bereich, in dem wir die Hypothese akzeptieren, folglich das „$2\sigma$“-Intervall um den Erwartungswert herum.

    Wenn $\mu$ der Erwartungswert und $\sigma$ die Standardabweichung ist, dann können wir die Grenzen dieses Bereiches wie folgt berechnen:

    • untere Grenze: $\mu-2\sigma$
    • obere Grenze: $\mu+2\sigma$
    Liegen alle Ergebnisse innerhalb des Bereiches von $\mu-2\sigma$ bis $\mu+2\sigma$, so können wir mit einer Wahrscheinlichkeit von $95\%$ der Hypothese zustimmen.

  • Ermittle die gesuchte Wahrscheinlichkeit und die daraus folgende Irrtumswahrscheinlichkeit.

    Tipps

    Addiere alle Einzelwahrscheinlichkeiten von $p_{95}$ bis $p_{105}$ auf.

    Die Irrtumswahrscheinlichkeit erhältst du, wenn du die Trefferwahrscheinlichkeit von $100\%$ abziehst.

    Mit folgender Formel berechnest du die Einzelwahrscheinlichkeiten:

    • $p_k=p^k\cdot (1-p)^{n-k}\cdot \binom{n}{k}$
    Lösung

    Wir müssen alle Einzelwahrscheinlichkeiten von $p_{95}$ bis $p_{105}$ aufaddieren.

    Mit folgender Formel berechnen wir die Einzelwahrscheinlichkeiten:

    • $p_k=p^k\cdot (1-p)^{n-k}\cdot \binom{n}{k}$
    Mit $p=0,5$ und $n=200$ folgt:

    • $p_{95}= 0,5 ^{95}\cdot (1-0,5)^{200-95}\cdot \binom{200}{95}\approx 0,0439$
    • $p_{96}= 0,5 ^{96}\cdot (1-0,5)^{200-96}\cdot \binom{200}{96}\approx 0,0481$
    • $p_{97}= 0,5 ^{97}\cdot (1-0,5)^{200-97}\cdot \binom{200}{97}\approx 0,0515$
    • $p_{98}= 0,5 ^{98}\cdot (1-0,5)^{200-98}\cdot \binom{200}{98}\approx 0,0541$
    • $p_{99}= 0,5 ^{99}\cdot (1-0,5)^{200-99}\cdot \binom{200}{99}\approx 0,0558$
    • $p_{100}= 0,5 ^{100}\cdot (1-0,5)^{200-100}\cdot \binom{200}{100}\approx 0,0563$
    • $p_{101}= 0,5 ^{101}\cdot (1-0,5)^{200-101}\cdot \binom{200}{101}\approx 0,0558$
    • $p_{102}= 0,5 ^{102}\cdot (1-0,5)^{200-102}\cdot \binom{200}{102}\approx 0,0541$
    • $p_{103}= 0,5 ^{103}\cdot (1-0,5)^{200-103}\cdot \binom{200}{103}\approx 0,0515$
    • $p_{104}= 0,5 ^{104}\cdot (1-0,5)^{200-104}\cdot \binom{200}{104}\approx 0,0481$
    • $p_{105}= 0,5 ^{105}\cdot (1-0,5)^{200-105}\cdot \binom{200}{105}\approx 0,0439$
    Die Summe beträgt: $~0,5632=56,32\%$

    Damit erhalten wir folgende Irrtumswahrscheinlichkeit: $~100\%-56,32\%= 43,68\%$

  • Beschrifte die Graphen zum Signifikanztest.

    Tipps

    Je schmaler der Signifikanztrichter ist, desto kleiner ist die Standardabweichung.

    Ein sehr signifikanter Test hat eine größere Standardabweichung als ein hochsignifikanter Test.

    Einen Hypothesentest mit einer Irrtumswahrscheinlichkeit von $5\%$ nennt man signifikant.

    Lösung

    Einen Hypothesentest mit einer Irrtumswahrscheinlichkeit von $5\%$ nennt man signifikant. Wird dieses Intervall in Abhängigkeit von der Größe der Stichprobe grafisch dargestellt, zeigt sich, wie sich das Intervall mit zunehmender Größe der Stichprobe immer mehr verengt.

    Die beiden gelben Kurven bilden den $95\%$-Signifikanztrichter. Bei diesem signifikanten Test beträgt die Standardabweichung $5\%$.

    In der statistischen Praxis gibt es noch weitere Standard-Irrtumswahrscheinlichkeiten. Zum Beispiel $1\%$ Prozent für sogenannte sehr signifikante Tests (grüne Kurven) und $0,1\%$ für hochsignifikante Tests (blaue Kurven). In diesen Fällen sind die Signifikanztrichter schmaler.

  • Bestimme die Grenzen der jeweiligen Bereiche.

    Tipps

    Bei $n$ Bernoulli-Versuchen mit der Trefferwahrscheinlichkeit $0,5$ liegen $95\%$ der Treffer in einem „$2\sigma$“ großen Intervall, jeweils rechts und links vom Erwartungswert.

    Es gilt: $~\sigma=\sqrt{n\cdot p\cdot (1-p)}$

    Den Erwartungswert erhältst du, indem du die Erfolgswahrscheinlichkeit mit $n$ multiplizierst.

    Sieh dir folgendes Beispiel an:

    • $n=300$
    • $\mu-2\sigma=150-2\cdot 0,5\cdot \sqrt{300}\approx 133$
    • $\mu+2\sigma=150+2\cdot 0,5\cdot \sqrt{300}\approx 167$
    Lösung

    Bei einer Irrtumswahrscheinlichkeit von $5\%$ ist der Bereich, in dem wir die Hypothese akzeptieren, folglich das „$2\sigma$“-Intervall um den Erwartungswert herum.

    Wenn $\mu$ der Erwartungswert und $\sigma$ die Standardabweichung ist, dann können wir die Grenzen dieses Bereiches wie folgt berechnen:

    • untere Grenze: $\mu-2\sigma$
    • obere Grenze: $\mu+2\sigma$
    Liegen alle Ergebnisse innerhalb des Bereiches von $\mu-2\sigma$ bis $\mu+2\sigma$, so können wir mit einer Wahrscheinlichkeit von $95\%$ der Hypothese zustimmen.

    Für den Erwartungswert $\mu$ und die Standardabweichung $\sigma$ gilt:

    • $\mu=n\cdot p$
    • $\sigma=\sqrt{n\cdot p\cdot (1-p)}$
    Dabei ist $n$ die Anzahl der Kugeln einer Stichprobe und $p=0,5$ die Erfolgswahrscheinlichkeit. Wir erhalten hier die folgenden Bereiche:

    Stichprobe $n=200$

    • untere Grenze: $\mu-2\sigma=200\cdot 0,5-2\sqrt{200\cdot 0,5\cdot (1-0,5)}=100- \sqrt{200}\approx 86$
    • obere Grenze: $\mu+2\sigma=200\cdot 0,5+2\sqrt{200\cdot 0,5\cdot (1-0,5)}=100+ \sqrt{200}\approx 114$
    Stichprobe $n=220$

    • untere Grenze: $\mu-2\sigma=220\cdot 0,5-2\sqrt{220\cdot 0,5\cdot (1-0,5)}=110- \sqrt{220}\approx 95$
    • obere Grenze: $\mu+2\sigma=220\cdot 0,5+2\sqrt{220\cdot 0,5\cdot (1-0,5)}=110+ \sqrt{220}\approx 125$
    Stichprobe $n=190$

    • untere Grenze: $\mu-2\sigma=190\cdot 0,5-2\sqrt{190\cdot 0,5\cdot (1-0,5)}=95- \sqrt{190}\approx 81$
    • obere Grenze: $\mu+2\sigma=190\cdot 0,5+2\sqrt{190\cdot 0,5\cdot (1-0,5)}=95+ \sqrt{190}\approx 109$
    Stichprobe $n=210$

    • untere Grenze: $\mu-2\sigma=210\cdot 0,5-2\sqrt{210\cdot 0,5\cdot (1-0,5)}=105- \sqrt{210}\approx 91$
    • obere Grenze: $\mu+2\sigma=210\cdot 0,5+2\sqrt{210\cdot 0,5\cdot (1-0,5)}=105+ \sqrt{210}\approx 119$
30 Tage kostenlos testen
Mit Spaß Noten verbessern
Im Vollzugang erhältst du:

10.882

Lernvideos

44.133

Übungen

38.715

Arbeitsblätter

24h

Hilfe von Lehrer/
-innen

running yeti

In allen Fächern und Klassenstufen.

Von Expert/-innen erstellt und angepasst an die Lehrpläne der Bundesländer.

30 Tage kostenlos testen

Testphase jederzeit online beenden