30 Tage kostenlos testen:
Mehr Spaß am Lernen.

Überzeugen Sie sich von der Qualität unserer Inhalte.

Hypothesentest – Signifikanz und Irrtumswahrscheinlichkeit 08:56 min

Textversion des Videos

Transkript Hypothesentest – Signifikanz und Irrtumswahrscheinlichkeit

In diesem Film werden einige der Grundprobleme der beurteilenden Statistik behandelt. Stellen wir uns vor, der Elektronikkonzern Tomato möchte eine neues Smartphone auf den Markt bringen, ein sehr teures Produkt. Daher will man bei Tomato schon vorab in Erfahrung bringen, wie viele Menschen in Deutschland so ein Gerät kaufen würden. Natürlich können dazu nicht zig Millionen Menschen befragt werden. Also werden nur 3000 ausgewählte Personen von Tomato angerufen. Die Menge aller möglichen Käufer, vereinfacht alle volljährigen Einwohner Deutschlands, stellt hier die sogenannte Grundgesamtheit dar. Die 3000 Personen, die tatsächlich angerufen werden, sind die Stichprobe. Das Grundproblem bei dieser Vorgehensweise ist nun: Ab welcher Teilnehmerzahl und mit welcher Sicherheit oder Unsicherheit kann man von einer Stichprobe auf die Grundgesamtheit schließen? Mit solchen Fragen beschäftigt sich die beurteilende Statistik. Sie setzt die beschreibende Statistik und einige Elemente der Wahrscheinlichkeitsrechnung voraus. Ehe wir uns aber um die Sorgen der Firma Tomato kümmern, vereinfachen wir die Problematik in einem Modell. Diese Urne enthält vorgeblich gleich viele weiße und schwarze Kugeln. Für eine Überprüfung dieser Angabe durch einfaches Nachzählen sind jedoch viel zu viele Kugeln in der Urne. Die Kugeln stellen in ihrer vorgegebenen, aber ungeprüften Aufteilung in Schwarz und Weiß nun die Grundgesamtheit dar. Jetzt wird eine Stichprobe entnommen. Tatsächlich wird ein Bernoulli-Prozess gestartet. Es wird zehnmal je eine Kugel gezogen, die immer wieder in die Urne zurückgelegt wird. Anhand des Ergebnisses soll die Hypothese überprüft werden, dass sich in der Urne 50% weiße und 50% schwarze Kugeln befinden. Daher wird ein solcher Versuch Hypothesentest genannt. Vor Versuchsbeginn wird definiert, welches Ergebnis erwartet wird. Wenn jeweils die Hälfte der Kugeln weiß und schwarz sind und zehnmal gezogen wird, sollten weiß und schwarz gleich oft gezogen werden, also je fünfmal. Die Wahrscheinlichkeit für weiß und für schwarz liegt bei jeder Ziehung bei 0,5. Das Produkt aus der Anzahl der Ziehungen und der Trefferwahrscheinlichkeit für jeden einzelnen Zug schließlich ist der Erwartungswert. Hier liegt er bei 0,5•10, also 5. Jetzt wird tatsächlich zehnmal eine Kugel gezogen. Das Ergebnis: sechsmal ist die Kugel weiß, viermal schwarz. Wie ist dieses Ergebnis zu bewerten? Sind die Kugeln doch eher im Verhältnis 60 zu 40 verteilt? Hier kann nun die Formel für die Trefferwahrscheinlichkeiten bei Bernoulli-Versuchen zu Hilfe genommen werden. Unter der Hypothese, dass jeweils 50% der Kugeln weiß und 50% schwarz sind, liegt danach die Wahrscheinlichkeit bei zehn Zügen sechsmal weiß zu ziehen, bei genau 20,5%. Mit Hilfe der Formel für die Wahrscheinlichkeit bei Bernoulli-Versuchen können wir ausrechnen, mit welcher Wahrscheinlichkeit jedes mögliche Ergebnis auftritt und dies grafisch darstellen. Wir sehen, dass die möglichen Ergebnisse sich um den Erwartungswert herum gruppieren. Die Wahrscheinlichkeit, genau den Erwartungswert, also Fünf zu erhalten, ist jedoch nur wenig größer als die für das Ergebnis Sechs, nämlich 24,6%. Eine sichere Aussage über die Verteilung der Kugeln in der Urne ist damit noch nicht möglich. Die Stichprobe ist einfach zu klein. Um ein schärferes Ergebnis zu erhalten, wird die Stichgruppe daher vergrößert. Es wird 100 mal gezogen, 45 mal davon weiß. Die Wahrscheinlichkeit dafür: 4,8%. Die Wahrscheinlichkeit, exakt den Erwartungswert, also 50 zu erreichen, knapp acht Prozent. Wir kommen einen Schritt weiter, wenn wir uns wieder die Verteilung der möglichen Trefferwahrscheinlichkeiten ansehen. Nur interessiert uns jetzt nicht mehr, wie groß die Wahrscheinlichkeit ist, genau eine bestimmte Anzahl weißer oder schwarzer Kugeln zu ziehen. Wir wollen wissen, wie groß die Wahrscheinlichkeit ist, dass die Ergebnisse der Ziehung in einem bestimmten Bereich liegen. Die Wahrscheinlichkeit, dass die Anzahl weißer Kugeln im Bereich von 40 bis 60 liegt, ist die Summe aller Einzelwahrscheinlichkeiten für diesen Fall. Hier sind dies 95,4%. Für alle anderen Verteilungsmöglichkeiten bleibt gerade einmal eine Wahrscheinlichkeit von 4,6% übrig. Das bedeutet im Umkehrschluss: Wenn wir bei 100 Zügen 40 bis 60 weiße Kugeln ziehen, können wir mit einer Wahrscheinlichkeit von 95,4% davon ausgehen, dass gleich viele weiße wie schwarze Kugeln in der Urne sind. In 4,6% der Fälle irren wir uns dagegen. Darum sind diese 4,6% auch die Irrtumswahrscheinlichkeit. Offenbar hängt der Bereich, in dem die Treffer erwartet werden dürfen, von der Größe der Stichprobe und ihrer Streuung ab. Für diese Streuung gibt es eine Maßzahl, die Standardabweichung. Diese hängt wiederum mit der Größe der Stichprobe zusammen. Für die Standardabweichung verwendet man den kleinen griechischen Buchstaben σ. Es gilt: Bei n Bernoulli-Versuchen mit der Trefferwahrscheinlichkeit 0,5 liegen 95% der Treffer in einem „zwei mal σ“-großen Intervall, jeweils rechts und links vom Erwartungswert. In der beurteilenden Statistik hat es sich eingebürgert, die Irrtumswahrscheinlichkeit vorzugeben. Daraus wird dann der Bereich bestimmt, in dem die Treffer liegen dürfen, um der Hypothese zuzustimmen. Erst dann wird der eigentliche Test durchgeführt. Bei einer Irrtumswahrscheinlichkeit von fünf Prozent und n Versuchen ist der Bereich, in dem wir die Hypothese akzeptieren, folglich das „2 σ"-Intervall um den Erwartungswert herum. Einen Hypothesentest mit einer Irrtumswahrscheinlichkeit von fünf Prozent nennt man „signifikant“. Wird dieses Intervall in Abhängigkeit von der Größe der Stichprobe grafisch dargestellt, zeigt sich, wie sich das Intervall mit zunehmender Stichprobengröße immer mehr verengt. Dies ist der 95%-Signifikanztrichter. In der statistischen Praxis gibt es noch weitere Standard-Irrtumswahrscheinlichkeiten. Zum Beispiel ein Prozent für sogenannte „sehr signifikante“ Tests. Und 0,1% für „hochsignifikante“ Tests. In diesen Fällen sind die Signifikanztrichter schmaler. Und schließlich gibt es auch Standardabweichungsintervalle für andere Trefferwahrscheinlichkeiten als 0,5. Übrigens, die Firma Tomato hat festgestellt, dass mit einer Irrtumswahrscheinlichkeit von einem Prozent das neue Smartphone weniger als 1000-mal verkauft werden würde. Das ergab sich schon daraus, dass unter den 3000 Befragten kein einziger Interesse an dem Gerät hatte. Die Entwicklung wurde sofort gestoppt.