Textversion des Videos

Transkript Signifikanztests – Beispiel Gewinnspiel

Hallo, es geht um das Testen von Hypothesen und da habe ich in den vorherigen Filmnummern schon etwas zu diesem Zufallsversuch und zu diesem Gewinnspiel gesagt. Ich möchte das hier nur noch einmal zusammenfassen, damit du folgen kannst. Wir haben 20 Karten gegeben. Die, die du hier siehst: Karo 8, Karo 9, Karo Bube, noch ein Karo Bube, Karo Dame, Karo Dame, Karo König, Karo König, Herz 7, Herz 8, Herz 9, Herz 10, Herz Dame, Herz König, Pik 7, Pik 10, Pik Dame, Pik 8, Kreuz 9 und Kreuz Bube. Das sind die 20 Karten. Man kann jetzt bei einem Gewinnspiel darauf wetten, dass beim nächsten zufälligen Zug aus dem Stapel mit 20 Karten eine Bildkarte erscheint. Der Einsatz beträgt 1 Euro. Wenn eine Zahlkarte kommt, dann ist dieser Einsatz weg. Weg ist er sowieso, aber wenn eine Bildkarte kommt, dann bekommt man etwas zurück. Und zwar 1,50 Euro, wenn eine Karo-Bildkarte kommt, 2 Euro, wenn eine Herz-Bildkarte kommt, 2,50 Euro bei einer Pik-Bildkarte und 3 Euro bei einer Kreuz-Bildkarte. Bedeutet hier - ich habe gesagt, der Einsatz ist sowieso weg: Wenn eine Karo-Bildkarte erscheint, beim nächsten Mal ziehen, hat man 1 Euro eingesetzt. 1,50 Euro bekommt man zurück. Das heißt, man macht einen Gewinn von 50 Cent. Hier macht man einen Gewinn von 1 Euro usw. Jetzt haben wir schon ausgerechnet, dass dieses Spiel nicht fair ist. Will also in dem Fall heißen, der Erwartungswert des Gewinns ist aus Sicht des Spielers -0,075. Das heißt, auf Dauer verliert der Spielende bei diesem Spiel und der Spielanbieter gewinnt auf Dauer. Nun kommen wir zur Situation in dieser Aufgabe. Wir stellen uns vor, es ist 100 mal gespielt wurden. Diese 100 Spiele sind dokumentiert wurden. Das heißt, man hat aufgeschrieben, was da jeweils gezogen wurde. Der Spielanbieter hat 10 Euro Gewinn gemacht und aufgrund dieser Tatsache vermuten wir, dass vielleicht weniger Bildkarten im Stapel sind, als die 10, die du hier siehst. Wenn der Spielanbieter jetzt immer eine Karte zufällig zieht, vielleicht hat er irgendwann einmal eine ausgetauscht - könnte ja sein. Also diesem Stapel sieht man nicht mehr an, ob da 10 Bildkarten drin sind oder nicht. Einmal angenommen, wir vermuten, es könnten weniger sein. Wir haben 100 dokumentierte Versuche. Nun ist die Frage: Wie kann man aufgrund dieser Datenlage einen Test formulieren, der klärt, ob da genügend Bildkarten drin sind oder nicht? Diese Aufgabenstellung ist - wenn man das Abitur-Niveau nimmt - nicht ganz so einfach, weil sie mehrere Möglichkeiten zulässt. Und die Schwierigkeit besteht darin, wenn man jetzt im Abitur sitzt und sich das versucht vorzustellen, dann könnte es passieren, dass man einen Gedankengang hat, der geht dahin, der andere geht dahin. Denkt man sich: "Die sind beide richtig. Was mach ich denn jetzt?" Natürlich muss man da sehr scharf überlegen. Man muss genau aufschreiben, was man machen will, wie man testen will. Wenn man zu einer vernünftigen Lösung kommt, dann ist die so okay. Es können aber auch ganz andere Lösungen vernünftig sein - möchte ich jetzt vormachen. Wir können uns auf den Standpunkt stellen, dass wir Hypothesen der Art haben, dass wir vermuten, es sind weniger Bildkarten im Spiel als 10. Wir wissen, dass man diese 100 Versuche als 100-stufige Bernoulli-Kette auffassen kann. Wenn wir den Bernoulli-Versuch so formulieren: Bei einem mal ziehen, wird eine Bildkarte gezogen oder es wird keine gezogen. Bildkarte ist Erfolg, keine Bildkarte ist Misserfolg. Wenn 10 Karten drin wären - 10 Bildkarten und 10 Zahlkarten - wäre die Erfolgswahrscheinlichkeit 0,5, die Misserfolgswahrscheinlichkeit auch 0,5. Dann können wir eine Zufallsgröße definieren, und zwar die Zufallsgröße, die bei dieser 100-stufigen Bernoulli-Kette die Anzahl der Erfolge zählt. Diese Zufallsgröße ist binomial verteilt. Das dürfen wir so voraussetzen, weil da eine 100-stufige Bernoulli-Kette zugrunde liegt und die Zufallsgröße der Anzahl der Erfolge zählt. Mithilfe einer solchen Zufallsgröße können wir jetzt unsere Hypothesen testen. Und zwar würden wir 50 Erfolge erwarten. Der Erwartungswert ist bei 50 Erfolgen, wenn die Erfolgswahrscheinlichkeit 0,5 ist und wenn 100 mal gezogen wird. Unsere Hypothesen könnten jetzt also so gestaltet sein, dass wir sagen, es sind weniger Bildkarten drin. Das heißt, die Erfolgswahrscheinlichkeit ist kleiner als 0,5 - sie könnte zum Beispiel 0,3 sein, sie könnte 0,35 sein, sie könnte 0,4 sein usw. Das Problem dabei ist: Wir können natürlich nicht alle diese Hypothesen testen, weil es einfach zu viele sind und wenn wir den Fall ganz allgemein nehmen, dann kommen alle Wahrscheinlichkeiten, die kleiner als 0,5 sind, in Betracht. Bei diesen konkreten Karten ist es nicht ganz so, aber jetzt einmal ganz allgemein gesehen. Das heißt, unsere Hypothese könnte auch lauten: Die Wahrscheinlichkeit ist nicht 0,5, sondern sie ist 0,49 oder sie ist 0,499 oder sie ist 0,4999 usw. Das sind also ganz viele Hypothesen, die können wir nicht alle testen, weil es zu viele sind. Wir können immer nur eine testen. Was wir aber machen können, wir können uns überlegen: Was müsste denn passieren, damit wir alle diese Hypothesen auf einmal fallen lassen? Es müssten bei diesen 100 Versuchen viel mehr Bildkarten sein, als alle unsere Hypothesen zulassen. Das kann man nun so testen, indem man sich die Grenze aller unserer Hypothesen anguckt. Die Grenze ist die Wahrscheinlichkeit von 0,5. Wir haben ja gesagt, dass wir glauben, die Hypothesen sind alle bei kleiner als 0,5. Deshalb ist die Grenze 0,5. Wir können uns einmal angucken, was passieren müsste, wenn da tatsächlich 10 Bildkarten sind. Das heißt, die Erfolgswahrscheinlichkeit ist bei 0,5. Dann würden wir also 50 Erfolge erwarten, der Erwartungswert ist bei 50. Unsere Zufallsgröße, Anzahl der Erfolge, wäre also binomial verteilt. Ich habe das hier jetzt einmal kontinuierlich gezeigt. Ich müsste natürlich jetzt, wenn ich es genau machen wollte, ein Balkendiagramm mit diesen ganzen Balken machen - habe ich jetzt einfach einmal so ungefähr gemacht. Wenn die Anzahl der Bildkarten weit höher liegt, als diese 0,5-prozentige Wahrscheinlichkeit für eine Bildkarte erwarten lässt, wenn also die Anzahl der Bildkarten in diesem Bereich ist, dann müssten wir alle unsere Hypothesen, dass die Erfolgswahrscheinlichkeit kleiner ist als 0,5, fallen lassen. Wenn das so ist, haben wir eine Entscheidungsregel, die ungefähr hier ist. Wir sagen, wenn so viele Bildkarten hier aufgetaucht sind, dann lassen wir alle Hypothesen fallen. Dann müssen wir noch ein Signifikanzniveau festlegen - ist oft 5 %. Das kann man hier einfach jetzt einmal so setzen, das erlaube ich mir einmal so. Wenn da nichts weiter steht, kannst du die 5 % nehmen, du kannst auch etwas anderes nehmen. Du musst es nur angeben, was du nimmst. Das heißt, wir könnten jetzt in der Tabelle nachgucken bei binomial verteilten Zufallsgrößen. Wir haben eine Erfolgswahrscheinlichkeit von 0,5 und gucken einmal, bis zu welchem Punkt hat man denn unter 95 % Wahrscheinlichkeit und ab wann geht es über die 95-prozentige Wahrscheinlichkeit hinaus. Das heißt also, der Rest dann hier von 5 %. Dann stellt man fest, die 59 liegt außerhalb und die 58 liegt noch innerhalb dieser Grenze, also vor dieser Grenze und hinter dieser Grenze. Das heißt, wenn wir bis zu 58 Bildkarten hätten, dann würden wir unsere ganzen Hypothesen, nämlich, dass die Wahrscheinlichkeit kleiner ist als 0,5, weder fallen lassen, noch hätten wir sie bestätigt. Bestätigen kann man eine Hypothese ja sowieso nicht, dann würde einfach gar nichts passieren. Ab 59 Bildkarten müssten wir sagen, wir müssten unsere Hypothesen fallen lassen. Es sind so viele Bildkarten aufgetaucht, dass es nicht sein kann, dass eigentlich zu wenige Bildkarten drin waren im Stapel. Bis dahin ist die Sache erledigt. Wie gesagt, du kannst in der Tabelle nachgucken, du kannst auch Sigma-Regeln verwenden. Du müsstest hier dann µ+1,64×σ rechnen. Entspricht hier jetzt der Rechnung von 50+1,64×5, σ ist ja 5, \sqrt(n×p×(1-p))=5, und das ist 58,2. Die Sigma-Regeln kannst du auch verwenden oder du kannst auch in der Tabelle nachgucken oder mit dem Taschenrechner ausrechnen - völlig egal. Wenn das so modelliert ist, dann ist hier die Aufgabe fertig. Du kannst das aber auch anders machen und das macht die Wahrscheinlichkeitsrechnung so faszinierend oder für manche dann ärgerlich. Man kann nämlich folgendermaßen vorgehen: Es steht ja die Hypothese im Raum, dass in diesem Stapel von Karten 10 Bildkarten drin sind und 10 Zahlkarten. Das ist die Hypothese und die wollen wir eigentlich widerlegen. Wann würden wir von der Hypothese, dass dort 10 Karten drin sind bzw. dass die Erfolgswahrscheinlichkeit für eine Bildkarte 0,5 ist, abrücken und sagen: "Nein, das stimmt nicht. Es sind stattdessen weniger Karten drin." Das würden wir machen, wenn viel weniger Bildkarten auftreten, als nach unserer Hypothese zu erwarten gewesen wäre. Bedeutet: Die 5-prozentige Wahrscheinlichkeit müsste hier liegen. Wir würden rechnen: µ-1,64×σ=41,8. Wir würden also, wenn wir das so modellieren, sagen: Bei 41 - also hier - müssen wir die Hypothese, dass es sich um 10 Bildkarten handelt, das heißt, dass die Erfolgswahrscheinlichkeit 0,5 ist, abrücken. Wenn es 42 Bildkarten oder mehr sind, haben wir die Hypothese, dass es 10 Bildkarten sind, also die Erfolgswahrscheinlichkeit gleich 0,5 ist, weder widerlegt, noch bestätigt. Dann sind wir genauso schlau wie vor. Wir würden also diese 0,5 verwerfen, wenn viel weniger Bildkarten da sind in unseren 100 dokumentierten Versuchen. Das Lustige an der Sache ist jetzt, dass wir 2 Entscheidungsregeln haben, die an 2 verschiedenen Enden dieser binomial verteilten Zufallsgröße liegen - für dieselbe Aufgabe. Beides wäre richtig. Es kommt in dem Fall nur darauf an, wie man die Hypothese formuliert. Ob wir sagen, unsere Ausgangshypothese ist: Die Wahrscheinlichkeit ist kleiner als 0,5. Dann müssten wir die Gegenhypothese, also die Wahrscheinlichkeit ist gleich 0,5 oder größer, testen. Dann würden wir davon abrücken, wenn es viel zu viele Bildkarten sind in diesen 100 Versuchen. Wenn wir sagen: Die Hypothese ist 0,5 und wir würden von dieser Hypothese abrücken, wenn es viel zu wenig Bildkarten sind. Dann ist die Entscheidungsregel hier. Beides kann man machen, muss man eben nur genau formulieren. Hier wieder einmal ein Hinweis - bei der Wahrscheinlichkeitsrechnung: Die Rechnung selber hier, ein bisschen σ ausrechnen, das ist ja Pillepalle, das ist nicht schwierig. Die Überlegung ist wichtig, die Begriffe sind wichtig und dass man eben genau dokumentiert: Was rechne ich da eigentlich, was ist meine Hypothese, was ist meine Zufallsgröße, was ist mein Zufallsversuch? Das ist das A und O in der Wahrscheinlichkeitsrechnung. Viel Spaß damit, tschüss.

Informationen zum Video