Advent, Advent, 1 Monat weihnachtliche Laufzeit geschenkt.

Nicht bis zur Bescherung warten, Aktion nur gültig bis zum 18.12.2016!

Textversion des Videos

Transkript Statistik Video 108 - Negative Binomialverteilung

Hallo, schön, dass ihr alle wieder zuguckt! Wir sind heute bei unserem Video zur negativen Binomialverteilung. Was ist die negative Binomialverteilung? Wir hatten ja in den letzten Videos die geometrische Verteilung besprochen. Die geometrische Verteilung fragt nach der Wahrscheinlichkeit im x-ten Versuch, den 1. Erfolg zu erzielen bei unabhängigen Versuchen. Wir hatten ja das Beispiel mit dem Schlüsselbund: Ich versuche, die Tür aufzuschließen und versuche einfach immer willkürlich einen Schlüssel. Wenn er passt, habe ich Erfolg, ich bin in der Wohnung drinnen. Wenn er nicht passt, wähle ich wieder willkürlich einen Schlüssel - bei unabhängigen Versuchen. Das heißt, ich merke mir nicht, welchen Schlüssel ich schon gewählt habe. Eine Erweiterung der geometrischen Verteilung ist im Prinzip die negative Binomialverteilung. Wie gesagt, wir haben ja bei der geometrischen Verteilung bei unserer Zufallsvariable Xg, g für geometrisch, die Anzahl der Versuche bis zum 1. Erfolg. Bei der negativen Binomialverteilung ist jetzt unsere Zufallsvariable X, XN für negative Binomialverteilung - die Anzahl der Versuche bis r-ten Erfolg, wobei hier r natürlich ≥ 1 sein muss. Das heißt, ich frage zum Beispiel: Wie groß ist die Wahrscheinlichkeit, dem 10. Versuch den 3. Erfolg zu erzielen. Wir sehen schon, wenn unser r=1 ist, also unser XN wäre dann Anzahl der Versuche bis zum 1. Erfolg, dann sind wir genau wieder bei der geometrischen Verteilung. Auch die negative Binomialverteilung hat natürlich Verteilungsparameter. Zuerst einmal π, die Erfolgswahrscheinlichkeit, genau wie bei der geometrischen Verteilung, und aber noch zusätzlich r, die Anzahl der Erfolge, die erzielt werden sollen. Gucken wir uns einfach mal ein kurzes Beispiel dazu an: Gut, wir nehmen also einfach mal ein klassisches Beispiel. Wir haben eine Urne mit unterschiedlichen Kugeln, drei rote und zwei blaue. Und wir ziehen aus dieser Urne jetzt hintereinander jeweils mit Zurücklegen. Uns interessiert jetzt, als Erfolg, eine rote Kugel zu ziehen. So, was wir uns fragen, ist die Wahrscheinlichkeit, dass wir im 10. Versuch den 3. Erfolg haben. So, wir sagen jetzt also, X, die Anzahl der Versuche bis zum 1. Erfolg, ist negativ binomial verteilt, mit den Verteilungsparametern r, die Anzahl der Erfolge, die wir erzielen wollen und π, die Erfolgswahrscheinlichkeit. In unserem Fall also r, die Anzahl der Erfolge - wir wollen 3 Erfolge erzielen, also schon mal 3. Und die Erfolgswahrscheinlichkeit, na gut, wenn wir uns das angucken, wir haben als Erfolg definiert, dass wir eine rote Kugel ziehen. 3 von 5 Kugeln in unserer Urne sind rot, also haben wir eine Erfolgswahrscheinlichkeit von 3/5 oder 0,6, also 60 %. So, das ist jetzt also die Definition für unser X. X ist negativ binomial verteilt mit den Verteilungsparametern 3 und 0,6. Und was uns jetzt interessiert, die Wahrscheinlichkeit, dass X sich zu 10 realisiert, das heißt, dass wir im 10. Versuch den 3. Erfolg haben. Also, die Wahrscheinlichkeit, X=7+3 bedeutet 7 Misserfolge und 3 Erfolge. So, wir wollen uns jetzt die Wahrscheinlichkeit dafür herleiten. Wir machen jetzt erst mal einen kurzen Exkurs und teilen das Ganze auf. Wir sagen jetzt also, okay, wir teilen das auf, erst einmal in die Versuche 1 bis 9. Okay, und in diesen Versuchen 1 bis 9 haben wir auf jeden Fall 7 Misserfolge und 2 Erfolge, weil wir wollen ja im 10. Versuch den 3. Erfolg, und zwar genau im 10. Versuch. Das heißt der 10. Versuch ist Erfolg in unserer Denkweise. Das heißt, bei den 9 Versuchen davor haben wir halt 2 Erfolge und die kompletten 7 Misserfolge. Wir wissen aber nicht in welcher Reihenfolge. Das heißt, wir können uns jetzt hier unser X1 definieren, also eine neue Zufallsvariable und X1 sei jetzt die Anzahl der Erfolge in n Versuchen. Und wir sehen schon, dadurch, dass uns egal ist, in welcher Reihenfolge die sind und natürlich auch alle Versuche voneinander unabhängig und identisch sind, ist X1 binomial verteilt. Wem das jetzt noch nicht direkt klar wird, der sollte sich vielleicht noch mal das Video oder die Videos zur Binomialverteilung angucken. Aber hier sieht man auf jeden Fall auch die Verbindung der negativen Binomialverteilung zur Binomialverteilung. Also X1 ist binomial verteilt mit n und π. In diesem Fall haben wir 9 Versuche und eine Erfolgswahrscheinlichkeit weiterhin von 0,6, also die Definition unseres Erfolges bleibt die gleiche, wir ziehen eine rote Kugel. So, und hierfür können wir jetzt die Wahrscheinlichkeit ausrechnen. Also die Wahrscheinlichkeit in 9 Versuchen, die wir ja hier haben, genau 2 Erfolge zu erzielen. Noch mal zur Erinnerung: Wir hatten insgesamt 10 Versuche, wollten da drin 3 Erfolge erzielen, aber nicht beliebig verteilt, sondern wir wollten genau im 10. Versuch genau den 3. Erfolg erzielen. Wir gucken uns jetzt also erst mal die Erfolge 1 bis 9 an, und dann wissen wir, in diesen Versuchen 1 bis 9 haben wir 7 Misserfolge und 2 Erfolge. Aber da ist es uns egal, in welcher Reihenfolge. Also wir könnten erst die beiden Erfolge haben und dann die 7 Misserfolge. Das spielt hier keine Rolle. Deshalb haben wir uns hier unsere Behelfsvariable gebaut für die Versuche 1 bis 9 und die ist binomial verteilt. Wir können jetzt also sagen: Die Wahrscheinlichkeit, dass X1=2 ist, also dass wir 2 Erfolge in unseren 9 Versuchen haben, ist nach Binomialverteilung (9 über 2)×0,62×(1-0,67). Also (9 über 2), Anzahl der Kombinationsmöglichkeiten, wie die Reihenfolge sein kann, mal Erfolgswahrscheinlichkeit hoch Anzahl der Erfolge mal Misserfolgswahrscheinlichkeit hoch Anzahl der Misserfolge. Gut, das ist also die Wahrscheinlichkeit für die ersten 9 Versuche. Gut, wir wollen jetzt also den 10. Versuch dazu bringen. Wir wissen, der 10. Versuch ist ein Erfolg und hat demnach die Wahrscheinlichkeit π, die Erfolgswahrscheinlichkeit. Also ich schreibe hier mal 10. Versuch. Und wir haben jetzt ja wieder unser X, X normal ohne Index, und das ist negativ binomial verteilt. Also können wir jetzt sagen, die Wahrscheinlichkeit, dass X=10 wird, also dass wir im 10. Versuch den 3. Erfolg haben, der 3. Erfolg ist hier definiert, ist einer der Verteilungsparameter, ist gleich die Wahrscheinlichkeit der Versuche 1 bis 9, also (9 über 2)×0,62×(1-0,67), und das Ganze jetzt noch mal multipliziert mit der Erfolgswahrscheinlichkeit für den 10. Versuch, also ×0,6. Und das Ganze kann man jetzt natürlich zusammenfassen, also man kann die 0,6 mit hier reinbringen und bekommt dann also (9 über 2)×0,63×(1-0,67). Und somit haben wir jetzt also die Wahrscheinlichkeitsfunktion der negativen Binomialverteilung hergeleitet, im Prinzip aus der Wahrscheinlichkeitsfunktion der Binomialverteilung. Das jetzt erst mal anhand unseres Beispiels. Jetzt machen wir es natürlich auch noch mal theoretisch und formal korrekt. Okay, gucken wir uns das Ganze also jetzt einmal formal allgemein an. Also wir haben unsere Zufallsvariable X. Sie ist negativ binomial verteilt mit den Verteilungsparametern r und π: r, Anzahl der Erfolge, π, Erfolgswahrscheinlichkeit. So, und jetzt die Definition: Die Wahrscheinlichkeit, dass wir unsere Zufallsvariable X zu einem Wert x+r realisiert, also hierbei wären x die Anzahl der Misserfolge, r die Anzahl der Erfolge, =(x+r-1), also im Prinzip Anzahl aller Versuche -1. Wir hatten ja gerade 10 Versuche und hatten hier eine 9 stehen, da wir nur in den ersten 9 Versuchen quasi eine Variation der Reihenfolge hatten, und der 10. musste ja auf jeden Fall ein Erfolg sein, deshalb Anzahl der Versuche -1 über Anzahl der Erfolge -1. Wir hatten ja gerade 9 über 2, da halt genau in den ersten 9 Versuchen r-1 Erfolge erzielt werden konnten. So, × Erfolgswahrscheinlichkeitr × Misserfolgswahrscheinlichkeitx, also ErfolgswahrscheinlichkeitAnzahl der Erfolge × MisserfolgswahrscheinlichkeitAnzahl der Misserfolge. Gut, vielleicht ist das jetzt die Formel, die ihr gelernt habt, vielleicht habt ihr aber auch die gelernt. Es ist im Prinzip genau die gleiche, es ist halt nur so, dass dieser Operator, wo man sagt "über", ist symmetrisch. Das heißt, man kann sagen, statt (x+r-1 über r-1) kann man auch sagen (x+r-1 über x), da kommt das Gleiche aus. Also ob ich 5 über 4 oder 5 über 1 rechne, da kommt das Gleiche raus. Wird hier auch klar, wenn man sich noch mal genau überlegt, wie man das denn wirklich denn nachher auflöst. Also man kann auch schreiben (x+r-1), das ist das Gleiche geblieben, also im Prinzip Anzahl der Versuche -1, über Anzahl der Misserfolge, und dann wieder × Erfolgswahrscheinlichkeitr × Misserfolgswahrscheinlichkeitx. Gut, das ist also die formale Definition der negativen Binomialverteilung. Gucken wir uns noch mal 2 Voraussetzungen davon an, und dann sind wir auch schon mit der 1. Theorie zur negativen Binomialverteilung fertig. Okay, also wir haben 2 wichtige Voraussetzungen. Zum Einen muss r > 1 sein. Also es macht keinen Sinn zu fragen: Wie groß ist die Wahrscheinlichkeit, dass ich im 10. Versuch den 0. Erfolg habe. Das macht irgendwie keinen Sinn. Also die Anzahle der Erfolge muss ≥ 1 sein. Nun teilt sich das Ganze auf: Wenn er genau gleich 1 ist, haben wir ja bereits am Anfang des Videos gesagt, dann sind wir in der geometrischen Verteilung. Wenn er jetzt größer ist als 1, sind wir natürlich in der negativen Binomialverteilung. Also könnte man sagen, dass die geometrische Verteilung ein Spezialfall der negativen Binomialverteilung ist. Man kann natürlich auch r=1 mit der Formel der negativen Binomialverteilung ausrechnen, man landet dann aber im Prinzip bei der geometrischen Verteilung. So, und ganz wichtig, 2. Voraussetzung - wir haben unabhängige Versuche. Ganz, ganz wichtig! Das heißt, wenn wir uns die Urne betrachten, können wir ja jetzt noch mal machen. So, wir haben also eine Urne und wir ziehen daraus, sagen wir, 10 mal 10 unabhängige Versuche wollen wir haben. Das heißt, wir ziehen, gucken, "Aha, was haben wir gezogen?" notieren das und geben rot wieder zurück. Das heißt, zwischen den Versuchen ändert sich die Erfolgswahrscheinlichkeit und auch die Misserfolgswahrscheinlichkeit nicht. Anders sähe das aus, wenn wir abhängige Versuche hätten. Dann würden wir sagen, okay, wir ziehen 3-mal, das heißt, wir ziehen das 1. Mal, sagen, aha, ich habe blau gezogen, super, legen wir die beiseite und ziehen ein 2. Mal. Ziehen noch mal, sehen, aha, ich habe wieder blau gezogen, tun die beiseite. So, und beim 3. Erfolg sehen wir, die Misserfolgswahrscheinlichkeit hat sich geändert, weil sie ist gleich 0. Wir haben keine blauen Kugeln mehr in der Urne, das heißt wir müssen eine rote ziehen. Das heißt die Erfolgswahrscheinlichkeit ist jetzt als das wären abhängige Versuche. Wir haben aber unabhängige Versuche, das ist die Grundvoraussetzung für die negative Binomialverteilung. Wir haben unabhängige Versuche. Das ist übrigens auch die Voraussetzung für die geometrische Verteilung und für die Binomialverteilung. Also, unabhängige Versuche - ganz, ganz wichtig! So, ihr seht schon, wir haben jetzt zur negativen Binomialverteilung schon viel gemacht. Im nächsten Video gucken wir uns dann noch mal Erwartungswert und Varianz an. Das ist aber relativ einfach, wenn man die geometrische Verteilung schon kennt und das tun wir ja bereits, und dann noch ein kleines Beispiel im nächsten Video. Danach kommt natürlich auch noch mal ein Übungsvideo zur negativen Binomialverteilung, damit ihr auch wisst, was für Aufgaben man damit ohne Probleme rechnen kann. Ich bedanke mich fürs Zuschauen, sage, bis zum nächsten Mal - und tschüss!

Informationen zum Video
2 Kommentare
  1. 53857 salehr

    Gut erklärt! :)

    Von Fady S., vor etwa einem Jahr
  2. Default

    ideal.

    Von Jan Michael Witt, vor fast 2 Jahren