Advent, Advent, 1 Monat weihnachtliche Laufzeit geschenkt.

Nicht bis zur Bescherung warten, Aktion nur gültig bis zum 18.12.2016!

Textversion des Videos

Transkript Statistik Video 110 - Negative Binomialverteilung Übung

Hallo, schön, dass ihr alle wieder zuguckt. Wir sind heute bei unserem Übungsvideo zur negativen Binomialverteilung. Wir haben ja bereits in den letzten beiden Videos uns die Theorie angeguckt, auch mit einem kleinen Beispiel. Wir haben den Erwartungswert hergeleitet, die Varianz und jetzt machen wir einfach noch mal eine umfassende Aufgabe dazu, damit ihr wisst, was für Fragestellungen bei der negativen Binomialverteilung auf euch zukommen können. Wir haben mal ein Beispiel aus dem Fußballbereich. Sagen wir mal, der 1. FC Berlin kämpft um den Klassenerhalt in der 7. Liga. Und es geht jetzt in die neue Saison, sie sind gerade aufgestiegen und sagen: "Okay, wir wissen, wir kämpfen gegen den Abstieg und wir rechnen mal damit, dass wenn wir 10 Siege schaffen in unserer Saison, dann schaffen wir den Klassenerhalt. Wenn wir weniger als 10 Siege schaffen, dann werden wir wahrscheinlich absteigen". Und sie rechnen auch damit, dass sie ungefähr jedes 4. Spiel gewinnen wollen, also, dass sie eine Siegwahrscheinlichkeit in jedem Spiel von 25% haben. Egal, ob sie jetzt zu Hause spielen, oder auswärts, oder gegen wen auch immer, sie rechnen einfach mal damit, dass sie in jedem Spiel eine Siegwahrscheinlichkeit von 0,25 haben. Das führt uns jetzt also zu unserer Zufallsvariablen x. x ist natürlich hier definiert als Anzahl der Versuche bis zum ersten Erfolg und x ist negativ binomial verteilt mit r und pi. r und pi haben wir aus der Aufgabenstellung gegeben, 10 und 0.25. Also 10 Siege wollen sie erreichen, 10 Erfolge und haben jeweils eine Erfolgswahrscheinlichkeit von 0,25. Also normalerweise wäre dieses Beispiel in einer Klausur im Fließtext enthalten und ihr müsstet jetzt irgendwie erkennen, dass bei den 10 Siegen, dass das r ist und dass die Erfolgswahrscheinlichkeit hier 0,25 ist. Da könnte aber auch stehen: Sie rechnen damit, im Durchschnitt jedes 4. Spiel zu gewinnen. Auch das müsstet ihr dann quasi im Kopf zu einer Erfolgswahrscheinlichkeit von 0,25 umwandeln können. Das ist also schon mal der 1. Schritt. Wir haben jetzt also unser X, wir wissen es ist negativ binomial verteilt mit 10 und 0,25. Was machen wir immer als erstes? Wir berechnen natürlich den Erwartungswert und die Varianz. Der Erwartungswert von X, wir erinnern uns daran, das haben wir beim letzten Mal hergeleitet. Die Formel dafür war r/pi. Also Anzahl der Erfolge/Erfolgswahrscheinlichkeit. 10/0,25=40. Sie rechnen damit im 40. Spiel den 10. Erfolg zu haben. Ist jetzt ein bisschen schlecht, wenn man sich überlegt, dass die nur 34 Spiele in der Liga haben. Wenn wir jetzt einfach mal davon ausgehen die Liga hat 18 Teams, also haben sie insgesamt 34 Spiele. Gut, ist natürlich blöd für ihre Erfolgsaussichten, wenn sie 40 Spiele brauchen um 10 Siege zu schaffen. Rechnen wir die Varianz aus und wir erinnern uns, die Formel für die Varianz war (r×1-pi)/pi². Also 10×0,75, also 1-pi, durch pi², also (0,25)². Wir gucken also: 0,75 sind 3/4, 10×3/4=30/4, geteilt durch 025, 0,25 ist natürlich 1/4 und 1/4²=1/16. Also 30/4, 30/4 sind 7,5, aus dem geteilt durch 1/16 können wir ×16 machen. Wir haben also 7,5×16=120. Die Varianz scheint schon recht groß zu sein, wobei es ziemlich schwierig ist, das jetzt so direkt zu interpretieren. Wir haben jetzt also unsere Zufallsvariable, wir kennen die Verteilung, wir haben die Verteilungsparameter, wir haben den Erwartungswert und die Varianz. Kommen wir doch jetzt mal zu den wirklich interessanten Fragen. Kommen wir jetzt also zu den interessanten Fragen. Frage a) P(x=10), was bedeutet das? Das bedeutet die Wahrscheinlichkeit, das X sich zu 10 realisiert. Wir erinnern uns: x=Anzahl der Versuche bis zum ersten Erfolg. Das heißt, die Wahrscheinlichkeit, dass wir beim 10 versuch den ersten Erfolg den 10. Erfolg haben. Oder in der Realität, die Wahrscheinlichkeit, dass unser 1.FC Berlin mit 10 Siegen in die Saison startet, also bereits am 10. Spieltag den 10. Sieg feiert und damit quasi schon den Klassenerhalt geschafft hat. Wir haben hier noch mal die allgemeine Wahrscheinlichkeitsfunktion, also wir haben x+r-1 über x, also die Anzahl der Versuche -1 über der Anzahl der Misserfolge × Erfolgswahrscheinlichkeitr ×Misserfolgswahrscheinlichkeitx. Wie gesagt, ihr könnt hier auch statt Anzahl der Versuche-1 über Misserfolge, Anzahl der Versuche -1 über Anzahl der Erfolge-1 rechnen. Wir haben also auf jeden Fall Anzahl der Versuche -1 oben stehen, wir haben insgesamt 10 Versuche, also haben wir hier eine 9 stehen. Wir könnten jetzt also schreiben 9 über 0, Anzahl der Misserfolge oder 9 über 9, Anzahl der Erfolge-1. Schreiben wir hier 9 über 0×Erfolgswahrscheinlichkeitr, also ^Anzahl der Erfolge. Das hier bleibt immer gleich, egal wonach ich hier frage, dieser Term bleibt immer gleich. Weil das ja ein Verteilungsparameter ist. Danach wird nicht gefragt, sondern dadurch ist die Verteilung schon beschrieben. ×0,75 Misserfolgswahrscheinlichkeit0, Anzahl der Misserfolge. Also haben wir 9 über 0, das dürfte 1 sein ×0,2510 und da kommt raus 0,000001, natürlich auch noch gerundet, also wirklich verschwindend gering. Wir müssen also leider sagen, dass die Wahrscheinlichkeit, dass unser 1.FC Berlin schon nach 10 Spieltagen die Klasse gehalten hat wirklich verschwindend gering ist. Gucken wir uns doch einmal ein anderes Beispiel an. Die Wahrscheinlichkeit, dass sich unser x zu 33 realisiert. Also die Wahrscheinlichkeit, dass wir am 33. Spieltag einen Klassenerhalt geschafft haben, und zwar genau am 33. Spieltag. Also am 33. Spieltag wird der 10. Sieg eingefahren. Wir sagen also hier Anzahl der Versuche-1, also 32 über Anzahl der Misserfolge. Wir haben 33 Spieltage, 10 Siege haben wir davon. Alles was kein Sieg ist zählen wir jetzt einfach mal als Misserfolg, also 32 über 23×0,2510×0,7523. Das kann man natürlich jetzt erst mal nicht im Kopf ausrechnen. Das ist schon alleine hier 32 über 23, das so alleine per Hand auszurechnen ist nicht so lustig. Deshalb, wenn wir das jetzt einmal in den Taschenrechner eingeben, kommen wir gerundet auf ungefähr 0,036. Das heißt, wir haben eine Wahrscheinlichkeit von ungefähr 3,6%, dass der Klassenerhalt, also die 10 Siege am 33. Spieltag geschafft wird. Gut, ist jetzt erst mal relativ gering. Wenn wir uns jetzt aber fragen, wie groß ist die Wahrscheinlichkeit, dass wir spätestens am 33. Spieltag den 10. Sieg einfahren, dann haben wir natürlich eine kumulierte Wahrscheinlichkeit, die dann auch deutlich höher ist und die ist auch deutlich aussagekräftiger. Problem ist, wir haben keine definierte Verteilungsfunktion für die negative Binomialverteilung. Das heißt, wir müssen tatsächlich das alles einzeln ausrechnen und aufaddieren. Wollen wir jetzt trotzdem als Beispiel einmal machen. Nachdem wir gerade die Wahrscheinlichkeit ausgerechnet haben, dass wir am 33. Spieltag den 10. Sieg einfahren, wollen wir jetzt die Wahrscheinlichkeit berechnen, dass wir spätestens am 33. Spieltag den 10. Sieg einfahren. Also dass sich unser x zu einem Wert < oder = 33 realisiert. Wie gesagt wir haben erst mal keine einfache Definition der Verteilungsfunktion. Also müssen wir uns irgendwie über Summen behelfen. Wie können also sagen, das ist die Summe aller Wahrscheinlichkeiten, dass sich x zu einem Wert kleiner gleich i realisiert. Die Frage ist jetzt, von wo bis wo läuft unser i. Okay, also gucken wir uns das Mal an. Was ist der kleinste Wert, den unser i annehmen kann? Na ja der kleinste Wert ist anscheinend r, wir brauchen mindestens r Versuche um r Erfolge zu erzielen. In diesem Fall 10. Wir können nicht am 9. Spieltag den 10. Sieg einfahren, das ist einfach nicht möglich. Das heißt, wir können unsere Zählweise hier bei 10 beginnen, weil das der kleinste Wert ist, den x überhaupt annehmen kann, und gehen natürlich bis zur oberen Grenze, bis zu 33. Also wollen wir die Einzelwahrscheinlichkeiten haben für alle Realisierungen von x, zwischen 10 und 33. Und wenn wir jetzt hier die Wahrscheinlichkeitsfunktion einsetzen, dann haben wir also die Summe von i=10 ist 33 von i-1, also die Anzahl der Versuche-1 über i-10, also die Anzahl der Misserfolge, wir haben auf jeden Fall 10 Erfolge in unseren Versuchen, das heißt wir würden hier anfangen bei 9 über 0, das wir auch gerade bei unserer Aufgabe a ausgerechnet haben ×0,2510, das bleibt auf jeden Fall gleich ×0,75i-10 Anzahl der Misserfolge. Und das ist jetzt natürlich nichts, was man für die Werte 10 bis 33 unbedingt in den Taschenrechner eingeben will. Da gibt es Programme, Schleifen, die Leute geschrieben haben, wo man quasi nur noch die Grenzen eingibt und die berechnen das dann für einen. Wir haben hier ungefähr 0,3. Das heißt, wir haben ungefähr eine 30%ige Wahrscheinlichkeit, dass wir bis zum 33. Spieltage 10 Siege eingefahren haben. Also schon mal gar nicht so schlecht. Gucken wir uns jetzt auch noch eine andere Frage von Interesse an. Was jetzt natürlich auch noch interessant ist, ist die Wahrscheinlichkeit, dass wir bis zum 34. Spieltag noch nicht 10 Siege geholt haben. Also wenn ihr so wollt, die Wahrscheinlichkeit, dass wir tatsächlich absteigen, wenn man davon ausgeht, dass wir immer dann absteigen, wenn wir weniger als 10 Siege geholt haben. Also die Wahrscheinlichkeit, dass x sich zu einem Wert größer als 34 realisiert, können wir jetzt so direkt nicht rechnen. Das heißt, was machen wir? Das was wir auch schon bei anderen Verteilungen gemacht haben. Wir sagen okay, das ist die gesamte Wahrscheinlichkeitsmasse minus genau das, was uns nicht interessiert. Also die gesamte Wahrscheinlichkeitsmasse 1- die Wahrscheinlichkeit, dass sich x zu einem Wert kleiner gleich 34 realisiert. Hier wissen wir ja, wie wir das rechnen, das haben wir hier ja schon gemacht, nur halt da für 33, jetzt für 34. Also 1-die Summe von i=10 diesmal bis 34 von i-1 über (i-10)×0,2510×0,75i-10. Machen wir hier noch eine Klammer herum, damit man weiß, dass das zusammengehört. Wir rechnen also die Wahrscheinlichkeit aus, dass wir bis zum 34. Spieltag 10 Siege geholt haben, und rechnen dann 1-diese Wahrscheinlichkeit, um herauszufinden, wie groß diese Wahrscheinlichkeit ist, dass wir in unseren 34 Spieltagen, die diese Saison immer lang ist, nicht die Siege holen oder zumindest nicht den 10. Sieg. Also gucken wir uns das an, wenn wir das hier ausrechnen kommt hier ein Wert von 0,336 heraus. Also haben wir insgesamt1-0,336=0,664. Das heißt, mit einer Wahrscheinlichkeit von 66,4% wird der 10. Sieg theoretisch erst nach dem 34. Spieltag geholt. Das heißt, in den ersten 34 Spieltagen schaffen wir es nicht, den 10. Sieg zu landen. Das heißt im Prinzip, wir steigen ab, schade. Gut, das war die Übung zur negativen Binomialverteilung. Ich hoffe ihr habt soweit alles verstanden und könnt mit der negativen Binomialverteilung so gut wie alles rechnen. Das war auch schon die letzte Verteilung, die wir in diesem Kurs behandeln wollen. Die nächsten 3 Videos werden sich noch mal mit Auswahl von Verteilungen beschäftigen, das heißt, wir bekommen einen Text, wo ein paar Daten drin stehen und wir müssen dann entscheiden was für eine Verteilung, wie berechne ich das, was ist die Wahrscheinlichkeitsfunktion. Ich bedanke mich für das Zuschauen, sage bis zum nächsten Mal und tschüss.

Informationen zum Video
2 Kommentare
  1. Default

    http://de.wikipedia.org/wiki/Negative_Binomialverteilung#Erwartungswert

    Kommt auf die Definition an. Bei der einen ist es r/p, bei der alternativen r*(1-p)/p.

    Je nachdem welche man benutzt, ändert sich natürlich auch der Erwartugnswert.

    Von Statistik Jona, vor mehr als 3 Jahren
  2. Default

    In meiner Formelsammlung ist als Erwartungswert E(x) = r*(1-p)/ p angegeben
    Damit ist der Erwartungswert 30 und nicht 40 !

    Von Philipp Osburg, vor mehr als 3 Jahren