Textversion des Videos

Transkript Statistik Video 109 - Negative Binomialverteilung II

Hallo, schön, dass ihr alle wieder da seid. Wir sind heute beim 2. Video zur negativen Binomialverteilung und in diesem beschäftigen wir uns erst einmal mit dem Erwartungswert und der Varianz.   Wir haben unsere Zusatzvariable X. Unsere Zusatzvariable x ist negativ binomialverteilt mit r und Pi, und wir wollen jetzt wissen: Was ist denn der Erwartungswert von X? Gucken wir uns erst noch mal den Erwartungswert der geometrischen Verteilung an. Das hatten wir ja vor ein paar Videos. Der Erwartungswert der geometrischen Verteilung ist 1/Pi. So, und wir wissen jetzt, dass die negative Binomialverteilung im Prinzip eine Summe von r identisch unabhängig geometrisch verteilten Zusatzvariablen ist, die alle die gleiche Erfolgswahrscheinlichkeit Pi haben. Das heißt, wir können aus dieser Summe jetzt im Prinzip den Erwartungswert unserer negativ binomialverteilten Zufallsvariable herleiten. Und das machen wir jetzt auch. Also wir sagen: E von X, und ich mache hier mal den Index n, das ihr wisst,  okay, das ist negativ binomialverteilt, dieses X, hier: Xn. Nur damit ihr das abgrenzen könnt von Xg, das geometrisch verteilt ist. Und wir haben ja bisher gesagt: Xn, also unsere negativ binomialverteilte Zufallsvariable ist im Prinzip nichts anderes als die Summe von r identisch, unabhängig geometrisch verteilter Zufallsvariablen. Und das können wir jetzt einsetzen, das heißt, wir haben hier den Erwartungswert von der (Summe i=1 bis r) von Xgi. Das heißt: Die Summe über r identisch, unabhängig geometrisch verteilter Zufallsvariablen. Also das g steht hier einfach dafür, dass dieses X geometrisch verteilt ist und das i ist hier der Laufindex der Summe. So, wenn ihr euch einmal erinnert, was wir über Erwartungswerte wissen ... Wir wissen z.B. dass der Erwartungswert einer Summe gleich der Summe der Erwartungswerte ist. Das ist eine sehr schöne Eigenschaft, die wir auch hier wieder verwenden wollen. Das heißt, wir können das Summenzeichen rausziehen. Dadurch ändert sich erst einmal nichts, das heißt, wir haben hier die Summe von (i=1 bis r) von E von Xgi. Also, wir konnten die Summe rausziehen und haben jetzt hier den Erwartungswert einer geometrisch verteilten Zufallsvariable. So, und wir wissen, dass alle diese i unterschiedlich geometrisch verteilten Zufallsvariablen haben den Verteilungsparameter Pi. Das haben wir hier definiert. Und damit haben wir den Erwartungswert, der nämlich nur von Pi abhängig ist, als 1/Pi. Wir haben also jetzt die Summe von (i=1 bis r) von 1/Pi. Wir setzen also hier für den Erwartungswert von Xg, also einer geometrisch verteilten Zufallsvariable, genau 1/Pi ein, was ja der Erwartungswert einer geometrischen Verteilung ist. Und wir sehen jetzt: Aha, das, was jetzt in der Summe, in dem Summenzeichen, entsteht, ist nicht mehr von i abhängig, hat keinen Laufindex i mehr. Das heißt, wir können jetzt sagen: Das ist r×1/Pi. Ja, und das ist nämlich genau der Erwartungswert einer negativ binomialverteilten Zufallsvariable in unserem Fall: der Erwartungswert von Xn. Also: r×1/Pi. Dadurch dass die negative Binomialverteilung, dass eine Summe von r identisch, unabhängig geometrisch verteilter Zufallsvariablen negativ binomialverteilt ist, können wir einfach sagen: Okay, nehmen wir r mal (den Erwartungswert den wir hier haben), und genau das ist es. Gut, nun haben wir also den Erwartungswert für die negative Binomialverteilung hergeleitet. Jetzt gucken wir uns doch einfach mal die Varianz an. Das geht im Prinzip genau so, könnt ihr also eigentlich auch alleine machen, aber wir machen das jetzt auch noch mal zusammen, vielleicht etwas kürzer. Gut, die Varianz, wie gesagt, funktioniert nach dem gleichen Schema. Wir gucken uns die Varianz der geometrischen Verteilung an. Varianz einer geometrisch verteilten Zusatzvariable ist (1-Pi)/Pi² und wir sagen wieder, okay, die Summe von r identisch, unabhängig geometrisch verteilter Zufallsvariablen X mit dem Verteilungsparameter Pi ist negativ binomialverteilt mit den Verteilungsparametern r und Pi. Und genau das nutzen wir jetzt auch, wenn wir die Varianz ausrechnen wollen. Wir sagen also die Varianz von Xn, also der negativ binomialverteilten Zufallsvariable ist gleich die Varianz der Summe über unserer geometrisch verteilten Zufallsvariable. So, und das kann man jetzt auch wieder auflösen. Hier ist das nicht so einfach, weil die Varianz andere Rechenregeln hat, als der Erwartungswert. Das heißt, wir können die Summe nicht einfach so nach außen ziehen und einfach die Summe der Einzelvarianzen berechnen, also zumindest nicht generell. Da müsst ihr sehr aufpassen. Das heißt, wenn wir das jetzt hier ausrechnen, sind das also die Summe der Einzelvarianzen plus die eventuellen Kovarianzen. Das Vorteilhafte, was wir jetzt haben ist, dass wir unabhängige Zufallsvariablen jetzt haben, das heißt die Kovarianzen sind jetzt alle 0. Das heißt: Im Prinzip können wir doch die Einzelvarianzen ausaddieren. Und wenn wir das machen, haben wir also r mal die Einzelvarianz, also haben wir r×((1-Pi)/Pi²). Und das ist dann unsere Varianz einer negativ binomialverteilten Zufallsvariable. Aber wie gesagt: Das durften wir jetzt nur machen ... oder das ist jetzt nur so einfach geworden, weil die Kovarianzen, die sich hieraus ergeben würden alle 0 sind, dadurch, dass wir unabhängige Zufallsvariablen haben. Gut, wir haben jetzt also den Erwartungswert hergeleitet. Wir haben die Varianz hergeleitet. Wir haben im letzten Video schon die Wahrscheinlichkeitsfunktionen hergeleitet, uns die Voraussetzungen angeguckt. Jetzt machen wir noch ein kleines Beispiel als Abschluss der beiden Theorievideos.   So, wir haben jetzt also ein Beispiel. Wir haben jetzt unser X, das ist negativ binomialverteilt mit 5 und 0,2. Was heißt das? Das heißt, wir haben eine Erfolgswahrscheinlichkeit von 0,2 und wollen 5 Erfolge haben. Alles was wir uns also noch fragen, ist der Versuch, indem der 5. Erfolg erzielt wird. So: P von X=15. Das heißt, das hier ist die Wahrscheinlichkeit im 15. Versuch, den 5. Erfolg zu haben. Diese 5 wird nicht mehr spezifiziert, sonder P von X=15 impliziert das schon. Die 5, also unser r ist ein Verteilungsparameter unserer negativen Binomialverteilung, das heißt P von X=15 sagt das schon: Okay, wir wollen im 15. Versuch den r. Erfolg haben. Und was genau das r ist, da müssen wir also in unseren Verteilungsparameter, also hier die 5. Gut, wir haben jetzt hier also unserer Wahrscheinlichkeit im 15. Versuch den 5. Erfolg zu haben. Das interessiert uns. Wir sagen also jetzt: Das ist 14 über 4, das heißt das ist im Prinzip, wenn wir uns das hier angucken, X+r-1 also die Anzahl der Versuche minus 1, weil wir ja gesagt haben, der 15., der letzte Versuch, muss immer ein Erfolg sein, so ist das definiert in der negativen Binomialverteilung, das heißt uns interessiert nur die Variationsmöglichkeiten in allen Versuchen vorher, also X+r-1. So und hier unten steht das X bzw. r-1. Da haben wir ja gesagt, kann man beides einsetzen, also x+r-1 über r-1. Das hier ist jeweils da Gleiche. Das heißt: Hier steht entweder die Anzahl der Misserfolge 10 oder die Anzahl der Erfolge minus 1, in unserem Fall 4. So, dann haben wir hier also unsere 0,2 also unsere Erfolgswahrscheinlichkeit hoch 5, was also jetzt wäre die Anzahl der Erfolge mal 0,8, also unsere Misserfolgswahrscheinlichkeit, die Gegenerfolgswahrscheinlichkeit. Wir sagen ja bei der negativen Binomialverteilung: Wir haben entweder einen Erfolg oder einen Misserfolg. Also wir haben immer nur 2 Optionen. Das heißt, es reicht auch, wenn wir die Erfolgswahrscheinlichkeit definieren. Dann ist die Gegenerfolgswahrscheinlichkeit auch auf jeden Fall die Misserfolgswahrscheinlichkeit. Also das wäre dann hier die Misserfolgswahrscheinlichkeit und die 10 wäre natürlich dann die Anzahl der Misserfolge. So setzt sich also diese Formel zusammen. Wenn man das Ganze jetzt mal ausrechnet, dann kommt 0,034 heraus, ungefähr, also natürlich gerundet, also knapp 3 1/2 Prozent. Also die Chance, beim 15. Versuch den 5. Erfolg zu haben liegt bei knapp 3,4 %. Wundert euch nicht, dass diese Wahrscheinlichkeiten, die ihr bei der negativen Binomialverteilung ausrechnet, alle sehr, oder eher klein sind, das ist so bei der negativen Binomialverteilung. Das wird dann auch erst mit der Verteilungsfunktion, also damit, dass sich das aufkumuliert. Wir könnten hier auch zeigen: Wie groß ist die Wahrscheinlichkeit im ... spätestens im 15. Versuch den 5. Erfolg zu haben. Dann hätte man das natürlich aufkumuliert. So, dabei wollen wir es jetzt natürlich noch nicht belassen. Jetzt haben wir in diesem Video den Erwartungswert und die Varianz eingeführt. Wollen wir jetzt also auch mal kurz ausrechnen. Also der Erwartungswert von X, ist ja wie wir gesagt haben r×1/Pi, also r ist in unserem Fall 5, mal 1/0,2. 1/0,2 ist wiederum 5, also 5×5 macht also 25. Und die Varianz von X war r×((1-Pi)/Pi²), also 5×(0,8/0,04), also 4/0,04 macht also 10. Wir haben also einen Erwartungswert von 25. Das heißt, wir erwarten im 25. Versuch den 5. Erfolg zu haben. Und eine Varianz von 10. Gut, wir haben also noch mal uns die Wahrscheinlichkeitsfunktion angeguckt, sie genau aufgedröselt, was man da überall einsetzt.Erwartungswert und Varianz sind jetzt auch nicht sonderlich schwer zu errechnen. Es ist im Prinzip wirklich nur eine Erweiterung der geometrischen Verteilung. Ja, das war auch schon das 2. Theorievideo zur negativen Binomialverteilung. Ihr solltet jetzt also alles eigentlich drauf haben. Wir machen im nächsten Video noch eine Übung dazu, um auch wirklich noch mal etwas schwierigere Fragestellungen, auch hier mit kleiner Gleichung, größer, und so uns anzugucken, wie man das auch rechnet. Sollte aber wirklich alles kein Problem sein. Ja, ich bedanke mich fürs Zuschauen, sage, bis zum nächsten Mal und tschüss.    

Informationen zum Video
1 Kommentar
  1. Default

    Hallo,
    kleiner "Rechenfehler" bei der Varianz 4/0,04 = 100 (Im Video wird 10 als Lösung gezeigt)

    Von Timm Hi, vor fast 2 Jahren