Textversion des Videos

Transkript Statistik Video 104 - Poissonverteilung Übung

Hallo! Schön, dass ihr alle wieder zuguckt. Wir sind heute bei unserer Übung zur Poissonverteilung. Wir haben ja in den letzten beiden Videos bereits die Theorie der Poissonverteilung durchgesprochen. Und jetzt wollen wir einfach noch einmal ein paar Aufgaben rechnen, damit ihr auch wisst, welche Problemstellungen bei der Poissonverteilung auf euch zukommen werden. Hier noch einmal zur Erinnerung die Wahrscheinlichkeitsfunktion der Poissonverteilung. Also, die Wahrscheinlichkeit, dass sich unserer Zufallsvariable groß X und klein x realisiert, ist gleich: P(X=x)=[λx)/x!]×e^-λ. OK, kucken wir uns unser Beispiel an: Wir wollen heute mal Fußball spielen. Eine Fußballmannschaft, sagen wir die deutsche Nationalmannschaft, schießt im Schnitt alle 30 Minuten ein Tor. Wir haben 2 Zufallsvariablen definiert: x ist die Anzahl der Tore pro Spiel und y ist die Anzahl der Tore pro Halbzeit. OK, die haben wir jetzt definiert und wir wollen jetzt also unsere Verteilungsparameter finden. Wir sehen nämlich, dass x und y beide poissonverteilt sind, durch unsere Angabe, die wir im Beispiel haben. Wir brauchen aber noch den Verteilungsparameter λ. OK, wie bekommen wir den raus? Wir sagen unser λx ist gleich die Zeit, die wir bei unserer Zufallsvariable x als Intervall definiert haben - die Länge eines Fußballspieles. Also 90 Minuten. Wir gehen jetzt einmal davon aus wir haben keine Verlängerung und auch keine Nachspielzeit. Wir haben immer genau 90 Minuten. Also, Länge unseres bei der Zufallsvariablen x definierten Intervalls geteilt durch durchschnittliche Zeit pro Erfolg. Das haben wir: Im Schnitt haben wir einen Erfolg, also ein Tor, alle 30 Minuten. Das macht also λx=90/30=3. Das bedeutet, wir können in unserem Intervall, das wir in x definiert haben (ein Fußballspiel), 3 Tore erwarten. Unser Fußballspiel dauert 90 Minuten. Im Durchschnitt wird alle 30 Minuten ein Tor geschossen. Also können wir 3 Tore erwarten. Das gleiche machen wir natürlich bei λy. Da haben wir also jetzt nicht das ganze Fußballspiel, sondern nur eine Halbzeit aus 45 Minuten. Wir teilen wieder durch 30 und bekommen λy=45/30=1,5 heraus. Wir können jetzt also hier schreiben: x ist P(3) und y ist P(1,5). Das haben wir jetzt gerade herausgefunden. Nachdem wir also die Größe unserer beiden Lambdas haben, λx und λy können wir jetzt also unserer ersten beiden Aufgaben auch einfach lösen. Aufgabe a), die Wahrscheinlichkeit, dass sich unser x zu 2 realisiert. Also bedeutet das die Wahrscheinlichkeit, dass wir ein Fußballspiel haben, in dem genau 2 Tore fallen, beziehungsweise in dem unsere Mannschaft genau 2 Tore schießt. Wenn wir uns also hier die Formel ankucken, haben wir λx/x!; λx (wir beobachten hier die Zufallsvariable x) ist 3. Also haben wir 3x. Nach welchem x fragen wir? Nach 2. Wir wollen wissen: Wie groß ist die Wahrscheinlichkeit, dass die deutsche Nationalmannschaft in einem Spiel genau 2 Tore schießt. Also: P(x=2)=(3²/2!)×e^-3. Das ist also jetzt die Formel. Wir sehen, wir mussten im Prinzip nur Lambda kennen. Das ist ja das Schöne an der Poissonverteilung - sie hat nur einen Verteilungsparameter, nämlich Lambda. Nach x wird ja gefragt. Insofern ist sie mit Lambda komplett beschrieben. Und das ist ungefähr 0,224. Das heißt, in ungefähr 22% der Fälle fallen in einem Spiel genau 2 Tore. Kucken wir uns unser zweites Beipiel an, diesmal y. Die Wahrscheinlichkeit, dass sich y zu 0 realisiert. Das heißt, die Wahrscheinlichkeit, dass in einer von uns zufällig betrachteten Halbzeit kein Tor fällt, beziehungsweise dass unsere Mannschaft kein Tor schießt. Es könnte ja immer noch sein, dass die anderen ein Tor schießen, aber das kucken wir uns hier nicht an. Also, λ von y haben wir hier: 1,5. Hoch 0 (hoch x). In diesem Fall halt das, wonach gefragt wird, also hoch 0: P(y=0)=(1,50/0!)×e^-1,5. Wir haben hier relativ viele Nullen. Wir haben auch im Nenner 0!. Normalerweise ist ja Fakultät das Produkt aller Zahlen, von der aktuellen runter bis zur 1. Also 2! wäre 2×1. 0! ist jetzt also eine Ausnahme. 0! ist per Definition 1. Das sollte man also wissen. Also haben wir im Nenner schon einmal eine 1 stehen. Das solltet ihr euch merken: 0! ist per Definition 1. Genauso wie jede beliebige Zahl hoch Null auch 1 ist. Also steht hier (1/1)×e^-1,5. Wir können also sagen: Wenn nach der Wahrscheinlichkeit gefragt wird in der Poissonverteilung, dass sich eine Zufallsvariable zu 0 realisiert, dann wird der erste Term immer 1 sein, weil wir immer λ0 haben, was 1 ist, geteilt durch 0!, was auch 1 ist. Und es wird sich immer auf den zweiten Term, also auf e^-λ konzentrieren. Das heißt, das ist das einize was wir übrig behalten, wenn danach gefragt wird, dass eine Zufallsvariable zu 0 realisiert. So, e^-1,5 ist ungefähr 0,223. Also in ungefähr 22% der Fälle fällt in einer Halbzeit kein Tor. Das waren die beiden einfachen Beispiele, also die Wahrscheinlichkeit, dass x zu 2 realisiert und die Wahrscheinlichkeit, dass y zu 0 realisiert. Machen wir noch mal ein etwas komplexeres Beispiel. OK, kucken wir uns also das nächste Beispiel an: P(y≤2). Also die Wahrscheinlichkeit, dass sich unser y, die Anzahl der Tore in einer Halbzeit, zu einem Wert ≤2 realisiert. Das heißt, unser Team schießt in einer Halbzeit maximal 2 Tore. Wenn ihr in den letzten Videos aufgepasst habt - und ich gehe davon aus, dass ihr es getan habt, werdet ihr wissen, dass wir keine einfache, definierte Formel für die Verteilungsfunktion der Poissonverteilung haben. Das heißt, wir müssen es quasi von Hand ausrechnen. Also die Ergebnisse nach unserer Poissonformel für die einzelnen Werte ausrechnen und aufaddieren. Wenn wir jetzt einen Wert von ≤2 haben wollen, welche Werte können das sein? Zuerst einmal die Wahrscheinlichkeit, dass sich y zu 2 realisiert. Dann noch die Wahrscheinlichkeit, dass y zu 1 realisiert, das ist ja kleiner als 2: P(y≤2)=P(y=2)+P(y=1). Warum können wir hier ein Plus schreiben? Das liegt daran, dass die Ereignisse disjunkt sind. Das bedeutet, wenn sich unser y zu einem Wert gleich 2 realisiert, also in einer Halbzeit 2 Tore geschossen werden, dann kann es sich nicht gleichzeitig zu einem Wert gleich 1 realisieren. Das heißt, es tritt immer nur eins dieser Ereignisse gleichzeitig auf. Deshalb können wir die Wahrscheinlichkeiten aufaddieren. Das ist aber noch nicht alles. y kann sich auch zu einem Wert von 0 realisieren. Nämlich genau dann, wenn unser Team kein Tor in einer Halbzeit schießt: P(y≤2)=P(y=2)+P(y=1)+P(y=0). Und hierfür müssen wir jetzt im Prinzip jeweils die Wahrscheinlichkeit ausrechnen - immer mit unserem Verteilungsparameter λ, den wir hier aufgeschrieben haben: 1,5. Also haben wir: [(1,5²/2!)×e^-1,5]+[(1,5¹/1!)×e^-1,5]+[(1,50/0!)×e^-1,5]. Man kann jetzt natürlich einfach das (e^-1,5) ausklammern und den Rest aufaddieren, aber man kann es auch einfach so ausrechnen. Für (1,50/0!) haben wir ja schon einen Wert, das haben wir ja gerade schon einmal ausgerechnet. Das waren ungefähr 0,223. Wir geben das einfach in den Taschenrechner ein und bekommen dann für die Wahrscheinlichkeit, dass y sich zu 1 realisiert ungefähr 0,335 raus, und für die Wahrscheinlichkeit, dass y sich zu 2 realisiert ungefähr 0,251. Das heißt, wir addieren die jetzt alle zusammen (0,223+0,335+0,251) und bekommen gerundet einen Wert von ≈0,81 heraus. Das heitß, die Wahrscheinlichkeit, dass unser Team in einer Halbzeit maximal 2 Tore schießt, liegt bei gut 80%. Das ist jetzt nicht weiter verwunderlich, wenn wir davon ausgehen, dass sie im Schnitt pro Halbzeit 1,5 Tore schießen. Dass wir da eine sehr große Wahrscheinlichkeit haben, dass sie maximal 2 Tore schießen, sollte eigentlich verständlich sein. Gut, das war das vorletzte Beispiel. Wir machen jetzt noch eins, wo wir nicht nach ≤ fragen, sonden nach >, damit ihr auch das einmal gesehen habt. OK, die letzte Übungsaufgabe: P(x>3). Also die Wahrscheinlichkeit, dass unser Team in einem Spiel mehr als 3 Tore schießt. Da könnte man sagen, das kann man so ausrechnen wie eben: Man fängt bei der Wahrscheinlichkeit P(x=4) an, plus P(x=5) plus P(x=6) plus P(x=7). Die Frage ist nur, wo hört man da auf? Hört man bei 10 auf - die Wahrscheinlichkeit, dass unser Team in einem Spiel 10 Tore schießt? Hört man bei 100 auf? Hört man bei 1000 auf? X kann theoretisch all diese Werte annehmen. Also macht man es genau anders herum. Man denkt sich, welche Werte sollen denn nicht angenommen werden? Wenn ich die Wahrscheinlichkeit wissen will, dass unser Team in einem Spiel mehr als 3 Tore schießt, dann bedeutet das, ich will genau die Wahrscheinlichkeit ausklammern, dass unser Team in einem Spiel 3 Tore schießt oder 2 oder 1 oder 0. Also alles ≤3 soll rausfliegen. Wie machen wir das? Das haben wir schon bei anderen Verteilungsfunktionen gemacht: Wir nehmen die gesamte Wahrscheinlichkeitsmasse, also alle Wahrscheinlichkeiten für alle möglichen Werte von x, also von 0 bis im Prinzip theoretisch unendlich, und ziehen genau die Wahrscheinlichkeitsmasse ab von dem Bereich, den wir nicht haben wollen. Da uns die Wahrscheinlichkeit für mehr als 3 Tore interessiert, ziehen wir also die Wahrscheinlichkeit für maximal 3 Tore ab:  P(x>3)=1-P(X≤3). Und das ist ja etwas, was wir gerade schon mit y gemacht haben. Also haben wir hier die Wahrscheinlichkeit, dass x sich zu 3 realisiert, also dass wir in einem Spiel 3 Tore schießen, die Wahrscheinlichkeit, dass wir 2 Tore schießen, die Wahrscheinlichkeit, dass wir 2 Tore schießen und die Wahrscheinlichkeit, dass wir gar kein Tor schießen: 1-[P(x=3)+P(x=2)+P(x=1)+P(x=0)]. Das ist es im Prinzip. Also, ihr wisst jetzt hoffentlich, wie ihr an diese Wahrscheinlichkeiten rankommt: Ihr setzt es in diese Formel ein (P(X=x)=[λx)/x!]×e^-λ.), rechnet es aus, addiert es zusammen und kommt auf eine Wahrscheinlichkeit von ≈0,35. Das heißt, in ungefähr 35% der Fälle schießt unsere Mannschaft in einem Spiel mehr als 3 Tore. In den restlichen 65% der Fälle werden maximal 3 Tore geschossen. Das war auch schon die Übung zur Poissonverteilung. Ich hoffe, es war soweit alles klar und verständlich und ihr könnt ab jetzt mit der Poissonverteilung sicher und fehlerfrei rechnen. Im nächsten Video fangen wir wieder mit einer neuen Verteilung an - diesmal mit der geometrischen Verteilung, auch eine sehr wichtige und interessante Verteilung, weil sie die Antwort auf eine ganz neue Fragestellung ist. Ich hoffe ihr kuckt euch auch die nächsten Videos an. Ich sage tschüss und bis zum nächsten Ma!

Informationen zum Video