Textversion des Videos

Transkript Statistik Video 105 - Geometrische Verteilung I

Hallo. Schön, dass ihr alle wieder zuguckt. Wir sind heute bei unserem Video zur geometrischen Verteilung. Wir fangen damit also eine neue Verteilung an.  Wir stellen uns einfach mal vor, wir kommen nachts müde und vielleicht etwas angetrunken nach Hause und versuchen, die Wohnungstür aufzuschließen. Wir haben ein Schlüsselbund. Da sind 4 Schlüssel dran. Einer davon ist der Schlüssel für die Wohnungstür, 3 davon sind andere Schlüssel. Wir gehen jetzt einfach mal davon aus, dass wir, weil wir so übermüdet sind, die Schlüssel nicht mehr auseinanderhalten können. Das heißt, wir nehmen unseren Schlüsselbund, wählen einen Schlüssel davon zufällig aus - wir können sie ja nicht auseinanderhalten - und versuchen, ob er passt. Entweder er passt oder er passt nicht. Wenn er passt, gut, wir sind in der Wohnung und können ins Bett gehen, alles ist super. Wenn er nicht passt, versuchen wir es natürlich weiter. Jetzt sind wir aber so müde, dass wir uns nicht merken, welchen Schlüssel wir schon ausprobiert haben. Das heißt, wir probieren nicht einfach am Schlüsselbund entlang, sondern sind frustriert, nehmen den Schlüsselbund wieder in die Hand und wählen wieder einen zufällig aus, ohne uns gemerkt zu haben, welchen wir schon getestet haben. Und die geometrische Verteilung fragt jetzt nach der Wahrscheinlichkeit, dass man eine bestimmte Anzahl an Versuchen bis zum ersten Erfolg braucht. Also im Prinzip: Wie wahrscheinlich ist es, dass ich direkt beim 1. Versuch den richtigen Schlüssel treffe? Wie wahrscheinlich ist es, dass ich auch beim 10. Versuch immer noch vor der verschlossenen Wohnungstür stehe? Wir haben, wie gesagt, einen richtigen Schlüssel und 3 falsche Schlüssel. Und wir gehen davon aus, dass das Ganze ein Bernoulli-Experiment ist. Das heißt, jeder Schlüssel hat die gleiche Wahrscheinlichkeit ausgewählt zu werden, nämlich ¼. Und unsere Variable x, die der geometrischen Verteilung folgt, fragt jetzt also nach der Anzahl der Versuche bis zum 1. Erfolg. Anzahl der Versuche, das ist der große Unterschied zu allen bisherigen Verteilungen, die wir besprochen haben. Da wurde meistens nach der Anzahl der Erfolge gefragt. So eine Variable haben wir in yi - Anzahl der Erfolge. yi ist hier Bernoulli verteilt, das heißt, y1 gibt die Anzahl der Erfolge im 1. Versuch an, y2 die Anzahl der Erfolge im 2. Versuch usw. Und wir wollen jetzt einfach mal gucken, wie groß ist denn die Wahrscheinlichkeit, dass wir genau 4 Versuche brauchen, um den richtigen Schlüssel zu finden. Also die Wahrscheinlichkeit, dass unser x=4 ist. Was bedeutet das? Das bedeutet, wir stehen vor unserer verschlossenen Wohnungstür und beim 1. Versuch schaffen wir es nicht, die Tür auszuschließen. Beim 2. Versuch schaffen wir es auch nicht, beim 3. Versuch schaffen wir es auch nicht und beim 4. Versuch schaffen wir es dann. Das heißt, das ist die Wahrscheinlichkeit, dass y1=0 ist, also y1, unser 1. Versuch, ist ein Misserfolg, kombiniert mit der Wahrscheinlichkeit, dass y2=0 ist und y3=0, also das bedeutet, die Versuche 1-3 sind Misserfolge. Und y4 soll dann =1 sein. Im 4. Versuch soll ich einen Erfolg haben. Das ist ja genau hier gefragt. Die Wahrscheinlichkeit, dass x (die Anzahl der Versuche bis zum Erfolg) =4 ist. Das heißt, dass ich im 4. Versuch meinen 1. Erfolg habe. Die Versuche sind jeweils voneinander unabhängig. Das habe ich ja bereits gesagt. Ich merke mir nicht, welche Schlüssel ich schon ausprobiert habe, sondern ich probiere einen Schlüssel aus, und wenn er nicht passt, bin ich frustriert, guck mir den Schlüsselbund wieder an und wähle wieder zufällig einen aus. Es kann durchaus passieren, dass ich zweimal hintereinander den gleichen Schlüssel probiere. Das heißt, die Versuche sind voneinander unabhängig. Was können wir also machen? Wir können die einzelnen Wahrscheinlichkeiten multiplizieren. Also die Wahrscheinlichkeit y1=0 × die Wahrscheinlichkeit y2=0 × die Wahrscheinlichkeit y3=0 × die Wahrscheinlichkeit y4=1. Und was wissen wir jetzt über diese Wahrscheinlichkeiten? Diese 3 Wahrscheinlichkeiten sind Misserfolgswahrscheinlichkeiten. Also ich wähle einfach den falschen Schlüssel aus, nicht den Wohnungstürschlüssel. Und das ist die Wahrscheinlichkeit, dass ich den Wohnungstürschlüssel aussuche. Ich habe 3 Schlüssel, die nicht passen von 4. Das heißt, die Wahrscheinlichkeit, dass ich einen falschen Schlüssel auswähle, ist  ¾. Also haben wir ¾×¾×¾×¼. Wenn man das jetzt ausrechnet, kommt man auf eine Wahrscheinlichkeit von ungefähr 0,11. Also in ungefähr 11% der Fälle treffe ich genau mit dem 4. Versuch meinen richtigen Schlüssel bei dieser Wahrscheinlichkeitsverteilung. 

Was bedeutet das aber allgemein? Wir sehen ja, diese ¾ ist ja wie gesagt die Misserfolgswahrscheinlichkeit. Das heißt, das ist 1-π, weil π ja unsere Erfolgswahrscheinlichkeit ist. Also haben wir (1-π)×(1-π)×(1-π)×π, × unserer Erfolgswahrscheinlichkeit. Und das bedeutet, wir haben (1-π)x-1. x ist ja im Prinzip die Anzahl der Versuche bis zum 1. Erfolg, also eine Zahl, die angibt, in welchem Versuch ich meinen 1. Erfolg habe. Bei uns 4. Das heißt, alle Erfolge vorher sind logischerweise Misserfolge. Das heißt, alle Versuche bis einschließlich x-1 sind Misserfolge, haben alle die Wahrscheinlichkeit 1-π und am Ende multipliziere ich noch einmal mit der Erfolgswahrscheinlichkeit π. Das ist die allgemeine Wahrscheinlichkeitsformel für die geometrische Verteilung, für P(x)=x, also (1-π)x-1×π. Also Misserfolgswahrscheinlichkeit hoch die Anzahl der Misserfolge, mal Erfolgswahrscheinlichkeit. Hoch 1 könnte man auch noch sagen, weil wir ja nur die Anzahl der Versuche bis zum 1. Versuch zählen. Das schon mal als Einführung. Gucken wir uns doch mal die Theorie etwas genauer an. Bei der geometrischen Verteilung haben wir die Wahrscheinlichkeitsfunktion, dass unsere Zufallsvariable x sich zu x realisiert von (1-π)x-1×π. Und π ist hier unser Verteilungsparameter. Und zwar unser einziger Verteilungsparameter, was die geometrische Verteilung wieder sehr schön macht. Man braucht nur einen Verteilungsparameter und sagt dann x ist geometrisch verteilt mit π.  Gucken wir uns noch mal 2 Spezialfälle an. Zuerst einmal die Wahrscheinlichkeit, dass unser x zu einem Wert > x realisiert, also, dass wir in den 1. x-Versuchen keinen Erfolg haben. Also beim Beispiel gerade, x=4, die Wahrscheinlichkeit, dass wir in den ersten 4 Versuchen keinen Erfolg haben. Und das ist offensichtlich (1-π), also die Misserfolgswahrscheinlichkeit ^x. Also wenn ich danach frage, wie groß ist die Wahrscheinlichkeit, in den ersten 4 Versuchen keinen Erfolg zu haben, dann muss ich wohl 4 Misserfolge hintereinander gehabt haben oder die Wahrscheinlichkeit dafür berechnen, dass ich 4 Misserfolge hintereinander habe. Das macht genau diese Formel (1-π)x. Und das ist nichts anderes als 1-F(X). Jetzt wissen wir ja bereits, dass, wenn wir diese Wahrscheinlichkeit ausrechnen wollen - die Wahrscheinlichkeit, dass sich unser X zu einem Wert > x realisiert - können wir auch einfach sagen, wir nehmen die gesamte Wahrscheinlichkeitsmasse und subtrahieren im Prinzip alle Fälle, die uns nicht interessieren. Also in diesem Fall F(X).  Was ist also unser F(X)? Unser F(X) ist im Prinzip die Wahrscheinlichkeit, dass sich unser X zu einem Wert ≤  x realisiert. Und da wir wissen, dass diese Wahrscheinlichkeit das Gleiche ist, wie 1-F(X), wissen wir, dass unser F(X)=1-(1- π)x sein muss. Das leitet sich aus diesem Zusammenhang ab. Um das noch mal klarzustellen, diesen Zusammenhang zwischen P(x > x)0 1-F(X) gibt es in jeder Verteilung. Also wenn ich danach frage, wie groß ist die Wahrscheinlichkeit, dass X > 3, kann ich auch sagen, das ist 1-die Wahrscheinlichkeit, dass x maximal 3 ist, also eine Wert ≤ 3 annimmt. Diese Wahrscheinlichkeit gibt es immer. Wir wissen jetzt, was die P(x > x) ist (1- π)x, also ist unsere Verteilungsfunktion 1-(1-π)x. Also im Prinzip einfach das Ganze umgestellt.  Wir haben also bei der geometrischen Verteilung wieder eine ganz klare Formel für die Verteilungsfunktion, müssen also nicht mehr alle Werte einzeln ausrechnen wie wir es ja z.B. noch bei der Poissonverteilung machen mussten. Gut, das war auch schon das 1. Theorie-Video zur geometrischen Verteilung. Es gibt natürlich noch, wie ihr es gewohnt seid, noch ein 2. Da gucken wir uns dann noch Erwartungswert und Variant an sowie zwei Eigenschaften, die die geometrische Verteilung hat. Ich bedanke mich fürs Zuschauen, sage bis zum nächsten Mal und tschüss.

Informationen zum Video