Advent, Advent, 1 Monat weihnachtliche Laufzeit geschenkt.

Nicht bis zur Bescherung warten, Aktion nur gültig bis zum 18.12.2016!

Textversion des Videos

Transkript Statistik Video 98 - Binomialverteilung II

Hallo, schön, dass ihr wieder alle zuguckt. Wir sind heute bei unserem 2. Video zu Binomialverteilung. Wir haben uns im letzten Video angeschaut, wie die Binomialverteilung definiert ist, wie man Wahrscheinlichkeiten damit ausrechnet und wie man diese Wahrscheinlichkeiten auch herleitet. Ich hoffe, ihr habt den Einstieg soweit verstanden. Wir machen heute weiter mit dem Erwartungswert der Varianz der Verteilungsfunktion und noch 1, 2 Eigenschaften der Binomialverteilung. Wir beginnen einfach mal direkt, da wo wir beim letzten mal aufgehört haben und berechnen einfach mal den Erwartungswert. Den Erwartungswert unserer Zufallsvariable x, die ja bei der Binomialverteilung immer definiert wird als Anzahl der Erfolge bei n unabhängigen Versuchen, wobei jeder dieser n unabhängigen Versuchen gleich binomialverteilt sein sollte, also mit der gleichen Wahrscheinlichkeit Bernoulli natürlich verteilt sein sollte. Also die Zufallsvariable x ist definiert als die Summe über alle n Versuche von xi. xi als jeweilige Zufallsvariable der Bernoulliverteilung. So, also haben wir hier den Erwartungswert der Summe von xi, Setzen also für x genau diese Definition ein. Und wir wissen vom Erwartungswert, das ist eine der Haupteigenschaften des Erwartungswertes, der Erwartungswert einer Summe ist gleich der Summe alle Erwartungswerte. Also ob ich den Erwartungswert von x+y ausrechne, das ist immer das Gleiche wie der Erwartungswert von x plus dem Erwartungswert von y. Eine Eigenschaft, die wir uns auch sehr gut zum Nutzen machen können. Also können wir einfach sagen, das ist die Summe über alle x des Erwartungswertes von xi. So, und der Erwartungswert von xi, wir erinnern uns an unser Video zur Bernoulliverteilung, ist gleich unsere Erfolgswahrscheinlichkeit P. Das heißt, wir haben hier im Prinzip stehen: die Summe über alle "i"s von 1 bis n von P. Ist jetzt P in irgendeiner Form zugehörig zu der Summe oder davon abhängig, hat es irgendwie den Index i? Nein, hat es nicht, das heißt, wir summieren einfach n×P auf. Also, der Erwartungswert von X ist bei einer binomialverteilten Zufallsvariable immer n×P. Ist ja auch relativ logisch, wir haben gesagt, wenn ich einen Würfel würfel und ich möchte oder ich definiere als Erfolg, dass ich eine 6 würfle, dann habe bei einer Bernoulli Verteilung den Erwartungswert 1/6. Wenn ich jetzt aber das Gleiche auf eine Binomialverteilung quasi erweitere und ich möchte wissen, was erwarte ich denn, wie oft erwarte ich eine 6 zu werfen, wenn ich das Ganze 6 mal mache. Dann ist der Erwartungswert natürlich 1. Ich erwarte bei 6 Würfen eine 6 dabei zu haben. Also, Erwartungswert der Binomialverteilung n×P. So, den könnt ihr benutzen, wenn ihr wisst, eine Zufallsvariable ist binomial verteilt. Das ist natürlich auch kein Zufall, dass hier nur die Verteilungsparameter drin sind n und P. Genau so wollen wir jetzt die Varianz ausrechnen. Die Varianz von x, also die Varianz der Summe aller "xi"s. Hier können wir das leider nicht einfach so sagen, also die Varianz einer Summe ist nicht gleich der Summe der Varianzen. Also wir können hier nicht sagen, Varianz x+y ist immer das Gleiche wie Varianz x + Varianz y. Hier brauchen wir eine Bedingung. Die Bedingung ist, die Kovarianz müsste 0 sein beziehungsweise die Versuche müssten voneinander unabhängig sein, damit die Kovarianz 0 ist, dann könnte man das einfach als Summe der Varianzen beschreiben. So, wir haben hier ja unabhängige Versuche, das heißt, die Kovarianz wird 0 sein. Und da wir unabhängige Versuche haben, dürfen wir das Ganze also aufbrechen. Aber ihr seht, diesmal haben wir eine Bedingung. Bei dem Erwartungswert konnten wir das ohne Bedingung machen, das funktioniert immer. Dieser Schritt funktioniert nur, wenn die Zufallsvariablen, die in der Summe stehen, stochastisch unabhängig sind. Also ist das jetzt die Summe über alle "i"s von Varianz xi. Und wir erinnern uns an die Bernoulliverteilung, die Varianz von xi war P×1-P. Also Erfolgswahrscheinlichkeit minus Mißerfolgswahrscheinlichkeit. Und wenn wir das hier wieder einsetzen, haben wir also die Summe von i=1 bis n von P×1-P. Ihr seht, wir haben hier wieder kein Index i, das heißt, wir summieren einfach n×1-P aus und kommen dann zu einer Varianz n×P×1-P. Also im Prinzip n mal die Varianz unserer Bernoulliverteilung. Gut, jetzt haben wir also Erwartungswert und Varianz hergeleitet und wir wissen jetzt, wenn wir eine Zufallsvariable haben, von der wir ganz klar wissen, sie ist binomial verteilt mit den Verteilungsparametern n und P, können wir sofort den Erwartungswert ausrechnen nxP und wir können sofort die Varianz ausrechnen n×P×1-P. Nachdem wir das haben, wollen wir uns als nächstes die Verteilungsfunktion angucken. Gucken wir uns die Verteilungsfunktion mal an. Groß F von x, also die Wahrscheinlichkeit, dass hier unsere Zufallsvariable x zu einem Wert kleiner gleich x realisiert. Ja, dieser liegt tabelliert vor. Was bedeutet das? Das bedeutet, wir müssen es nicht von Hand berechnen, sondern wir können einfach in einer Tabelle nachgucken und haben das Ergebnis. Die Tabellen sehen meisten relativ ungemütlich aus, also bei mir sieht es so aus. Das Ganze erstreckt sich jetzt über ungefähr 15, 20 Seiten. Und ich zeige euch jetzt aber mal, wie so eine Tabelle aufgebaut ist. Also, bei mir steht links oben die Wahrscheinlichkeit, also unser 1. Verteilungsparameter P. Hier, in diesem Beispiel ×0,1. Bei mir ist das tabelliert für 0,05 bis 0,5, immer in 5-Prozent-Schritten, also Eintrittswahrscheinlichkeit hier 10 % und ich habe die Tabellen von 5 bis 50 %. Vielleicht habt ihr noch mehr, vielleicht habt ihr noch weniger, vielleicht habt ihr nur 10er Schritte, aber ihr solltet auf jedenfall unterschiedliche Tabellen haben. Das heißt, man muss immer erstmal schauen, dass man in der richtigen Tabelle landet. Nummer 1: immer nach dem richtigen P suchen. So, dann steht hier der zweite Verteilungsparameter, die Anzahl der Versuche. n=1, ein Versuch, n=2, 2 Versuche, meine Tabelle geht bis n=30, 30 Versuche. Es gibt natürlich noch Tabellen, die noch viel weiter gehen, aber mein Prof hat gesagt, bei 30 muss Schluss sein. Wenn es mehr als 30 werden, dann könnte man es auch anders approximieren. Also hier n=30. Ihr müsst also gucken, dass ihr hier in der richtigen Spalte landet, euer 2. Verteilungsparameter. Also sagen wir, wir haben jetzt mal n=30. In dieser Spalte wären wir gelandet. Das heißt, unser x ist binomialverteilt, groß B, mit n=30 und P=0,1. Aus dieser Zeile müsst ihr hierhin finden, ihr müsst die richtige Tabelle finden. P= 0,1 und ihr müsst die richtige Spalte finden - n=0. Und hier steht im Prinzip das, wonach gefragt wird. Also x=0, x=1 und x=30. Also die Wahrscheinlichkeit, dass sich euer x zu einem Wert ≤ 0, ≤ 1, ≤ 30 realisiert. Vielleicht steht bei eurer Tabelle auch das x nicht, sondern nur ≤0, ≤1, das bedeutet das aber. Wenn jetzt also gefragt wird, sagen wir, groß F von 5, dann müsstet ihr nachsehen, in der Spalte, in der Zeile x≤5, denn gefragt ist nach der Wahrscheinlichkeit, dass sich unser x zu einem Wert von ≤5 realisiert. Und genau dieser Wert ist hier tabelliert. Also hätten wir hier jetzt x≤5. So, dann würde man in der richtigen Spalte, in der richtigen Zeile nachsehen, da würde dann ein 4stelliger Wert stehen. Bei mir ist das auf 4 Stellen hinter dem Komma genau: 0,9268. Das ist schon die Wahrscheinlichkeit, die ihr sucht, das hier sind die kummulierten Wahrscheinlichkeiten. Also das ist die Wahrscheinlichkeit, dass sich euer x zu einem Wert ≤5 realisiert, bei einer Erfolgswahrscheinlichkeit von 0,1 und 30 Versuchen. Es könnte auch sein, dass bei euch so etwas steht: 9268. Das bedeutet dann, das sind dann die Nachkommastellen. Das heißt, die 0 vorher wird schon obligatorisch vorausgesetzt, also müsst ihr euch dazu denken 0,9268. Das ist also eure Wahrscheinlichkeit, die ihr gesucht habt. So müsst ihr also da ran gehn. Ihr müsst immer gucken, bin ich auf der richtigen Seiten, habe ich die richtige Erfolgswahrscheinlichkeit, dann sucht ihr eure Spalte in der ihr bleibt, je nach Anzahl der Versuche und die Zeilen variieren dann. Die Zeilen sind, die variieren, je nach Fragestellung. Gut, so sieht die Verteilungsfunktion aus. Ihr seht, wenn man weiß, wie man mit dieser Tabelle umgeht, geht es sehr schnell und man muss nichts rechnen. Gucken wir uns jetzt 1, 2 Eigenschaften an. Sollte einmal die Notwendigkeit bestehen, die Verteilungsfunktion per Hand auszurechnen. Entweder weil ihr gerade keine Tabelle zur Hand habt oder weil euer Prof das explizit von euch haben möchte, dann müsst ihr leider in den saueren Apfel beißen und das komplett durchrechnen. Die Formel sieht dann also wie folgt aus: die Wahrscheinlichkeit, dass x sich zu einem Wert ≤X definiert, ist ∑ k=0 bis x von n über k×pk×(1-p)n-k. So, sieht erstmal verwirrend aus, was bedeutet das? Das bedeutet nichts anderes, als ihr die Wahrscheinlichkeit ausrechnen müsst für x=0, x=1, x=2 bis zum gefragten Wert. Das heißt also, ihr müsst alle Einzelwahrscheinlichkeiten ausrechnen, also die Wahrscheinlichkeit, dass sich x zu k realisiert, also fangt ihr bei k=0 an, also 0 Erfolge bis ihr zu eurer Grenze x kommt. Also sagen wir, x wäre 3. Das heißt, ihr müsst die Wahrscheinlichkeit ausrechnen, also die Wahrscheinlichkeit zu 0 realisiert, also dass ihr 0 Erfolge habt, die Wahrscheinlichkeit, dass ihr 1 Erfolg habt, die Wahrscheinlichkeit, dass ihr 2 Erfolge habt und die Wahrscheinlichkeit, dass ihr 3 Erfolge habt und die dann aufeinander addieren. Genau das zeigt diese Formel. Die Summe, ihr fangt bei 0 an, hört bei eurer Grenze x auf und berechnet die Einzelwahrscheinlichkeit. Ja, also ihr seht, es gibt ein Grund, warum die Binomialverteilung tabelliert vorliegt. Das möchte man nicht unbedingt bei einer Grenze von 17 bei 30 Versuchen haben. Da möchte man nicht hier 18 Terme ausrechnen müssen. So, gucken wir uns noch 2 Eigenschaften der Binomialverteilung an. Einmal die Additionseingenschaft. Wir haben 2 Zufallsvariablen x und y. Beide sind binomialverteilt. x ist binomialverteil mit n1 und der Erfolgswahrscheinlichkeit P. Also sagen wir, 10 Versuche Erfolgswahrscheinlichkeit 25 %. y ist auch binomialverteilt, mit n2 und P. Also sagen wir, 8 Versuche n2 und der Erfolgswahrscheinlichkeit 25 %. Das ist hier eklatant wichtig. Die Erfolgswahrscheinlichkeiten sind hier die Gleichen, P ist gleich. n1 und n2 sind verschieden. Dann können wir sagen x und y, x+y ist auch binomialverteilt mit n1 und n2, also in diesem Fall 10+8 Versuche, also 18 Versuche und der natürlich gleichen Erfolgswahrscheinlichkeit 25 %. Ist also die Erfolgswahrscheinlichkeiten von 2 binomialverteilten Zufallsvariablen die selbe, dann ist die Summe dieser beiden Zufallsvariablen auch wieder binomialverteilt mit der gleichen Erfolgswahrscheinlichkeit und der Summe der Anzahl der Versuche. Die Verteilung. Wie sieht die Verteilung einer binomialverteilten Zufallsvariable aus? Wenn P=0,5, also 50 % Erfolgswahrscheinlichkeit, dann haben wir eine symmetrische Verteilung. Also angenommen, wir werfen eine Münze, wir definieren Kopf ist ein Erfolg, Zahl ist ein Mißerfolg. Beides hat die Eintrittswahrscheinlichkeit ½, also haben wir eine Erfolgswahrscheinlichkeit von ½. Dann haben wir eine symmetrische Verteilung. Also sieht das ganze dann so aus, wir haben links und rechts eher kleine Wahrscheinlichkeiten, Eintrittswahrscheinlichkeiten und in der Mitte größere Eintrittswahrscheinlichkeiten. Geht jetzt unsere Erfolgswahrscheinlichkeit eher gegen 1, haben wir eine rechtssteile Verteilung. Das heißt, wir haben große Erfolgswahrscheinlichkeiten eher rechts, wird nach rechts also größer, wenn hier die Wahrscheinlichkeit aufgetragen ist. Geht unser P eher gegen 0, haben wir das ganze linkssteil, das heißt, das quasi gespiegelt, also hätten wir links höhe Wahrscheinlichkeiten. Also wir haben für eher wenig Erfolge, hohe Wahrscheinlichkeiten. Und für sehr viele Erfolge eine sehr kleine Wahrscheinlichkeit. Was ja auch bei einer kleinen Erfolgswahrscheinlichkeit relativ logisch ist.

So, das war also auch schon das 2. Theorievideo zu Binomialverteilung. Ich hoffe, ihr habt alles soweit verstanden. Das war vielleicht etwas viel Stoff für ein Video, aber wir machen im nächsten Video noch eine Übung, wo wir dann hoffentlich so gut wie alle Fragestellung auch einmal durchgehen werden, damit ihr am Ende auch die Binomialverteilung auch komplett verstanden habt und damit auch wirklich super rechnen könnt, damit sie euch absolut keine Probleme bereiten sollte. Ich bedanke mich für Zuschauen und hoffe, ihr guckt euch auch die nächsten Videos an, sage bis zum nächsten Mal und tschüss.

Informationen zum Video