Advent, Advent, 1 Monat weihnachtliche Laufzeit geschenkt.

Nicht bis zur Bescherung warten, Aktion nur gültig bis zum 18.12.2016!

Textversion des Videos

Transkript Statistik Video 111: Richtige Wahl der Verteilung

Hallo! Schön, dass ihr alle wieder zuguckt. Wir sind heute bei unseren abschließenden Videos zu unserer diskreten Verteilung. Nachdem wir uns jetzt also alle diskreten Verteilungen angeguckt haben, wollen wir in den nächsten Videos - in diesem Theorievideo und in den nächsten 2 Übungen - noch gucken, wie man die richtige Verteilung wählt. Das heißt, wenn ihr in einer Klausur sitzt und ihr bekommt eine Textaufgabe und ihr bekommt eine Zufallsvariable x, die irgendwie definiert ist, dann müsst ihr natürlich wissen, wie ist x verteilt. Das heißt, wie kann ich den Erwartungswert ausrechnen, wie die Varianz und wie die Wahrscheinlichkeit. Sehr wichtig! Wir gucken uns jetzt also hier unsere 7 behandelten diskreten Verteilungen an, jeweils mit Verteilungsparameter und den Eigenschaften. Das heißt, in diesem Video machen wir noch die ganze Theorie, fassen unsere diskreten Verteilungsmodelle noch einmal zusammen und in den nächsten beiden Videos machen wir dann Übungen, also wie bekommen tatsächlich Textaufgaben und alles was wir machen, ist, zu sagen, wie ist x verteilt. Gucken wir uns das jetzt doch mal an. Verteilungsparameter, wir fangen mal an mit der Gleichverteilung. Die Gleichverteilung war ja sehr simpel. Man hatte eine Zufallsvariable x und man hatte von ihr bekannte Ausprägungen, die sie annehmen kann. Zum Beispiel, ich werfe einen 6-seitigen Würfel, ich kann 1 bis 6 als Zahlenergebnisse bekommen. Der Verteilungsparameter ist hierbei n, die Anzahl der Realisationsmöglichkeiten. Dann hat natürlich jede dieser Realisationsmöglichkeiten die Wahrscheinlichkeit 1/n realisiert zu werden. So, Eigenschaften, ja gut, alle haben die gleiche Wahrscheinlichkeit, was durch das Wort Gleichverteilung auch schon impliziert wird. Machen wir weiter mit der Bernoulliverteilung. Die Bernoulliverteilung war ein Versuch mit einer gewissen Erfolgswahrscheinlichkeit. π oder vielleicht p, π, das ist die Erfolgswahrscheinlichkeit. Und zwar ist hier wichtig zu sehen, dass wir nur einen Versuch haben, also wir haben einen Versuch und eine Erfolgswahrscheinlichkeit π und das war's. Also das ist wirklich ein sehr simpler Fall, entweder wir haben einen Erfolg oder wir haben keinen Erfolg, in einem Versuch. Mehrere Versuche haben wir dann in der Binomialverteilung, hier haben wir die Verteilungsparameter n, die Anzahl der Versuche, die wir durchführen und π, die Erfolgswahrscheinlichkeit. π ist für jeden Versuch gleich, das heißt, wir haben unabhängige Versuche. Also, wir haben n unabhängige Versuche, also klassisches Beispiel: Ziehen mit zurücklegen, ziehen aus einer Urne mit zurücklegen - unabhängig, ganz wichtig. Das ist eins der Schlagwärter: unabhängig! Dann haben wir die Poissonverteilung. Die Poissonverteilung ist sehr angenehm, denn sie hat nur einen Verteilungsparameter: λ. λ ist im Prinzip, die zu erwartende Anzahl der Erfolge, die in einem bestimmten Intervall eintreten, also immer wenn so was kommt wie "Erwartungswert" oder "im Durchschnitt kommen pro Stunde", dann sind wir bei der Poissonverteilung. Die hypergeometrische Verteilung: Da haben wir 3 Verteilungsparameter, also ist das die diskrete Verteilung, in der wir am meisten Verteilungsparameter brauchen, von denen, die wir behandelt haben. Und zwar hatten wir die Verteilungsparameter: n, N und M. Wir erinnern uns: n, die Anzahl der Züge, die Anzahl der Versuche, wie immer, wie auch bei der Binomialverteilung. N, die Anzahl der Grundgesamtheit, also wenn ich eine Urne betrachte, die Anzahl aller Urnen. Und M, die Anzahl der Elemente, die einen Erfolg implizieren, also wenn ich eine Urne betrachte, wenn ich sage, eine rote Kugel ist ein Erfolg, dann wäre M die Anzahl der roten Kugeln. So, und hier haben wir abhängige Versuche. Also, das ist auch manchmal nur ein Schlagwort. Wenn einfach nur in einer Aufgabe steht: "Okay, wir haben so und so viele Kugeln in einer Urne und es wird abhängig oder es wird unabhängig gezogen", dann wisst ihr schon: Okay, wir sind in der Binomialverteilung oder wir sind in der hypergeometrischen Verteilung. Gut, die hypergeometrische Verteilung kann man approximieren durch die Binomialverteilung. Ihr wisst das, wir hatten uns das schon in dem Theorievideo angeguckt. Und zwar, wenn die Stichprobe im Vergleich zur Grundgesamtheit sehr klein ist, also konkret bedeutet das als Faustregel: Wenn n/N kleiner gleich als 0,05 ist, dann ist x appr B(n,M/N). Also M/N ist hier dann die Erfolgswahrscheinlichkeit, steht also hier für das π und n, die Anzahl der Züge, ist natürlich die gleiche. Also, wenn n deutlich kleiner ist als N, dann kann man sagen: Okay, x, also die Zufallsvariable unserer  hypergeometrischen Verteilung ist approximativ binomial verteilt. Das heißt, das werdet ihr auch häufiger sehen, wenn ihr euch Altklausuren zum Beispiel anguckt, dann steht da eine Aufgabe und dann steht die Frage: Wie ist x verteilt? Dann sagt ihr: Okay, x ist hypergeometrisch verteilt und eventuell steht da aber auch die Frage: Wie ist x approximativ verteilt? Dann müsst ihr sagen: x ist approximativ binomial verteilt. Gut, die geometrische Verteilung. Wir erinnern uns, wir hatten die Anzahl der Versuche bis zum 1. Erfolg. Das heißt, wir hatten hier wieder nur einen Verteilungsparameter, nämlich π, die Erfolgswahrscheinlichkeit, und wir hatten auch wieder unabhängige Versuche. Unabhängige Versuche ist immer sehr schön, damit lässt sich leicht rechnen. Und quasi als Erweiterung der geometrischen Verteilung, die negative Binomialverteilung, in der wir 2 Verteilungsparameter hatten, nämlich zum einen π, die Erfolgswahrscheinlichkeit in jedem Versuch und zum anderen r, der r-te Erfolg nach dem gefragt wird. Also bei der negativen Binomialverteilung wäre es die Anzahl der Versuche bis zum 1. Erfolg. Und auch hier haben wir unabhängige Versuche. Ihr seht also, wenn von abhängigen Versuchen die Rede ist oder „Ziehen ohne zurücklegen“, wenn man eine Urne betrachtet, dann scheinen wir in der hypergeometrischen Verteilung zu sein. Gut, so viel zu den Verteilungsparametern und den Eigenschaften. Gucken wir uns doch noch mal an, wie allgemein die Zufallsvariablen in unseren Verteilungen definiert sind. Gut, gucken wir uns also an, wie x in der jeweiligen diskreten Verteilung definiert wäre. Ihr seht, ich hab die Gleichverteilung ausgelassen, weil bei der Gleichverteilung haben wir einfach nur die verschiedenen Realisationsmöglichkeiten. Also, in der Bernoulliverteilung haben wir x, wäre definiert eine Zufallsvariable x, als Anzahl der Erfolge in einem Versuch. Also entweder wir haben einen Erfolg oder nicht, nicht so schwer. Die Binomialverteilung, wir erinnern uns, ist quasi eine Kombination von n identischen und jeweils unabhängigen Bernoulliverteilungen, die Anzahl der Erfolge bei n unabhängigen Versuchen. Poissonverteilung: Die Anzahl der Erfolge im Intervall t, also es wird ein Intervall angegeben. Wir erinnern uns an unsere Übungen zur Poissonverteilung. Da wurde dann gefragt: Okay, wie groß ist die Wahrscheinlichkeit, dass wir mehr als 5 Erfolge in 2 Stunden haben, zum Beispiel. Die hypergeometrische Verteilung: Die Anzahl der Erfolge bei n abhängigen Versuchen, also im Unterschied zur Binomialverteilung haben wir jetzt abhängige Versuche. Die geometrische Verteilung: Die Anzahl der Versuche bis zum 1. Erfolg. Also hier wird nach den Versuchen gefragt und nicht wie sonst immer nach den Erfolgen. Und die negative Binomialverteilung: Die Anzahl der Versuche bis zum r-ten Erfolg. Ihr seht also schon, bei der geometrischen und der negativen Binomialverteilung wird hier nach der Anzahl der Versuche gefragt und immer sonst wird nach der Anzahl der Erfolge gefragt. So, wenn wir jetzt also herausgefunden haben, wir unser x tatsächlich verteilt ist, dann ist natürlich die Frage, wie schreiben wir das richtig auf?  Also, wir könnten natürlich einfach schreiben: x ist negativ binomial verteilt mit dem Verteilungsparameter r=3 und π=0,5, ist natürlich ziemlich lang und sieht auch nicht besonders schön aus. Also, haben wir eine Zusatzvariable x, die bernoulliverteilt ist, dann sagen wir: x ist bernoulliverteilt, und hier müssen wir das tatsächlich noch aufschreiben, aber auch nur bei der Bernoulliverteilung. Bernoulliverteilt mit π. Normalerweise schreibt man dann: mit π=0,5. Also bei der Bernoulliverteilung würde man das tatsächlich aufschreiben, bernoulliverteilt, ansonsten benutzt man Abkürzungen. Also bei der Binomialverteilung: x ist verteilt, das ist hier diese Schlange, ist binomial verteilt, das B steht für die Binomialverteilung mit n und π. Also hier würde man dann schreiben: x ist binomial verteilt B mit 10 und 0,5. Das heißt, n und π kann man hier gleich durch die Zahlenwerte ersetzen.
Bei der Poissonverteilung im Prinzip genau das gleiche: Ein P mit λ. Also poissonverteilt mit Lambda.
Hypergeometrisch verteilt: x~H(n,N,M) oder x ist approximativ B(n,M/N), aber nur wenn tatsächlich n/N kleiner gleich 0,05 ist, also wenn diese Bedingung erfüllt ist, können wir sagen: x ist approximativ binomial verteilt. Bei der geometrischen Verteilung haben wir auch nur wieder ein Verteilungsparameter, sagen also: x~G(π). Und bei der negativen Binomialverteilung schließlich: x~NB(r,π), also Anzahl der Erfolge, die ich erreichen will und π Erfolgswahrscheinlichkeit. So würde man das also aufschreiben, ihr seht also, fast jede diskrete Verteilung hat seinen eigenen Buchstaben, bis auf die Bernoulliverteilung, die aber tatsächlich sehr selten vorkommt, weil sie einfach so simpel ist. Die Bernoulliverteilung dient mehr als Grundgerüst für die Binomialverteilung. Wann macht man schon mal nur einen Versuch? Das kommt wirklich sehr, sehr selten vor. Gut, das war auch schon das 1. Theorievideo zur Wahl der Verteilung. Wir machen jetzt noch 2 Übungsvideos, gucken uns einfach Aufgaben an und versuchen herauszufinden, wie die verschiedenen Zufallsvariablen verteilt sind.
Ich bedanke mich fürs Zuschauen und sage bis zum nächsten Mal und tschüss.

Informationen zum Video
1 Kommentar
  1. Default

    Definitiv die besten Statistikvideos!

    Von Christinablessing, vor mehr als 2 Jahren