Textversion des Videos

Transkript Statistik Video 101 - Hypergeometrische Verteilung Übung

Hallo, schön, dass ihr alle wieder zuguckt. Wir sind heute bei unserer Übung zur hypergeometrischen Verteilung. Und ich habe mir da einmal ein kleines Beispiel ausgedacht. Also nehmen wir einfach einmal an, wir haben 10 Kuchen gebacken. Davon sind 6 Apfelkuchen und 4 sind Kirschkuchen. Blöderweise sind das alles gedeckte Kuchen, sodass wir sie nicht voreinander unterscheiden können. Wir können also nicht draufgucken und sagen, aha Apfelkuchen, aha, Kirschkuchen. So, wir können sie also nicht voreinander unterscheiden, beziehungsweise erst, wenn wir sie aufschneiden, also klassisch hypergeometrisch verteilt. Wir ziehen zufällig einen dieser 10 Kuchen heraus und gucken dann, ist es ein Kirschkuchen oder ist es ein Apfelkuchen. Wir haben die beiden Zufallsvariablen X und Y definiert. X ist die Anzahl der Apfelkuchen bei n=5 abhängigen Versuchen, y Anzahl der Kirschkuchen bei n=5 abhängigen Versuchen. So, und ihr kennt das ja von mir, als Erstes wollen wir einmal den Erwartungswert und die Varianz berechnen. Noch mal zur Erinnerung, hier oben steht noch mal die Wahrscheinlichkeitsfunktion für die hypergeometrische Verteilung, und der Erwartungswert wie bei der Binomialverteilung ist ja n mal Erfolgswahrscheinlichkeit, also n×M/N. In diesem Fall also n ist 5, also 5 Mal, wir haben 6 Apfelkuchen und X fragt ja nach Apfelkuchen, das heißt, für die Zufallsvariable X ist ein Apfelkuchen als Erfolg definiert. 5 mal 6 durch Anzahl aller Kuchen, weil es sind insgesamt 10, also 5×6/10= 3. Erwartungswert von X ist 3. Ich erwarte also, bei 5 abhängigen Versuchen, 3 Apfelkuchen zu ziehen. Gucken wir uns den Erwartungswert von Y an. Auch hier die gleiche Formel n×M/N. Aber jetzt müssen wir aufpassen, weil M hat sich verändert. M ist ja die Anzahl der Objekte, die das von mir gesuchte Merkmal trägt. Und da wir hier den Erwartungswert von Y ausrechnen, ist das gesuchte Merkmal, dass es ein Kirschkuchen ist. Also ist in diesem Fall M nicht 6, sondern M ist 4. Ich mache deshalb auch zur besseren Unterscheidung hier immer so einen kleinen Index dran, M1 und M2. Also haben wir hier 5×4/10, also 2. Bei 5 abhängigen Versuchen erwarte ich also, 2 Kirschkuchen zu ziehen. So, die Varianz von X. Noch einmal zur Erinnerung, n mal Erfolgswahrscheinlichkeit mal Misserfolgswahrscheinlichkeit wie bei der Binomialverteilung, mal den Korrekturfaktor. Also n×M/N×(1-M/N)×(N-n)/(N-1), also hier der Korrekturfaktor. Diese Ms hier sind natürlich jeweils unser M1, also die Anzahl der Apfelkuchen. Wir haben also 5 mal 0,6, hier diese 6/10, mal 1-0,6 ist 0,4 mal N sind 10, n sind 5, also 10-5 durch 10-1, also mal 5/9, also 5 n mal 0,6 M1/N mal 0,4 1-M1/N mal Korrekturfaktor, und das macht 2/3. Unsere Varianz von X ist also 2/3. So, gucken wir uns die Varianz von Y an. Hier haben wir natürlich jetzt M2. Die Formel schreibe ich jetzt nicht noch einmal auf, sondern wir machen direkt weiter. Also, n 5 mal M2 durch N 0,4, diese 4/10, mal Gegenwahrscheinlichkeit 0,6 mal Korrekturfaktor, und der Korrekturfaktor ändert sich ja auch nicht, es ist ja Anzahl aller Objekte minus Anzahl der Züge geteilt durch Anzahl aller Objekte minus 1. Und wir sehen hier schon, es ist genau die gleiche Formel, wenn wir das dann tatsächlich eingesetzt haben, also 2/3. Wir haben jetzt also Varianz X und Y ausgerechnet, zusätzlich noch den Erwartungswert von X und Y. Und wir sehen hier schon eine gewisse Symmetrie. Das ist auch kein Zufall. Dadurch, dass wir beide Zufallsvariablen so definiert haben, dass wir wirklich alles abdecken, also im Prinzip, es gibt nur zwei Möglichkeiten, entweder es ist ein Apfelkuchen oder es ist ein Kirschkuchen, und für beides haben wir eine Zufallsvariable definiert, müssen sich die Erwartungswerte auf n aufsummieren und die Varianzen gleich sein. Also das ist die Symmetrie der hypergeometrischen Verteilung. Gut, dann gucken wir uns auch einfach einmal einige Rechnungen an, die man damit anstellen kann. Also berechnen wir einmal die erste Aufgabe. Gefragt ist nach P(X=3), also die Wahrscheinlichkeit, dass wir bei 5 abhängigen Zügen genau 3 Apfelkuchen haben. Die Wahrscheinlichkeit, die allgemeine Formel steht hier MüberX×(N-M)über(n-X)/(Nübern). Wir gehen das jetzt mal Teil für Teil durch. Müberx, Was ist M? M ist die Anzahl der Kuchen, die die von uns geforderte Eigenschaft haben, also in diesem Fall die Anzahl aller Apfelkuchen, die sich überhaupt in dem großen Pool befinden, also 6. Wir haben insgesamt 6 Apfelkuchen. X ist die Anzahl, nach der gefragt ist. Die steht auch hier, also 3. Wir wollen genau 3 Apfelkuchen ziehen. Und zwar aus 6 Apfelkuchen, die wir haben, wollen wir 3 ziehen. So, das ist der erste Teil, mal M-N, also die Anzahl aller Kuchen minus der Anzahl der Apfelkuchen, also 10-6, also im Prinzip die Anzahl der Kuchen, die nicht die von uns geforderte Eigenschaft haben, über n-X, also die Anzahl der Züge, die wir tun, minus die Anzahl der Apfelkuchen, die wir ziehen wollen, also 5-3. Wir haben hier also jetzt quasi 4über2, das bedeutet, aus den 4 Kirschkuchen, die wir haben, also beziehungsweise 4 Kuchen, die eben keine Apfelkuchen sind, ziehen wir noch mal 2. Weil wir müssen ja bei unseren 5 Zügen jedes Mal einen Kuchen ziehen, das heißt wir wollen dreimal einen Apfelkuchen ziehen und zweimal eben keinen Apfelkuchen in unseren 5 Zügen. Das Ganze teilen wir dann noch durch Nübern, also die Anzahl aller Kuchen über die Anzahl der Züge, also im Prinzip, wie viele unterschiedliche Möglichkeiten gibt es überhaupt, 5 abhängige Züge zu tun, also wie viele verschiedene Möglichkeiten der Reihenfolgen, also hier 10über5. Also, das Ganze rechnen wir jetzt einfach einmal aus. 6über3 bedeutet 6!/(3!×3!). 6!=6×5=120, weil, sind 30×4=120×3=360×2=720. Das heißt, wir haben hier schon einmal 720 geteilt durch 3! sind 3×2×1=6, also 3!=6×3!=6, also 6×6=36, das Ganze mal 10-6=4 über 5-3=2, also mal 4über2, also 4!=24/(2!×2!), also 24/(2×2) macht 4. Und das Ganze geteilt durch 10über5, das ist etwas, das muss man nicht unbedingt im Kopf rechnen können, ich sage es euch einfach einmal, das 252. Okay, dann kürzen wir jetzt die Brüche. 720/36=20, 36×2 wären 72, dann noch eine 0 dran, also 20. 24/4=6. Also 20×6/252, das heißt im Zähler steht 120, im Nenner 252, das heißt das Ganze ist ungefähr 0,476. Das heißt, knapp über 47 % ist die Wahrscheinlichkeit, dass wir bei 5 abhängigen Versuchen mit obigen Grundbedingungen, die wir hier haben, genau 3 Apfelkuchen ziehen, knapp über 47 %, schon relativ hoch. Gucken wir uns also b) an. Gefragt ist hier: Wie groß ist die Wahrscheinlichkeit, dass wir bei 5 abhängigen Versuchen genau einen Kirschkuchen ziehen? Es ist diesmal also nicht nach X gefragt, sondern nach Y. Y sind ja die Kirschkuchen. Gefragt ist also P(Y=1). Und auch hier können wir es wieder einsetzen. M über X. Diesmal ist M=2, Anzahl der Kirschkuchen, also 4über1 mal M-N, also Anzahl der Nichtkirschkuchen, sind 6 über Anzahl der Misserfolge sind 4, geteilt durch 10 über 5, Nübern. Also 4über1 bedeutet 4!/(1!×3!), 1! ist 1, kann man rauslassen, 4!/3! ist im Prinzip 4×3×2×1/(3×2×1). Ihr seht schon, das Ganze kürzt sich weg, wir bleiben bei einer 4. Mal 6über4, 6über4 sind also 6×5×4×3×2×1 geteilt durch 4×3×2×1×2×1, also 6!/(4!×2!), könnt ihr zu Hause noch einmal ausrechnen, sind 15, könnt ihr mir einfach glauben. So, und 10 über 5 hatten wir hier gerade schon ausgerechnet, 10über5 sind insgesamt 252. Wie kommen also auf 60/252, oder eine Wahrscheinlichkeit von ungefähr 0,238, also knapp unter 24 %. Das war auch schon b). b) ist natürlich genauso simpel wie a). Wir rechnen eine simple Wahrscheinlichkeit aus. Bei c) wird es jetzt etwas komplizierter. Da wollen wir nämlich wissen: Wie groß ist die Wahrscheinlichkeit, dass wir höchstens 2 Kirschkuchen ziehen, also etwas, wofür wie eine Verteilungsfunktion wirklich bräuchten. Wir müssen es aber von Hand ausrechnen. Gucken wir uns Aufgabe c) an. Höchstens 2 Kirschkuchen. Zunächst einmal, wonach ist gefragt? Nach Kirschkuchen, also nach Y. Also die Wahrscheinlichkeit, dass Y kleiner gleich 2 ist. So, was brauchen wir dafür? Wir können das nicht einfach so ausrechnen, sondern wir müssen die Einzelwahrscheinlichkeiten addieren, also die Wahrscheinlichkeit, dass Y gleich 1 ist, die Wahrscheinlichkeit, dass Y gleich 2 ist. Reicht das? Kommt noch was? Ja, die Wahrscheinlichkeit, dass Y gleich 0 ist. Das kann ja auch passieren. Das wird häufig vergessen. Macht diesen Fehler nicht auch. Wenn nach so etwas gefragt ist, müsst ihr immer die 0 mit berücksichtigen. Also die Wahrscheinlichkeit, dass Y gleich 1 ist, haben wir hier schon stehen, ungefähr 0,238 oder, um es genauer zu sagen, 60/252. So, die Wahrscheinlichkeit, dass Y=2 ist, gut, können wir jetzt wiederr aufstellen, also ist 4über2×6über3/10über5, hier haben wir wieder unsere 252igstel, und hier oben stehen, wenn man das jetzt ausrechnet 120. Also, die Wahrscheinlichkeit ist 120/252. So, und die Wahrscheinlichkeit, dass Y gleich 0 ist, ist also, wenn wir das alles wieder einsetzen 4über0, auch das geht, mal 6über5/10über5. So, und das Ganze sind 6/252. Gut, wir haben jetzt also unsere Einzelwahrscheinlichkeiten, und die können wir aufaddieren. Wir können also sagen P(Y≤2)=P(Y=0)+P(Y=1)=P(Y=2) oder auch 6/252+60/252+120/252, macht also insgesamt 186/252 oder auch, um es einmal wieder schön als Dezimalzahl anzugeben, ungefähr 0,74. Wir haben also eine Wahrscheinlichkeit von ungefähr 74 %, dass wir bei 5 abhängigen Versuchen höchstens 2 Kirschkuchen ziehen. Gut, ich hoffe, ihr habt jetzt gesehen, wie man die Wahrscheinlichkeiten berechnet, wie man auch die Verteilungsfunktion berechnet, auch wenn man die Verteilungsfunktion explizit nicht hat, sondern wie man das dann über die Einzelwahrscheinlichkeiten bekommt. Ja, das war die Übung zur hypergeometrischen Verteilung. Im nächsten Video fangen wir wieder mit einer neuen Verteilung an, diesmal mit der Poisson-Verteilung. Ich bedanke mich fürs Zuschauen und sage bis zum nächsten Mal und tschüss.

Informationen zum Video
1 Kommentar
  1. Default

    Lieber Jona,

    ich studiere Psychologie an der Fernuni und habe momentan das Thema Statistik. Ohne Ihre Videos wäre ich verloren. Für mich erklären Sie von allen Tutoren mit Abstand am Besten. Bei den andern verstehe ich auch nicht allzuviel.
    Also ganz herzlichen Dank!!
    Julia Düttmann

    Von Julia Duettmann, vor etwa 3 Jahren