Advent, Advent, 1 Monat weihnachtliche Laufzeit geschenkt.

Nicht bis zur Bescherung warten, Aktion nur gültig bis zum 18.12.2016!

Textversion des Videos

Transkript Statistik Video 87 - stochastische Unabhängigkeit Übung

Hallo, schön, dass ihr heute alle wieder zuguckt. Wir sind heute bei unserer Übung zur stochastischen Unabhängigkeit. Ich habe hier im letzten Video schon erwähnt, dass das wirklich ein sehr, sehr wichtiges Thema ist. Deshalb machen wir heute auch noch mal eine schöne Übung dazu, bei stetigen mehrdimensionalen Zufallsvariablen und auch bei diskreten mehrdimensionalen Zufallsvariablen. Wir fangen einfach mal mit den stetigen Zufallsvariablen an und wir gehen von vornherein schon mal davon aus, dass x und y, unsere beiden stetigen Zufallsvariablen stochastisch unabhängig sind. Beide sind stetig gleich verteilt. Was das genau bedeutet, kommt in der der Statistik 2, wenn die stetigen Verteilungsmodelle behandelt werden. Ihr müsst euch erst mal nur merken, okay, die Dichtefunktion ist folgendermaßen definiert: Die Dichtefunktion von x nimmt immer dann den Wert 0,25 an, wenn x zwischen 0 und 4 liegt, ansonsten ist es 0. Und die Dichtefunktion von y nimmt immer dann den Wert 0,4 an, wenn y zwischen 0 und 2,5 liegt, und ist sonst überall 0. Das heißt, wenn man das mal irgendwie in ein Diagramm zeichnen möchte, sagen wir mal, wir wollen die Dichtefunktion von y mal kurz darstellen, dann haben wir also zwischen 0 und 2,5 einen Wert von 0,4, also so. Und überall sonst, also rechts hiervon und links hiervon, haben wir dann jeweils den Wert 0. So würde das aussehen. Das Gleiche natürlich bei x, nur halt mit anderen Zahlen. Also hätten wir hier den Wert, 0,25 und es würde von 0 bis 4 gehen. Also im Prinzip sehr ähnlich dem Beispiel, was wir auch schon mal gerechnet haben. So, jetzt interessiert uns die gemeinsame Verteilungsfunktion, ich meine die gemeinsame Dichtefunktion f(x, y). Gut, wir wissen jetzt, x und y sind stochastisch unabhängig und im letzten Video zur stochastischen Unabhängigkeit haben wir gelernt: Wenn die beiden stochastisch unabhängig sind, ist die gemeinsame Dichtefunktion das Produkt der einzelnen Dichtefunktionen. Das heißt, f(x, y)= die Dichtefunktion von x × die Dichtefunktion von y. So, und zwar in jedem möglichen Bereich. Das heißt, f(x, y) ist dann definiert als 0,1, was ja 0,25×04 sind, also das Produkt der beiden einzelnen Dichtefunktionen. Und jetzt ist aber wichtig, in welchem Bereich das als 0,1 definiert ist, und zwar zählen da jetzt alle Bereiche, also alle Einschränkungen, die wir vorher gemacht haben. Also x muss zwischen 0 und 4 liegen und gleichzeitig muss y noch zwischen 0 und 2,5 liegen. Denn immer wenn einer der beiden Werte aus diesem Rahmen rausfällt, ist diese Dichtefunktion sofort 0 und damit wird auch das Produkt der beiden Dichtefunktionen 0. Das heißt, wir haben jetzt beide Einschränkungen und einen anderen Bereich, wo überhaupt ein Wert für diese Dichtefunktion angenommen wird. Gut, jetzt haben wir also die gemeinsame Dichtefunktion. Okay, was wir jetzt noch brauchen, ist natürlich dann der jeweilige Erwartungswert noch, also e(x) und e(y). Wir erinnern uns noch einmal kurz an die allgemeine Formel für den Erwartungswert, das ist das Integral von - ? bis ?, von x×f(x)dx oder auch natürlich f(y)dy. So, und mit dieser Formel können wir jetzt unsere Erwartungswerte für x und y ausrechnen. Wir nehmen aber nicht die Grenzen von - ? bis ?, sondern wir beschränken uns auf den Bereich, wo unsere Dichtefunktion von x einen Wert ? 0 annimmt, also für x zwischen 0 und 4. Also haben wir hier e(x)= das Integral zwischen 0 und 4, also wir nehmen nur den Bereich, wo die Dichtefunktion ? 0 ist und rechnen jetzt: x×f(x), also die Dichtefunktion in diesem Bereich, 0,25dx. So, und das Ganze integrieren wir jetzt. Aus x wird x², aus x wird x²/2 sogar. Das heißt, wir haben 0,25x²/2, 1/8x², und das in den Grenzen von 0 bis 4. So, wenn wir uns das jetzt angucken: 4²=16×1/8=2. 0²=0, kann man also weglassen. Also haben wir als Erwartungswert von x 2. Das Gleiche machen wir jetzt natürlich auch mit y. So, hier haben wir die Grenzen 0 bis 2,5, also der Bereich, wo unsere Dichtefunktion von y ? 0 ist und rechnen: y×, die Dichtefunktion in diesem Bereich, 0,4dy. So, wir integrieren das also, haben hier y²/2. Wir haben also 1/5y², 0,4 sind 2/5, ½×0,4=1/5, und das in den Grenzen 0 bis 2,5. So, wir sehen, wenn wir 0 einsetzen, kommt auch wieder 0 raus, können wir also weglassen. Wenn wir 2,5 einsetzen, y², 2,5 eingesetzt, haben wir 6,25. 1/5 davon sind 1,25. Der Erwartungswert von y ist also 1,25. Jetzt rechnen wir den Erwartungswert von dem Produkt aus, also E(xy), im Prinzip der Erwartungswert der gemeinsamen Dichtefunktion. Da wir wissen, x und y sind stochastisch unabhängig, können wir einfach das Produkt der einzelnen Erwartungswerte nehmen. Das heißt, wir können sagen E(xy)=2×1,25, also E(x)×E(y) und haben dann als Erwartungswert raus 2,5. Gut, das war die erste Aufgabe zur stetigen mehrdimensionalen Zufallsvariablen. Und jetzt kommt noch ein Beispiel mit einer diskreten mehrdimensionalen Zufallsvariablen, wo wir selber mal testen, ob unsere Zufallsvariable tatsächlich stochastisch unabhängig ist. Gucken wir uns also mal ein Beispiel für eine diskrete mehrdimensionale Zufallsvariable an. Wir haben hier x und y. x hat die Realisationsmöglichkeiten 0, 1 und 2, y die Realisationsmöglichkeiten 2 und 3. So, wir wollen erst mal die Erwartungswerte ausrechnen. Im diskreten Fall ist das ja relativ einfach. Wir nehmen die Realisationsmöglichkeiten mal den Randverteilungen. Also 0×¼+1×½+2×¼. Also ½+½ =1. Erwartungswert von x ist 1. So, der Erwartungswert von y ist 2×½+3×½, also 1×1,5=2,5. So, jetzt habe ich noch eine 3. Zufallsvariable definiert, nämlich z. z ist das Produkt aus x und y. So, gucken wir uns erst einmal die Wahrscheinlichkeitsverteilung von z an. So, welche Werte kann z annehmen? Na ja, wir haben x×y, also 1×2, 1×3, also 2 und 3 kann angenommen werden. 2×2=4, 4 kann auch angenommen werden. 2×3=6, kann auch angenommen werden und natürlich 0. Also haben wir 0, 1, 2, 3, 4 und 6. Diese Werte können angenommen werden und jetzt gucken wir mal, wann sie angenommen werden. Also 0 wird immer dann angenommen, wenn x=0, also jedes 4. Mal – Wahrscheinlichkeit ¼. 1, 1 wird gar nicht angenommen. Also 1 ist gar keine Realisationsmöglichkeit. So, 2 wird angenommen, wenn x=1 und y=2. Also Wahrscheinlichkeit 0, auch keine Realisationsmöglichkeit. 3 wird angenommen, wenn x=1 und y=3. Also in 50 % der Fälle, Wahrscheinlichkeit ½. 4 wird angenommen, wenn x=2 und y=2, also in ¼ der Fälle, Wahrscheinlichkeit ¼. Und 6 wird angenommen, wenn x=2 und y=3 - gut, Wahrscheinlichkeit 0, können wir also auch weglassen. Das hier ist also unsere komplette Wahrscheinlichkeitsverteilung für z. So, uns interessiert jetzt also der Erwartungswert von z, der ja gleich ist dem Erwartungswert von x×y, das das ja genau die Definition für z ist. So, das ist =0×1,4+3½+4×¼. Also 1,5+1=2,5. Das heißt, bei uns tritt ein: E(xy)=E(x)×E(y). Denn wenn wir die 1er-Erwartungswerte 1 und 2,5 miteinander multiplizieren, kommen wir auch auf 2,5, das heißt, dieser Satz tritt ein. Können wir jetzt daraus schließen, dass die beiden stochastisch unabhängig sind, die beiden Zufallsvariablen? Wir haben gelernt, können wir nicht. So, die Frage ist also: Sind x und y voneinander stochastisch unabhängig? Das ist noch kein Beweis für stochastische Unabhängigkeit. Der Beweis folgt über das Produkt der Randverteilung und hat folgende Bedingung: Die Wahrscheinlichkeit ij, also die Wahrscheinlichkeit der i-ten Spalte und j-ten Zeile muss gleich sein dem Produkt der Randverteilung, also Pi Punkt und P Punkt j, also dem Produkt der Randverteilung. Prüfen wir erst einmal nach, wie das aussehen müsste. Ich male das mal eben auf. Also so müsste das aussehen. Wir haben hier die Randverteilung ½ und ½, ¼, ½ und ¼. Und wenn die beiden Zufallsvariablen jetzt stochastisch unabhängig wären, dann müssten wir diese Wahrscheinlichkeiten wiederfinden. So, gucken wir mal nach: Hier haben wir ¼, hier haben wir 1/8, ist schon mal nicht das Gleiche, das heißt, wir können schon mal sagen, die beiden sind nicht stochastisch unabhängig. Sobald auch nur ein Eintrag anders ist - gut, nur einer kann nicht anders sein, es müssen immer mindestens 2 anders sein – aber sobald das der Fall ist, kann man schon sagen, die sind nicht stochastisch unabhängig. Das heißt, das hier ist in unserem Fall nicht gegeben, das heißt, die beiden Variablen sind stochastisch abhängig, obwohl der Erwartungswert des Produkts beider Variablen gleich dem Produkt der Einzelerwartungswerte ist. Ihr seht also, das ist noch kein Beweis für stochastische Unabhängigkeit. Das muss man immer über diese Formel überprüfen, und wenn das nicht gegeben ist, sind sie stochastisch abhängig, auch wenn diese Formel erfüllt ist. Ja, das war auch schon das Video zur stochastischen Unabhängigkeit – die Übung. Wir machen weiter mit der Kovarianz und danach noch mit dem Korrelationskoeffizienten. Ich hoffe, ihr habt so weit alles verstanden, guckt euch auch die nächsten Videos an. Ich sage, vielen Dank – und tschüss!

Informationen zum Video