Advent, Advent, 1 Monat weihnachtliche Laufzeit geschenkt.

Nicht bis zur Bescherung warten, Aktion nur gültig bis zum 18.12.2016!

Textversion des Videos

Transkript Statistik Video 89 - Kovarianz Übung

Hallo! Schön, dass ihr alle wieder zuguckt. Willkommen bei der Übung zur Kovarianz! Ich habe mir hier ein kleines Glücksspiel überlegt, wo wir mal die Kovarianz berechnen wollen. Das funktioniert folgendermaßen: Wir haben 2 verschiedene Urnen: Urne Nummer 1 und Urne Nummer 2. Da sind, wie ihr seht, schwarze und blaue Kugeln drin. In Urne Nummer 1 2 schwarze, zwei blaue. In Urne Nummer 2 eine schwarze, eine blaue. Wir fangen an, aus Urne Nummer 1 zu ziehen, und zwar zweimal, jeweils mit Zurücklegen. Dann gucken wir: Wie viele blaue Kugeln haben wir gezogen? Das ist unsere Zufallsvariable x. Wir könnten 0 blaue ziehen, eine oder 2. Wie gesagt, jeweils mit Zurücklegen, das heißt, bei jedem Zug ist die Wahrscheinlichkeit, eine blaue Kugel zu ziehen, ½. Die Züge sind unabhängig voneinander. Je nachdem, wie unser x ausgeprägt ist, tun wir blaue Kugeln in die 2. Urne oder nicht. Das heißt, wenn wir bei unseren 2 Zügen aus der 1. Urne eine blaue Kugel gezogen haben, dann kommt die in die 2. Urne. Wenn wir 2 blaue gezogen haben, kommen 2 in die 2. Urne. Haben wir keine gezogen, kommt auch keine in die 2. Urne. Aus der 2. Urne ziehen wir dann wiederum eine Kugel, und wenn wir blau ziehen, haben wir gewonnen, wenn wir schwarz ziehen, haben wir verloren. Ihr seht also, dass die Wahrscheinlichkeit, aus der 2. Urne eine blaue Kugel zu ziehen, davon abhängt, wie viele blaue Kugeln wir aus der 1. Urne gezogen haben. So, uns interessiert erst mal die gemeinsame Wahrscheinlichkeitsverteilung. Ich habe für x schon mal die Randverteilung aufgeschrieben, also dass wir keine blaue ziehen, dafür müssten wir ja zweimal hintereinander eine schwarze ziehen, jeweils mit der Wahrscheinlichkeit ½, also ½×½, macht ¼. Genauso für 2 blaue, da müssten wir zweimal hintereinander eine blaue ziehen, jeweils mit der Wahrscheinlichkeit ½, also auch für 2 blaue die Wahrscheinlichkeit ¼. Für eine blaue haben wir dann die Wahrscheinlichkeit ½. So, fangen wir mal hier links an. Wenn wir keine blaue Kugel gezogen haben, in der 1. Urne, haben wir also dieses Bild in der 2.: eine schwarze, eine blaue. Das heißt, die Wahrscheinlichkeit, eine blaue zu ziehen, ist für die 2. Urne allein gesehen ½ und die Wahrscheinlichkeit, eine schwarze zu ziehen, ist (für die 2. Urne alleine gesehen) auch ½. Das heißt, hier müsste jetzt ½ stehen, ½ allerdings von ¼, also 1/8. Noch mal zum Verständnis, wo dieses 1/8 herkommt: In jedem 4. Fall, also mit 25 Prozent der Wahrscheinlichkeit, landen wir hier. Das heißt, jedes 4. Mal, durchschnittlich, ziehen wir aus der 1. Urne keine blaue Kugel, also jedes 4. Mal landen wir überhaupt in dieser Spalte. Von diesem 4. Mal ziehen wir dann jedes 2. Mal eine blaue und jedes 2. Mal die schwarze, also keine blaue. Das heißt, insgesamt ziehen wir jedes 8. Mal eine blaue, wenn wir vorher keine gezogen haben. Also hier 1/8. Wenn wir vorher eine blaue gezogen haben, sieht das Bild also so aus: Wir haben eine schwarze und 2 blaue. Die Wahrscheinlichkeit, keine blaue zu ziehen, ist jetzt also für diesen Zug 1/3, 1/3 von ½, also gemeinsame Wahrscheinlichkeit: 1/6. Die gemeinsame Wahrscheinlichkeit dafür, dass wir aus der 1. Urne bei 2 Versuchen eine blaue ziehen und aus der 2. Urne dann keine, ergo: 2/6 für "Wir ziehen eine blaue". Haben wir aus der 1. Urne 2 blaue gezogen, sieht das Bild so aus: Wir haben also ¼ Wahrscheinlichkeit, eine schwarze zu ziehen, und ¾ Wahrscheinlichkeit, eine blaue zu ziehen. ¼ von ¼ macht 1/16 und 3/16. So, jetzt rechnen wir hier die Randverteilung aus, das ist ein bisschen umständlich, weil das kleinste gemeinsame Vielfache hier 48 ist. Also haben wir 6/48, 8/48 und 3/48, macht also 17/48. Und als Test rechnen wir das unten auch noch mal per Hand aus: 6/48, 16/48 und 9/48 macht 31. Und sie addieren sich zu 1 auf, das scheint also so weit richtig zu sein. Gut, wir haben jetzt also die gemeinsame Wahrscheinlichkeitsfunktion. Wir wollen natürlich die Kovarianz ausrechnen, schließlich sind wir gerade in der Übung zur Kovarianz. Und wir erinnern uns: Die Kovarianz von x und y war: E(x×y)-E(x)×E(y). So, das heißt, wir müssen noch unser x×y haben und davon die Wahrscheinlichkeitsverteilung. Schreiben wir das noch mal kurz auf. Was für Möglichkeiten gibt es? Offensichtlich gibt es eine dicke, dicke 0. Dann gibt es eine 1 und eine 2 – und mehr Ausprägungen gibt es auch gar nicht. Fangen wir mal hinten an. Die 2 taucht genau dann auf, wenn ich beim 1. Mal 2 blaue Kugeln ziehe und beim 2. Mal eine, also können wir die Wahrscheinlichkeit übernehmen: 3/16. Die 1 taucht dann auf, wenn ich beim 1. Mal eine ziehe und beim 2. Mal auch eine, also 2/6. Und die 0 taucht immer dann auf, wenn ich entweder beim 1. Mal keine blaue ziehe oder beim zweiten Mal, also rechnen wir (1/8)+(1/8), sind 2/8 oder ¼, +(1/6), +(1/16). Also ¼+(1/6), müssen wir auf 12 erweitern, also (3/12)+(2/12), sind 5/12 und mit den 3 1/16 müssen wir wieder auf 48 erweitern, also (20/48)+(3/48), macht 23/48. Kurzer Test, ob das stimmt, müsste ja wieder 1 rauskommen: Hier haben wir 9/48, hier haben wir 16, sind 25, +23 macht 48 – passt also. Wir haben jetzt also auch die Wahrscheinlichkeitsverteilung für x×y. Was wir jetzt machen können, ist natürlich erst mal, die Erwartungswerte auszurechnen. Sollte ja eigentlich kein Problem sein. Gut, die Erwartungswerte. Wir fangen einfach mal mit dem Erwartungswert von x an. Das ist ja immer die Ausprägung × die Eintrittswahrscheinlichkeit, wobei wir hier die Randverteilung nehmen. Wir haben also 0×¼ – gut, das ist 0, das könnte man natürlich auch rauslassen, ich schreibe es mal der Vollständigkeit halber hin – +1×½+2×¼. Also haben wir ½ und 2×¼ ist auch ½, Erwartungswert x: 1. Der Erwartungswert von y ist sehr leicht zu berechnen, da wir hier nur eine Ausprägung haben, die ≠0 ist, also haben wir: 0×(17/48)+1×(31/48)=31/48. Ja, so schnell geht das. Jetzt rechnen wir noch den Erwartungswert von x×y aus, den haben wir oft auch einfach mit z benannt, ich lasse es jetzt einfach mal bei x×y. Und wir haben: 0×(23/48), fällt weg, 1×(2/6)+2×(3/16), wir haben also: 1/3 (2/6 sind 1/3) + 6/16, das kürzen wir auch, sind 3/8. So, das müssen wir jetzt wieder auf das kleinste gemeinsame Vielfache erweitern, auf 24stel, da haben wir: (8/24)+(9/24)=(17/24). Da wir sonst 48stel haben, erweitern wir es auf 48stel, dann haben wir 34/48. Und da wir jetzt alle Erwartungswerte haben, die wir brauchen, rechnen wir die Kovarianz aus. Das, wo wir eigentlich hinwollten, Kovarianz von x und y. Wir haben ja hier schon die Formel stehen: E(x×y)-E(x)×E(y). So, der Erwartungswert von x×y (34/48) - der Erwartungswert von x (1) × 31/48. Die 1 fällt weg, brauchen wir nicht, also (34/48)-(31/48), also 3/48 oder 1/16. Also, wir haben eine positive Kovarianz, das heißt, tendenziell haben wir einen positiven linearen Zusammenhang zwischen x und y. Ist ja auch logisch. Wenn wir ein hohes x haben, also viele blaue aus der 1. Urne gezogen haben, gehen die ja rüber in die 2. Urne und die Wahrscheinlichkeit steigt, dass wir auch da wieder ein großes y, also 1 in diesem Fall, haben. Ja, wir können daraus jetzt allerdings noch nicht direkt die Stärke ablesen, dafür brauchen wir den Korrelationskoeffizienten – und genau das ist das Thema unseres nächsten Videos. Ich hoffe, ihr schaut da auch wieder rein, bedanke mich fürs Zuschauen und sage: tschüss und bis zum nächsten Mal.

Informationen zum Video
3 Kommentare
  1. Default

    Gut erklaert! Sehr hilfreich!

    Von Sylvia R., vor mehr als 3 Jahren
  2. Default

    Ja das ist richtig, die Kovarianz sagt nichts über die Stärke der Abhängigkeit aus. Cov(X,Y)=1 bedeutet aber einen perfekten linearen Zusammenhang weil Y immer größer wird wenn X größer wird und kleiner wird, wenn X kleiner wird. Der lineare Zusammenhang ist daher perfekt, eine Aussage über die Stärke wird aber nicht getroffen.

    Von Statistik Jona, vor fast 4 Jahren
  3. Default

    Ich hab mal eine Frage zur Testfrage. Dort ist die Antwort richtig, dass Cov(X,Y)=1 perfekter linearer Zusammenhang bedeutet. Es ist aber doch so, dass die Kovarianz nichts über die Stärke der Abhängigkeit aussagt. Müsste Cov(X,Y)=1 nicht einfach positiver linearer Zusammenhang bedeuten?

    Von Na1, vor fast 4 Jahren