Advent, Advent, 1 Monat weihnachtliche Laufzeit geschenkt.

Nicht bis zur Bescherung warten, Aktion nur gültig bis zum 18.12.2016!

Textversion des Videos

Transkript Statistik Video 82 - diskrete mehrdimensionale Zufallsvariablen

Hallo, schön, dass ihr alle wieder zuguckt. Bevor wir uns demnächst mit den diskreten Verteilungsmodellen beschäftigen, dem letzten Part unseres Statistik I Kurses, gucken wir uns noch einmal die mehrdimensionalen Zufallsvariablen an. Eindimensionale Zufallsvariablen kennen wir ja bereits, jetzt gucken wir uns das Ganze mehrdimensional an. Die meisten Beispiele, die ich jetzt in den nächsten 10 Videos bringen werde, sind für zweidimensionale Zufallsvariablen, können aber auch ganz einfach auf mehr Dimensionen erweitert werden. Alle Regeln gelten auch auf mehr als zwei Dimensionen, es sei denn, ich sage das explizit dazu. Wann hat man überhaupt mehrdimensionale Zufallsvariablen? Man bekommt sie immer dann, wenn man Zufallsversuche oder Zufallsexperimente hat, die pro Durchführung mehr als 1 Realisation liefern, oder die mehrmals hintereinander unter exakt gleichen Bedingungen, also stochastisch unabhängig, durchgeführt werden. Ihr seht schon, wir haben stochastisch unabhängig unterstrichen und ein Ausrufezeichen dahinter gesetzt, d. h. ihr solltet merken, aha, das ist wichtig. Stimmt auch. Wir machen dazu noch einmal ein  normales Lehrvideo und ein Übungsvideo, damit ihr begreift: erst einmal, was stochastisch unabhängig genau bedeutet, und wie man prüft, ob 2 Zufallsvariablen stochastisch unabhängig sind. Wir hatten das ja schon in der Empirie damals, da haben wir die Korrelation ausgerechnet, oder auch die Varianz, oder auch die Kovarianz, um zu gucken, ob die beiden Variablen unabhängig voneinander sind oder nicht. Und genau so machen wir das hier auch bei einer mehrdimensionalen Zufallsvariablen, gucken wir uns dann halt an, ob die verschiedenen Realisierungen stochastisch unabhängig sind oder nicht. So, das wäre erst einmal der grobe Einstieg. Machen wir ein kleines Beispiel, wie so eine mehrdimensionale Zufallsvariable aussieht. Gucken wir uns also einmal ein Beispiel für eine mehrdimensionale Zufallsvariable an. Zuerst brauchen wir dazu natürlich einen Versuch. Wir haben jetzt den Versuch: Wir werfen 5-mal mit einer Münze, um also 5 Ergebnisse zu bekommen. Wir wissen, bei einer perfekten Münze haben beide Seiten die gleiche Wahrscheinlichkeit von ½ und die Versuche sind, wenn ich sie mehrmals hintereinander werfe, stochastisch unabhängig. D. h. der Münze ist völlig egal, wie oft ich vorher schon Kopf geworfen habe, trotzdem hat beim nächsten Wurf "Kopf" die Wahrscheinlichkeit von ½. Also könnte ich meine Münze 5-mal hintereinander werfen, oder, wir haben ja gerade gesagt, man kann nicht nur den gleichen Zufallsversuch hintereinander durchführen, sondern man kann auch Zufallsversuche nehmen, die bei einer Durchführung mehrere Realisationen liefern. D. h. das quasi gleiche Zufallsexperiment wäre, wenn ich 1-mal mit 5 Münzen werfe. Die sind auch stochastisch unabhängig, es würde also auch das Gleiche herauskommen. Hier haben wir also unsere Zufallsvariable Xi: Das Ergebnis beim i-ten Wurf und wir haben unsere mehrdimensionale Zufallsvariable, die in unserem Fall aus 5 Realisationen besteht. Also X1, X2, X3, X4 und X5. Das ist unsere mehrdimensionale Zufallsvariable. Und da kommen nun unsere Realisationen herein, wie sie tatsächlich aufgetreten sind, unsere Zufallsvariablen Xi realisieren sich also zu ihren Ergebnissen und es würde dann ein Ergebnis herauskommen von, von mir aus: Kopf, Kopf, Kopf, Kopf und Zahl. D. h. die ersten 4 Münzen zeigen Kopf, die letzte Münze zeigt Zahl, oder wenn wir uns dieses Beispiel angucken, werfen wir die ersten 4-mal, wo wir unsere Münze werfen, jeweils Kopf, und dann werfen wir 1-mal Zahl. So wird also eine mehrdimensionale Zufallsvariable beschrieben und so bekommt man sie auch. Gucken wir uns also noch ein bisschen mehr Theorie zur diskreten mehrdimensionalen Zufallsvariablen an. Okay, also der Umgang mit mehrdimensionalen Zufallsvariablen ist wie in der Empirie. Auch da hatten wir ja mehrdimensionale Daten und damals hatten wir ja so etwas wie bedingte Verteilungen, Randverteilungen und gemeinsame Verteilungen, damals halt immer Häufigkeitsverteilungen. Jetzt haben wir im Prinzip genau das Gleiche, nur dass wir nicht mehr mit Häufigkeiten rechnen, sondern mit Wahrscheinlichkeiten. Wir haben jetzt also Wahrscheinlichkeitsverteilungen: bedingte Wahrscheinlichkeitsverteilung, Wahrscheinlichkeitsrandverteilung und gemeinsame Wahrscheinlichkeitsverteilung. Gucken wir uns zuerst einmal die bedingten Wahrscheinlichkeitsverteilungen an. Da wird halt gefragt: Wie groß ist die Wahrscheinlichkeit, dass sich unser X zu x realisiert unter der Bedingung, dass sich unser Y zu y realisiert. Wir bauen hier also eine Bedingung mit ein. Damit kann man auch sehr schöne Fragestellungen beantworten und da sollte man schon wissen, wie man damit umzugehen hat. Dann Randverteilungen: Wie schon in der Empirie werden natürlich mehrdimensionale Zufallsvariablen, genauer mehrdimensionale Daten in Tabellen dargestellt und dann hat man Randverteilungen. Die Randverteilung P.j ist definiert als die Summe über alle i´s von Pj oder anders ausgedrückt, die i´s sind hier unsere Realisationsmöglichkeiten der Spalten, d. h. die Summe über alle Spalten für eine bestimmte Zeile. Also, hier würde dann die Randverteilung P.j1 stehen und hier die Randverteilung P.j2. Dann haben wir natürlich gemeinsame Wahrscheinlichkeitsverteilungen und da wird danach gefragt, wie groß ist die Wahrscheinlichkeit, dass X sich zu xi realisiert und Y sich zu yj realisiert, d. h. dass beides gleichzeitig eintritt. Das ganze schreibt man dann in Kurzform auch die Wahrscheinlichkeit von xi bzw yj P(xi;yj), oder wenn man es noch kürzer haben will: die Wahrscheinlichkeit Pij. Also i und j geben dabei immer nur quasi die Kennzahl der Realisationsmöglichkeit an. Man hat natürlich auch hier mal wieder kumuliert das Gesetz, dass die Summe über alle Einzelwahrscheinlichkeiten, über alle i´s und über alle j´s, genau 1 sein muss. Also die Summe über alle Wahrscheinlichkeiten muss 1 sein, also hier muss immer eine dicke 1 stehen. Genauso wie wir es auch in der Empirie hatten mit der Häufigkeitsverteilung. Natürlich kann man in so eine Tabelle auch gleich die kumulierten Wahrscheinlichkeiten eintragen, ob das jetzt so richtig sinnvoll ist, sei mal dahingestellt. Gut, das war auch schon das 1. Video zu den diskreten mehrdimensionalen Zufallsvariablen, im nächsten Video gibt es dann eine Übung dazu, wo wir ein sehr ausführliches Beispiel durchrechnen werden, um dann noch einmal zu den stetigen mehrdimensionalen Zufallsvariablen zu kommen, zu den Themen, stochastische Unabhängigkeit, Kovarianz und Korrelation. Wenn wir dann diesen Themenbereich dieser mehrdimensionalen Zufallsvariablen abgeschlossen haben, dann widmen wir uns den diskreten Verteilungsmodellen im letzten Kapitel unseres Statistik I Kurses. Ich freue mich, dass ihr zugeschaut habt, hoffe, ihr guckt auch beim nächsten Mal wieder herein und sage vielen Dank und tschüss.

Informationen zum Video
1 Kommentar
  1. Default

    Gut erklärt! Kleiner Hinweis zu einem Typo in der Videofrage: "Ob ich in einem Zufallsexperiment 5-mal hintereinander eine Münze oder 1-mal fünf Münze werfe ist.." am Ende MünzeN ;)

    Von Cuibono, vor mehr als 3 Jahren