Textversion des Videos

Transkript Statistik Video 91 - Korrelationskoeffizient Übung

Hallo, schön, dass ihr alle wieder zuguckt. Wir sind heute bei dem neuen Video: Die Übung zum Korrelationskoeffizenten. Wir haben ja vor zwei Videos eine Übung zur Kovarianz gemacht. Da hatten wir das Beispiel mit denen Urnen, aus denen man dann blaue Kugeln ziehen musste. Bei diesem Beispiel haben wir ja damals die Kovarianz bestimmt. Jetzt nehmen wir das gleiche Beispiel und bestimmen den Korrelationskoeffizenten. Wir haben hier also wieder unsere Variablen x und y. x war: Wie viele blaue Kugeln ziehe ich aus der ersten Urne bei zwei Versuchen? y war: Wie viele blaue Kugeln ziehe ich aus der zweiten Urne bei genau einem Versuch? Ihr erinnert euch, wenn man bei den ersten beiden Versuchen aus der ersten Urne blaue Kugeln gezogen hat, kamen die mit rüber in die zweite Urne. Wenn ihr euch noch mal anschauen wollt, wie diese Wahrscheinlichkeitsverteilung zustande gekommen ist, guckt euch noch mal Video 89 an, da haben wird das alles noch einmal sehr ausführlich erklärt.  Ich habe jetzt einfach hier die Wahrscheinlichkeitsverteilung noch mal aufgeschrieben und auch aufgeschrieben, was wir bisher schon bestimmt hatten. Wir hatten die Kovarianz bestimmt - klar, das war ja das Ziel der Übung damals. Diese war 1/16. Wir hatten den Erwartungswert von x, der gleich 1 ist und den Erwartungswert von y, was gleich 31/48 ist. So, ich habe hier auch schon einmal aufgeschrieben, wie wir die Varianz bestimmen. Das ist natürlich der Verschiebungssatz. Wir können die Varianz über den Erwartungswert berechnen. Und so werden wir es heute auch tun. Wir erinnern uns ja: Für unser r von x, y benötigen wir die Kovarianz von x, y und teilen das durch die Wurzel der Varianz von x mal der Wurzel der Varianz von y. Die Kovarianz von x und y haben wir ja bereits. Was wir jetzt noch brauchen, ist Varianz x und Varianz y. Wir fangen bei der Varianz von x an. Dafür brauchen wir zwei Teile. Wir brauchen einmal den Erwartungswert von x² und wir brauchen den Erwartungswert von x zum Quadrat. Gut. Der Teil ist simpel. Der Erwartungswert von x ist 1. Das heißt: Das zum Quadrat ist auch 1. So, den zweiten Teil haben wir also schon. Was wir jetzt noch brauchen, ist der Erwartungswert von x². Und dafür bauen wir uns jetzt mal eine kleine Wahrscheinlichkeitsrechnung nur von x². Also wir haben jetzt eine Wahrscheinlichkeitsverteilung von x². Unser x kann ja die Ausprägung 0, 1 und 2 annehmen. Also kann unser x² die Ausprägung 0, 1 und 4 annehmen, eben die jeweilige Ausprägung quadriert. Dann übernehmen wir einfach nur die Wahrscheinlichkeiten, eben 1/4, 1/2 und 1/4. Was wir dann noch machen, ist einfach den Erwartungswert unserer neuen Variable x² auszurechnen. Wie immer: Ausprägung mal Eintrittswahrscheinlichkeit. Also 0×1/4 + 1×1/2+4×1/4. So, das fällt natürlich weg, da ist ja eine Null drin. 1×1/2 ist 1/2. Plus 4×1/4 ist 1. Wir kommen also auf einen Erwartungswert von x² von 1,5. Können wir jetzt gleich zur Varianzberechnung nehmen. Wir haben hier also 1,5. Das ist dieser Teil E von x². Und wir haben 1, das ist der Teil, E von x zum Quadrat. Also haben wir eine Varianz von x von 0,5.   O.k., wir haben die Varianz von x. Rechnen wir doch einfach mal die Varianz von y aus. Wird ein bisschen eklig, sind krumme Zahlen. Kann man nix machen. So, um die Varianz von y auszurechnen, machen wir genau das Gleiche wie vorhin. Also wir stellen erst einmal die Wahrscheinlichkeitsverteilung von y² auf. y hat die Ausprägung von 0 und 1, also hat y² die Ausprägungen 0 und 1. 0² ist 0, 1² ist 1. Die Eintrittswahrscheinlichkeiten bleiben natürlich auch gleich. 17/48 für 0, 31/48 für 1. Und der Erwartungswert von y² ist dann denkbar einfach: 0×17/48+1×31/48 Der erste Teil fällt natürlich weg, also 31/48. Das ist unser Erwartungswert von y². Also der erste Teil von Varianz y. Der zweite Teil, das ist dann der eklige Teil. Wir haben ja den Erwartungswert von y, der ist 31/48. Und den wollen wir noch mal quadrieren. Ihr seht schon, da kommen keine schönen Zahlen bei raus. Wir haben dann also 31/48-961/2304. Das ist dann also unsere Varianz y. Und wenn man das dann noch ausrechnet, kommt man auf eine Varianz y von 527/2304. O.k., das ist keine schöne Zahl, aber - da können wir nichts machen. Das ist die Varianz von y. Gut, wir haben jetzt die Kovarianz von x und y, die Varianz von x, wir haben die Varianz von y. Es steht also nichts mehr im Wege, den Korrelationskoeffizienten von x und y auszurechnen. Ja, der Korrelationskoeffizient. Wie wir im letzten Video gelernt haben, ist der definiert als die Kovarianz von x, y geteilt durch die Wurzel der Varianz von x mal die Wurzel der Varianz von y. Also im Prinzip das Produkt der Standardabweichung. Gut: Wir haben die Kovarianz, die Varianz von x und die Varianz von y. Jetzt müssen wir diese nur noch einsetzen und unseren Taschenrechner bemühen. Also Kovarianz x und y ist 1/16 geteilt durch Wurzel 0,5 - das ist die Varianz von x - mal Wurzel 527/2304. Gut, das kann glaube ich keiner von euch mehr mit im Kopf rechnen. Ich auch nicht. Das schmeißen wir also in den Taschenrechner und kommen auf einen Korrelationskoeffizienten von ungefähr 0,1848. Also eher an 0 dran als an 1.

Was können wir jetzt alles daraus lesen?  Nun, wir haben zumindest schon mal die Richtung, also wir haben einen positiven linearen Zusammenhang zwischen x und y. Das ist jetzt die neue Information, die durch den Korrelationskoeffizienten hinzugekommen ist. Wir haben keinen sonderlich starken Zusammenhang. Was Starkes wäre irgendetwas, was näher an 1 dran ist. Und das ist ja eher an 0 dran. Insofern: Gut, es gibt einen positiven linearen Zusammenhang, und das wussten wir ja auch schon durch die Kovarianz. Und er ist nicht sonderlich stark. Das ist jetzt die neue Information, die durch den Korrelationskoeffizienten hinzugekommen ist. Ja, das war auch schon das Video mit der Übung zum Korrelationskoeffizienten. Ich hoffe, ihr habt das so weit verstanden und gesehen, dass der Korrelationskoeffizient im Prinzip relativ einfach zu berechnen ist. Die Varianzen kann man relativ einfach berechnen, die Kovarianz kann man relativ einfach berechnen und dann gibt man das alles einmal in den Taschenrechner ein und fertig ist das Ganze. Gut. Das war auch schon das letzte Video zu den mehrdimensionalen Zufallsvariablen. Jetzt beschäftigen wir uns mit den diskreten Verteilungsmodellen. Ein sehr wichtiges Thema und gleichzeitig auch das letzte Thema unseres Statistik 1 Kurses. Ihr solltet also noch mal einschalten. Ich bedanke mich für´s Zuhören und sage bis zum nächsten Mal. Tschüss.      

Informationen zum Video