Advent, Advent, 1 Monat weihnachtliche Laufzeit geschenkt.

Nicht bis zur Bescherung warten, Aktion nur gültig bis zum 18.12.2016!

Textversion des Videos

Transkript Statistik Video 90 - Korrelationskoeffizient

Hallo, schön, dass ihr alle wieder zuguckt. Wir sind heute bei unserem Video zum Korrelationskoeffizienten. Wir haben uns ja in den letzten beiden Videos mit der Kovarianz beschäftigt. Und wir haben gesagt: Die Kovarianz ist zwar ein Indikator für einen linearen Zusammenhang zwischen 2 Variablen, sie gibt aber nur die Richtung an. Sie macht keine Aussage über die Stärke des Zusammenhangs. Deshalb beschäftigen wir uns jetzt noch mal mit dem Korrelationskoeffizienten. Den Begriff "Korrelationskoeffizient" nach Spearman solltet ihr eigentlich schon aus der Empirie kennen. Und genauso wie in der Empirie wird unser Korrelationskoeffizient auch berechnet. Unser Korrelationskoeffizient r ist definiert als die Kovarianz geteilt durch /sqrt(var(x))×/sqrt(var(y)) - wie gesagt, wie in der Empirie. Ihr könnt euch ja noch mal das Video 34 und die dazu gehörige Übung, das Video 35, angucken. Da wird das alles auch noch einmal in der Empirie erklärt. Wir haben jetzt natürlich Zufallsvariablen. Das heißt, die Varianz ist etwas anders definiert, bzw. kann man anders bekommen - über den Verschiebungssatz (haben wir im Prinzip auch schon gemacht). Hier noch mal zur Erinnerung: Die Var(x) ist definiert als E(x²)-[E(x)]². Im Prinzip ist der Korrelationskoeffizient nichts sonderlich Dramatisches. Wir wissen, wie wir die Kovarianz berechnen, wir wissen, wie wir die Varianz berechnen - das geht immer alles über den Erwartungswert. Ihr seht also, ich habe nicht gelogen, als ich gesagt habe, der Erwartungswert, der wäre wirklich, ein wirklich zentraler Aspekt. Aber wenn wir all diese Sachen haben, kann man den Korrelationskoeffizienten sehr einfach ausrechnen. Ein kleines Beispiel: Wir hatten ja in der Übung eine Kovarianz von 1/16. Wir gehen jetzt einfach davon aus, wir haben wieder die Cov(x,y)=1/16 und wir hätten Var(x)=Var(y)=1/4. Und jetzt möchten wir mit diesen Daten unseren Korrelationskoeffizienten ausrechnen. Gut, wäre ja kein Problem. Unser r wäre also (1/16)/(\sqrt(1/4)×\sqrt(1/4)). Gut, \sqrt(1/4) ist jeweils 1/2. 1/2×1/2 ist wieder 1/4. (1/16)/(1/4) macht wieder 1/4. So, und damit hätten wir schon unseren Korrelationskoeffizienten ausgerechnet. Das heißt, alles war wir brauchen für den Korrelationskoeffizienten ist die Var(x), die Var(y), die Kovarianz (x,y) und fertig. Eigentlich überhaupt kein Problem. Gut, wir haben jetzt einen Korrelationskoeffizienten von 1/4. Jetzt müssen wir natürlich wissen: In welchen Bereichen kann denn der Korrelationskoeffizient überhaupt liegen? Naja, gucken wir uns das einfach mal an. Gut, ich habe hier also mal die "Eckpunkte" für r aufgeschrieben. Also r, das muss man wissen, liegt immer zwischen -1 und 1. Wobei 0 bedeutet, x und y sind unkorreliert. Das heißt, es besteht kein linearer Zusammenhang zwischen x und y. Wohingegen r=1 oder r=-1 bedeutet, das ist ein perfekter linearer Zusammenhang. Das eine Mal in die eine Richtung, das andere Mal in die andere Richtung. Wenn r?0 ist, was können wir daraus schließen? r?0, wir können daraus schließen: x und y sind abhängig. Diese Richtung gilt. Die Frage ist: Sind x und y abhängig, können wir dann daraus schließen, dass r auf jeden Fall ?0 ist? Nicht unbedingt! Wir haben ja gesehen, wenn x und y abhängig sind, kann es trotzdem sein, dass die Kovarianz=0 ist. Ist die Kovarianz=0, ist auch r=0. Also, nur weil x und y abhängig sind, muss das nicht heißen, dass r auch ?0 ist. Der Pfeil in diese Richtung gilt also nicht. Das gleiche Spielchen bei r=0. Was können wir daraus schließen? Nun, erst einmal andersherum: sind x und y unabhängig, ist die Kovarianz auf jeden Fall 0, als ist unser r auf jeden Fall 0. Diese Richtung gilt. Kann unser r auch 0 sein, wenn x und y abhängig sind? Ja, das haben wir ja gerade gesagt. Das heißt: Diese Richtung gilt nicht. Nur weil r=0 ist, muss das nicht bedeuten, dass x und y unabhängig sind. Gut. Nachdem wir das geklärt haben, kucken wir uns doch mal ein paar grafische Darstellungen an mit dem dazugehörigen r. Also, ich hab hier einfach mal 4 mögliche Punktwolken aufgemalt. Und jetzt gucken wir einfach mal, was für ein r daraus resultiert. Also hier, wir gehen erst mal davon aus, das wäre hier linear eine Gerade. So, dann haben wir einen perfekten linearen Zusammenhang. Alle diese Punkte liegen auf einer Geraden und wir haben einen positiven Zusammenhang. Das heißt, wir haben r=1. Hier (gehen wir jetzt auch einfach mal davon aus, dass alle auf einer Geraden liegen) haben wir einen perfekten linearen Zusammenhang, allerdings negativ, r=-1. So, hier haben wir 4 unterschiedliche Punktwolken, die anscheinend keinen linearen Zusammenhang haben. Denn egal, was für eine Gerade ich hier durchlege, sie wird nie alle Punkte der Punktwolke gut beschreiben. Das heißt, das wäre so ein Fall, wo r=0 ist - wo es vielleicht einen Zusammenhang zwischen x und y gibt, der aber nicht linear bestimmt werden kann. Hier haben wir noch mal einen Sonderfall. Wenn wir eine horizontale Gerade haben, oder auch eine Vertikale, also eine Gerade, die zu einer Achse parallel ist, bedeutet das, dass eine der Varianzen=0 ist. Also in diesem Fall wäre Var(y)=0. Da alle Punkte den gleichen y-Wert haben, gibt es keine Streuung in y. Das heißt, die Var(y)=0. Das heißt, der komplette Nenner unserer Gleichung des Korrelationskoeffizienten wäre 0 und wir müssten durch 0 teilen. Das heißt, hier ist r nicht definiert. Obwohl es eigentlich ein sehr schöner linearer Zusammenhang ist, ist r nicht definiert! Ja, das war auch schon das Theorieviedo zum Korrelationskoeffizienten. Im nächsten Video machen wir noch eine Übung dazu. Ich hoffe, ihr habt soweit alles verstanden, das war ja im Prinzip ein Thema, was sich wiederholt hat, was wir in der Empirie schon einmal hatten. Ich bedanke mich für's Zuschauen, sage "Bis zum nächsten Mal!" und tschüss!

Informationen zum Video
3 Kommentare
  1. Default

    ok danke. ja bei mir wird es auch wieder so angezeigt.

    Von Cyos, vor mehr als 4 Jahren
  2. Default

    Die dritte Antwort ist die richtige, bei mir wird das so auch angezeigt. Sieht nicht nach nem Fehler aus.

    Von Statistik Jona, vor mehr als 4 Jahren
  3. Default

    ich hab versucht die frage zum video zu beantworten und es wird bei jeder antwortmöglichkeit falsch angezeigt. ein fehler im system oder gewollt?

    Von Cyos, vor mehr als 4 Jahren