Kovarianz 08:32 min

Textversion des Videos

Transkript Kovarianz

Hallo. Es geht um eine weitere Kenngröße der deskriptiven Statistik, und die heißt Kovarianz. Also, wie kann man sich das vorstellen, die Kovarianz. Wir haben zum Beispiel Leute gefragt, wie groß sie sind und welche Schuhgröße sie haben. Wir haben aus allen Körpergrößen, die wir haben, das arithmetische Mittel gebildet und wir haben aus allen Schuhgrößen, die wir haben, auch das arithmetische Mittel gebildet. Dann können wir mal ein Messwertepaar nehmen und die Körpergröße zum Beispiel minus den Durchschnitt aller Körpergrößen und die Schuhgröße minus Durchschnitt aller Schuhgrößen und diese beiden Differenzen multiplizieren. Wir können dann alle Produkte, die sich so ergeben, addieren, also von 1 bis n und dann durch n-1 teilen. Manche Autoren teilen auch hier durch n. Sage ich an dieser Stelle nichts zu, kommt später. Und das, was da rauskommt, das ist die Kovarianz. Zur Kovarianz möchte ich jetzt hier an dieser Stelle gar nicht so viel sagen, denn die Kovarianz fängt erst an richtig Spaß zu machen, wenn sie als Teil der Korellationen auftritt. Das kommt später. Bei der Korrelation braucht man dann Standardabweichungen und Dikovarianz und dann wird´s richtig lustig. Hier nur kurz zum Verständnis, was die Kovarianz sein soll und dann ist es damit auch schon vorbei. Also wie kann man sich das vorstellen, was sie ist, steht ja hier schon definiert. Angenommen wir haben eine Punktewolke durch Messwerte erlangt. Hier ist die x-Achse, hier ist die y-Achse, dann gibt es ein arithmetisches Mittel, x-quer genannt, es gibt ein arithmetisches Mittel der y-Wert, y-quer. Und hier treffen sich die beiden. Was kann jetzt passieren? Wenn wir xi minus x-quer rechnen, dann könnte also Folgendes passieren. Angenommen hier ist das Messwertepaar xi und yi. Dann ist xi minus x-quer positiv und yi minus y-quer ist positiv. Das heißt, dieses Produkt wird positiv. Wenn wir hier ein x haben und ein yj vielleicht genannt, wenn wir hier xj minus x-quer rechnen, dann ist diese Differenz negativ, weil ja x-quer größer ist und wir können auch yj minus y-quer rechnen, das ist dann nauch negativ, das heißt, das Produkt ist wieder positiv. Das bedeutet also, wenn die Wertepaare in diese Richtung abweichen und wenn sie in diese Richtung abweichen, dann sind diese Produkte hier positiv. Und das führt dann dazu, dass wenn wir eine Regressionsgerade haben, dann ist die Summe dieser Produkte hier geteilt durch n-1 positiv. Dann sagt die Kovarianz also etwas darüber aus, ob die Punktewolke sich mehr in diese Richtung hier entwickelt oder mehr in eine andere. Ich zeige das noch an einem anderen Beispiel. Also hier für die Kovarianz ist nur wichtig: Ist sie positiv oder negativ? Der tatsächliche Wert, also ob es jetzt 15 oder 150 ist, ist eigentlich egal. Das wird dann erst interessanter im Zusammenhang mit der Korellation. Hier haben wir eine Punktewolke, die ist halt so in diese Richtung mehr gestrickt. Wir können auch hier wieder ein x-quer bilden, das ist vielleicht hier ungefähr so. Da ist ein x-quer, also der Durchschnitt. Und hier y-quer, warum nicht. Jetzt sehen wir, dass die meisten Werte in diese Richtung hier und in diese Richtung der beiden arithmetischen Mittel abweichen. Was passiert, wenn das xi und das yi dort ist? Dann rechnen wir hier xi minus x-quer. Das ist positiv, weil ja xi größer ist als x-quer. Und wir rechnen yi minus y-quer. Und das ist negativ. Positiv mal negativ ist negativ. Also wird dieses Produkt negativ. Und das gilt für alle Messwerte, die in diese Richtung hier vom arithmetischen Mittel, also vom Schnittpunkt der beiden arithmetischen Mittel, abweichen. Das gilt ebenso - das zeige ich jetzt nicht noch mal ausführlich - für Messwerte, die in diese Richtung hier abweichen. Also dieses ist ausgeklammert und dieses ist ausgeklammert, und wenn die in diese Richtung abweichen, dann ist das Produkt auch negativ. Und wenn also mehr in diese Richtung abweichen statt in dieser Richtung, dann ist also die Kovarianz negativ, wir haben also eine Regressionsgerade, die ungefähr so verläuft. Und jetzt alles durcheinander ... Aber ich glaube, es ist trotzdem klar geworden. Noch eine kleine Sache möchte ich zeigen, dann ist aber auch wirklich gut. Also dafür, dass ich nichts dazu sagen wollte, sage ich ganz schön viel im Moment. Die Messwerte können auch so aussehen. Habe ich mir jetzt so ausgedacht. Und das, was rauskommt, ist dann ziemlich nah bei Null, das heißt, dann haben wir also so eine Verteilung, das heißt, wir haben dann keine eindeutige Richtung, wie man hier diese Punktemenge, die Messwerte in eine Abhängigkeit zueinander bringen könnte.Wir haben ein x-quer hier und ein y-quer hier. Also ich meine, dass die jetzt im Kreis herum sind, dazu kann ich mir jetzt keine Situation vorstellen, aber es kann durchaus sein, dass die Messwerte gleichmäßig verteilt sind. Und dann passiert nämlich etwas Bestimmtes mit der Korellation. Wir sehen, dass wir hier Abweichungen haben in diese Richtung, und zwar ungefähr genauso so viele wie in diese Richtung und in diese Richtung und in diese Richtung auch. Das heißt, wir werden letzten Endes Produkte hier haben, und ungefähr die Hälfte dieser Produkte wird positiv sein, ungefähr die Hälfte wird negativ sein. Und das, was rauskommt, ist dann ziemlich nah bei Null, das heißt, dann haben wir also so eine Verteilung, das heißt, wir haben dann keine eindeutige Richtung, wie man hier diese Punktemenge, die Messwerte in eine Abhängigkeit zueinander bringen könnte. Das war es dann also zur Kovarianz, ich glaube, wir haben alles betrachtet, was wir hier brauchen. Viel Spaß damit. Tschüss.  

Informationen zum Video