Advent, Advent, 1 Monat weihnachtliche Laufzeit geschenkt.

Nicht bis zur Bescherung warten, Aktion nur gültig bis zum 18.12.2016!

Varianz 07:49 min

Textversion des Videos

Transkript Varianz

Hallo! Es gibt Streuungsmaße, die heißen auch Variabilitätsmaße, oder Dispersionsmaße. Was ist eine Streuung? Stellen wir uns vor, wir gehen in die Kneipe, in eine Kneipe, in der man Dart spielen kann. Wir spielen Dart, trinken ein paar Bier dazu, und im Laufe des Abends könnte es also passieren, dass die Zielgenauigkeit abnimmt. Und das der Bereich, den wir mit unseren Dartpfeilen treffen, immer größer wird, ja, und das was dann größer wird, das ist die Streuung. So nur mal als anschauliches Beispiel. Wenn man jetzt in der Statistik sich befindet, eine statistische Untersuchung macht, Messwerte hat, wir gehen jetzt von intervallskalierten Messwerten aus, sonst haben wir kein vernünftiges Maß für eine Streuung, übrigens. Wir haben Messwerte, die sind irgendwie auf einer Skala hier angeordnet, wir haben einen Mittelwert und möchten jetzt ein Maß dafür finden, wie weit so diese Messwerte hier vom Mittelwert abweichen. Was kann man da machen? Man könnte zunächst rechnen (Messwert-Mittelwert)+(Messwert-Mittelwert), hier alle, und da auch immer (Messwert-Mittelwert)+(Messwert-Mittelwert), usw., und dann hinterher durch die Anzahl der Messwerte teilen. Könnte man machen. Haben wir schon besprochen, was da rauskommt, nämlich 0. Also, das ist ungeeignet. Was könnten wir noch machen? Wir könnten die Beträge bilden, jeweils. Also wenn wir hier Messwert-Mittelwert rechnen, ist das ja hier negativ. Wir könnten den Betrag bilden, also die Zahl positiv machen und dann die ganzen Beträge addieren. Hier auch, bzw. die Abstände addieren, die Abstände vom Mittelwert, und dann durch die Anzahl der Messwerte teilen. Ist möglich, hat sich aber so nicht durchgesetzt. Warum es sich nicht durchgesetzt hat, das hat viele Gründe. Es gibt keinen mathematischen Grund, warum man das so nicht machen dürfte, vielleicht, und was anderes machen müsste. Es ist halt so, dass sich das eine durchsetzt und das andere nicht. Man kann eben nicht genau sagen, was exakt unter einer Streuung zu verstehen ist. Es gibt mehrere Möglichkeiten dafür, und eine von denen, die sich durchgesetzt hat, ist hier. Das ist die Varianz. Die Varianz hat den Namen s². Warum? Weil es auch eine Standardabweichung gibt. Sag ich in einem anderen Film was dazu. Die Standardabweichung hat die Bezeichnung s, und die Varianz ist das Quadrat der Standardabweichung, deshalb steht hier s². So, was passiert bei der Varianz? Wir möchten sagen, wie weit die Messwerte vom Mittelwert abweichen, so im Ganzen gesehen. Und dazu können wir den Messwert nehmen, oder einen Messwert, und den Mittelwert davon abziehen, und das Ganze dann quadrieren. Also die Differenz quadrieren, dann wird es immer nicht negativ. So eine Differenz kann 0 oder positiv sein. Dann können wir diese ganzen Quadrate der Differenzen addieren und durch, entweder die Anzahl der Messwerte teilen, bzw. Anzahl der Messwerte n-1. Warum nimmt man hier n-1? Da gibt es auch unterschiedliche Ansichten darüber. Manche nehmen n, manche nehmen n-1. Hat auch alles so seine Vor- und Nachteile. Möchte ich jetzt an der Stelle auch gar nicht so viel zu erzählen. Kommt später noch genauer. Nun, das ist die Varianz, und die Varianz hat die Eigenschaft, dass Differenzen von Messwerten, die weit weg vom Mittelwert sind, verhältnismäßig weit weg, auf die ganze Messreihe gesehen, die fallen hier mehr ins Gewicht, weil quadriert wird. Da kann man auch sagen, ja gut, vielleicht empfindet mancher das als Verfälschung der Streuung, oder so, aber letzten Endes ist es auch das, wie wir Menschen Streuung empfinden. Wenn wir so einen Mittelbereich haben, dann fällt uns das nicht weiter auf, und das was so weit aus der Mitte herausragt, das fällt uns viel mehr auf. Das ist bei großen und kleinen Kartoffeln genauso wie bei viel und wenig Einkommen oder bei Körpergrößen oder so was. Wir Menschen sind da so, dass uns das eben mehr auffällt, was weiter von der Mitte weg ist, und vielleicht hat sich das auch deshalb durchgesetzt. Es gibt viele Gründe, weshalb sich das durchgesetzt hat. Auch die kann ich jetzt hier nicht alle erzählen. Ist jetzt hier für den Fortgang der Sache nicht unbedingt wichtig. Es gibt noch ein paar Eigenschaften, oder 2, die ich hier eben zeigen möchte. Nämlich, wenn wir alle Messwerte verschieben, nach da oder nach da, alle Messwerte auf einmal, dann kann man das bezeichnen als, also mathematisch addieren wir zu allen Messwerte dann eine Zahl, die positiv ist oder die negativ ist. Wenn das jetzt ein Maß der Streuung ist, dürfen wir erwarten, dass sich die Streuung dann dadurch nicht ändert. Und das kann man sich schnell hier klar machen, indem man nämlich statt x, x+a hinschreibt, a ist jetzt irgendeine reelle Zahl, kann positiv oder negativ sein. Dann wissen wir schon, dass sich der Mittelwert auch um a verschiebt, und wenn man das jetzt hier in diese Formel für die Varianz einsetzt, sieht man sofort, hier haben wir a, da haben wir dann -a, und letzten Endes ist also alles wie vorher. Die Streuung ändert sich dadurch nicht. Und auch das ist das, was wir erwarten können, an dieser Stelle. Es gibt noch eine Möglichkeit, diese Messwerte zu verändern. Und zwar kann man sich das so vorstellen, ich hab es jetzt leider nicht so vorbereiten können, wenn wir die Messwerte mal auf ein Gummiband eintragen, oder auftragen, wie auch immer, und dann können wir das Gummiband in die Länge ziehen. Dann werden quasi alle Abstände so ein bisschen größer, nicht. Dann dürfen wir erwarten, dass die Streuung auch größer wird. Und das ist auch der Fall. Mathematisch sieht das dann so aus, dass man jeden Messwert mit einer Zahl b, die ist jetzt b genannt, weil irgendeine reelle Zahl sein, multipliziert. Bei dem Gummiband, wenn man das auseinanderzieht, sind das Zahlen, die größer als 1 sind. Wir könnten auch von einem gespannten Zustand ausgehen und dann mit einer Zahl multiplizieren, die kleiner als 1 ist, dann würden die ganzen Messwerte also wieder zusammenlaufen. Das kann irgendeine reelle Zahl sein, gut, wenn´s 0 ist, dann ist das Quatsch, dann haben wir ja gar keine Messwerte mehr. Wir multiplizieren alle Messwerte mit einer Zahl, dann haben wir auch schon geklärt, dass sich dann der Mittelwert ändert, den müssen wir dann nämlich auch mit dieser Zahl multiplizieren. Was passiert dann, wenn wir das quadrieren? Wir können das b ausklammern und haben dann hinterher b² da stehen. Wir haben da wieder                     (x i-x quer)²×b². Und deshalb ist das hier so aufgezeichnet. Wenn wir alle Messwerte mit einer Zahl multiplizieren, dann ändert sich die Streuung, und zwar müssen wir die Streuung, also die Varianz, in dem Fall, mit b² multiplizieren. Das war´s zur Varianz. Viel Spaß damit, tschüss!

Informationen zum Video