Advent, Advent, 1 Monat weihnachtliche Laufzeit geschenkt.

Nicht bis zur Bescherung warten, Aktion nur gültig bis zum 18.12.2016!

Textversion des Videos

Transkript Statistik Video 79: Varianz

Hallo, schön, dass ihr alle wieder zuguckt. Wir sind heute bei unserem neuen Video zur Varianz. Die Varianz kennen wir ja schon aus der Empirie - ist ja ein Maß für die Streuung. Eine Empirie haben wir folgendermaßen berechnet: Wir hatten 1÷n, oder bei euch vielleicht auch 1÷n-1, ×Σ von (i=1 bis n), (unserer einzelnen Werte xi)-(das arithmetische Mittel) und das zum Quadrat. Also im Prinzip die quadrierte Differenz unserer Beobachtungswerte vom arithmetischen Mittel und davon die Summe. Wenn wir jetzt uns die Varianz einer - in diesem Fall noch diskreten Zufallsvariable - berechnen, berechnen wir das im Prinzip ganz ähnlich. Wir haben also die Varianz unserer Zufallsvariablen x, und die ist die Summe über alle i=1 bis n, wie gehabt, von xi, also unsere verschiedenen Realisationsmöglichkeiten, -µ, µ ist hier der Erwartungswert, das wird oft so angegeben: µ ist der Erwartungswert einer Zufallsvariable, σ2 ist die Varianz einer Zufallsvariablen. Das solltet ihr euch also merken: µ und σ2 und natürlich dann σ. σ ist, wie schon in der Empirie, die Wurzel der Varianz, die Standardabweichung. Also: µ: der Erwartungswert. σ: die Standardabweichung. σ2: die Varianz. Die Varianz von x ist: (die Summe über alle Realisationsmöglichkeiten)-(der Erwartungswert, also die Differenz gebildet)2, gewichtet mit der jeweiligen Eintrittswahrscheinlichkeit. Also: Σ(xi-µ)2×Pi. Das ist die Varianz einer Zufallsvariable - einer diskreten Zufallsvariable. Denn, wie wir schon zum Beispiel vom Erwartungswert wissen, können wir diese Formel nicht anwenden, wenn wir eine stetige Zufallsvariable haben. Wie schon beim Erwartungswert sieht auch das wieder schlimmer aus, als es ist. Wir gucken uns das einfach einmal an einem einfachen Beispiel an: Schauen wir uns also für die Varianz ein denkbar einfaches Beispiel an. Wir haben einen sechsseitigen Würfel - W6, wie ich das gerne abkürze - und haben als Zufallsvariable x die Augenzahl, die wir würfelten. Wir haben, wie wir in den letzten Videos schon bemerkt haben, einen Erwartungswert von 3,5. Nochmals zur Erinnerung: Der Erwartungswert muss nicht einer Realisationsmöglichkeit entsprechen. Wie hier: ein Erwartungswert von 3,5, aber Realisationsmöglichkeiten von 1, 2, 3, 4, 5 und 6. Wir haben einen idealen Würfel, das heißt, jede der 6 Realisationsmöglichkeiten hat die gleiche Eintrittswahrscheinlichkeit von 1/6, und wir wollen uns jetzt also die Varianz ausrechnen. Wir haben also: Var(x)=Σ(1 bis n, also über alle Realisationsmöglichkeiten)(xi-µ)2×Pi. Also: (Realisationsmöglichkeit)-(Erwartungswert; hier E(x) oder auch µ)×(die Eintrittswahrscheinlichkeit). Wir haben also eine große Klammer für die Summe: (1-3,5)2×1/6. Hier x1 eingesetzt. (Realisationsmöglichkeit)-(Erwartungswert)2×(Eintrittswahrscheinlichkeit). +(2-3,5)2×1/6+(3-3,5)2 usw. Ich denke, das könnt ihr dann auch noch selber aufstellen. Wir kommen dann also auf eine Varianz von x von ungefähr 2,91. Das heißt, das hier ist im Prinzip die Streuung - also die Varianz, die wir bekommen, wenn wir mit einem sechsseitigen Würfel würfeln. Logischerweise kann man sich vorstellen, wenn wir mit 2 sechsseitigen Würfeln würfeln würden, wäre die Varianz auch größer, weil wir dann nicht nur Zahlen zwischen 1 und 6 erwürfeln können, sondern zwischen 2 und 12. Wir sehen, die Varianz ist leicht zu berechnen, auch bei Zufallsvariablen, und hat dann doch schon einiges an Aussagekraft, wenn man sie richtig zu interpretieren weiß. Die Varianz gibt es natürlich nicht nur bei diskreten Zufallsvariablen, sondern auch bei stetigen. Und wie sie da definiert ist, gucken wir uns auch einfach einmal an: Wir haben jetzt unsere Zufallsvariable x als stetige Zufallsvariable definiert und dann bekommen wir bei der Varianzberechnung wieder das allseits beliebte Integral. Wir haben also als Varianz von x das Integral von -∞ bis ∞. Von (x-µ)2, also (x-der Erwartungswert)2, ×f(x), unsere Dichtefunktion der Zufallsvariable, dx. Sieht wieder wild aus, vor allen Dingen, wenn wir uns jetzt noch einmal daran erinnern, was denn µ war. µ ist der Erwartungswert von x. Der ist bei einer stetigen Zufallsvariable auch als Integral definiert, und zwar das Integral von -∞ bis ∞, von x×f(x)dx. Es sieht relativ wild und kompliziert aus, aber wenn ihr bedenkt, dass normalerweise f(x) eine sehr leichte Funktion ist, die man einsetzen kann, µ würde man normalerweise vorher berechnen, den Erwartungswert, ist also dann ein Zahlenwert. Dann hat man hier ein relativ simples Integral in den meisten Fällen, jagt das einmal durch und hat dann die Varianz raus - also alles nicht so schwer. Im nächsten Video machen wir auch zur Varianz noch eine Aufgabe, und zwar nehmen wir die Aufgabe, die wir jetzt beim Erwartungswert hatten, wo wir also bei einer stetigen Zufallsvariable den Erwartungswert ausgerechnet haben, und berechnen davon einfach auch noch die Varianz. Gucken wir uns doch jetzt aber noch einmal einige Rechenregeln der Varianz an: Als Erstes gucken wir uns einmal die Lineartransformation an. Wir definieren eine Zufallsvariable y, die eine Lineartransformation der Zufallsvariable x ist. Also: b×x+a. Wir kennen das ja schon aus dem Erwartungswert und hatten also jetzt herausgefunden, dass der Erwartungswert unserer neuen Zufallsvariable y das Gleiche ist, wie b×(der Erwartungswert von x)+a. Also dass man im Prinzip die Lineartransformation genauso, eins zu eins, auf den Erwartungswert übernehmen kann. Bei der Varianz ist das ein bisschen anders. Wenn wir diese Lineartransformation haben - also: y=b×x+a - und wir wollen jetzt wissen, was ist die Varianz von y im Vergleich zur Varianz von x, dann müssen wir sagen, dass wir die Lineartransformation so nicht übernehmen können. Gucken wir uns erst einmal die Konstante an. Wir nehmen einfach einmal an, wir haben hier unsere Zufallsvariable, die so verteilt ist, also irgendwie normal verteilt, das hier wäre unsere Zufallsvariable x, davon die Dichtefunktion natürlich. Diese Konstante macht ja nichts anderes, als im Prinzip alle Werte, also unsere ganze Dichtefunktion, komplett zu verschieben. Wenn das jetzt vorher bei 0 verankert war und wir nur eine Konstante addieren, dann sieht es am Ende genauso aus, ist aber dann bei a verankert. Im Prinzip hat man das, was man vorher hatte, genommen und nach links oder nach rechts verschoben mit dieser Konstante a. Hat das irgendwas damit zu tun, wie groß die Varianz zwischen den möglichen Realisierungen ist? Nein, das ist völlig egal. Wenn wir uns das einmal bei der Empirie angucken, wo wir tatsächlich Daten hatten, ist es ja egal, ob ich sehr viele Daten um 0 oder um 100 habe. Die Streuung ist die Gleiche, wenn einfach überall die gleiche Konstante aufaddiert ist. Und so ist das hier auch. Das heißt, die Konstante a fällt komplett heraus. Wenn wir also einer Lineartransformation einfach nur eine Konstante addieren, fällt das bei der Varianz nicht ins Gewicht. Ganz anders sieht das schon aus, wenn wir mit dem Faktor b multiplizieren. Denn da ist es so, dass alles, was multipliziert wird, also ob das gestreckt oder gestaucht wird, umso stärker ins Gewicht fällt bei der Streuung natürlich. Deshalb haben wir auch den Faktor b2 davor. Das heißt, bei der Lineartransformation, um das noch einmal zusammenzufassen: Ein konstanter Faktor a, der addiert wird, fällt überhaupt nicht ins Gewicht, sondern fällt komplett heraus. Ein Faktor b, mit dem multipliziert wird, geht aber im Quadrat mit in die Varianz ein. Also die Varianz von y=b2×Var(x) So viel zur Lineartransformation - gucken wir uns doch jetzt noch einmal die Varianz von Summen von Zufallsvariablen an: Wenn wir die Varianz der Summe von 2 Zufallsvariablen haben - Var(x+y) - hätten wir es sehr gerne, wenn wir einfach die beiden Einzelvarianzen aufaddieren könnten: Var(x)+Var(y). Die Frage ist: Dürfen wir das? Das dürfen wir schon - unter der Bedingung, dass die beiden stochastisch unabhängig sind. Genauso wie bei der Multiplikation vom Erwartungswert, wir erinnern uns. Einschränkung: Wenn beide stochastisch unabhängig sind, dürfen wir das. Ansonsten kommt hier immer noch:+2×Cov(x, y), also Var(x+y)=Var(x)+Var(y)+2×Cov(x,y). Diese Formel gilt immer. Wenn jetzt die beiden Zufallsvariablen x und y stochastisch unabhängig sind, dann ist die Covarianz 0. Das heißt das, dieser komplette hintere Teil, fällt heraus. Dann haben wir tatsächlich Var(x)+Var(y). Aber wenn sie stochastisch nicht unabhängig sind, muss ich immer noch die Covarianz berechnen: Cov(x,y))=E(x×y)-E(x)×E(y). Genau hieraus folgt auch, warum es 0 wird. Denn wir hatten ja beim Erwartungswert die Regel: Wenn die beiden stochastisch unabhängig sind, dann ist der E(x×y)=E(x)×E(y). Das heißt, das ist gleich dem. Damit ist das gleich 0 und die Covarianz ist auch 0. Als Letztes noch einmal eine andere Definition der Varianz: Wir können die Varianz von x auch über den Erwartungswert ausdrücken. Die Varianz von x ist nämlich, wenn man es über den Erwartungswert ausdrückt: E(x2)-[E(x)]^2. Ihr seht allerdings, das Quadrat steht hier an unterschiedlichen Stellen und das ist wichtig. Also so kann man die Varianz auch ausdrücken und natürlich auch berechnen. Gut, das war auch schon das erste Video zur Varianz. Wir machen jetzt natürlich noch eine Übung, wo wir auch noch einmal die Varianz berechnen: bei einer diskreten Zufallsvariable und bei einer stetigen Zufallsvariable. Damit ihr auch Sachen wiedererkennt, nehmen wir einfach die Aufgaben aus dem Übungsvideo zum Erwartungswert, da hatten wir ja schon 2 schöne Beispiele und rechnen dafür jeweils die Varianz aus. Ich bedanke mich fürs Zuschauen, hoffe ihr guckt euch auch das nächste Video - die Übung zur Varianz - noch an. Varianz und Erwartungswert sind 2 sehr wichtige Themen, die garantiert auch irgendwann einmal in eurer Klausur auftauchen werden. Vielen Dank fürs Zuschauen, bis zum nächsten Mal. Tschüss.

Informationen zum Video
1 Kommentar
  1. Default

    Jona, ich wohne in CHina und schaue alle deine Videos, da ich an einer Fernuni studiere. Du bist klasse! Danke!

    Von S Reinecke, vor fast 3 Jahren