Advent, Advent, 1 Monat weihnachtliche Laufzeit geschenkt.

Nicht bis zur Bescherung warten, Aktion nur gültig bis zum 18.12.2016!

Textversion des Videos

Transkript Bivariate Zusammenhänge - Regressionsgerade Teil 2

Hallo! Es geht um eine Gerade, die möglichst gut durch eine Punktwolke verläuft. Ich habe im letzten Film ein Beispiel dazu gezeigt, erklärt, worum es geht, möchte ich hier nicht noch mal machen. Hier möchte ich die Begriffe und genauen Bezeichnungen dazu nennen und vielleicht auch erklären. Also, wir haben 2 Größen, die wir messen. Wir können diese gemessenen Größen, zum Beispiel hier Körpergröße und Schuhgröße, in so ein Koordinatensystem eintragen, indem wir dann hier bei xi und bei yi einen Punkt machen. Xi heißt Wert im Prädikator X, also das ist die Eigenschaft X, die wir messen, und der y-Wert, yi hier, heißt also Wert im Kriterium Y, das ist hier. Also wenn wir hier jetzt parallel zur y-Achse so einen Strich machen und parallel zur x-Achse, dann kann man den Zusammenhang vielleicht ein bisschen besser erkennen. Dann haben wir ein yiDach und das ist der vorhergesagte Wert, und zwar stellen wir uns vor, dass diese Gerade hier einen Wert vorhersagt und der liegt dann hier. Also wenn wir jetzt zum Beispiel eine Person sehen, die ist so und so groß, dann könnte diese Gerade vorhersagen, welche Schuhgröße sie hat. Deshalb, so stellt man sich das vor, deshalb heißt hier yiDach vorhergesagter Wert. Es ergibt sich hier eine Differenz von yi und yiDach und die nennt sich ei. Und dieses ei hat eine besondere Bezeichnung, die heißt nämlich Residuum. Ei ist ein Residuum, mehrere ei's heißen dann Residuen. Und wir wollen jetzt eine Gerade finden, für die gilt, dass die Summe aller Quadrate der Residuen möglichst klein ist. Ja, also wir haben eine Punktewolke, wir wollen eine derartige Gerade durch diese Punktewolke legen, sodass die Summe aller dieser Quadrate möglichst klein ist. Und das kann man auch noch präziser aufschreiben, das sieht nämlich so aus, ja? Wir nehmen die Differenzen von yi und yiDach, quadrieren diese Differenzen, und wenn wir alle diese Differenzen addieren, dann soll ein möglichst kleiner Wert rauskommen und dann sagen wir also, das ist die Regressionsgerade, so heißt die, die da rauskommt. Das ist die Gerade, bei der die Summe dieser Quadrate möglichst klein ist, und das nennt sich halt die "Kleinste-Quadrate"-Methode. Ja, wie kommt man jetzt auf so eine Gerade? Man könnte natürlich, wenn man jetzt eine Rechenanlage zur Verfügung hat, einfach ein paar Millionen Geraden durchprobieren lassen, dann würde man ziemlich schnell zu einer Geraden kommen, die dann doch ziemlich gut dazu passt. Man kann aber auch mathematisch exakt vorgehen, um diese Gerade zu suchen. Da muss man noch eben präzisieren, was es bedeutet, eine solche Gerade zu suchen. Wir möchten also eine Geradengleichung haben yDach=a+b×x. Hier könnte es, wenn du in der Literatur guckst, auch andere Variablen geben oder es könnten die beiden Summanden vertauscht sein, lass dich davon nicht irritieren. Also, wir suchen eine solche Gerade bzw. eine solche Geradengleichung und zu bestimmen sind a und b, wenn wir a und b haben, sind wir fertig. Das a ist relativ einfach zu kriegen, wenn wir das b haben. Dann ist nämlich a=yquer, also das arithmetische Mittel der y-Werte, -b×xquer, also das arithmetische Mittel der x-Werte. Ja, aber das b ist ein bisschen komplizierter zu berechnen, und wie das geht, das siehst du hier eingeblendet. Ja, das ist mal ein Ding, kann man sich fragen, wie kommt man auf so was? Man braucht da die Analysis für, dann kann man 2 Ableitungen machen und dann sieht man das, dass da so was rauskommt, möchte ich jetzt hier nicht im Einzelnen zeigen. Also, wenn du jetzt Human- oder Sozialwissenschaften studierst, ist das nicht unbedingt nötig, dass du diesen Beweis verstehst, man kann diese Formel auch so anwenden einfach und dann eben das b finden, was zu dieser Regressionsgeraden gehört. Deshalb, ja, ist hier die Erklärung zu Ende. Viel Spaß damit. Tschüss!

Informationen zum Video
3 Kommentare
  1. Default

    ich finde es nicht gut, dass die Berechnung der Regressionsgeraden nicht gezeigt wird, ich lerne auf meine Statistikprüfung und brauche genau das! Für das Geld sollte dies erläutert werden.

    Von L Rehmann, vor etwa 3 Jahren
  2. Default

    ich seh leider auch nichts eingeblendet

    Von Andi1122, vor mehr als 5 Jahren
  3. Default

    Da ist nichts eingeblendet! ...Und ich will wissen wie man auf b kommt.

    Von Jimi@Geomix.At, vor mehr als 5 Jahren