Advent, Advent, 1 Monat weihnachtliche Laufzeit geschenkt.

Nicht bis zur Bescherung warten, Aktion nur gültig bis zum 18.12.2016!

Textversion des Videos

Transkript Determinationskoeffizient

Hallo, wir haben den Determinationskoeffizienten R² und der geht wie folgt, ja, hier hab ich noch einmal hingeschrieben, dass das Ganze R² ist. Wir nehmen die, durch die Regressionsgerade, vorhergesagten yi-Werte minus den Mittelwert der y-Werte, also y(quer), quadrieren das, summieren alles, dann nehmen wir die tatsächlichen y-Werte, ziehen y(quer) ab, quadrieren diese Differenz und summieren alle Differenzenquadrate. Das wird dann durcheinander geteilt und das ist der Determinationskoeffizient R². Man kann auch sagen, das sind die Quadratsummen des Modells geteilt durch die Quadratsummen Total, also die tatsächlichen Quadratsummen, also die Quadratsummen der tatsächlichen Abweichungen vom Mittelwert. Ja, stellen wir uns das kurz vor. Angenommen wir haben hier 2 Größen abgetragen, ich sage mal Körpergröße und Schuhgröße, da gibt es ja nun einen Zusammenhang. Dann, nur zur Klärung, was wird hier eigentlich verrechnet: angenommen wir sind Schuhverkäufer, es kommt jemand herein, der hat eine Körpergröße von, sag ich mal, 2 m. Und dann sagt die Regressionsgerade etwas darüber aus, welche Schuhgröße dieser Mensch, nehmen wir mal an, es ist ein Mann, haben könnte. Mal angenommen der Mittelwert der Schuhgrößen bei Männern ist 44, die Schuhgröße 44, und die Regressionsgerade sagt uns jetzt, dass dieser Mann eine Schuhgröße von 47 haben sollte. Dann bilden wir hier also die Differenz 47-44, also 3. Dann gucken wir hier unten die Differenz zum Mittelwert an, die jetzt tatsächlich auftritt. Angenommen wir möchten dem jetzt Schuhe verkaufen, dann stellen wir fest, der hat eine Größe von 46. Wir bilden also Schuhgröße 46-Mittelwert, also minus Schuhgröße 44, also 2. Und das wird hier verrechnet, dann quadriert und summiert und so weiter. So, jetzt ist die Frage, also das ist erst mal nicht da hier, jetzt ist die Frage , wie kann man das verstehen, dass dieser Determinationskoeffizient etwas darüber aussagt, was er aussagen soll. Also er soll etwas darüber aussagen, wie nahe solche Messpunkte hier an der Geraden liegen. Und da können wir uns Folgendes vorstellen: wenn die Messpunkte alle exakt auf der Geraden liegen, wie groß ist dann dieser Determinationskoeffizient R²? Dann gilt nämlich das die Punkte yi(Dach) die Gleichen sind, wie die yi, bzw. diese Koordinaten der Punkte, so heißt es ja korrekt. Das heißt, hier oben steht dasselbe wie da unten und dann teilen wir dieselbe Summe durch dieselbe Summe und das ist 1, wenn der Zusammenhang perfekt wäre, der lineare Zusammenhang. Wenn wir überhaupt gar keinen Zusammenhang haben, dann passiert Folgendes, dann wissen wir, dass die Regressionsgerade die Steigung 0 hat. Das bedeutet aber, dass die, von der Regressionsgerade, vorhergesagte Abweichung vom Mittelwert immer 0 ist. Ja, hier steht ja immer dasselbe wie dort, wenn die Steigung 0 ist. Hier stehen lauter Nullen, das heißt, wir teilen 0 durch irgendetwas und das ist immer 0. Jetzt müssen wir nur noch klären, was ansonsten, wenn der Zusammenhang zwischen perfekt und überhaupt nicht vorhanden liegt, was ja in der Regel der Fall ist, warum ist dann dieser Quotient zwischen 0 und 1, warum ist der nicht woanders? Und da kann man sich Folgendes vorstellen: wenn wir also einen nicht perfekten Zusammenhang haben, dann haben wir Punkte, also Messpunkte, die unterhalb der Regressionsgeraden liegen und welche, die oberhalb der Regressionsgeraden liegen. Sagen wir mal hier, von da bis da, ist die Abweichung vom Mittelwert a und mal angenommen, dieser kleine Teil hier, das ist b. Wir haben also einen Messpunkt, der jetzt um die Differenz b unterhalb dieses vorhergesagten Messwertes liegt und wir haben einen der liegt um b Einheiten dadrüber. Dann müsste ja eigentlich die Summe dieser Quadrate größer sein als die Summe dieser Quadrate, damit das hier dann letzten Endes zwischen 0 und 1 liegt. Und das ist tatsächlich der Fall, ach so, da hab ich es. Und zwar kann man sich Folgendes vorstellen: hier haben wir die vorhergesagte Differenz, das ist a. Die wird quadriert, also a², angenommen wir haben jetzt 2 Messwerte und 2×, also wenn die jetzt hier übereinander liegen, kommt da als vorhergesagter Messwert durch die Regressionsgerade 2× dieses a raus, also müssen wir 2×a² rechnen hier im Zähler. Was passiert im Nenner? Wir haben hier einen Messwert, der ist unterhalb von a, also a-b, auch den müssen wir quadrieren, und wir haben einen Messwert, der ist oberhalb von a, also können wir sagen a+b und auch das müssen wir quadrieren. Und wenn wir das jetzt ausrechnen, das heißt, wir müssen ein paar Mal die binomische Formel anwenden oder hier einmal die 2. binomische Formel und da die 1. binomische Formel. Wir haben a²-2ab+b², das ist das hier. Und wir haben a²+2ab+b², das ist das hier. Wenn wir diese beiden addieren, hebt sich das hier auf und addiert sich zu 0 und wir haben 2×a²+2×b². So, und weil b² größer als 0 ist, in dem Fall, ja, b ist ja nicht 0, 2×b² ist auch größer 0, also ist das hier größer als das. Und damit ist, wenn Abweichungen vorhanden sind, von der Regressionsgeraden, diese Summe hier größer als die. Deshalb liegt der Quotient zwischen 0 und 1. Und ich glaube man kann es sich leicht vorstellen, je größer b wird, desto größer wird auch der Unterschied zwischen Nenner und Zähler. Und wenn der Nenner im Verhältnis zum Zähler immer größer wird, dann wird der Kuchen immer kleiner und wird irgendwann 0, wenn der Nenner immer größer wird. Und das ist die Situation, so ganz grob, die wir hier haben, deshalb liegt der Determinationskoeffizient immer zwischen 0 und 1. Und je näher er bei 1 liegt, desto näher liegen die Punkte, die Messpunkte an der Regressionsgeraden, je weiter er zur 0 geht, desto weiter sind die Punkte, die Messpunkte von der Regressionsgeraden entfernt. Viel Spaß damit, tschüss.  

Informationen zum Video
1 Kommentar
  1. Default

    kann es sein, dass die videos hier nicht nach der reihe abgespielt werden?

    Von Eva Zefi 1, vor etwa einem Jahr