Textversion des Videos

Transkript Bivariate Zusammenhänge - Regressionsgerade Teil 1

Hallo, es gibt messbare Größen, die einen Zusammenhang haben, wie zum Beispiel die Menge und der Preis. Und zwar sagen wir beim Kartoffelkauf. Wenn ich 1kg Kartoffeln kaufe, muss ich einen bestimmten Preis dafür zahlen. Der Preis ist hier, das kg ist hier. Wenn ich doppelt so viel haben möchte, muss ich auch doppelt so viel Zahlen. Dann ist der Preis hier ungefähr, und wenn man das jetzt hier für alle möglichen Kartoffelmengen einträgt, dann stellt man fest, dass alle diese Einträge auf einer Geraden liegen. Die sieht dann so aus. Diese Gerade stellt also den Zusammenhang zwischen Menge und Preis dar. Diese Gerade hat eine Geradengleichung, die die Form hat y=b×x. Hier ist also die x-Koordinate, hier ist die y-Koordinate. Immer wenn ich diesen Funktionswert, also diese Höhe suche, kann ich also ein x nehmen, dieses x mit einer bestimmten Zahl b multiplizieren und erhalte dann diese Höhe hier. Die Höhe, in der sich dieser Punkt der Geraden befindet. Die Höhe ist natürlich auf dieses Koordinatensystem hier gemünzt. Solche Zusammenhänge heißen proportional.

Es gibt andere Zusammenhänge, die eine gewisse Ähnlichkeit haben zum Beispiel beim Telefonieren könnte es sein, dass wir einen Vertrag haben, bei dem wir eine Grundgebühr bezahlen müssen und zusätzlich zur Grundgebühr müssen wir nach den vertelefonierten Minuten und Sekunden auch noch bezahlen. Das heißt wir könnten hier, wenn wir gar keine Zeit vertelefoniert haben, müssten wir einen ganz bestimmten Betrag bezahlen, und wenn wir dann eine Zeit telefonieren, dann wird es immer teurer, je mehr wir telefonieren. Und das ergibt dann auch eine Gerade. Wenn man hier jetzt sagen würde, ich habe so viele Minuten oder Sekunden telefoniert, dann kann ich hier ablesen, was ich zahlen muss. Dann ist hier der Preis. So ein Zusammenhang heißt linear und eine solche Gerade, die jetzt hier natürlich weiter geht, was für uns jetzt jedoch keine Aussagekraft hat, da wir nicht weniger Zeit als gar nicht telefonieren können. Solche eine Gerade hat eine Geradengleichung von y=b×x+a. Diese Strecke hier ist a und du siehst hier eine gewisse Ähnlichkeit zum proportionalen Zusammenhang. Wenn a=0 ist, dann ist der lineare Zusammenhang ein spezieller linearer Zusammenhang dann ist es nämlich ein proportionaler Zusammenhang. Lass dich nicht von diesen Buchstaben irritieren von diesen Buchstaben hier. Manchmal heißt das auch m hier vorne. Manchmal heißt es auch a hier und da heißt es b. Manchmal sind die beiden auch verkehrt herum aufgeschrieben, oder andersrum vertauscht. Lass dich davon nicht irritieren, jedes Mal ist das gleiche gemeint. Dann gibt es noch andere Situationen, die ich jetzt hier mal plakativ darstellen möchte. Wir haben zum Beispiel die Körpergröße und die Schuhgröße eines Menschen. Wenn wir uns jetzt also Menschen vornehmen, deren Körpergröße und Schuhgröße messen, dann können wir diese Messwerte in so ein Koordinatensystem eintragen. Und wenn wir dann kleine Menschen haben, haben die wahrscheinlich auch kleine Füße. Wir werden dann solche Punkte hier ungefähr erhalten und grundsätzlich werden wir hier einen Zusammenhang derart erkennen, dass größere Menschen auch größere Füße haben und damit auch größere Schuhgrößen und kleinere Menschen haben somit auch kleinere Füße und kleinere Schuhgrößen. Das Ganze was ich hier eingezeichnet habe, ist ein Streudiagramm. So nennt sich das oder man kann auch Punktediagramm dazu sagen. Ich glaube uns ist gefühlsmäßig klar, dass es hier einen Zusammenhang gibt, so was Ähnliches, wie einen linearen Zusammenhang, natürlich keinen exakten linearen Zusammenhang. Das kann natürlich nicht sein. Aufgabe der deskriptiven Statistik ist es nun, mit solchen Punktewolken umzugehen und solche Wolken, solche Punktediagramme etwas exakter zu beschreiben und hier zum Beispiel eine Systematik, die uns gefühlsmäßig hier irgendwie klar ist zu präzisieren. Wie kann man das machen? Grundsätzlich kann man das so machen, in dem man hier eine Gerade hindurch legt. Und zwar eine Gerade, die jetzt auf irgendeine Art und Weise gut zu diesen Punkten passt. Was gut zu den Punkten passen bedeutet, muss man jetzt eben noch präzisieren.   Da kann man sich folgende Situation vorstellen. Wir brauchen wieder ein Koordinatensystem. So, das ist auch jetzt wieder schnell gemacht hier, wenn auch nicht ganz 100% exakt. Angenommen wir haben jetzt hier eine Punktewolke zunächst mal. Ich male jetzt nicht zu viele Punkte hier hin, damit man gut sehen kann, was ich hier vorhabe. Normalerweise hat man natürlich mehr Messwerte. Jetzt könnte es sein, das so diese Gerade hier durchgeht. Dass ich jetzt hier bei 0 angefangen habe, war Zufall. Du musst nicht bei 0 anfangen, so wie du das hier siehst zum Beispiel, das ist nicht nötig. Und hier fängt es ja auch nicht bei 0 an. Falls man davon sprechen kann, dass Geraden überhaupt irgendwo anfangen. Also das ist jetzt reiner Zufall. Angenommen wir haben jetzt eine Punktewolke und wir möchten jetzt eine Gerade finden, die gut zu dieser Punktewolke passt. Dann stellt man sich Folgendes vor. Wir haben also diese Punkte hier, da ist einer und der hat einen Abstand, den wir jetzt parallel entlang zur y Achse messen. Hier ist die y Achse, hier ist die x Achse. Dann wollen wir hier den Abstand parallel zur y Achse messen. Und hier haben wir auch einen Abstand, den wir parallel zur y Achse messen. Einen Abstand des Messwertes zur Geraden. Oder zu einem Punkt der Geraden. Da auch und wir können nun sagen, dass diese gerade gut zu diesen Punkten passt, wenn diese Abstände zusammengenommen möglichst klein sind. Und was soll ich sagen, man hat sich darauf geeinigt, dass man in dem Fall nicht die Abstände selber nimmt, sondern man nimmt die Quadrate der Abstände. Man nimmt also den Differenzpunkt der Geraden und den Messpunkt der Geraden und jede einzelne Differenz wird quadriert, dann werden alle Quadrate der Differenzen addiert und wenn da ein möglichst kleiner Wert herauskommt, dann haben wir die Gerade, die am besten zu diesen Punkten passt. Ich will hier gar nicht weiter darauf eingehen, warum man die Quadrate der Differenzen nimmt und nicht die Beträge der Differenzen. Auch das wäre ja möglich gewesen. Das hat viele praktische Gründe und hat auch den Grund, das wenn man die Quadrate nimmt, die größeren Werte überproportional stärker ins Gewicht fallen als die kleinen Abstände.  Und das ist wieder so etwas, was wir Menschen als vernünftig empfinden. Man kann auch gut damit rechnen, wenn man keine Beträge hat, sondern Quadrate. Kommt also alles zusammen, deshalb nimmt man die Quadrate. Ja, und wie man jetzt aus einer Punktewolke ganz genau die Gerade findet, die also am besten dazu passt, dass heißt, wo die Summe der Quadrate die ich gerade erklärt habe dann möglichst gering ist kommt im nächsten Film. Bis dahin, tschüss....  

Informationen zum Video
4 Kommentare
  1. Default

    Hallo , ich dachte immer man nimmt die Quadratzahl damit kein negativer Wert entsteht !?

    Von Zen, vor etwa 2 Jahren
  2. Default

    Um etwas zu verstehen, muss man es sich herleiten können. Diese Herleitung wird hier sehr gut und deutlich vermittelt. Danke dafür.

    Von Basma Hammel, vor fast 3 Jahren
  3. Flyer wabnik

    @Nat Lerne Deutsch, bevor du mir Ratschläge erteilst.

    Von Martin Wabnik, vor mehr als 4 Jahren
  4. Default

    Die Videos sollten schneller und auf dem Punkt bringen, dass ganze Gelabber könnten sie sich sparren, für das beste beispiel schauen sie sich mal dieses Video http://www.youtube.com/watch?v=IOYyCHGWJq4&feature=relmfu sehen, sie könnten was lernen.

    Von Nat, vor mehr als 4 Jahren