Advent, Advent, 1 Monat weihnachtliche Laufzeit geschenkt.

Nicht bis zur Bescherung warten, Aktion nur gültig bis zum 18.12.2016!

Textversion des Videos

Transkript Statistik Video 72: Dichtefunktion

Guten Tag! Schön, dass ihr alle wieder zuguckt. Wir sind heute bei unserem Video zur Dichtefunktion. Ich habe das ja schon im Video zur Wahrscheinlichkeitsfunktion angedeutet: Die Dichtefunktion ist das Pendant zur Wahrscheinlichkeitsfunktion. Nur dass wir uns halt hier nicht in einer diskreten Verteilung befinden, sondern in einer stetigen. Also es entspricht der Wahrscheinlichkeitsfunktion im diskreten Fall, wenn man sich in einer stetigen Verteilung befindet. Man kann jetzt halt nicht mehr so direkt mit den Wahrscheinlichkeiten rechnen, sondern muss, wie der Name schon sagt, über die Dichte gehen. Was genau das bedeutet, das zeigen wir jetzt einmal. Also wir haben eine U-Bahn und wir wissen, die kommt alle 10 min. So, und wir gehen irgendwann zum U-Bahnsteig und wissen nicht, wann ist die letzte gefahren und wann ist die nächste gefahren. Uns interessieren jetzt die Wahrscheinlichkeiten, wie lange wir warten. So, also wir haben hier a bis b Minuten, das heißt hier zum Beispiel 0 bis 1 min; die Wahrwahrscheinlichkeit, dass wir zwischen 0 und 1 min warten, hier. Da wir offensichtlich unser ganzes Intervall von 10 min in 10 Teile einteilen, hat jedes die Wahrscheinlichkeit 1/10. Also die Wahrscheinlichkeit, dass wir 1 min warten, liegt maximal bei 1/10. Die Wahrscheinlichkeit, dass wir zwischen 1 und 2 min warten, liegt bei 1/10. Da wir ja nicht wissen, wann die nächste U-Bahn kommt, ist jedes dieser 10 Intervalle gleich wahrscheinlich. Das nennt man auch stetige Gleichverteilung. Also haben wir überall die Wahrscheinlichkeit 1/10.  So, im diskreten Fall haben wir daraus jetzt ein Diagramm gezeichnet und haben hier die Wahrscheinlichkeit aufgetragen: P(x=x), also die Wahrscheinlichkeit, dass sich unsere Zufallsvariable x, hier die Wartezeit in min, auf x realisiert. Dann hätten wir hier bei 1/10 Säulen gemalt, für jede Realisierungsmöglichkeit eine. Das hätten wir im diskreten Fall gemacht. Das dürfen wir jetzt nicht mehr machen. Denn wir sehen ja, wir haben hier Intervalle. Das heißt, da wir auch eine stetige Zufallsvariable haben, die Zeit, ist hier jeder Punkt im Prinzip möglich. Das heißt, wir müssten jetzt, wenn wir es so machen wollen, wie im diskreten Fall, hier unendlich viele Striche, alle auf die gleiche Höhe machen. Also das machen wir nicht. Was man stattdessen macht, ist: Man zeichnet die sogenannte Dichte ein. Das heißt, auf der y-Achse trägt man nicht mehr die Wahrscheinlichkeit ein, sondern die Dichtefunktion f(x). So, und die Dichtefunktion bei der stetigen Gleichverteilung in diesem Fall ist halt zwischen 0 und 10. Hier, dass wir hier auf 1/10 sind, bis hier, und dann geht es hier im Prinzip wieder bei 0 weiter. Also das hier wäre die Dichtefunktion unseres Beispiels, unserer stetigen Gleichverteilung. Darüber kriegen wir aber noch nicht die Wahrscheinlichkeit, denn hier haben wir zwar die Wahrscheinlichkeiten für unsere Intervalle der Breite 1 - das könnten wir hier direkt ablesen: 1/10 - aber wenn uns jetzt die Wahrscheinlichkeit interessiert, dass wir zwischen 0 und 5 min warten, dann ist die Wahrscheinlichkeit offensichtlich ½. Da wir nicht wissen, wann die nächste U-Bahn kommt, wir wissen, dass sie alle 10 min fährt, ist die Wahrscheinlichkeit, dass wir maximal 5 min warten, ½. Und ihr seht: ½ können wir jetzt nicht hieraus direkt ablesen. Das heißt, was im stetigen Fall sowieso so ist, man geht nicht über die Höhe, sondern über den Flächeninhalt. Das heißt, wir sagen 0 bis 5 und die Wahrscheinlichkeit wird jetzt von dem Flächeninhalt angegeben, der zwischen 0 und 5 liegt. So, wenn wir das hier also mal markieren, dann ist der Flächeninhalt, der hier drin liegt, die Wahrscheinlichkeit in diesem Intervall. Den müssen wir jetzt ausrechnen. Gut, das ist ein Rechteck. Bei der stetigen Gleichverteilung ist das sehr einfach. Das heißt, wir können sagen: 5 (Breite des Rechtecks) ×1/10 (Höhe des Rechtecks) =5/10=½. Also haben wir tatsächlich unsere Wahrscheinlichkeit. Wenn wir eine kompliziertere Verteilungsfunktion haben, wie zum Beispiel bei der Normalverteilung, die so eine Glockenkurve hat, dann müssten wir, um den Flächeninhalt, sagen wir, zwischen diesen beiden Stellen zu finden, über die eine mathematische Funktion gehen, die wir kennen, um einen Flächeninhalt unter einer Funktion, unter einer Kurve zu bestimmen, nämlich das Integral. Gut, das liegt aber noch in der Zukunft. Gucken wir uns also erst einmal die Definition für die Dichtefunktion an, nachdem ihr jetzt hoffentlich für die Einleitung und den Grund, warum es ein Unterschied zur Wahrscheinlichkeitsfunktion ist, verstanden habt. Gucken wir uns also die Definition der Dichtefunktion an. Zuerst einmal brauchen wir eine Zufallsvariable, und zwar eine reelle Zufallsvariable: Z.V. - Abkürzung für Zufallsvariable. So, dann ist die Funktion f, die von dem Raum der reellen Zahlen auf den Raum der reellen Zahlen abbildet, eine Dichtefunktion, falls gilt: Die Wahrscheinlichkeit, dass x sich zwischen a und b, also in diesem Intervall, realisiert, sei das ∫ von a bis b der Funktion f(x) für alle a< b. Das heißt, das ∫, der Flächeninhalt unter der Funktion zwischen a und b, soll gleich der Wahrscheinlichkeit sein. Also wenn wir uns das noch einmal bei der Normalverteilung angucken  und wir sagen: Okay, das ∫ zwischen 2 Punkten (hier a und b), also dieser Flächeninhalt, wenn der gleich der Wahrscheinlichkeit ist, dann ist das hier eine Dichtefunktion. Oder anders gesagt: Wenn wir eine Dichtefunktion haben, ist der Flächeninhalt zwischen 2 Punkten gleich der Wahrscheinlichkeit, dass unser x, wenn es sich realisiert, zwischen diesen beiden Punkten liegt. Aus dieser Definition kann man jetzt wiederum Folgendes ableiten: Die Wahrscheinlichkeit, dass x sich zu einem Wert a realisiert. So, wie groß ist die? Also die Wahrscheinlichkeit, dass das x hier genau auf unserem Wert a landet? Nun, wenn wir mal diese Voraussetzung a< b weglassen und sagen, wir bilden das ∫ von a nach a, dann sehen wir ja, dass ein ∫ von a nach a, also der Flächeninhalt, unter einem Punkt logischerweise immer 0 ist. Also ist auch die Wahrscheinlichkeit im stetigen Fall, dass sich x zu einem bestimmten Wert realisiert, immer 0. Das ist ganz wichtig. Einzelne Werte haben im stetigen Fall die Eintrittswahrscheinlichkeit 0. Im stetigen Fall kann man Wahrscheinlichkeiten nur über den Flächeninhalt definieren und nicht über punktförmige Eintritte. Das ist sehr, sehr wichtig. Gucken wir uns also noch mal Eigenschaften der Dichtefunktion an. Also die Eigenschaften der Dichtefunktion: Bei der Wahrscheinlichkeitsfunktion im diskreten Fall hatten wir die Eigenschaft, dass sich alle Einzelwahrscheinlichkeiten zu 1 aufaddieren müssen. Natürlich müssen wir auch im stetigen Fall am Ende eine Wahrscheinlichkeit von 1 haben. Da wir aber die Einzelwahrscheinlichkeiten ja nicht aufaddieren können, weil punktförmige Ereignisse im stetigen Fall die Eintrittswahrscheinlichkeit 0 haben, müssen wir es wieder über das Integral lösen. Wir sagen halt, das ∫ von -∞ bis ∞ soll 1 sein. Das heißt, der komplette Flächeninhalt unter unserer Verteilung hat den Flächeninhalt 1. Das ist eine sehr, sehr wichtige Eigenschaft der Dichtefunktion. Denn wenn es nicht so wäre, wäre es auch keine Dichtefunktion, da wir ja wissen: Der Flächeninhalt unter der Dichtefunktion muss gleich der Wahrscheinlichkeit sein. So, dann ist weiterhin die Frage: Wie werden unsere reellen Zahlen abgebildet in unserer Funktion? Das heißt im Prinzip: Was ist der Wertebereich unserer Dichtefunktion? Bei der Wahrscheinlichkeitsfunktion wiederum hatten wir ja Werte zwischen 0 und 1, die dann am Ende zu 1 aufaddiert wurden. Das heißt: Ist es hier auch so, dass die Dichtefunktion in das Intervall zwischen 0 und 1 abbildet? Großes Fragezeichen! So, wir haben ja, noch mal zur Überlegung: Die Wahrscheinlichkeit ist ja nicht die Höhe der Dichtefunktion, sondern der Flächeninhalt darunter. Ist es also theoretisch möglich, dass die Dichtefunktion einen Wert über 1 bekommt und der Flächeninhalt unter der gesamten Dichtefunktion trotzdem noch nur 1 ist? Ja, das ist durchaus möglich, wenn sich der Bereich, wo unsere Dichtefunktion über 1 liegt, sehr begrenzt. Das heißt, das hier ist schon mal falsch. Nein, sondern es ist so, dass die Dichtefunktion von den reellen Zahlen tatsächlich in den Bereich 0 bis ∞ abbildet. Also kann auch die Dichtefunktion, wie die Wahrscheinlichkeitsfunktion, keine negativen Zahlen annehmen, aber sie kann beliebig hoch werden. Also es wäre durchaus möglich, wenn wir das hier auftragen - hier ist unsere Dichtefunktion, hier wäre irgendwo 1 - dass unsere Dichtefunktion irgendwie so aussehen würde. Natürlich hier oben etwas runder, nicht so sprunghaft, aber das wäre möglich. Dadurch, dass der Bereich, wo es über 1 liegt, dann relativ klein ist und solange der Flächeninhalt unter der Dichtefunktion weiterhin 1 ist, ist das möglich.  Ja, das war auch schon das Video zur Dichtefunktion. Ich hoffe, ihr habt es so weit verstanden, auch die Ähnlichkeiten und die Unterschiede zur Wahrscheinlichkeitsfunktion, vielleicht noch mal die Unterschiede zwischen dem diskreten und dem stetigen Fall. Im nächsten Video gucken wir uns dann die Verteilungsfunktion an, die es wieder für beide gibt - für den diskreten Fall mit der Wahrscheinlichkeitsfunktion und für den stetigen Fall arbeitet es dann mit der Dichtefunktion. Ja, das war es für heute. Ich bedanke mich fürs Zuschauen und sage bis zum nächsten Mal und tschüss!  

Informationen zum Video
1 Kommentar
  1. Default

    Super Video, hab es nun verstanden :)

    Von Lovedrunk, vor mehr als einem Jahr