Textversion des Videos

Transkript Statistik Video 73: Verteilungsfunktion

Guten Tag! Schön, dass ihr alle wieder dabei seid. Wir sind heute bei unserem Video zur Verteilungsfunktion. Die Verteilungsfunktion kennen wir ja schon aus der Empirie. Damals hatten wir die empirische Verteilungsfunktion, also die kumulierten relativen Häufigkeiten. Hier haben wir so etwas Ähnliches, nur halt jetzt nicht mit relativen Häufigkeiten, sondern mit Wahrscheinlichkeiten. Ihr seht also, alles, was wir damals in der Empirie mit relativen Häufigkeiten gemacht haben, taucht jetzt wieder mit Wahrscheinlichkeiten auf. Die Verteilungsfunktion ist eine Funktion der kumulierten Wahrscheinlichkeiten aller Ereignisse kleiner/gleich x. Sie wird mit F bezeichnet. Das heißt F(x) bezeichnet die Wahrscheinlichkeit, dass sich unser X zu einem Wert ≤x realisiert. Wenn wir das jetzt grafisch darstellen, haben wir im diskreten Fall die Treppendarstellung. Das heißt, wir haben hier unsere Realisierungsmöglichkeiten und immer, wenn eine eine Wahrscheinlichkeit hat, machen wir so einen Sprung, gehen weiter, bei der nächsten machen wir wieder so einen Sprung. Das kennen wir schon aus der empirischen Verteilungsfunktion. Neu ist die stetige Verteilungsfunktion. Also im stetigen Fall haben wir natürlich keine Treppenfunktion, weil wir jeden Wert haben können. Sondern wir haben dann auch eine stetige Funktion, die halt aus -∞ kommt, irgendwann Richtung 1 läuft und irgendwann auf 1 wieder gegen ∞ läuft. Gucken wir uns doch einfach einmal die grafische Darstellung an, erst im diskreten Fall und dann im stetigen Fall. Im diskreten Fall sagt die Verteilungsfunktion, wie gesagt, nichts anderes aus als die Wahrscheinlichkeit, dass sich unser x zu einem Wert ≤x realisiert. Das heißt, es ist im Prinzip die Summation aller Wahrscheinlichkeiten, solange unser X≤x ist. Also wenn wir uns dieses folgende Beispiel angucken: Wir haben eine Zufallsvariable, die 3 mögliche Realisierungsmöglichkeiten hat, 0, 1 und 2, mit den Wahrscheinlichkeiten 0,42 für die Realisierung 0, 0,53 für die Realisierung 1 und 0,05 für die Realisierung 2. Und als Verteilungsfunktion sieht das dann halt so aus. Das heißt, wir haben hier unsere Wahrscheinlichkeit P0, also 0,42. Wir haben hier unsere Wahrscheinlichkeit P1 und hier unsere Wahrscheinlichkeit P2. Vor der 1. Realisationsmöglichkeit läuft es halt auf dem Level 0. Dann springt es bei der 0, weil wir da ja eine Wahrscheinlichkeit haben, auf die 0,42, läuft weiter auf dem gleichen Niveau bis zum nächsten Punkt, wo wir eine Wahrscheinlichkeit angeben können, das heißt, hier die 1, springt dann um 0,53 auf 0,95, läuft auf dem Niveau weiter bis zur 2, springt da auf die 1 und läuft dann im Prinzip bis ins ∞ weiter. So, man kann jetzt verschiedene Funktionswerte angeben, zum Beispiel F(-1). Bei -1 sind wir noch nicht irgendwo gesprungen, weil das noch unterhalb der kleinsten Realisationsmöglichkeit ist. Das heißt, wir hätten eine 0. Unser F(0) ist also genau der Punkt, an dem wir springen. Dort haben wir also eine kumulierte Wahrscheinlichkeit von 0,42. Und zum Beispiel die Verteilung F(1,7), also die Wahrscheinlichkeit, dass wir eine Realisation haben ≤1,7, also im Prinzip entweder die 0 oder die 1, liegt (sagen wir irgendwo hier) bei 0,95. So rechnet mal also mit der Verteilungsfunktion im diskreten Fall. Eigentlich kein Problem, das kennen wir auch alles schon aus der Empirie. Gucken wir uns also als Nächstes den stetigen Fall an. Im stetigen Fall: Unser Verteilungsfunktionswert F(a) (wir nehmen jetzt einmal a und nicht x) ist also = der Wahrscheinlichkeit, dass sich unser X zu einem Wert ≤a realisiert. Deshalb nehmen wir a. Wir haben also das ∫ von -∞ bis zu unserer Grenze a von f(x)dx. Das heißt, ihr seht, unsere Verteilungsfunktion ist die Stammfunktion von unserem f(x). Eine schöne Eigenschaft, die wir bei der Verteilungsfunktion im stetigen Fall haben, ist es, wenn wir die Wahrscheinlichkeit haben, dass unser x in ein bestimmtes Intervall fällt zwischen a und b. Diese Wahrscheinlichkeit ist ja, wie aus dem letzten Video mit der Dichtefunktion her wissen, das ∫ von a bis b unserer Funktion f(x), also unserer Dichtefunktion. Und das ist nichts anderes als F(b)-F(a). Also im Prinzip, wenn man sich das anguckt, von -∞ bis b - von -∞ bis a. Also sagen wir, hier wäre b, hier wäre a: Dann würden wir also das Komplette nehmen, alles was Links von b liegt, den ganzen Flächeninhalt, und alles, was links von a liegt, wieder abziehen, um halt nur diesen Flächeninhalt zu bekommen. Ihr seht schon, ich habe hier eine Verteilungsfunktion aufgezeichnet (hier) und die Dichtefunktion, die dazugehört. Wenn wir jetzt einmal sagen, okay, uns interessiert als Punkt a der Punkt hier in der Mitte. Und wir sagen, das Ganze ist eine symmetrische Normalverteilung. Dann wissen wir, der ganze Flächeninhalt hier, alles was Links von a liegt, ist ½, und alles was Rechts von a liegt, ist auch ½. Also wir nehmen die Normalverteilung, hier unsere Glockenkurve, die ist symmetrisch, und schneiden sie genau in der Mitte. Das heißt, wir haben links die Hälfte und wir haben rechts die Hälfte davon. Und wenn wir das jetzt auf unsere Verteilungsfunktion übertragen, landen wir halt bei a (hier), und zwar bei einem Wert von 0,5. Das heißt, wir können aus unserer Verteilungsfunktion direkt den Flächeninhalt ablesen von -∞ bis zu unserem Punkt, der uns interessiert, was ja auch genau hier steht. Also auch im stetigen Fall lässt sich damit sehr gut rechnen. Und ihr müsst jetzt auch nicht Bange machen vor diesem ∫. Wenn ihr denkt: Oh Gott, Integrale konnte ich noch nie. Wieso soll ich das denn ausrechnen können? Je nachdem, welche Verteilung man hat, sind solche Integrale bzw. meistens dann direkt schon die Verteilungsfunktion tabelliert. Das heißt, man guckt, okay, welchen Wert b brauche ich, schlägt den in der Tabelle nach, guckt welchen Wert a brauche ich, schlägt den in der Tabelle nach, bildet noch die Differenz daraus und hat seine Wahrscheinlichkeit. Also im praktischen Fall werdet ihr diesem ∫ kaum begegnen. Das ist mehr so das theoretische Konstrukt, was dahinter liegt. Aber das ganze Rechnen mit dem ∫ hat man euch meistens schon abgenommen, indem man halt diese Tabellen gebaut hat. Okay. Gucken wir uns noch allgemeine Eigenschaften der Verteilungsfunktion an. Noch einmal 2 wichtige Eigenschaften zur Verteilungsfunktion. Die Verteilungsfunktion F(x) ist monoton nicht fallend. Das heißt, sie bleibt entweder gleich oder sie steigt an. Sie fällt nie. Wie auch? Es ist ja eine Kumulation von Wahrscheinlichkeiten. Wahrscheinlichkeiten können nie negativ sein, insofern kann die Verteilungsfunktion nie fallen. Dann noch die andere Eigenschaft: Der Grenzwert der Verteilungsfunktion f(x), wenn x gegen -∞ geht, ist 0. Das heißt, es wird sich im Bereich -∞ zumindest 0 annähern, wenn nicht sogar 0 sein. Genau das Gleiche im anderen Fall: lim(F)x bei x gegen +∞ = 1. Das heißt, es wird sich 1 annähern oder halt irgendwann sogar 1 werden. Das sind auch schon die wichtigen Eigenschaften der Verteilungsfunktion, die wir bisher noch nicht hatten. Das war das Video zur Verteilungsfunktion. Im nächsten Video machen wir dazu natürlich eine Übung, einmal im diskreten Fall, einmal im stetigen Fall, wie man damit rechnet. Das sollte für euch eigentlich kein Problem mehr darstellen. Ich bedanke mich fürs Zuschauen, hoffe ihr guckt auch beim nächsten Mal rein und sage: tschüss!

 

Informationen zum Video
2 Kommentare
  1. Default

    Es geht nur um die Integrale in unserer Uni

    Von Derursm, vor mehr als einem Jahr
  2. Default

    Gut erklärt! Zu behaupten, dass man in der Regel keinen Kontakt mit den Integralen hat ist aber gewagt. Manche Profs scheinen gerade damit Ihre Studenten quälen zu wollen - jedenfalls an meiner Uni.

    Von Cuibono, vor mehr als 3 Jahren