Textversion des Videos

Transkript Statistik Video 81: Ungleichungen von Tschebyschow und Markow

Hallo, schön dass ihr alle wieder zuguckt. Wir sind heute bei einem Video über Ungleichungen, wichtige Ungleichungen in der Stochastik. Was ist die Motivation von diesen Ungleichungen? Naja, oftmals ist die Verteilung einer Zufallsvariable X nicht genau bekannt. Also wir werden in späteren Videos noch spezielle diskrete und stetige Verteilungen kennen lernen, wie zum Beispiel die Normal-Verteilung oder die Binominal-Verteilung, aber oftmals ist so eine Verteilung von X unbekannt. Was man aber vielleicht trotzdem hat, ist der Erwartungswert, oder der Mittelwert, μ und die Varianz σ ^2. Nun möchte man trotzdem Aussagen über Wahrscheinlichkeiten treffen, auch wenn man nicht weiß, wie die Zufallsvariable verteilt ist. Das geht mit den Ungleichungen von Markow, ein russischer Mathematiker, und Tschebyschow, ein ebenfalls russische Mathematiker - manchmal auch Tschebytschew - die Ungleichungen aufgestellt haben mit Ober- oder Untergrenzen von bestimmten Wahrscheinlichkeiten angegeben werden können. Gucken wir uns das einfach mal im Detail an, wir fangen an mit der Ungleichung von Markow und machen dann die Ungleichung von Tschebyschow. Okay, die Ungleichung von Markow beschreibt quasi die Wahrscheinlichkeit, die Obergrenze der Wahrscheinlichkeit, dass unsere Zufallsvariable X, den Wert einer bestimmten positiven Konstante a überschreitet. Also wir haben hier die Wahrscheinlichkeit, dass unsere Zufallsvariable x größer gleich ist unserer vorher festgelegten, positiven Konstante a, die Wahrscheinlichkeit ist kleiner als der Erwartungswert von a(x)/h(a). h ist jetzt noch mal eine Funktion, die auf x quasi auferlegt wird. Wir haben folgende Einschränkung: Wir haben unsere Zufallsvariable x, die aus unserem Ergebnisraum in die realen Zahlen abbildet, wir haben unser a, das eine reelle Zahl größer 0 ist und wir haben unsere Funktion h(x), die aus den reellen Zahlen in den positiven Bereich abbildet. Okay, das ist jetzt noch nicht sehr schlüssig, deshalb gucken wir uns insbesondere den Spezialfall an, der Spezialfall heißt, wir haben h(x)=x, das heißt, die Funktion bildet also quasi x direkt einfach auf x ab, was unsere Ungleichung wie folgt verändert: Wir haben also die Wahrscheinlichkeit, dass unsere Zufallsvariable x größer ist als a, ist kleiner gleich der Erwartungswert von x/a. Okay, das klingt ja auch noch nicht sehr einleuchtend, könnte ich mir vorstellen, gucken wir uns das deshalb an einem Beispiel an. Wir wollen also wissen, die Wahrscheinlichkeit mit einem 20-seitigen Würfel, einem W20, eine Augenzahl größer, oder von mindestens 15 zu würfeln. So, mindestens 15, wir gehen jetzt davon aus, wir wissen nicht, wie unser x verteilt ist, x wäre hier die Augenzahl, sondern wollen jetzt also die Obergrenze haben. Also, das Ganze sieht dann wie folgt aus: Die Wahrscheinlichkeit, dass unsere Zufallsvariable x - die Augenzahl - einen Wert größer gleich 15 annimmt - genau das wollen wir ja wissen - ist kleiner gleich der Erwartungswert, in diesem Fall bei einem 10-seitigen Würfel, 10,5/15, oder auch 7/10. Das heißt, ohne zu wissen, wie unser x verteilt ist, wissen wir, dass die Wahrscheinlichkeit einen Wert größer gleich 15 zu würfeln unter 70% liegt. Also wir haben hier eine Obergrenze angegeben, die sagt, okay, maximal 70% kann es sein, egal wie dein x verteilt ist. Das heißt, wir können uns eine sehr extreme Verteilung  ausdenken, wo es dann tatsächlich 70% ist, aber es gibt keine Verteilung für x, wo die Wahrscheinlichkeit etwas größer als 15 zu würfeln, größer ist als 70%. Das sagt diese Obergrenze aus. Die Ungleichung von Markow und auch von Tschebyschow werden sehr gerne genommen, obwohl die Grenzen meist relativ weit von der reellen Wahrscheinlichkeit entfernt sind, weil die Schranken sehr leicht zu berechnen sind, wo man so schon eine grobe Einschätzung kriegen kann. So, das war die Ungleichung von Markow, jetzt gucken wir uns die Ungleichung von Tschebyschow an. Gut, gucken wir uns also die Ungleichung von Tschebyschow, oder wie ich es gelernt habe Tschebyschew, an. Wir haben also die Zufallsvariable x, die beliebig verteilt sein kann. Was wir allerdings brauchen ist: Wir müssen den Erwartungswert von x kennen und die Varianz von x. Also μ und σ ^2 müssen bekannt sein. Dann liefert uns die Ungleichung von Tschebyschew folgende Ungleichung: Also die Wahrscheinlichkeit, dass die Differenz von x vom Erwartungswert einen bestimmten Wert k, eine Konstante, überschreitet, ist kleiner als die Varianz unserer Zufallsvariable x/k2. Oder anders gesagt: Die Wahrscheinlichkeit, dass sich unsere Zufallsvariable x zu einem Wert um unseren Erwartungswert My realisiert, der kleiner ist als k, also wo die Differenz kleiner ist als k, die Wahrscheinlichkeit davon ist größer als 1- unserer Varianz/k2. Um das mal anschaulich zu machen, wir nehmen hier wieder die Normalverteilung und hier ist μ, so dann wäre hier μ+k und μ-k, und die Wahrscheinlichkeit bei unserem Versuch jetzt, dass x irgendwo zwischen hier und hier liegt, was genau diese Wahrscheinlichkeit wäre, der Betrag muss kleiner sein als k, also als dieser Abstand, die Wahrscheinlichkeit hier reinzufallen irgendwo, ist jetzt also größer als 1- σ2/k2. So gucken wir uns das auch wieder an einem Beispiel an: Nehmen wir mal die Sofatutor Videos und sagen ok, unser μ, die durchschnittliche Länge eines Sofatutor Videos sind 15 Minuten mit einer Varianz σ2 von sagen wir 4. So, jetzt interessiert uns die Wahrscheinlichkeit, dass wir max ein Video haben, das maximal 3 Minuten von der erwarteten Zeit abweicht. Also die Wahrscheinlichkeit, dass x-15, der Betrag davon, kleiner ist als 3. Also dass wir zwischen 12 und 18 Minuten, ein Video der Länge zwischen 12 und 18 Minuten haben. Und was jetzt die Ungleichung von Tschebyschew sagt, die Ungleichung von Tschebyschew sagt: Diese Wahrscheinlichkeit ist größer als 1- die Varianz 4/k2, 9, also größer gleich 5/9, also größer gleich ungefähr 55%. So, ohne zu wissen, wie unsere Zufallsvariable x die Zeit, die Länge eines Sofatutor Videos verteilt ist, nur mit dem Erwartungswert und der Varianz, können wir also sagen, dass die Wahrscheinlichkeit, wenn wir zufällig ein Video auswählen, dass dieses Video zwischen 12 und 18 Minuten lang ist, auf jeden Fall größer ist als 55%. Auf jeden Fall. Ja, das sagen die Ungleichungen von Tschebyschew und Markow aus, die, wie schon gesagt, sehr gerne benutzt werden weil die Grenzen sehr einfach sind, und sie schon mal eine grobe Richtung vorgeben. Außerdem ist grade bei Tschebyschew die Verteilung völlig unwichtig, also nicht unwichtig, aber sie muss nicht gegeben sein, und die Ungleichung von Tschebyschew funktioniert auch bei Verteilungen die sich sehr stark von der Normalverteilung, die wir ja hier schon wieder haben, unterscheidet. So das war noch mal ein kurzer Exkurs zu den Ungleichungen von Tschebyschew und Markow, das werdet ihr wahrscheinlich auch in eurem Statistikkurs kurz mal durchnehmen und wenn ihr mal eine Aufgabe sehr und gefragt wird, ok, geben sie die Wahrscheinlichkeit an, dass x zwischen so und so und so und soviel liegt und keine Verteilung für x angegeben ist, dann müsst ihr euch erinnern an die Ungleichungen von Tschebyschew und Markow. Ja, das war´s auch schon wieder für dieses Video, ich bedanke mich fürs Zuschauen, freue mich aufs nächste Mal und sage tschüss!

Informationen zum Video
4 Kommentare
  1. Default

    Das k ist beliebig gewählt. Man könnte genauso gut berechnen, wie groß die Wkt. ist, dass ein zufällig ausgewähltes Video zwischen 10 und 20min lang ist (dann wäre k=5).

    k wird hier also durch die Fragestellung definiert.

    Von Statistik Jona, vor etwa 4 Jahren
  2. Default

    Könntest du nochmal kurz schreiben, wie man auf k kommt? Wieso ist das drei? Vielen Dank!

    Von Dan Berlin2003, vor etwa 4 Jahren
  3. Default

    Also im Prinzip sind die Formeln identisch, demnach sollte natürlich auch dasselbe rauskommen.

    guck einfach mal unter:
    de.wikipedia.org/wiki/Tschebyscheff-Ungleichung

    da findest du alle drei Formeln.

    Von Statistik Jona, vor mehr als 4 Jahren
  4. Default

    Hallo, danke für das Video.
    Ich habe hier als Tschbebyschev Ungleichung aber noch zwei andere Formeln gegeben, und wenn ich mit denen versuche, die Aufgabe zu lösen, kommt da irgendwie was anderes raus (wegen k mal μ). Weißt du, ob das praktisch dieselbe Formel (umgestellt) ist, oder etwas ganz anderes?

    P(|X - μ| ≤ kσ) ≥ 1 - 1/k²
    P(|X - μ| > kσ) ≤ 1/k²

    Welche Formel sollte man verwenden? Kann man das verallgemeinern? Und ist μ dann auch gleich dem Schwankungsintervall? Vielen Dank!

    Von Dan Berlin2003, vor mehr als 4 Jahren