Advent, Advent, 1 Monat weihnachtliche Laufzeit geschenkt.

Nicht bis zur Bescherung warten, Aktion nur gültig bis zum 18.12.2016!

Textversion des Videos

Transkript Bedingte Wahrscheinlichkeit und Satz von der totalen Wahrscheinlichkeit

In diesem Video geht es um bedingte Wahrscheinlichkeit und die Formel für die totale Wahrscheinlichkeit. Wie kommt man eigentlich auf den Begriff der bedingten Wahrscheinlichkeit? Dazu gucken wir uns ein Beispiel an: Wir würfeln zweimal mit einem Würfel. Dann ist die Wahrscheinlichkeit, dass man 2 Sechsen bekommt (1/6)×(1/6), also 1/36. Wenn man aber im ersten Wurf schon eine 3 würfelt, ist klar, dass man keine Chance mehr hat, 2 Sechsen zu machen. Die Wahrscheinlichkeit für 2 Sechsen, unter der Bedingung, dass der erste Wurf eine 3 ist, ist also 0. Nun zur formalen Definition der bedingten Wahrscheinlichkeit. Sei E eine Ereignisalgebra über einer Grundmenge Ω und A, B Ereignisse aus E, wobei B nicht die Wahrscheinlichkeit 0 hat, dann heißt die Zahl, die wir so bezeichnen und berechnen durch P(A geschnitten B)/P(B), bedingte Wahrscheinlichkeit von A unter B bzw. Wahrscheinlichkeit von A unter der Bedingung B. Nehmen wir als Beispiel eine Familie mit 2 Kindern. A soll bedeuten, es gibt 2 Jungen, und B soll bedeuten, es gibt mindestens 1 Jungen. Insgesamt gibt es für die Verteilung der Kinder diese 4 Möglichkeiten, jede davon hat Wahrscheinlichkeit ¼. Die Wahrscheinlichkeit, dass es 2 Jungen sind, ist also A-priori ¼. Wenn man aber schon weiß, dass es mindestens 1 Jungen gibt, ist die Wahrscheinlichkeit für 2 Jungen nach unserer Formel von eben: P(A geschnitten B)/P(B), A geschnitten B heißt, es gibt 2 Jungen, und das Ereignis B wird durch diese 3 Elementarereignisse erzeugt, die summieren wir also auf, und dann erhält man ¼/¾=1/3. Wenn man also schon weiß, dass mindestens 1 Junge dabei ist, ist die Wahrscheinlichkeit für 2 Jungen größer. Na, das hätte man ja auch erwartet. Wenn ich jetzt in diesem Ausdruck für die bedingte Wahrscheinlichkeit das B so fest lasse, kann ich eigentlich statt A auch andere Ereignisse aus der Ereignisalgebra einsetzen. Die Frage, die sich stellt, ist dann, ob diese Funktion PB, die von der Ereignisalgebra in das Intervall [0;1] geht, wirklich ein Wahrscheinlichkeitsmaß ist. Und dass das tatsächlich so ist, will ich jetzt mal beweisen. Als Erstes muss man dazu PB(Ω) ausrechnen, das ist also P(Ω geschnitten B)/P(B). Da aber Ω geschnitten B gleich B ist, kommt hier 1 raus und damit ist die 1. Bedingung für ein Wahrscheinlichkeitsmaß erfüllt. Als Nächstes nimmt man sich 2 disjunkte, also unvereinbare Ereignisse und schaut, was die Wahrscheinlichkeit von deren Vereinigung ist. Wenn es ein Wahrscheinlichkeitsmaß sein soll, muss das dann die Summe der Einzelwahrscheinlichkeiten sein. Da wenden wir zuerst die Definition an und dann das Distributivgesetz. A1 und A2 waren disjunkt, das heißt, diese beiden Schnitte hier links und rechts müssen auch disjunkt sein, denn sie sind ja jeweils noch kleiner als die Mengen A1 bzw. A2. Und das Maß P haben wir als Wahrscheinlichkeitsmaß vorausgesetzt, das heißt, ich kann im Zähler die Summe der Einzelwahrscheinlichkeiten schreiben. Das schreibe ich dann auf 2 einzelne Brüche und dann sehe ich schon, dass das genau die Definition von PB(A1) und PB(A2) ist. Eigentlich müsste man diese Gleichung jetzt noch für abzählbar unendliche Vereinigungen von disjunkten Ereignissen zeigen, aber das wird hier ein bisschen zu lang und das geht im Prinzip genauso wie mit 2 Mengen. Kommen wir also jetzt zur Formel von der totalen Wahrscheinlichkeit. Die Wahrscheinlichkeit von A kann ich auch schreiben als Wahrscheinlichkeit von A geschnitten Ω - und Ω kann ich schreiben als disjunkte Vereinigung eines Ereignisses B und dessen Komplement. Dann kann ich das Distributivgesetz anwenden und dies kann ich wieder als Summe der einzelnen Schnitte schreiben, weil ja B und Bquer disjunkt sind, also erst recht A geschnitten B und A geschnitten Bquer. Jetzt brauchen wir eine kleine Nebenrechnung. Wir schreiben die Definition für die bedingte Wahrscheinlichkeit noch mal hin und formen das nach P(A geschnitten B) um. Dann ersetzen wir die beiden Summanden aus dem letzten Schritt eben durch diese Formel und erhalten die Formel von der totalen Wahrscheinlichkeit. Wenn ich also so ein System habe, das disjunkt ist und Ω vollständig erzeugt, dann kann ich mithilfe von dessen Wahrscheinlichkeiten und den Wahrscheinlichkeiten von A unter Bedingung dieser Ereignisse, die Wahrscheinlichkeit von A selbst komplett beschreiben. Allgemein kann ich das so schreiben. Ich nehme immer die Wahrscheinlichkeit von A unter der Bedingung eines solchen Basisereignisses × der Wahrscheinlichkeit des Basisereignisses. Und das wird dann aufsummiert über alle diese Basisereignisse. Beispiel: In einem Experiment mit 100 Testpersonen erhalten einige ein Medikament und die anderen nur ein Placebo. Danach wird getestet, ob sie gesund geworden sind oder krank geblieben sind. Die Zahlen für die jeweiligen Ereignisse tragen wir in diese Tabelle ein. Am Rand tragen wir jeweils die entsprechenden Summen ein. Die Wahrscheinlichkeit, dass eine zufällig ausgewählte Testperson die Medizin genommen hat, ist also 0,8 und dass sie ein Placebo genommen hat, ist 0,2. Und wir möchten jetzt wissen, wie groß die Wahrscheinlichkeit dafür ist, dass eine Person gesund ist, wenn wir wissen, dass sie die Medizin genommen hat. Wir setzen die Formel aus der Definition ein und können die Einzelwahrscheinlichkeiten in der Tabelle ablesen. Es ergibt sich also 0,7. Damit ist die Wahrscheinlichkeit, dass jemand, der die Medizin genommen hat, nicht gesund ist 0,3. Dass die Wahrscheinlichkeit des Gesamtpfades stimmt, können wir in der Tabelle nachprüfen. Die Wahrscheinlichkeit, dass jemand gesund ist, der das Placebo genommen hat, berechnet sich entsprechend. Auch hier gibt die Probe wieder unser erwartetes Ergebnis. Und die Wahrscheinlichkeit dafür, dass eine zufällig gewählte Person gesund ist, können wir jetzt mit dem Satz von der totalen Wahrscheinlichkeit ausrechnen. Wir nehmen also P(G) unter der Bedingung M×P(M)+P(G) unter der Bedingung NichtM×P(NichtM). Die bedingten Wahrscheinlichkeiten kann man immer am 2. Teil des Baumes ablesen, die anderen am 1. Es ergibt sich 0,6, so, wie wir es aus der Tabelle erwartet hatten.  Okay, und jetzt haben wir erst mal genug mit bedingten Wahrscheinlichkeiten gerechnet. 

Informationen zum Video
2 Kommentare
  1. Default

    Zu kompliziert Erklärt

    Von Tmk18, vor 8 Monaten
  2. Hz muhammed sav

    Informativ und weniger erklärend.

    Von Furkan A., vor etwa 2 Jahren