Textversion des Videos

Transkript Statistik Video 66: Unabhängigkeit von Ereignissen Übung

Hallo. Schön, dass ihr alle wieder zuguckt. Wir sind heute bei der Übung zur Unabhängigkeit von Ereignissen. Ich habe mir da gleich mal ein paar Beispiele überlegt. Wir sind in einem Hotel. Sagen wir mal, wir sind der Betreiber von einem Hotel und wir möchten gerne etwas über unsere Gäste wissen. Deshalb fragen wir unsere 800 Gäste zum einen nach ihrem Alter und zum anderen nach ihrer Lieblingssportart. Wir würden gerne wissen, ob sich das Alter irgendwie bei der Lieblingssportart bemerkbar macht. Wir wissen, bei vielen Leuten ist die Lieblingssportart Tennis. Deshalb haben wir auch das Ereignis B: Die Lieblingssportart eines zufällig ausgewählten Gastes ist Tennis. Und wir haben das Ereignis A: Unser Hotelgast ist jünger als 30 Jahre. Wir wollen jetzt also gucken, ob A und B stochastisch unabhängig sind. Also, ob es zum Beispiel wahrscheinlicher ist, dass jemand gerne Tennis spielt, wenn er jünger als 30 Jahre ist oder eben nicht. Wie gesagt, wir haben 800 Hotelgäste, die wir befragen und wir wissen noch etwas mehr. Wir wissen, 160 unserer Hotelgäste sind jünger als 30 Jahre. Also haben wir hier 160. Und wir wissen, bei 240 Leuten wurde angegeben, dass die Lieblingssportart Tennis ist. Also haben wir hier eine 240. So, können wir also jetzt schon mal hier die Randbereiche ausfüllen. Wir haben insgesamt 640 Leute, die älter sind als 30 Jahre, und wir haben 560 Leute, deren Lieblingssportart nicht Tennis ist. Wir wissen auch noch: Unter allen, die jünger sind als 30 Jahre, haben 48 angegeben, dass ihre Lieblingssportart Tennis ist. Also gegeben A, der Gast ist jünger als 30 Jahre, haben 48 angegeben, dass Tennis die Lieblingssportart ist. Gut, jetzt können wir also auch den Rest machen, weil wir, das muss ich ja hier immer aufaddieren. 48 haben angegeben: Ja, Tennis ist meine Lieblingssportart. Also haben wohl 120 angegeben, Tennis sei nicht ihre Lieblingssportart. Und hier, bei B, unter allen, deren Lieblingssportart Tennis ist, wenn 48 jünger sind als 30 Jahre, sind wohl 192 nicht jünger als 30 Jahre. Insgesamt 448 sind nicht jünger als 30 Jahre und ihre Lieblingssportart ist auch nicht Tennis. Jetzt haben wir hier also unsere Vierfeldertafel. Jetzt würden wir gerne wissen, ob unsere beiden Ereignisse stochastisch unabhängig sind. Wir haben ja gesagt, wir sind immer dann stochastisch unabhängig, wenn gilt: Die Wahrscheinlichkeit von A und B ist gleich der Wahrscheinlichkeit von A mal der Wahrscheinlichkeit von B. Das muss gelten. Wir haben die Wahrscheinlichkeit von A und B hier, 48/800. Die Wahrscheinlichkeit von A und B, also dass A und B gleichzeitig eintreten, ist 48/800 oder auch 0,06. Wir möchten jetzt wissen: Sind unsere beiden Ereignisse stochastisch unabhängig? Das ist die Frage. Wenn das so ist, dann müsste die Wahrscheinlichkeit A mal der Wahrscheinlichkeit B gleich 0,06 sein. Überprüfen wir das doch Mal. Die Wahrscheinlichkeit von A. Wir haben 160 Leute, die jünger sind als 30 Jahre. 160 von 800 ist also jeder Fünfte, also haben wir 1/5 als Wahrscheinlichkeit von A. Und bei B: Die Wahrscheinlichkeit, dass Tennis die Lieblingssportart ist, haben wir insgesamt 240 Leute. 240 von 800 sind 0,3. Also hier 0,2. Ich schreib das mal beides dezimal auf. 1/5 war auch richtig, aber, um da mal konsistent zu bleiben. 0,2×0,3, das ergibt auch 0,06. Wir sehen also: P(A)×P(B) ist gleich P(A und B). Wir schließen daraus, unsere Ereignisse A und B sind stochastisch unabhängig. Warum jetzt dieses "stochastisch"? Das bedeutet einfach, aus den Daten, die wir gezogen haben, haben wir geschlossen, dass beide Ereignisse unabhängig voneinander sind. Was eventuell daran liegen könnte, dass unsere Daten unglücklich verteilt sind. Es könnte theoretisch sein, dass die beiden Ereignisse voneinander abhängig sind, wir das aber anhand unserer Daten nicht feststellen können. Deshalb schreiben wir hier stochastisch unabhängig. Das war unser Beispiel 1, machen wir doch einfach noc hmal ein Zweites. Machen wir also ein 2. Beispiel. Auch hier starten wir erst mal mit einer Vierfeldertafel. Diesmal sind wir nicht ein Hotelbetreiber, sondern ein Busunternehmen. Wir haben insgesamt 60 Busse. Wir haben Busse von der Firma Apel und wir haben Busse von andern Firmen. Wir haben rote Busse und wir haben nicht rote Busse. Von mir aus sind die anderen gelb. Was wissen wir jetzt? Wir haben insgesamt 45 Busse der Firma Apel, also haben wir 15 Busse, die nicht von der Firma Apel sind. Und wir haben insgesamt 42 rote Busse, also haben wir 18 Busse, die nicht rot sind. Was wissen wir noch? Von unseren 42 Bussen, die rot sind, sind insgesamt 36 von der Firma Apel. Sind wir also hier und die übrigen 6 sind nicht von der Firma Apel. Also haben wir 9 Busse, die nicht rot sind und nicht von der Firma Apel, und 9 Busse, die zwar nicht rot sind, aber trotzdem von der Firma Apel. Wir würden jetzt gerne wissen: Gibt es eine Unabhängigkeit zwischen unseren Ereignissen A und B? Gucken wir uns also erst einmal an, die Wahrscheinlichkeit von A und B, also gucken wir hier rein, wir haben 36 Busse, die von der Firma Apel sind und rot sind, von 60. Also haben wir eine Wahrscheinlichkeit von 36/60, also 0,6. Das soll jetzt gleich sein der Wahrscheinlichkeit von A und B. Wenn das gegeben ist, sind die Beiden stochastisch unabhängig. Wenn das nicht gegeben ist, sind sie stochastisch abhängig. Unsere Wahrscheinlichkeit A: Wir haben 45 von 60, also 0,75. Unsere Wahrscheinlichkeit B: Wir haben 42 von 60, also 0,7. 0,75×0,7 macht 0,525, wenn ich mich nicht verrechnet habe. Wir sehen, P(A)×P(B) ist nicht gleich P(A und B). Was schließen wir daraus? A und B sind stochastisch - auch hier wieder richtig, denn es könnte theoretisch sein, dass uns unsere Daten trügen, dass sie eigentlich unabhängig sind, aber unsere Daten uns etwas anderes geben - diesmal sind wir stochastisch abhängig. Da das nicht gleich dem ist, sind sie nicht voneinander unabhängig. Nur wenn das gegeben ist, wäre das so. Führen wir das Beispiel weiter, um auch noch mal den Multiplikationssatz zu betrachten. Um dieses Beispiel jetzt noch mal etwas weiter zu führen, habe ich noch ein 3. Ereignis definiert. Und zwar unser Ereignis C: Ein zufällig ausgewählter Bus ist älter als 4 Jahre. Wir sehen, die Wahrscheinlichkeit für C liegt bei 0,5. Also ist jeder 2. Bus älter als 4 Jahre, also 30 von 60. Uns interessiert jetzt die Wahrscheinlichkeit, dass alle 3 Ereignisse gleichzeitig eintreten. Und zwar gegeben: Die Ereignisse sind unabhängig voneinander. Und gegeben: Die Ereignisse sind abhängig voneinander. Gehen wir mal davon aus, alle Ereignisse wären voneinander unabhängig. Das heißt, unsere 3 Ereignisse sind vollständig unabhängig voneinander. Wir ignorieren einfach mal, was wir gerade anhand der Daten berechnet haben, und gehen davon aus, sie sind unabhängig voneinander. Dann, erinnern wir uns, dürfen wir den Multiplikationssatz berechnen. Das heißt, die gemeinsame Wahrscheinlichkeit von A, B und C ist das Produkt der Einzelwahrscheinlichkeiten. Sehr simpel, sehr schön. Also können wir hier rechnen: Die Wahrscheinlichkeit von A, 0,75, mal die Wahrscheinlichkeit von B, 0,7, mal die Wahrscheinlichkeit von C, 0,5, also 0,2625. Gut, diese Wahrscheinlichkeit haben wir, wenn alle voneinander unabhängig sind. Das heißt, ungefähr 25%, ein bisschen mehr, meiner Busse sind von der Firma Apel, sind rot und älter als 4 Jahre. Wie sieht das aus, wenn unsere 3 Ereignisse voneinander abhängig sind? So, wie wir es gerade auch zwischen A und B berechnet haben. Wie berechnen wir das dann? Genau das ist nämlich das Problem, warum man gerne unabhängige Ereignisse hat. Das können wir nicht berechnen ohne weitere Zusatzinformationen. Ein dickes Fragezeichen. Wir müssten jetzt unsere, in diesem Fall nicht Vierfeldertafel, sondern Achtfeldertafel aufstellen, alle möglichen Kombinationen hier reinschreiben. Dazu bräuchten wir noch ein paar bedingte Wahrscheinlichkeiten oder zumindest gemeinsame Wahrscheinlichkeiten, um alle 8 Felder ausfüllen zu können. Dann könnten wir aus dieser Matrix oder aus dieser Tafel unsere gemeinsame Wahrscheinlichkeit ablesen und berechnen. Nur mit den Einzelwahrscheinlichkeiten können wir die gemeinsame Wahrscheinlichkeit nicht berechnen, wenn wir davon ausgehen, dass die Ereignisse voneinander abhängig sind. Deshalb hat man so gerne unabhängige Ereignisse. Da multipliziert man das Ganze und kommt ein Ergebnis. Fertig ist das. Hier brauchen wir deutlich mehr Informationen. Haben wir jetzt nicht gegeben, können wir jetzt nicht ausrechnen. Das war auch schon die Übung zur Unabhängigkeit von Ereignissen. Ich hoffe, ihr habt jetzt gesehen, wie man beweist, dass Ereignisse stochastisch unabhängig voneinander sind oder auch abhängig voneinander, wie man die Wahrscheinlichkeit bei Unabhängigkeit berechnen kann, warum man die Wahrscheinlichkeit bei Abhängigkeit nicht so leicht berechnen kann und nehmt das auch mit und könnt das dann auch in einer Klausur reproduzieren. Ich bedanke mich fürs Zuschauen, freue mich schon aufs nächste Video und sage: Tschüss.                                                                                                                                                                        

Informationen zum Video