Textversion des Videos

Transkript Statistik Video 64: Satz von Bayes Übung

Schönen guten Tag! Schön, dass ihr alle wieder zuguckt. Wir sind heute bei unserem neuen Video zum Satz von Bayes und wir machen dazu eine Übung. Wir haben uns ja im letzten Video schon den Satz von Bayes angeguckt, wie man also aus einer bedingten Wahrscheinlichkeit quasi die entgegengesetzte bedingte Wahrscheinlichkeit berechnen kann, und wollen uns das heute einmal in einem etwas komplexeren Beispiel angucken. Wir nehmen mal als Beispiel einen HIV-Test, also einen Aidstest. Wir haben zwei Ereignisse: Zum einen haben wir das Ereignis A, ob die Person tatsächlich an Aids erkrankt ist und als Ereignis B, ob der Test auch positiv ist. Bei solchen Tests gibt es immer zwei Dinge, die angegeben werden - die Sensitivität und die Spezifität. Die Sensitivität gibt an, wie viele falsch negative Ergebnisse es gibt, also wir haben eine Sensitivität von 99,9 %. Das heißt, wenn wir 1000 infizierte Personen testen, bekommen wir 999 positive Testergebnisse. Das heißt, 1 Testergebnis von 1000 ist falsch negativ. Also, der Test ist negativ, obwohl die Person eigentlich infiziert ist. Der entgegengesetzte Fall ist bei der Spezifität. Wir haben eine Spezifität von 99,8 %, das bedeutet, wir haben von 1000 getesteten Personen 2 falsch positive Meldungen. Das heißt, wenn wir gegeben haben, die Person ist nicht HIV-infiziert, ist also HIV-negativ, dann bekommen wir bei 1000 Tests 998 negative Ergebnisse und halt 2 positive, also 2 falsch positive unter 1000. Gucken wir uns das Ganze doch einfach einmal in einer 4-Feldertafel an. Wir gehen jetzt einmal davon aus, dass wir uns als Gesamtheit alle Einwohner von Deutschland angucken, also 82000000. Dazu sei noch gegeben, dass ungefähr 1 ‰ aller Deutschen HIV-positiv ist, was in unserem Fall bedeutet, in Wahrscheinlichkeiten ausgedrückt: Die Wahrscheinlichkeit für Ereignis A sei 1‰, also 0,001. Das ist ungefähr auch der tatsächliche Wert. In Deutschland gibt es ungefähr 80000 an Aids erkrankte Personen unter 82000000. Wir rechnen jetzt einfach mal mit 1‰ und genau 82000000, damit das Ganze etwas leichter von der Hand geht. Wir haben also: 1 ‰ ist an Aids erkrankt, also die Wahrscheinlichkeit von A 1%, also von 82000000 haben wir hier 82000. Und wir wissen ja, die Spalten müssen sich immer dann hier zu N aufaddieren, also haben wir hier 81918000. Gut, was wissen wir noch? Wir haben ja noch die Sensitivität und die Spezifität. Was genau bedeutet das jetzt? Wir können aus der Sensitivität die Wahrscheinlichkeit für B und A schließen, also für ein positives Ergebnis, wenn die zu testende Person tatsächlich erkrankt ist, liegt bei 0,999, also bei 99,9 %. Und die Spezifizität sagt aus, die Wahrscheinlichkeit für ein negatives Testergebnis, wenn die Person tatsächlich nicht erkrankt ist, liegt bei 0,998, also bei 99,8 %. Das können wir jetzt in unsere 4-Feldertafel wunderbar einbauen. Wir haben gegeben A, 99,9 %, auf das auch B zutrifft, also von 82000 99,9 %. Das macht also 81918 und entsprechend die restlichen 82 wären dann Falschmeldungen, also gegeben A, B-nicht. Und hier entsprechend können wir dann also auch, gegeben A-nicht 99,8 %, hier auf B-nicht berechnen. Das sind 163836, die also gegeben, die Person ist nicht krank, haben wir einen positiven Test, haben wir 163836. Und 99,8 % von diesen 81918000 haben, wenn sie nicht krank sind, einen negativen Test, macht also 81754164. So, jetzt können wir natürlich unsere Spalten hier noch zusammen aufaddieren. Wir haben hier 245754 und hier 81754164. So, das ist also unsere 4-Feldertafel, wie wir sie ja öfters schon mal aufgestellt haben. Wir wollen jetzt ja den Satz von Bayes anwenden. Also wir haben ja die Wahrscheinlichkeit, dass unser Test positiv ist, gegeben, 1 Person ist krank. Was uns jetzt aber interessieren würde, wäre eigentlich die Wahrscheinlichkeit, dass eine Person krank ist, gegeben, unser Test ist positiv. So, das würde uns eigentlich interessieren und das möchten wir jetzt mit dem Satz von Bayes ausrechnen. Wir erinnern uns noch mal kurz an die Formel. Die Wahrscheinlichkeit A gegeben B ist die Wahrscheinlichkeit B, gegeben A mal die Wahrscheinlichkeit von A geteilt durch die Wahrscheinlichkeit von B. Gut, was davon haben wir, was davon brauchen wir noch? Die Wahrscheinlichkeit B gegeben A haben wir hier. Haben wir also schon. Die Wahrscheinlichkeit von A haben wir hier. Haben wir also auch schon. Die Wahrscheinlichkeit von B haben wir noch nicht, die müssen wir uns also irgendwie noch suchen. So, ja, die Wahrscheinlichkeit von B ist auch tatsächlich das Letzte, was uns noch fehlt, um zu dieser bedingten Wahrscheinlichkeit zu kommen. Gut, warum berechnen wir das nicht einfach? Was fällt uns da ein, was wir nehmen könnten? Die totale Wahrscheinlichkeit - und die benutzen wir auch. So, wir brauchen jetzt also noch die totale Wahrscheinlichkeit von B. Also wie groß ist die Wahrscheinlichkeit, wenn ich von 82000000 1 zufällig auswähle, dass der HIV-Test positiv ist? So, und wir erinnern uns, der Satz der totalen Wahrscheinlichkeit: Die totale Wahrscheinlichkeit von B ist die Wahrscheinlichkeit B unter A × die Wahrscheinlichkeit von A + die Wahrscheinlichkeit B unter A-nicht × die Wahrscheinlichkeit von A-nicht, da ja A und A-nicht entgegengesetzt sind und somit auch (unklar). Ja, haben wir eigentlich alles gegeben. Also die Wahrscheinlichkeit B unter A, haben wir hier, 0,999. So, und das ×0,001, also × der Wahrscheinlichkeit, dass jemand überhaupt krank ist. Dann die Wahrscheinlichkeit, dass ein Test positiv ist, gegeben, die Person ist nicht krank. Haben wir jetzt so noch nicht gegeben, aber wir haben die Gegenwahrscheinlichkeit dazu. Wir haben die Wahrscheinlichkeit, dass unser Test negativ ist, gegeben, die Person ist nicht krank, also ist die Gegenwahrscheinlichkeit hierzu die Wahrscheinlichkeit, die wir suchen. Da das hier 99,8 % sind, haben wir also eine Wahrscheinlichkeit von 0,2 % oder 0,02. Und das ×A-nicht, also die Wahrscheinlichkeit, dass jemand, den wir zufällig auswählen, nicht krank ist, ist die Gegenwahrscheinlichkeit dazu, dass jemand krank ist, also 0,999. Und wenn man das jetzt alles ausrechnet, kommen wir auf eine totale Wahrscheinlichkeit von B von 0,002997, also etwas weniger als 3 ‰. Das heißt die Wahrscheinlichkeit, einen positiven Test zu haben, liegt nur bei ungefähr 3‰ , also 3 von 1000 Tests in Deutschland sind überhaupt nur positiv. So, jetzt haben wir also hier die totale Wahrscheinlichkeit von B, können jetzt also die eigentlich interessante bedingte Wahrscheinlichkeit ausrechnen, nämlich die Wahrscheinlichkeit, dass jemand krank ist, wenn sein Test positiv ist. Das ist nämlich ganz wichtig. Wir haben ja zwar die Sensitivität und die Spezifität - die Tests scheinen also sehr gut zu sein. Wir wollen jetzt aber wissen: Wenn ich ein positives Ergebnis habe, kann ich mich tatsächlich darauf verlassen, dass derjenige auch krank ist, weil zum Beispiel die Wahrscheinlichkeit bei 99,9 % liegt? Oder muss ich vielleicht noch weiter testen? Ja, rechnen wir das doch einfach mal aus. Also wir haben: Die Wahrscheinlichkeiten B unter A liegt bei 99,9 % × die Wahrscheinlichkeit von A, von 0,001. So, und das teilen wir jetzt durch die totale Wahrscheinlichkeit von B, also 0,002997. So, und da kommen wir jetzt auf ein Ergebnis, was sehr erstaunlich ist! Wir haben ja, wie wir hier sehen, sehr gute Tests. Also wir haben von 1000 Tests nur 1 falsch negativen und von 1000 Tests nur 2 falsch positive. Also die Tests sind wirklich sehr, sehr gut. Das sind auch so die Werte, die man tatsächlich im Moment bei den Aidstests hat. Und trotzdem haben wir hier nur eine Wahrscheinlichkeit von 1/3, dass, wenn ich einen positiven HIV-Test bekomme, ich tatsächlich krank bin. Also wenn ich mich jetzt testen lasse, heute, auf HIV und mein HIV-Test mit diesen Werten ist positiv, ist die Wahrscheinlichkeit, dass ich kein HIV habe, trotzdem noch höher als die Wahrscheinlichkeit, dass ich es habe, obwohl ich einen positiven Test habe. So, woran liegt das? Das liegt natürlich daran, dass, obwohl wir nur 2 von 1000 falsch positive Nachrichten haben, also nur bei 2 von 1000 Leuten, die kein HIV haben, wird es trotzdem attestiert, die Anzahl einfach so viel größer ist als die der tatsächlich Infizierten, dass das halt zu diesem Ergebnis kommt. Wenn wir uns noch mal an die 4-Feldertafel, die wir gerade hier aufgebaut hatten, erinnern, da haben wir ja gesehen, dass 160000 falsch positive Meldungen es gibt, unter 82000000, ungefähr 160000, es aber ja nur 82000 überhaupt Infizierte gibt. Das heißt, wir haben ungefähr doppelt so viel falsch positive Meldungen wie Infizierte. Und daher kommt es auch zu dieser Wahrscheinlichkeit, dass, wenn wir ein positives Testergebnis haben, die Wahrscheinlichkeit, tatsächlich krank zu sein, tatsächlich nur bei 1/3 liegt. Auch deshalb wird natürlich bei solchen Ergebnissen, bei einem positiven HIV-Test immer noch ein 2. Nachtest gemacht, um dieses Ergebnis zu verifizieren oder auch zu falsifizieren. Gut, das war die Übung zum Satz von Bayes, also wie berechnet man aus einer bedingten Wahrscheinlichkeit die andere, auch noch mal ein bisschen totale Wahrscheinlichkeit mit drin. Ich hoffe, ihr habt das so weit verstanden und sollte eigentlich auch kein Problem mehr für euch sein. Ja, das war's für diese Woche. Ich bedanke mich fürs Zuschauen und sage - bis zum nächsten Mal und tschüss!

Informationen zum Video
3 Kommentare
  1. 281

    Hallo Jona,

    ich finde deine Videos wirklich toll und in den meisten Fällen auch didaktisch wertvoll. Allerdings hätte ich mir bei diesem Übungsvideo (Satz von Bayes) gewünscht, dass die letztendliche Fragestellung früher klar formuliert wird, damit man zunächst selber probieren kann, ob man auf die Lösung kommt. So habe ich mir schon angeschaut, wie die einzelnen bedingten Wahrscheinlichkeiten berechnet werden und ich weiß nicht genau, ob ich selber drauf gekommen wär. Das ist aber nur ein winziges Problem, die Videos sind wirklich unglaublich gut. Vielen Dank also!

    Von Eve Horizone, vor etwa 4 Jahren
  2. Default

    Danke hast mir wirklich geholfen :D

    Von John John Mielck, vor mehr als 4 Jahren
  3. Default

    Ich weiß gar nicht warum die Bewertungen bisher so schlecht waren.
    Ich fand das Video wirklich sehr gut-vielen Dank-dickes Lob!

    Frohe Weihnachten!

    Von Yuffy3112, vor fast 5 Jahren