Advent, Advent, 1 Monat weihnachtliche Laufzeit geschenkt.

Nicht bis zur Bescherung warten, Aktion nur gültig bis zum 18.12.2016!

Textversion des Videos

Transkript Statistik II - Video 28: Konfidenzintervalle für den Anteilswert

Herzlich willkommen zusammen! Wir fahren heute fort mit unserer Reihe über interessante Konfidenzintervalle. Heute geht es dabei um das Konfidenzintervall für den Anteilswert. Anteilswert, wissen wir, wird wann verwendet? Wenn wir eine dichotome Grundgesamtheit haben. Dichotome Grundgesamtheit bedeutet, wenn wir 2 mögliche Ereignisse in der Grundgesamtheit vorliegen haben, a oder b, richtig oder falsch, um nur einige Beispiele hier zu nennen. So, das heißt, wir bestimmen heute das Konfidenzintervall für den Anteilswert. Was können wir noch machen? Bereits kennengelernt haben wir Konfidenzintervalle für den Erwartungswert und darüber hinaus werden wir uns im nächsten Video noch anschauen, das Konfidenzintervall für die Varianz. Nun, was gibt es hier zu beachten, bei dem Konfidenzintervall für den Anteilswert? Je nachdem, ob wir eine näherungsweise normal verteilte Grundgesamtheit vorliegen haben, können wir sagen, dass die Wahrscheinlichkeit tatsächlich normal verteilt ist. Wenn wir aber bestimmte Gegebenheiten nicht erfüllt haben, müssen wir tatsächlich von einer F-Verteilung ausgehen, was das Ganze einen Ticken komplizierter macht, aber auch dieser Herausforderung werden wir uns heute stellen. Kommen wir nun zur Definition des Konfidenzintervalls für den Anteilswert, und zwar für den Anteilswert unter Verwendung der Normalverteilung. Unter welcher Voraussetzung können wir die Normalverteilung in diesem Fall annehmen? Nun, wenn diese Gleichung erfüllt ist. Das heißt, wenn dieses Produkt aus nΘ und im Gegenereignis 1-Θ, wenn dieses Produkt > 9 ist, können wir tatsächlich davon ausgehen, dass unser Wert hier P, unser Anteilswert, dass dieser annähernd normal verteilt ist, mit diesen Parametern, Erwartungswert und Varianz, die in diesem Falle sind: Erwartungswert entspricht dem Anteilswert, dem tatsächlichen Anteilswert, und die Varianz entspricht diesem Quotienten aus eben Θ×1-Θ, dividiert durch den Stichprobenumfang. So kommen wir auf die Parameter Erwartungswert und Varianz. Diese brauchen wir hier nun auch wieder, wenn wir das Konfidenzintervall tatsächlich aufstellen wollen. Das Konfidenzintervall hat die gleiche Form, wie alle Konfidenzintervalle. Wir haben als Grundgerüst gegeben, die Wahrscheinlichkeit dafür, dass der tatsächliche Anteilswert innerhalb dieser Grenzen liegt, diese Wahrscheinlichkeit ist 1-α. Nun, das heißt innerhalb dieser Grenzen, wir haben also eine Untergrenze und eine Obergrenze gegeben, die unterscheiden sich wie immer nur in der Form, dass wir hier ein - haben und hier ein +. Das heißt, wir haben hier unser P-z, den z-Wert, den wir wieder aus der Tabelle bekommen, multipliziert mit der Wurzel aus der Varianz, genau, multipliziert mit der Standardabweichung also. Ja, die einzig fehlende Information an dieser Stelle ist noch, dass dieses P hieraus resultiert, aus dem Quotienten x/n, nämlich Anzahl der Treffer ÷ die Höhe des Stichprobenumfangs. So kommen wir auf diese Wahrscheinlichkeit und wenn wir alle Werte zusammenhaben, können wir tatsächlich das Konfidenzintervall aufstellen, unter Verwendung der Normalverteilung, wenn genau diese Gleichung erfüllt ist. Weiterhin geht es um das Konfidenzintervall für den Anteilswert, allerdings haben wir hier ein 2. Szenario gegeben. An dieser Stelle ist es nämlich nicht möglich, die Binomialverteilung durch die Normalverteilung zu approximieren. Das heißt, wir haben dieses Produkt hier < 9, im Gegensatz zu zuvor, wo es ja > 9 war, das heißt, > 9 ist eine Approximation an die Normalverteilung möglich, in diesem Fall allerdings nicht. Wie verfahren wir hier? Wir verwenden die F-Verteilung. Wie sieht das aus? Wir haben abermals unsere untere Grenze und unsere obere Grenze für unser Konfidenzintervall, die sehen hier schon ein wenig komplexer aus, also, ich sage mal, was die Handlebarkeit der Aufgaben angeht, ist es an sich recht angenehm, wenn wir doch durch die Normalverteilung approximieren können. Naja, nichtsdestotrotz müssen wir auch hiermit zurechtkommen. Wie sieht das aus? Wir haben x, die Anzahl der Treffer, dividiert durch x+, in der Klammer steht hier n-x+1, multipliziert, ×F1. F1 ist ein Wert, den wir aus der Tabelle bekommen, genauso wie F2. F2 verwenden wir dann in der oberen Intervallgrenze, und zwar haben wir dann hier im Zähler stehen: (x+1)×F2, dividiert durch (x+1)×F2+n-x. Hier ist höchste Konzentration gefragt, weil man sich hier sehr schnell verrechnet. Verrechnet, was Falsches einsetzt, was Falsches abschreibt - also, da bitte wirklich schön aufpassen, was ihr da zusammenrechnet. Vor allem hier bei der Bestimmung der Werte F1 und F2 wird es noch ein wenig schwieriger. Also schwieriger im Sinne von, naja, man muss aufmerksam sein und sich konzentrieren darauf. Mag vielleicht alles ein wenig übertrieben klingen, was ich gerade erzähle, aber es kommt wirklich häufig zu Fehlern. Das heißt, wie bestimmen wir hier unser F1 und unser F2? Nun, wir haben F in Abhängigkeit von 3 verschiedenen Werten, diese ergeben sich in Abhängigkeit des Konfidenzniveaus: 1-(α/2), der nächste Wert ist 2n-2x+2 und der 3. Wert, den wir brachen, um F aus der Tabelle ablesen zu können, ist 2x. Für F2 gilt hier Folgendes: 1-(α/2) bleibt das 1., der 2. Wert verändert sich zu 2x+2 und der 3. dann: 2n-2x. Also hier aufpassen, wo die Strichpunkte tatsächlich die Grenzen ziehen. Das ist das Konfidenzintervall für den Anteilswert, wenn eine Approximation nur durch die F-Verteilung möglich ist, nicht durch die Normalverteilung. Und was noch wichtig ist, das ist die Beobachtung für ein 2-seitiges Intervall. Jetzt schauen wir uns gleich noch mal die Werte für ein 1-seitiges Konfidenzintervall an. Wie bereits vorgewarnt haben wir hier noch die Formel gegeben für das 1-seitige Konfidenzintervall. Und zwar weiterhin folgendes Szenario, dass wir nicht die Normalverteilung verwenden können, anstatt der Binomialverteilung, da dieses Produkt < 9 ist. Ein 1-seitiges Konfidenzintervall, bedeutet, wir haben eben einmal eine untere Grenze, die das Minimalste, was wir haben können an einem Anteilswert, Anteilswert 0, hat. Und im Gegenbeispiel den Anteilswert von 1. Das sind ja sowieso die 2 von Natur aus gegebenen Grenzen und nun können wir zu jedem dieser Intervalle, also links oder rechts, was wir uns gerade anschauen, den anderen Wert bestimmen. Dieser Anteilswert ergibt sich dann hieraus, aus (x+1)×F2 und das Ganze dividiert durch den gleichen Ausdruck, (x+1)×F2, und dann +n-x. Das ist dann so gesehen, wenn wir diese Untergrenze gegeben haben, haben wir diese Obergrenze, und die 2. Möglichkeit für ein 1-seitiges Intervall ist, dass wir eben die Obergrenze 1 haben und die Untergrenze gegeben durch x / x+ und jetzt den Ausdruck in Klammern, n-x+1, ×F1. Hierbei gilt es auch zu beachten, dass, wenn wir in einer Aufgabe beispielsweise die gleichen Angaben haben und einmal nach einem 1-seitigen Intervall und daraufhin nach einem 2-seitigen Intervall gefragt ist, wir wirklich darauf achten müssen, dass wir die Werte F1 und F2 tatsächlich auch neu berechnen, da wir hier andere Zahlen haben, andere Werte, die wir bekommen für F1 und F2. Also hier ist so gesehen F1 gegeben, durch abermals 3 verschiedene Parameter, der 1. ergibt sich aus 1-α, der 2. aus 2n-2x+2 und der 3. einfach aus 2x. F2 erhalten wir wiederum aus 1-α, dann den 2. Parameter 2x+2 und der 3. Teil 2n-2x. Also, darauf gilt es zu achten. Hier sind die Formeln für 1-seitige Konfidenzintervalle für den Anteilswert, und zwar unter der Voraussetzung, dass wir durch die F-Verteilung approximieren müssen. Das war's auch schon wieder von dieser Episode zu den Konfidenzintervallen. Wir haben heute das Konfidenzintervall für den Anteilswert bestimmt, unter 2 unterschiedlichen Voraussetzungen, nämlich einerseits, dass wir durch die Normalverteilung approximieren können, also die Binomialverteilung durch die Normalverteilung ersetzen können, und die andere Möglichkeit ist, dass diese Approximation an die Normalverteilung nicht möglich ist und wir stattdessen die F-Verteilung verwenden müssen. Die Binomialverteilung an sich wird hier überhaupt nicht in Betracht gezogen, weil es rein formal gar nicht möglich ist, das zu machen, sondern wir müssten das in einem iterativen Verfahren berechnen, anhand einer Simulation. Das heißt, wenn wir Anteilswert berechnen, werden wir dies immer nur aufgrund der Approximation durch die Normalverteilung oder durch die F-Verteilung machen. Ja, Beispiele dazu wird es noch geben, in einem extra Video, lohnt sich auf jeden Fall mal reinzuschauen, denn das sind die formalen Grundlagen, vielleicht hier und da ein bisschen unverständlich, so ist das, wenn man so etwas das erste Mal sieht, aber anhand von Beispielen lässt sich das wirklich ganz gut erläutern, wie wir das bereits Gelernte jetzt anwenden können. Ja, so viel dazu, zu den Anteilswerten, es gibt noch einen weiteren Parameter, über den wir ein Konfidenzintervall bestimmen wollen, und das ist die Varianz, das folgt dann im nächsten Video. Von daher wie immer viel Spaß mit dem Gelernten und bis gleich!

Informationen zum Video