Textversion des Videos

Transkript Statistik II - Video 30: Konfidenzintervalle für die Varianz

Herzlich willkommen zusammen, schön euch zu sehen! Wir beschäftigen uns heute zum letzten Mal mit den Konfidenzintervallen, also zumindest mit der formalen Definition der Konfidenzintervalle, denn sie werden uns auch weiterhin in den Prüf- und Testverfahren begleiten. Heute geht es darum, dass wir das Konfidenzintervall für die Varianz bestimmen. Das ist noch einer dieser Parameter, die uns übrig geblieben sind. Wir haben bereits Konfidenzintervalle bestimmt für was? Wer hat aufmerksam zugeschaut? Für den Erwartungswert, den Anteilswert - und nun bestimmen wir das Gleiche für die Varianz. Des Weiteren, ja, gibt es was zu sagen. Es ist wiederum die Sache, dass wir ein einseitiges und ein zweiseitiges Intervall haben, was Konfidenzintervalle nun mal an Eigenschaften so mit sich bringen. Wir werden jetzt die Formaldefinition lernen und dann in den Übungsvideos entsprechend die Anwendung probieren. Kommen wir nun zur Konstruktion des Konfidenzintervalls für die Varianz. Hier haben wir nur ein Problem. Auch wenn uns bekannt ist, dass die Grundgesamtheit beispielsweise näherungsweise normalverteilt ist, können wir noch keine Aussage treffen, über die Verteilung der Stichprobenvarianz. Also, was machen wir? Wir bilden diese Größe, denn so können wir Aussagen über die Verteilung treffen. Warum können wir das? Diese Größe ist Chi-Quadrat-verteilt. Wir erinnern uns, was bedeutet die Chi-Quadrat-Verteilung, wie ergibt sie sich? Nun, die Chi-Quadrat-Verteilung ergibt sich aus der Summe von Quadraten von unabhängig und standardisierten Zufallsgrößen. Das ist so gesehen die Definition der Chi-Quadrat-Verteilung und genau diesen Aspekt dieses Terms machen wir uns zunutze. Denn die Varianz, wie wir hier sehen, ist eine Summe von quadrierten Zufallsgrößen. Und so können wir dann diesen Quotienten bilden und sagen, dass dieser Chi-Quadrat-verteilt ist, mit dem Parameter n-1. Soviel zur Konstruktion an sich. Das heißt, diese Größe müssen wir uns merken, das ist eine Hilfsgröße, die wir hier verwenden, um das Konfidenzintervall tatsächlich konstruieren zu können. Das ergibt sich dann quasi aus dem Produkt des Stichprobenumfangs und der Stichprobenvarianz, dividiert durch eine weitere Chi-Quadrat-verteilte Größe, die wir hier rausbekommen. Diesen Wert bekommen wir, wie die üblichen Werte, auch aus einem Tabellenwerk, in diesem Fall Tabellenwerk für die Chi-Quadrat-Verteilung mit den Parametern 1-(α/2), das ist das Konfidenzniveau, das wir uns anschauen, das müssen wir auch dann in der Tabelle entsprechend raussuchen, mit dem 2. Parameter n-1. Ja, dann hatten wir die untere Größe berechnet. Wie kommen wir jetzt auf die obere Größe? Wie man sieht, wenig Unterschied. Der einzige Unterschied ist die Chi-Quadrat-verteilte Größe im Nenner. Und zwar ist hier bitte besonders darauf zu achten: Für die untere Grenze brauchen wir den oberen Wert der Chi-Quadrat-Größe und für die obere Grenze den unteren Wert. Das ist also hier kein Fehler und wird auch in der Praxis bei den Berechnungen der Aufgaben gerne falsch gemacht. Das heißt, hier haben wir dann einen Unterschied. Der einzige Unterschied ergibt sich aus der Wahrscheinlichkeit durch 1-(α/2) und das andere Mal durch α/2. Ja, mit diesen Werten und diesem Trick über die Chi-Quadrat-Verteilung hätten wir auch schon das zweiseitige Konfidenzintervall für die Varianz bestimmt. Jetzt fehlt uns nur noch das einseitige. Hier sehen wir das Konstrukt zur Bildung des einseitigen Konfidenzintervalls für die Varianz. Das heißt, wir haben hier wieder die Ausgangsstellung, wie man sie hat bei einseitigen Konfidenzintervallen. Und zwar, dass n wieder die eine Grenze als fix angesehen wird, als das Maximale oder das Minimale, was die Dichtefunktion der jeweiligen Verteilung zulässt. Das heißt, wir haben einmal als Untergrenze der Chi-Quadrat-Verteilung die 0, als Obergrenze der Chi-Quadrat-Verteilung haben wir ∞. So, dann brauchen wir nur jeweils die andere Grenze zu bestimmen. Diese ergibt sich wie gehabt, dass wir sagen: Die Obergrenze ergibt sich aus n×S2 durch die Zufallsgröße χ2u. Diese ergibt sich dann nicht, wie zuvor gehabt, aus α/2, sondern wir müssen ja schauen, dass die komplette Gegenwahrscheinlichkeit, die Wahrscheinlichkeit, dass unser gesuchter Parameter außerhalb unseres Intervalls liegt, ist ja nicht mehr auf 2 Bereiche aufgeteilt und damit auf α/2, sondern das fällt nur noch auf einen Bereich und dementsprechend haben wir hier nur α. Ja, für die zweite Möglichkeit, das sind ja immer zwei unterschiedliche Aufgabentypen, die zweite Möglichkeit, dass wir sagen, wir wollen die Untergrenze bestimmen für unseren Parameter, nehmen wir als Obergrenze ∞ an und als Untergrenze abermals (n×S2)/χ2. Nur hier wieder drauf achten: χ2o für oben. Nicht wundern: Untergrenze, aber Chi-Quadrat oben - immer merken und, naja klar, bitte nicht falsch machen! Diese Chi-Quadrat-Größe ergibt sich abermals aus dem Tabellenwerk mit 1-α, mit dieser Wahrscheinlichkeit und dem Freiheitsgrad n-1. So, das Ganze habt ihr jetzt hier formal kennengelernt, bitte alles schön notieren, in eure Formelsammlung, und dann werden wir das alles zu gegebener Zeit ordentlich anwenden können.  

Informationen zum Video