Advent, Advent, 1 Monat weihnachtliche Laufzeit geschenkt.

Nicht bis zur Bescherung warten, Aktion nur gültig bis zum 18.12.2016!

Textversion des Videos

Transkript Statistik II - Video 36: Test einer Hypothese über den Mittelwert - Übung

Herzlich willkommen zusammen! Schön und vor allem wieder vernünftig, dass ihr dabei seid. Ja, womit beschäftigen wir uns heute? Es geht um den Test einer Nullhypothese über den Mittelwert. Wenn ihr jetzt hier dabei seid, habt ihr euch bestimmt auch schon das Theorievideo dazu angesehen. Und im Rahmen dieses Videos wollen wir uns das Ganze anhand eines Beispiels etwas genauer ansehen. Das heißt, was haben wir hier vorbereitet? Wir haben eine Aufgabenstellung, zu der wir folgende Sachen gegeben haben, das heißt folgendes Szenario: Wir überprüfen einfach die Verspätung der Bahn. Beziehungsweise Verspätung ist ein bisschen böse ausgedrückt, sagen wir Wartezeit. Die Wartezeit für eine Bahn sei normalverteilt, das ist gegeben, und die beträgt im Moment etwa 40 min. So, was machen wir jetzt, um zu testen, ob sie sich signifikant verringert hat, die Wartezeit, nachdem es grobe Umstrukturierungsmaßnahmen innerhalb des Konzerns gab? Das heißt, wir haben eine Stichprobe im Umfang von n=10. Der Stichprobenmittelwert beträgt 35, das heißt, im Mittel mussten die Personen 35 Minuten Wartezeit hinnehmen, bei einer Standardabweichung der Stichprobe von 10,5 Minuten. Das Ganze soll getestet werden zu einem Signifikanzniveau α=0,01, das ist ja unsere Irrtumswahrscheinlichkeit. Das heißt, wir testen hier etwas, aber wir können ja nie mit 100%iger Sicherheit sagen, ob unser Test greift, beziehungsweise was es dann letztendlich bedeutet. Aber wir können mit einer bestimmten Irrtumswahrscheinlichkeit sagen, ob sich was verändert hat oder eben nicht. Und genau das tun wir auch. Wir haben unsere Nullhypothese, die da lautet: Die Wartezeit μ ist ≥ einer bestimmten Wartezeit. Nun, jetzt müssen wir uns noch mal vor Augen führen, was wir genau untersuchen wollen. Die Frage lautet: Hat sich die Wartzeit signifikant verringert nach diesen Umstrukturierungsmaßnahmen? Was machen wir also? Die Nullhypothese, die wir hierzu aufstellen, also ich habe die jetzt unter gegeben hier notiert, aber häufig kommt es nun mal vor, dass man die auch selber aufstellen muss. Die Nullhypothese zu der Fragestellung, ob die Wartzeit sich signifikant verringert hat, lautet, wir überprüfen, sie hat sich vergrößert. Warum machen wir das? Nun, wenn wir widerlegen können im Rahmen dieses Tests, dass die Wartzeit sich vergrößert hat oder gleich geblieben ist (also ≥), dann können wir mit statistischer Sicherheit vom Gegenereignis 1-0,01 sagen, dass sie sich tatsächlich verringert hat, die Wartezeit. Ich hoffe, das hat euch jetzt nicht vollkommen verwirrt, aber diese Sachen müssen einem klar sein. Dass wir die Nullhypothese widerlegen wollen, das ist unser Ziel. Deswegen muss die Nullhypothese als Gegenereignis formuliert werden von dem, was wir eigentlich zeigen wollen. Gut, aber dazu haben wir das Beispiel, spätestens am Ende macht es bestimmt klick. Was haben wir? Nun, wir haben im Rahmen des Theorievideos unseren Entscheidungsbaum kennengelernt. Das heißt, hier ist das strategische Vorgehen auf den Punkt gebracht. Zunächst überprüfen wir, ob die Standardabweichung oder die Varianz der Grundgesamtheit gegeben ist. Kann auch ab und zu der Fall sein, ist hier nicht der Fall. Wir haben keinerlei Aussagen über die Grundgesamtheit außer, dass sie normalverteilt ist. Das heißt, das x, die Wartezeit, ist normalverteilt. Daraus folgt, dass auch unser Stichprobenmittelwert normalverteilt ist. Wenn es nicht mehr unbekannt ist, x normalverteilt, so lautet dann der nächste Schritt, dass diese Standardisierung hier, nämlich x-μ0 / unseren Schätzer für die Standardabweichung, dass diese studentverteilt ist; studentverteilt wie üblich mit n-1 Freiheitsgraden. Gut, was gilt es dann zu überprüfen? Wir müssen schauen, ist es jetzt mit Zurücklegen, ist es ohne Zurücklegen? Es ist einfach nur die Frage, können wir jetzt von einer unendlich großen Grundgesamtheit ausgehen oder nicht, also brauchen wir keine Endlichkeitskorrektur oder brauchen wir eine? Nun, wir gehen hier einfach davon aus n/N, also Stichprobenumfang / Grundgesamtheit, < 0,05. Das bedeutet einfach, wir hätten ein paar mehr Stichprobenelemente entnehmen können. Also wir haben eine richtig, richtig große Grundgesamtheit und können deswegen von dieser Formel ausgehen für den Schätzer der Standardabweichung. Also das heißt, was haben wir hier für Elemente? Die Formel kennen wir bereits. Wir haben hier unser S, das ist die Standardabweichung der Stichprobe, geteilt durch \sqrt(n-1). Und das ergibt unsere Schätzung für die Standardabweichung der Grundgesamtheit für den Stichprobenmittelwert. Der nächste Schritt ist, haben wir einen einseitigen oder einen zweiseitigen Test vorliegen? Was macht das für einen Unterschied? Nun, bei einem einseitigen Test haben wir eben nur eine Grenze. Beim zweiseitigen Test müssen wir schauen, weil unser Ergebnis ja letztendlich links irgendwo wegfallen kann (von euch aus gesehen rechts) oder eben auf der anderen Seite. Und bei einem einseitigen Test haben wir so gesehen nur eine untere oder eine obere Grenze, die über- oder unterschritten werden kann. In unserem Fall werden wir sagen unser μ ≥ μ0, das ist das, was wir testen. Dann haben wir so gesehen eine untere Grenze, die es zu testen gibt. Wenn diese untere Grenze überschritten ist, dann können wir das eben widerlegen. Das heißt, wir haben hier die untere Grenze = μ0-t×σx. Und das Ganze schauen wir jetzt uns in Form der Rechnung an. Wie ihr erkennen könnt, habe ich hier schon ein bisschen was vorbereitet. Und zwar, wie bereits im letzten Bild angedeutet, berechnen wir jetzt unser σ(Dach). Und zwar brauchen wir dafür die Standardabweichung der Stichprobe, die beträgt 10,5. Das ist unser S, was wir hier gegeben haben. Und was brauchen wir noch? \sqrt(n-1), also Stichprobenumfang - 1, die Wurzel daraus. Das heißt, wir haben 10-1, entspricht =9, und die \sqrt9=3. Das heißt, wir haben jetzt diesen Wert für die geschätzte Standardabweichung. Was machen wir damit? Die brauchen wir letztendlich für Grenze, die wir gleich aufstellen. Was brauchen wir dafür noch? Wir brauchen noch den t-Wert. Wir haben ja gesagt, das ist studentverteilt. Das heißt, was müssen wir machen? Studentverteilt mit 1-α; 1-α=1-0,01, unser Signifikanzniveau, das entspricht dann =0,99, und studentverteilt mit dem Freiheitsgrad n-1, das ist auch immer üblich so. Das heißt, bei uns entspricht das dem Wert 9. Das heißt, jetzt an dieser Stelle brauchen wir wieder unser Tabellenwerk. Das ist eben häufig am Ende gewisser Lehrbücher zu finden oder auch im Internet kriegt ihr das bestimmt. An der Stelle solltet ihr dann finden zum Signifikanzniveau, also zum 0,99, dem Wert, in Kombination mit der Zahl 9, findet ihr den Wert für t=2,8214. Die untere Grenze hatte ich im letzten Tafelbild euch aufgezeichnet. Die untere Grenze setzt sich zusammen aus unserem μ0; das ist unser μ0, das ist ja das, was wir überprüfen wollen. Von wegen, ist die Wartezeit jetzt tatsächlich geringer oder eben > 40 min? Das heißt, von dem Wert, von dem wir ausgehen, über den wir testen, ziehen wir eine gewisse sage ich mal Toleranz ab, das ist ja auch hier in Kombination nichts anderes als die Standardabweichung, multipliziert mit dem Wert t. Und wir bekommen den Wert 30,13 heraus. Wofür steht jetzt dieser Wert 30,13? Nun 30,13 ist die untere Grenze für unseren Test. Was testen wir jetzt? Die untere Grenze wird verglichen mit dem Wert, den wir herausbekommen haben in unserer Stichprobe mit unserem Stichprobenmittelwert. Das heißt, wie verhalten sich jetzt die 2 Variablen, hier unser Stichprobenmittelwert und unser Cu? Wir haben einen Stichprobenmittelwert von 35 und ein Cu von 30,13, eine untere Grenze. Das heißt, unser Stichprobenmittelwert liegt über der unteren Grenze, ist also größer als die untere Grenze. Und was heißt das jetzt? Wir wollten ja testen, ob unser μ über μ0 liegt. Und eine untere Grenze darf so gesehen nicht unterschritten werden. Diese Grenze wurde jetzt nicht unterschritten, sondern unser X(Dach) ist > unsere untere Grenze. Das heißt, es passt wunderbar in unseren Test. Denn wäre die untere Grenze von 30 min unterschritten worden, also hätten wir einen Stichprobenmittelwert von 28 min beispielsweise, dann untere Grenze unterschritten, wäre unsere Nullhypothese nichtig. Wäre! In unserem Fall ist es aber so, dass die Nullhypothese bestätigt wird. Wir wollten testen μ ≥ μ0, deswegen haben wir eine untere Grenze. Unser Wert 35 liegt über der Untergrenze, also an sich alles wunderbar. Die Nullhypothese wird nicht widerrufen. Wir können ja so gesehen keine Nullhypothesen bestätigen. Aber sie wird nicht widerrufen, nicht widerlegt, nicht verworfen, wie man es auch immer sehen will. Das heißt, wenn wir die Nullhypothese nicht verwerfen können, können wir auch nicht das Gegenteil bestätigen, und das war ja die Fragestellung. Die Fragestellung war ja: Hat sich die Wartezeit signifikant verringert? Hätten wir die Nullhypothese verworfen, hätten wir sagen können: Mit der und der Wahrscheinlichkeit zu unserem Signifikanzniveau hat sich die Wartezeit tatsächlich verringert. Da wir die Nullhypothese aber jetzt nicht verwerfen können, können wir auch nicht bestätigen, dass es sich verringert hat. Wir können aber auch nicht bestätigen, dass es sich tatsächlich vergrößert hat oder gleich geblieben ist. Das können wir auch nicht machen mit diesem Test. Wir können so gesehen mit diesem Ergebnis einfach nur sagen, die Nullhypothese wird nicht verworfen. Und somit können wir nicht bestätigen, dass sich die Wartezeit signifikant verringert hat. Und auf zum nächsten Beispiel. Hier geht es darum, dass behauptet wird, dass die Kinder im Haushalt eine gewisse Anzahl von Geschirrgegenständen im Monat zerstören. Und zwar wird behauptet, dass pro Monat 15 Geschirrgegenstände in einem Haushalt kaputt gehen aufgrund von Einflüssen von Kindern. Das gilt es nun zu überprüfen. Was haben wir hier gegeben? Wir haben gegeben: Erstens (sage ich jetzt so dazu, steht nicht da) ist diese Größe, die wir hier untersuchen, also die Anzahl der kaputten Gegenstände, normalverteilt. Das ist eine wichtige Information. Dann haben wir hier unser μ0=15. Das ist das, was wir behaupten wollen, also was wir beweisen wollen. Dann haben wir eine Standardabweichung von 2, also Standardabweichung der Grundgesamtheit. Wir haben einen Stichprobenumfang von n=49 gegeben. Dann haben wir einen Stichprobenmittelwert von 12. Das heißt, aus den 49 Familien, die wir getestet haben, ergeben sich 12 kaputte Gegenstände im Schnitt. Und wir haben ein Signifikanzniveau, zu dem wir testen wollen, von 0,05. Aus diesen Informationen und der Fragestellung können wir schon unsere Nullhypothese basteln, die da lautet: Es wird behauptet, dass die Anzahl an Gegenständen = 15 ist. Und wenn wir das widerlegen wollen, das sind so geliebte Spielchen bei den Fragestellungen, wenn das einer behauptet, dann gibt es diese Person oder die Tests, die diese Behauptung belegen wollen oder es gibt die Tests, die diese Behauptung widerlegen wollen, also von der Grundidee der Aufgabenstellung. Hier ist es so, das wird behauptet, und wir wollen das so gesehen widerlegen. Und wie können wir das widerlegen? Das können wir widerlegen, indem wir sagen, wir besetzen die Nullhypothese mit dieser Behauptung. Denn wenn wir dann diese Nullhypothese verwerfen können, also widerlegen können, dann haben wir das Gegenteil bewiesen. Dann haben wir bewiesen, dass es eben nicht 15 Gegenstände pro Monat sind. Das wollen wir beweisen. Also wir wollen beweisen, dass es eben nicht 15 Gegenstände sind, und deswegen stellen wir wieder die Nullhypothese über das Gegenereignis auf, nämlich, dass es genau 15 sind. Das heißt, wir erinnern uns an unseren Entscheidungsbaum. Welche Punkte gilt es hier abzuhaken? Zunächst σ, die Standardabweichung der Grundgesamtheit, ist bekannt. Das heißt, wir können bereits gewisse Aussagen über die Verteilung treffen. Denn wenn wir sagen, dass unser X der Grundgesamtheit normalverteilt ist und unser σ bekannt ist, können wir genauso gut sagen, dass unser Stichprobenmittelwert normalverteilt ist mit den entsprechenden Parametern μ und σX(Balken). Was gilt es dann zu überprüfen? Brauchen wir eine Endlichkeitskorrektur in unserer Formel oder nicht, müssen wir die beachten oder nicht? Nun, wir können auch hier wieder von einer recht großen Grundgesamtheit ausgehen. Häufig gibt es auch Beispiele, wo man diesen Bruch tatsächlich berechnen muss. Wenn keine näheren Angaben drin sind, wird irgendein gewisser Wortlaut in der Aufgabenstellung darauf hinweisen, dass es eine sehr große Grundgesamtheit ist oder einfach von einer unendlich großen eben ausgegangen werden kann, so wie hier auch. Ich habe jetzt nicht die Aufgabenstellung hier komplett, aber ich sage es euch dazu, sodass ihr diese Information habt. Das heißt, wir brauchen keine Endlichkeitskorrektur. Dementsprechend  lautet unsere Formel für die Standardabweichung des Stichprobenmittelwerts: Das ergibt sich aus der Standardabweichung der Grundgesamtheit, dividiert durch \sqrt(n). Dann, was gilt es als Nächstes zu betrachten? Einen zweiseitigen Test haben wir hier. Denn wenn wir zeigen wollen, dass μ tatsächlich μ0, also einem bestimmten Wert entspricht, kann diese Hypothese ja widerlegt werden, indem wir entweder jetzt überspitzt gesagt einen ganz kleinen Wert (von euch aus gesehen jetzt) haben, einen ganz kleinen Wert im Sinne von 1 oder 2 Gegenständen. Oder das Gegenteil, wir haben eine ganz große Anzahl an kaputten Gegenständen, weiß nicht, 120 oder so was. Das heißt, links und rechts von unserem zu überprüfenden Wert können diese Werte eben darauf hinweisen, dass die Nullhypothese widerlegt ist. Dementsprechend brauchen wir eine untere und eine obere Grenze, die es zu überprüfen gilt. Und die ergibt sich wie gehabt aus μ0 ± (je nachdem, ob jetzt obere oder untere Grenze) z × unser σX × die Standardabweichung vom Stichprobenmittelwert. z haben wir hier, das ist die Testgröße für unseren Tabellenwerkwert für standardnormalverteilte Zufallsvariablen. Naja und das haben wir hier oben ja gegeben, also kümmern wir uns um die Standardnormalverteilung, die es hier im Rahmen dann von z einzupflegen gilt. Und gleich geht es zur Rechnung weiter. So, dann lasst uns mal die Rechenschritte gemeinsam durchgehen. Zunächst, was wir berechnen müssen, ist die Standardabweichung vom Stichprobenmittelwert mit dieser Formel, die wir uns soeben erarbeitet haben. Also σ/\sqrt(n) ist in dem Fall die Standardabweichung der Grundgesamtheit von 2 / \sqrt(n), (/\sqrt49), entspricht dem Quotienten 2/7. Dann brauchen wir den z-Wert. Da hatten wir auch schon ein paar hilfreiche Videos glaube ich dazu. Was die Standardnormalverteilung, die Normalverteilung angeht, das gehört zu den ersten Videos dieser Veranstaltungsreihe. Da haben wir uns schon angeschaut, wie wir letztendlich von diesen Wahrscheinlichkeiten auf den entsprechenden z-Wert kommen. Nämlich diese Wahrscheinlichkeit von 0,975 ist direkt in der Tabelle enthalten, und wir müssen den Achsen dann den z-Wert entnehmen. Als Nächstes stellen wir Cu und Co auf, die untere und obere Grenze. Die Formel lautet ja wie folgt: μ0-z×σX(Balken)=15, das ist ja unser μ0, was wir behaupten, 15-1,06, den z-Wert, × unsere Standardabweichung von 2/7, die wir soeben oben berechnet haben, und das ergibt den Wert von 14.44. Parallel dazu berechnen wir die obere Grenze. Das ist dann μ0+z×σX(Balken), entspricht 15 + den gleichen Term wie soeben darüber, =15,56. Ihr merkt ja langsam bestimmt auch, dass man sich bei diesen Aufgabentypen ein bisschen gut Zeit sparen kann, da wir ja hier häufig eigentlich immer den gleichen Ausdruck stehen haben. Also von wegen der Ergebnisse, da lohnt es sich wahrscheinlich wirklich dann mal, einen Zwischenschritt zu machen, wenn wir dieses Ergebnis berechnet haben, mal separat zu notieren und bei der anderen Grenze wieder zu verwenden. Aber die Übung wird euch da bestimmt auch weiterhelfen, den einen oder anderen Clou noch herauszufinden. Was hilft uns das jetzt? Wir haben eine untere Grenze, wir haben eine obere Grenze, und es steht immer noch die Frage im Raum: Ist unsere Nullhypothese widerlegt oder nicht? Was müssen wir nun überprüfen? Nun, wir haben hier unsere Cu ≤ sollte das unserem μ0 sein, ≤ unserem Co. Also wenn unser μ0 von 15, Entschuldigung, jetzt sage ich schon 15, da liegt der Fehler jetzt. Das, was wir überprüfen wollen, muss natürlich in der Mitte liegen, und zwar das, was wir aus der Stichprobe entnommen haben. Das sind nämlich unsere 12, unser X(quer). Dieser Stichprobenmittelwert wird überprüft, ob er innerhalb dieser Grenzen liegt. Nun, tut er das? Können wir direkt mal nachprüfen. Wir haben hier 14,44 ≤ 12 ≤ 15,56. Naja und wir sehen, dass das eben Quatsch ist. Von daher sehen wir, dass unser Stichprobenmittelwert von 12, dass dieser über der Untergrenze liegt. Und damit ist unsere Nullhypothese eben nicht bestätigt, sondern diese ist zu verwerfen dann. Das heißt, unser Stichprobenmittelwert liegt unter der Untergrenze, die Nullhypothese wird verworfen: H0 zu verwerfen. Und was heißt das jetzt für unsere Fragestellung? Es war ja gefragt: Beträgt die gesuchte Größe von der Anzahl des kaputten Geschirrs genau 15? Und wir können sagen: Nein, sie beträgt nicht genau 15, nicht genau 15 zu dem Signifikanzniveau 0,05. Also habt ihr jetzt hier noch mal in aller Deutlichkeit die einzelnen Rechenschritte dazu, und somit haben wir die Nullhypothese verworfen. Ja, das war es jetzt hier von der Übung zum Test einer Hypothese über den Mittelwert. An sich ist das Vorgehen ja recht ähnlich. Und wenn ihr mit solchen Aufgaben zu tun habt, werdet ihr bestimmt auch noch das eine oder andere Video zum Test über Varianz oder Anteilswert brauchen. Schaut da auch mal rein, es hängt ja alles gut miteinander zusammen. Und vielleicht ergeben sich hier und da noch ein paar Zusammenhänge. Von daher viel Erfolg mit dem Gelernten und bleibt der Statistik treu!

Informationen zum Video
8 Kommentare
  1. Default

    Sehr hilfreiches Video! Großen Dank an Konrad!

    Von Dimput2, vor mehr als einem Jahr
  2. Susi

    Hallo,
    wir haben die Reihenfolge der Videos überarbeitet und korrigiert. Du kannst dir nun problemlos und übersichtlich ein Video nach dem anderen ansehen.

    Wir wünschen euch gutes Gelingen!

    Von Susann B., vor mehr als 3 Jahren
  3. Default

    Wo sind die Videos 35,36,38,39??? Warum auch so ein durcheinander in der Liste und dazu springt man bei eineigen Videos plötzlich in den Bereich Stochastik... Scheinbar besteht das Problem schon länger... Das passt nicht gerade zu dem sonst sehr professionellen Auftreten von sofatutor... Bitte reparieren oder Videos aus Stochastik einfach nochmal doppelt in Statistik II stellen, das Video "Statistik II Video 37" ist ja witzigerweise auch zwei mal vorhanden mit unterschiedlicher Laufzeit.
    Das alles trägt nicht gerade zur intuitiven, benutzerfreundlichen Bedienung bei.

    Von Cuibono, vor mehr als 3 Jahren
  4. Default

    Fehlen da nicht immer noch Videos?

    Von Elina Maria21, vor fast 4 Jahren
  5. Default

    Es fehlen immer noch die Videos! =(

    Von Menge Katharina, vor fast 4 Jahren
  1. Img 5225 web

    Hallo,

    da ist mir die liebe Redaktion schon zuvorgekommen...

    VG
    Konrad

    Von Dr. Konrad Hnatow, vor fast 5 Jahren
  2. Who is who 34

    Hallo,
    die fehlenden Videos befinden sich aktuell noch in der Produktion und werden nun Stück für Stück auf der Plattform zur Verfügung stehen.

    Von Sebastian W., vor fast 5 Jahren
  3. Default

    Hallo Konrad H.,
    ist es geplant, dass in der nächsten Zeit die noch fehlenden Videos kommen?

    Von Ms7777, vor fast 5 Jahren
Mehr Kommentare