Advent, Advent, 1 Monat weihnachtliche Laufzeit geschenkt.

Nicht bis zur Bescherung warten, Aktion nur gültig bis zum 18.12.2016!

Textversion des Videos

Transkript Statistik II - Video 21: Schluss von der Stichprobe auf die Grundgesamheit

Herzlich willkommen zusammen! Schön, dass ihr auch dieses Mal wieder dabei seid. Es geht weiter mit der spannenden Welt der Statistik. Heute insbesondere geht es darum, dass wir sagen, wir ziehen letztendlich tatsächlich Rückschlüsse von der Stichprobe auf die Grundgesamtheit. Rückschlüsse, das ist sehr zaghaft ausgedrückt, im Endeffekt werden wir schätzen müssen. Und was für Probleme bei dem Schätzen aufkommen können, damit werden wir uns heute beschäftigen, und zwar indem wir diese zwei Methoden hier kennenlernen: einmal die Punktschätzung und einmal die Intervallschätzung. Nun, was haben wir gegeben? Wir haben das arithmetische Mittel der Stichprobe, das entspricht einer ZV, einer Zufallsvariable, diese Abkürzung sollte uns langsam geläufig sein. Und diese Zufallsvariable hat den Erwartungswert für das Stichprobenmittel =μ, und μ ist der Erwartungswert der Grundgesamtheit. Nun, wenn wir sagen, dass das arithmetische Mittel aus der Stichprobe den Erwartungswert μ der Grundgesamtheit hat, und wir jetzt soweit sind, dass wir sagen, wir wollen von der Stichprobe auf die Grundgesamtheit schließen, liegt es hier nahe, dass wir sagen: Der geschätzte Erwartungswert der Grundgesamtheit entspricht dem arithmetischen Mittel der Stichprobe. Also das ist jetzt so gesehen einfach die Punktschätzung umgedreht, dass wir sagen: Was erwarten wir denn letztendlich für die Grundgesamtheit, wenn wir die entsprechenden Parameter der Grundgesamtheit nicht gegeben haben? Nun, wir erwarten, dass der Parameter μ der Grundgesamtheit unserem arithmetischen Mittel aus der Stichprobe entspricht. Ja, an dieser Stelle ein recht mutiger Schritt. Bei der Punktschätzung, können wir uns vorstellen, ist die Wahrscheinlichkeit extrem gering, dass wir da richtig liegen. Also: Hier können wir davon ausgehen, dass es grundsätzlich falsch ist, aber es ist an dieser Stelle nun mal das Naheliegendste, was wir machen können. Eine Alternative zu der Punktschätzung bietet die Intervallschätzung. Wir werden uns das gleich grafisch noch ein wenig herleiten, nur zum Verständnis, was wir haben. Intervallschätzung, das heißt, wir haben hier in dieser Klammer das Intervall, das wir aufspannen, sprich, wir sagen: Unser arithmetisches Mittel ist verteilt zwischen den Grenzen Erwartungswert der Grundgesamtheit - den Parameter Z, lernen wir gleich noch kennen, × die Standardabweichung, und zwischen der zweiten Grenze, die einfach sagt, wir gehen von μ (unserem Erwartungswert) nach rechts. Also, damit ist das Intervall aufgespannt, und was haben wir jetzt für eine Aussage hier? Wir haben P, die Wahrscheinlichkeit dafür, dass unser arithmetisches Mittel x der Stichprobenfunktion innerhalb dieser Grenzen liegt. Das ist die Intervallschätzung, und zwar mit der Wahrscheinlichkeit 1-α. Das heißt, hier haben wir direkt auch eine Fehlerwahrscheinlichkeit 1-α mit eingegeben, weil wir nun sagen: Es ist und bleibt eine Schätzung, und da eine Schätzung falsch sein kann, haben wir hier eine entsprechende Wahrscheinlichkeit dafür, dass diese Schätzung tatsächlich falsch ist. Also, das sind die wichtigsten Punkte vorab, und gleich geht es ein wenig mehr ins Detail. Hier haben wir nun schrittweise die Herangehensweise dargestellt für den Schluss von der Stichprobe auf die Grundgesamtheit. Das heißt, was haben wir zunächst gegeben? Wir haben eine Grundgesamtheit gegeben, in der haben wir die Größe x, welche normal verteilt ist mit den Parametern Erwartungswert und Standardabweichung. Wenn wir von diesen Parametern ausgehen können für die Grundgesamtheit, ergibt sich für den Stichprobenmittelwert - das heißt dem, was wir aus der Grundgesamtheit entnehmen - die Verteilung des Stichprobenmittelwerts ergibt sich dann dementsprechend auch normal verteilt, mit den Parametern μ (Erwartungswert) und hier haben wir jetzt σ/n, das ist jetzt so gesehen der Schätzer für die Varianz der Grundgesamtheit. Also dieser Schritt, wie man von hier auf hier kommt, der ist bereits im Video 'Stichprobenfunktion' erklärt und hergeleitet worden, da könnt ihr gerne noch mal nachschauen, wenn ihr gerade nicht wisst, wie das zustande kommt. So, das heißt: Wenn wir davon ausgehen können, dass unser Stichprobenmittelwert normal verteilt ist, können wir nun hier auf die Punktschätzung übergehen, die Punktschätzung, wie wir darauf kommen, dass der Erwartungswert des Stichprobenmittelwerts exakt dem Erwartungswert der Grundgesamtheit entspricht. Das ist auch schon in dem Vorlesungsvideo 'Stichprobenfunktion' erklärt worden. Und wenn wir soweit sind, betrachten wir nun die Intervallschätzung, weil die Punktschätzung natürlich fehlerhaft ist. Also wenn wir mehrere Punktschätzungen vereinzelt machen, gleichen sich die Fehler mit der Zeit wieder aus, weil man sagt: Die Punktschätzung ist im Mittel richtig. Aber eben im Mittel, und das heißt, entweder alternativ oder ergänzend wird die Intervallschätzung angewendet, und die schaut dann folgendermaßen aus...das heißt zunächst interessiert uns noch, wo in etwa der Stichprobenmittelwert liegt, das heißt wir stellen hier ein Intervall auf mit der unteren Grenze und der oberen Grenze, jeweils um den Erwartungswert der Grundgesamtheit, -Z× σx quer; Z benutzen wir hier aus dem Tabellenwerk, und wir benutzen hier Z und keine andere Verteilung, weil Z die zuständige Variable ist für die Standardnormalverteilung. Das heißt, wir können mit einer Wahrscheinlichkeit P 1- α sagen, dass sich der Stichprobenmittelwert, den wir aus der Stichprobe entnehmen, innerhalb dieses Intervalls befindet. Gleich schauen wir uns das Ganze noch mal grafisch an, und vor allem den Schritt, wie wir dann tatsächlich von der Stichprobe auf die Grundgesamtheit schließen können. An dieser Stelle wandeln wir unseren theoretischen Ansatz der Intervallschätzung, wo unser Stichprobenmittelwert liegt, innerhalb welcher Grenzen, in einen Ansatz, in dem wir sagen: Wo liegt denn der Erwartungswert der Grundgesamtheit? So, das heißt, wir müssen uns erst noch mal klar werden: Was ist hier der Unterschied? Hier sagen wir, der Stichprobenmittelwert liegt zwischen zwei Grenzen. Diese zwei Grenzen sind allerdings fest, weil wir ja einen bestimmten Erwartungswert, einen bestimmten Mittelwert μ, derjenige, der dann die beiden Grenzen bestimmt, und...ja, wir können mit einer bestimmten Wahrscheinlichkeit sagen, wir groß der Stichprobenmittelwert innerhalb dieser Grenzen liegt. Schön und gut, was uns aber interessiert ist, wie wir von der Stichprobe auf die Grundgesamtheit schließen können. Und das ist das Ergebnis des nächsten Intervalls, dass wir nämlich sagen: Hier haben wir eine Wahrscheinlichkeit 1- α, mit der wir sagen können, dass der Erwartungswert der Grundgesamtheit zwischen diesen Grenzen liegt, und diese Grenzen bestimmen sich nun aus der gezogenen Stichprobe und daraus eben aus dem gezogenen Stichprobenmittelwert. So, das ist erst mal die Herangehensweise, warum wir das Ganze machen, und nun lasst uns das mal gemeinsam herleiten, dass ihr die einzelnen Schritte auch nachvollziehen könnt. Hier berechnen wir Ungleichungen, das heißt, wir haben bestimmte Rechenoperationen zur Verfügung, im Grunde genommen wie in der normalen Gleichung, die wir kennen, mit einem kleinen Unterschied: Dass sich, wenn wir mit -1 multiplizieren, das Ungleichzeichen dann einfach ändert - dazu gleich. Wie ist jetzt die Herangehensweise? Von hier nach hier ist es rein mathematisch, brauchen wir von statistischem Verständnis derzeit gar nichts. Was ist der erste Schritt? Im ersten Schritt subtrahieren wir den Mittelwert μ, das heißt wir haben hier den linken Teil μ-z×σx quer, -μ, bleibt nur noch der zweite Teil stehen. In der Mitte x quer, x quer-μ, und rechts verschwindet ebenfalls das μ. Das ist der erste Rechenschritt; der nächste Rechenschritt ist, dass wir den Stichprobenmittelwert subtrahieren aus der Ungleichung, das heißt vorne kommt er hin mit -x, der Rest wird einfach übernommen, hier aus der Mitte verschwindet er dementsprechend, und hier rechts kommt er ebenso hinzu, einfach Zσx quer -x. In welcher Reihenfolge wir das Ganze schreiben: egal. Das heißt, hier sind wir eigentlich schon fast fertig, das Einzige was uns jetzt hier noch stört, ist das negative Vorzeichen. Was machen wir deswegen? Wir multiplizieren die gesamte Gleichung mit -1. Und jetzt gehen die Alarmglocken an, dass sich, wenn wir eine Ungleichung mit -1 multiplizieren, die Richtung des Ungleichheitszeichens ändert. Hier ändern sich einfach die Vorzeichen, - wird +, - wird +, - wird +... + wird -, das ist, was sich an Vorzeichen ändert, und das Ungleichheitszeichen dreht sich um. Hier hatten wir < stehen, jetzt haben wir eben > stehen. Das einzige, was wir jetzt noch im letzten Schritt ändern, ist, dass wir die Ungleichung umdrehen, das heißt dass wir hier x quer -Zσx quer, dass wir das auf die linke Seite bringen, und die obere Grenze, wo wir sozusagen was hinzuaddieren zum Stichprobenmittelwert, dass die dann auf einmal rechts steht. Und das ist jetzt unsere vollkommene Intervallschätzung, das heißt, wir können nun anhand dieses Intervalls sagen: μ, der Mittelwert der Grundgesamtheit, liegt innerhalb dieser Intervallgrenzen, die sich aus der Stichprobe ergeben. Zum Abschluss haben wir noch mal beide Intervalle gegenübergestellt, um auch wirklich noch mal zu begreifen, was wir eigentlich vorliegen haben. Mit dem ersten Intervall, wo wir sagen, wie sind denn die Grenzen des Stichprobenmittelwerts, das heißt die untere und obere Grenze, wo unser Stichprobenmittelwert liegen kann mit der Wahrscheinlichkeit 1- α. Hier ist es wie gesagt so, dass μ unbekannt ist und damit aber trotzdem eine feste Größe, eine bestimmte Größe, die wir nur leider nicht kennen. Nichtsdestotrotz ist deswegen die Grenze an sich fest, und wir können keine weiteren Aussagen darüber treffen. Was wir aber gerade mathematisch hergeleitet haben, ist dieses Intervall, und dieses Intervall erlaubt uns den Schluss von der Stichprobe auf die Grundgesamtheit. Nämlich deswegen, weil wir sagen: Die untere und obere Grenze ergeben sich aus der Stichprobe und deswegen können wir sagen, mit einer bestimmten Wahrscheinlichkeit 1-α liegt der unbekannte Wert μ innerhalb dieser Grenzen. Soweit dazu. Dann noch ein paar Grundbegriffe, die wir hier eigentlich kennen müssen: Warum können wir hier jetzt Aussagen darüber treffen? Die untere und die obere Grenze sind Zufallsvariablen, weil sie sich aus der Stichprobe ergeben, und deswegen ist die Stichprobe hilfreich, um Schlüsse auf die Grundgesamtheit zu ziehen. Z× σx quer wird hierbei 'Schätzfehler' genannt. Nun, warum? Wir überlegen uns noch mal, was wir hier gerade gemacht haben. An sich sind wir gestartet in dieses Thema mit einer Punktschätzung, wer dazu noch ein bisschen Nachholbedarf hat, kann sich gerne mal die Vorlesung zur Stichprobenfunktion anschauen, da ist der Background nochmal gegeben. Von der Punktschätzung aus haben wir gesagt: Gut, die Punktschätzung ist nicht unbedingt richtig, das heißt, wir hätten gern eine Wahrscheinlichkeit dafür, wie richtig sie denn ist. Deswegen haben wir ein Intervall aufgespannt und gesagt: Die Punktschätzung für den Erwartungswert der Grundgesamtheit ist mit der Wahrscheinlichkeit 1-α zwischen den beiden Grenzen - und somit haben wir eine Wahrscheinlichkeit für den Fehler gegeben. Das war soweit die Basis des statistischen Testens. Das ist jetzt etwas theoretisch gewesen; anschaulicher, vor allem in Form von Beispielen, kommt es in den nächsten Vorlesungen, wenn es darum geht, Konfidenzintervalle zu berechnen. Das heißt an sich, das im Hinterkopf bewahren, sich die Vorlesung für 'Stichpunktfunktion' anschauen und die Übungen zu den Konfidenzintervallen. Von daher: viel Spaß mit dem Gelernten und bis später!

7 Kommentare
  1. Felix

    @Deciples: Die Nummerierung stimmt leider nicht. Video 20 gibt es nicht.

    Von Martin B., vor etwa einem Jahr
  2. Default

    Hallo! Wo ist Video 20 zu finden?

    Von Deciples, vor etwa einem Jahr
  3. Default

    trotz Sortierung sind die Videos nicht auffindbar, auf die sich der Tutor bezieht

    Von Pfadenhauer, vor mehr als 3 Jahren
  4. Susi

    Hallo,

    wir haben die Reihenfolge der Videos überarbeitet und korrigiert.
    Du kannst dir nun problemlos und übersichtlich ein Video nach dem anderen ansehen.

    Wir wünschen dir gutes Gelingen!

    Von Susann B., vor mehr als 3 Jahren
  5. Default

    Ja - Leider kann ich diese Videos auch nicht finden. Das Video 'Stichprobenfunktionen' wird zwar in diesem Video angesprochen, ist aber nicht auffindbar. :(

    Von Hestero, vor etwa 4 Jahren
  1. Default

    Hallo, das sind sehr gute hilfreiche Videos! Leider ist aber die Übersichtsseite noch sehr chaotisch, und die Videos sind nicht immer nachfolgend angeordnet. Gibt es zB ein Video Nr. 20 oder Nr. 19? Konnte ich nicht finde. Es wäre toll, wenn dieses Manko behoben werden könnte, so sind diese tollen Videos leider wenig nutzbar.

    Von Dan Berlin2003, vor etwa 4 Jahren
  2. Default

    Wo sind denn bitte die Videos zu F Verteilung und Stichprobenfunktionen - ich hab jetzt eine Ewigkeit gesucht und keine gefunden.

    Von Marcusr666, vor etwa 4 Jahren
Mehr Kommentare