30 Tage risikofrei testen

Überzeugen Sie sich von der Qualität unserer Inhalte im Basis- oder Premium-Paket.

Überzeugen Sie sich von der Qualität unserer Inhalte.

30 Tage risikofrei testen

Was ist eine Stichprobe?

In der beschreibende Statistik wird eine Teilmenge der untersuchten Grundmenge oder Gesamtheit als Stichprobe bezeichnet.

Wenn die Stichprobe genau so viele Elemente enthält wie die Grundmenge spricht man von einer Totalerhebung.

Um aus einer Stichprobe verlässliche Schlüsse auf die Grundgesamtheit ziehen zu können, muss die Stichprobe repräsentativ sein.

Dies kann man zum Beispiel erreichen, indem

  • zum einen der Stichprobenumfang groß genug gewählt und
  • zum anderen die Elemente der Stichprobe rein zufällig ausgewählt werden. Dies wird als Zufallsstichprobe bezeichnet.

Beispiel

Du möchtest gerne wissen, wie viele Menschen voller Freude an ihren Mathematik-Unterricht zurückdenken. Nun wirst du sicher nicht alle möglichen Menschen befragen (können!), sondern suchst einige Menschen aus. Dies ist dann die Stichprobe.

Vor- und Nachteile von Sitchproben

Im Rahmen einer statistischen Erhebung wird eine Stichprobe durchgeführt.

  • Da diese nur eine Teilmenge der Grundmenge ist, kann es zu Ungenauigkeiten kommen.
  • Dies lässt sich durch eine Totalerhebung vermeiden.
  • Ein Beispiel für eine solche Totalerhebung ist, im Idealfall, eine Volkszählung.
  • Stichproben sind allerdings weniger aufwändig und damit auch kostengünstiger als eine Totalerhebung.
  • Stichproben können durchaus auch zu genaueren Ergebnissen führen, da, zum Beispiel eine Befragung mit mehr Zeit durchgeführt werden kann.

Beispiel

Es soll ermittelt werden, wie viel Zeit ein Schüler des Abiturjahrgangs pro Woche mit Lernen verbringt. Hierfür wird ein Fragebogen erstellt und an eine Stichprobe von $30$ Schülern geschickt. Die Schüler sollen volle Stunden angeben. Dabei kommt es zu den folgenden Ergebnissen:

  • zehn Schüler geben an, eine Stunde pro Woche zu lernen,
  • vier Schüler sagen, dass sich zwei Stunden pro Woche lernen,
  • ein Schüler lernt drei Stunden,
  • fünf Schüler lernen jeweils vier Stunden,
  • sieben Schüler fünf Stunden und
  • drei Schüler sechs Stunden.

Diese Daten aus der Stichprobe können als geordneter Datensatz dargestellt werden. Zusätzlich sind hier noch die entsprechenden absoluten und relativen Häufigkeiten angeben.

3069_Stichproben.jpg

Es gibt verschiedene statistische Kennwerte zur Erklärung oder Beschreibung von diesen Daten:

  • Lageparameter, ein Kennwert dafür, in welchem Bereich die Daten sich befinden, und
  • Streuungsparameter, mittels welcher man prüfen kann, wie weit die tatsächlichen Datenwerte um den Mittelwert streuen.

Lageparameter

  • Das Minimum des obigen Datensatzes ist der kleinste Wert, also $1$ Stunde.
  • Das Maximum dieses Datensatzes ist der größte Wert, also $6$ Stunden.
  • Die Spannweite dieses Datensatzes ist Maximum minus Minimum, hier also $6-1=5$.

Den arithmetischen Mittelwert ($\bar x$) dieses Datensatzes erhältst du, indem du alle Datenwerte addierst und die so erhaltene Summe durch die Anzahl der Daten dividierst:

$\quad~~\bar x=\frac{10\cdot 1+4\cdot 2+1\cdot3+5\cdot 4+7\cdot 5+3\cdot 6}{30}=\frac{106}{30}=3,1\bar 3$

Das bedeutet, dass die Schüler des Abiturjahrganges im Schnitt etwas mehr als $3$ Stunden pro Woche lernen.

Der Median oder Zentralwert ($\tilde{x}$) ist der mittlere Datenwert des geordneten Datensatzes. Da die Anzahl in diesem Beispiel $30$, also gerade, ist, liegen zwei Datenwerte in der Mitte: $3$ und $4$. Daher bestimmst du den arithmetischen Mittelwert dieser beiden Datenwerte:

$\quad~~\tilde{x}=\frac{3+4}2=\frac{7}2=3,5$.

Streuungsparameter

Die Varianz $\sigma^2$ ist ein Maß für die Abweichung der Daten von einem Mittelwert. Gängigster Weise vom arithmetischen Mittelwert. Du kannst diese wie folgt berechnen:

  • Du multiplizierst jeweils die quadrierte Differenz der Stundenzahl und dem Mittelwert mit der zugehörigen relativen Häufigkeit.
  • Dann addierst du alle Produkte.

Dies siehst du hier am Beispiel des arithmetischen Mittelwert.

$\begin{array}{rcl}\sigma^2&=&(1-3,1\bar 3)^2\cdot\frac{10}{30}+(2-3,1\bar 3)^2\cdot\frac{4}{30}+(3-3,1\bar 3)^2\cdot\frac{1}{30}\\\ &&+(4-3,1\bar 3)^2\cdot\frac{5}{30}+(5-3,1\bar 3)^2\cdot\frac{7}{30}+(6-3,1\bar 3)^2\cdot\frac{3}{30}\\\ &=&3,44\bar8\end{array}$.

Die Standardabweichung $\sigma$ ist die Wurzel aus der Varianz

$\sigma=\pm\sqrt{3,44\bar8}\approx 1,857$.

Das bedeutet, dass die tatsächlich mit Lernen verbrachte Zeit um knapp zwei Stunden von dem arithmetischen Mittelwert abweicht.

Man würde angeben:

$\bar{x}\pm \sigma=3,1\bar 3\pm 1,857$

Damit sollte sich die tatsächlich durchschnittlich mit Lernen verbrachte Zeit in dem Fenster von $1,3$ bis $5$ Stunden bewegen.

Videos und Übungen in Stichproben

3 Videos

Arbeitsblätter zum Ausdrucken zum Thema Stichproben

007e089f0d40647d767bc14f66f714ee 1 Stichproben – Einführung Anzeigen Herunterladen
8f60b2c9e8dba9a630a26db027d15ef8 1 Stichproben – Übung Anzeigen Herunterladen