30 Tage risikofrei testen

Überzeugen Sie sich von der Qualität unserer Inhalte im Basis- oder Premium-Paket.

Überzeugen Sie sich von der Qualität unserer Inhalte.

30 Tage risikofrei testen

Was ist ein Lageparameter?

Die beschreibende Statistik beschäftigt sich mit der Erhebung sowie Darstellung von Daten.

Es gibt verschiedene statistische Kennwerte zur Erklärung oder Beschreibung von statistischen Daten:

Ein Lageparameter ist ein Kennwert dafür, in welchem Bereich die Daten sich befinden.

Stell dir vor: In einer Schulklasse werde alle Noten einer Klassenarbeit gesammelt. Zwei Schüler haben eine 1, drei eine 2, fünf eine 3, vier eine 4, 3 eine 5 und ein Schüler hat eine 6.

Diese Noten können auf viele Arten dargestellt werden, z.B. in Form einer Strichliste, als Notenspiegel, oder auch als ungeordneter oder geordneter Datensatz.

Am geordneten Datensatz können wir einiges erkennen:

$1;~1;~2;~2;~2;~3;~3;~3;~3;~3;~4;~4;~4;~4;~5;~5;~5;~6$

  • Das Minimum dieses Datensatzes ist der kleinste Wert, also $1$.
  • Das Maximum dieses Datensatzes ist der größte Wert, also $6$.
  • Die Spannweite dieses Datensatzes ist Maximum minus Minimum, hier also $6-1=5$.

Die nun folgenden Mittelwerte werden jetzt alle an diesem Datensatz erklärt.

Das arithmetische Mittel

Das arithmetische Mittel ($\bar x$) eines Datensatzes erhältst du, indem du alle Datenwerte addierst und die so erhaltene Summe durch die Anzahl der Daten dividierst:

$\quad~~\bar x=\frac{1+1+2+2+2+3+3+3+3+3+4+4+4+4+5+5+5+6}{18}=\frac{60}{18}=3,\bar 3$

Dies ist der Notendurchschnitt in der Klasse bei der Klassenarbeit.

Das arithmetische Mittel wird auch als Durchschnitt, empirischer Mittelwert oder arithmetischer Mittelwert bezeichnet.

Der Median

Der Median ($\tilde{x}$) ist der mittlere Datenwert des geordneten Datensatzes. Da die Noten bereits geordnet sind, schaust du dir denjenigen Datenwert an, der den Datensatz genau in zwei gleich große Teile aufteilt. Da es 18 verschiedene Noten, also eine gerade Zahl, gibt, liegen zwei Datenwerte in der Mitte. Daher bestimmst du das arithmetische Mittel dieser beiden Datenwerte:

$\quad~~\tilde{x}=\frac{3+3}2=\frac{6}2=3$

Mit Hilfe des Medians wird ein Datensatz in zwei gleich große Teile geteilt. Wenn diese Teile wieder durch den entsprechenden Median in gleich große Teile geteilt werden, erhält man Quartile.

Quartile teilen einen geordneten Datensatz also in vier gleich große Teile.

Der Modalwert

Der Modalwert oder auch Modus ($\tilde{x_d}$) ist derjenige Datenwert, der am häufigsten auftritt. Da die Note 3 fünfmal auftritt, alle anderen Noten aber weniger häufig, ist dies der Modalwert: $\tilde{{x}_{d}} =3$.

Vergleich der Mittelwerte

Du kannst an dem Beispiel mit den Noten in der Klassenarbeit erkennen, dass sowohl das arithmetische Mittel, der Median als auch der Modus recht nahe beieinander liegen. Dies ist nicht immer so.

Die Spannweite beträgt bei diesem Datensatz $5$, das heißt, dass die einzelnen Datenwerte recht nahe beieinander liegen. Wenn jedoch der Datensatz etwas weiter gestreut ist, kann es zu sehr verschiedenen Mittelwerten kommen. Hierfür schauen wir uns folgendes Beispiel an.

In einem Volkshochschulkurs Mathematik sitzen sieben Personen. Sie üben gerade Mittelwerte. Deshalb notieren sie das Alter der einzelnen Teilnehmer in einem geordneten Datensatz:

$22;~27;~32;~32;~32;~35;~72$

Das Minimum dieses Datensatzes ist $22$ und das Maximum $72$. Somit ist die Spannweite $72-22=50$. Diese ist recht groß. Nun können die einzelnen Mittelwerte berechnet werden:

  • Das arithmetische Mittel: $\bar x=\frac{22+27+32+32+32+35+72}{7}=36$. Du kannst hier schon erkennen, dass sechs der sieben Teilnehmer jünger sind als das arithmetische Mittel und nur einer älter. Dieses Mittel teilt den Datensatz nicht gleichmäßig. Das liegt an der großen Spannweite. Anders ausgedrückt: Bis auf eine Person sind alle Altersangaben recht nahe beieinander. Das Alter $72$ ist ein Ausreißer.
  • Der Median: $\tilde{x}=32$ Hier haben wir eine ungerade Anzahl an Daten, daher ist der Median genau der mittlere Datenwert im geordneten Datensatz. Er teilt den Datensatz gleichmäßig in zwei Hälften. Jedoch wird das Alter $72$ ebenso gewichtet wie zum Beispiel $32$.
  • Der Modus: $\tilde{{x}_{d}} =32$, dieser Wert kommt am häufigsten vor.

An dem Beispiel kannst du schon sehen, dass es Vor- und Nachteile der verschiedenen Lageparameter gibt. Um die Güte des Mittelwertes zu prüfen, verwendet man die Streuungsparameter. Mittels dieser Parameter kann man prüfen, wie weit die tatsächlichen Datenwerte um den Mittelwert streuen.

Welcher Mittelwert kann bei welchem Skalenniveau verwendet werden?

Es gibt verschiedene Skalen, in welchen Daten erhoben werden können:

Die Nominalskala

Die Nominalskala wird verwendet, wenn Daten beschrieben werden, wie zum Beispiel die Haarfarbe. In diesem Fall kann ausschließlich der Modus verwendet werden.

Die Ordinalskala

Die Ordinalskala wird verwendet, wenn etwas in verschiedene Klassen eingeteilt wird. Zum Beispiel Güteklasse $A$, $B$ oder $C$ für Obst. Auch hier kann der Modus verwendet werden. Da die Güteklassen geordnet werden können, kann auch der Median bestimmt werden.

Im eigentlichen Sinne sind auch Schulnoten ordinal skaliert. Nichtsdestotrotz rechnet man mit diesen üblicherweise wie mit ratio skalierten Daten.

Die Intervallskala

Die Intervallskala kann zum Beispiel bei Temperaturen verwendet werden. Hier werden nicht feste Temperaturen, sondern Temperaturen von ... bis ... angegeben. Ist ein Datensatz intervallskaliert, können alle drei genannten Mittelwerte verwendet werden.

Die Ratioskala

Die Ratioskala oder auch Verhältnisskala ist die Skala, die beim Sammeln von messbaren Daten, wie zum Beispiel Zeiten beim Laufen, Anzahl der Geschwister, Alter, ..., verwendet wird. Bei solchen Daten können ebenfalls alle drei genannten Mittelwerte berechnet werden.