Was sind Quartile?

Quartile gehören zu den Lageparametern in der beschreibenden Statistik. Aus dem Lateinischen übersetzt bedeutet “Quartil” “Viertelwert” und ist ein Lagemaß für statistische Daten. Der Median ist das mittlere Quartil oder auch das 2. Quartil $\text{Q}_2$. Der Median teilt einen geordneten Datensatz in zwei gleich große Teile.

Der untere der beiden durch den Median getrennten Teile wird durch das untere Quartil, das 1. Quartil $\text{Q}_1$, und der obere durch das obere Quartil, das 3. Quartil $\text{Q}_3$, wiederum in gleich große Teile geteilt.

Die Quartile teilen einen geordneten Datensatz z. B. von Stichproben also in vier gleich große Teile.

Wie werden die Quartile bestimmt?

Um die Quartile bestimmen zu können, muss zunächst ein gegebener Datensatz der Größe nach sortiert werden.

Stelle dir zum Beispiel vor, dass bei einem Sportfest die Sprungweiten der einzelnen Schüler gemessen und notiert werden (alle Angaben in Zentimetern):

$435;~420;~485;~440;~490;~430;~425;~510;~500;~480;~460$

Der geordnete Datensatz sieht dann so aus:

$420;~425;~430;~435;~440;~460;~480;~485;~490;~500;~510$

Diese Daten können auf einem Zahlenstrahl dargestellt werden. Der kleinste Wert, $420$, wird als Minimum und der größte, $510$, als Maximum bezeichnet. Die Differenz zwischen Minimum und Maximum, $510-420=90$, wird Spannweite genannt.

Das mittlere Quartil, der Median, befindet sich genau in der Mitte des geordneten Datensatzes. Da die Anzahl der Sprungweiten, $11$, ungerade ist, ist dies die sechste Position: Das mittlere Quartil ist $\text{Q}_2=460$.

Die untere der durch den Median geteilten Hälften lautet dann:

$420;~425;~430;~435;~440$

Die obere Hälfte sieht so aus:

$480;~485;~490;~500;~510$

Von beiden Hälften wird wieder der mittlere Wert ermittelt: Da beide Hälften wieder eine ungerade Anzahl an Werten enthält, nämlich jeweils $5$, liegt die Mitte beim jeweils 3. Wert. Der mittlere Wert der unteren Hälfte, $\text{Q}_1=430$, ist das untere Quartil und der der oberen Hälfte, $\text{Q}_3=490$, das obere Quartil.

1199_2.jpg

Wie werden Boxplots erstellt und interpretiert?

Ein Boxplot, auch Box-Whisker-Plot oder Kastengrafik genannt, besteht aus einem Rechteck (der Box), welches sich von dem unteren Quartil $\text{Q}_1$ bis zum oberen Quartil $\text{Q}_3$ erstreckt. Diese Box ist mit Linien, sogenannten Whiskern oder auch Antennen, nach links mit dem Minimum und nach rechts mit dem Maximum verbunden.

1199_2.jpg

$~$

Der Vorteil von Boxplots besteht darin, dass sie einen schnellen Überblick über Daten ermöglichen. Dabei gibt die Box einen Bereich an, in dem sich etwa die Hälfte der Daten befindet.

  • Die Größe der Box ist ein Maß für die Streuung der Daten. Ist die Box sehr breit, so liegt die mittlere Hälfte der Daten, also die Daten zwischen $\text{Q}_1$ und $\text{Q}_3$, weiter gestreut vom Median als bei einer kurzen Box.
  • Je nachdem wo der Median innerhalb der Box liegt, lässt sich sofort ablesen, ob die mittlere Hälfte der Daten eher unterhalb, oberhalb oder gleichermaßen verteilt vom Median liegt.
  • Je länger die Whisker, also die Antennen, bei einer gleich großen Box sind, desto größer ist die Spannweite des Datensatzes.