Boxplot – Definition
Wenn du Median und Mittelwert bereits kennst, ist der Boxplot der nächste Schritt für eine aufschlussreiche Darstellung von Datensätzen und Messungen in der Mathematik bzw. Statistik.
Der Boxplot dient der Auswertung statistischer Daten. Durch den Median und zwei kleine Mediane, die sogenannten Quartile, wird eine Box definiert. Durch diese werden Datenpunkte übersichtlich gruppiert und ihre Verteilung verdeutlicht.
Boxplot – Erklärung
Boxplots werden genutzt, um Datensätze übersichtlich darzustellen. Dazu wird die Menge aller Datenpunkte in vier Bereiche eingeteilt. Die Verteilung der Daten auf die Bereiche wird so vorgenommen, dass in jedem der vier Bereiche gleich viele Datenpunkte liegen. Das geht so:
- Durch den Median werden die Daten in zwei Bereiche geteilt. Links und rechts des Medians liegen gleich viele Datenpunkte. Damit das klappt, muss es zwischen den Datenpunkten eine Rangfolge geben und die Daten müssen dementsprechend geordnet sein.
- Der Datenpunkt, der am weitesten links vom Median liegt, ist das Minimum. Der Datenpunkt, der am weitesten rechts vom Median liegt, ist das Maximum.
- Zwischen dem Minimum und dem Median liegt ein weiterer Median, der diese Hälfte des Datensatzes wiederum in zwei Bereiche unterteilt. Dieser kleine Median wird auch erstes Quartil genannt.
- Zwischen dem Median und dem Maximum liegt ebenfalls ein kleiner Median, das sogenannte dritte Quartil. (Das zweite Quartil ist gleichbedeutend mit dem ursprünglichen Median.)
- Durch das Minimum, die drei Quartile und das Maximum werden die Daten in vier Bereiche geteilt. In diesen vier Bereichen liegt jeweils eine gleich große Anzahl an Datenpunkten.
Der Bereich zwischen erstem und dritten Quartil wird durch eine Box umschlossen – das ist die Box des Boxplots. Der Abstand der Werte zwischen erstem und dritten Quartil wird auch Interquartilsabstand genannt. Dieser Abstand entspricht der Länge der Box. Vom linken und rechten Rand dieser Box werden Linien zum Minimum bzw. Maximum gezeichnet – das sind die Antennen der Box, auf Englisch auch Whiskers genannt. Der Boxplot wird auch Box-Whisker-Plot oder Kastengrafik genannt.
Wusstest du schon?
Der Boxplot wurde 1977 von dem Mathematiker John Tukey entwickelt. Tukey war bekannt für seine kreative Herangehensweise an Statistik. Er hat den Boxplot genutzt, um Daten übersichtlicher darzustellen. Also, jedes Mal, wenn du einen Boxplot zeichnest, folgst du in seinen Fußstapfen!
Boxplot – Diagramm
Um einen Boxplot zeichnen zu können, müssen also die Datenpunkte geordnet werden und Minimum, Maximum und Median der Daten bestimmt werden. Wenn dann noch die zwei kleinen Mediane bestimmt werden, sind alle Komponenten des beisammen.
Komponente |
Beschreibung |
Minimum |
Das ist der kleinste bzw. unterste Wert des Datensatzes. |
linke/untere Antenne (Whisker) |
Das ist der linke bzw. untere Bereich des Datensatzes. Er enthält das untere bzw. kleinere Viertel der Datenpunkte. |
erstes/unteres Quartil (kleiner Median) |
Das ist die Grenze zwischen dem linken bzw. unteren Bereich und der Box. |
zweites Quartil (Median) |
Das ist der Median des Datensatzes. |
drittes/oberes Quartil (kleiner Median) |
Das ist die Grenze zwischen der Box und dem rechten bzw. oberen Bereich. |
Box |
Das ist der Bereich zwischen dem ersten und dritten Quartil. Er enthält die Hälfte aller Datenpunkte. Da die Box durch die beiden Quartile links und rechts des Medians begrenzt wird, wird dieser Bereich auch Interquartilsabstand genannt. |
rechte/obere Antenne (Whisker) |
Das ist der rechte bzw. obere Bereich des Datensatzes. Er enthält das obere bzw. größere Viertel der Datenpunkte. |
Maximum |
Das ist der größte bzw. oberste Wert des Datensatzes. |
Sehen wir uns ein Beispiel eines Boxplots an:

Hier sehen wir einen Datensatz mit $19$ Datenpunkten, die verschiedene Werte zwischen $1$ und $100$ darstellen. Zwei Datenpunkte liegen genau auf den Grenzen der Box, also dem ersten und dritten Quartil. Der Median, also das zweite Quartil, liegt ebenfalls genau auf einem Datenpunkt – das muss nicht immer so sein, denn bei einer geraden Anzahl an Datenpunkten wäre der Median der Mittelwert der beiden mittleren Datenpunkte.
In der Box liegen genauso viele Datenpunkte wie innerhalb der beiden Antennen zusammen (Das stimmt nicht ganz, da die Anzahl der Datenpunkte ungerade ist.)
Aus der Größe und Lage der Box können wir auf die Verteilung der Datenpunkte schließen. Dazu kommen wir später noch im Detail.
Boxplot – Whiskers
Die Whiskers (Antennen) werden von den Enden der Box, also dem ersten bzw. dritten Quartil, bis zum Minimum bzw. Maximum gezeichnet. Ans Ende eines Whiskers wird ein vertikaler Strich gesetzt, um den jeweiligen Whisker klar abzugrenzen.
Boxplot – Ausreißer
Es gibt einen Sonderfall, in dem ein Whisker nicht genau bis zum Minimum bzw. Maximum verläuft: Wenn der Abstand eines Datenpunkts vom unteren oder oberen Quartil größer ist als das $1{,}5$-fache des Interquartilsabstands (also eineinhalb mal so lang wie die Länge der Box), dann ist in der Regel davon auszugehen, dass es sich um einen sogenannten Ausreißer handelt.
Ausreißer sind Messwerte, die deutlich außerhalb der übrigen oder der erwarteten Ergebnisse liegen und mit hoher Wahrscheinlichkeit auf einen Messfehler oder eine außergewöhnliche Störung der Messung zurückzuführen sind. Solche Werte werden bei der Auswertung einer Statistik üblicherweise nicht berücksichtigt.
Ausreißer sind sowohl nach links/unten (jenseits des ersten Quartils) als auch nach rechts/oben (jenseits des dritten Quartils) möglich.
Gibt es einen oder mehrere Datenpunkte, die hinsichtlich des Interquartilsabstands einen Ausreißer darstellen, wird der entsprechende Whisker nur bis zu einer Länge des $1{,}5$-fachen des Interquartilsabstands gezeichnet. In diesem Fall liegt also das Minimum (oder Maximum) nicht genau auf dem Ende des entsprechenden Whiskers.
Boxplot – Quartil
Der Median und die beiden kleinen Mediane werden als Quartile bezeichnet. Diese Bezeichnung bezieht sich darauf, dass die drei Quartile die Gesamtmenge aller Datenpunkte in vier Bereiche unterteilen.
Links bzw. unterhalb des ersten Quartils liegen die kleinsten bzw. untersten Werte des geordneten Datensatzes. Das sind die unteren $25\,\%$ aller Datenpunkte.
Rechts bzw. oberhalb des dritten Quartils liegen die größten bzw. obersten Werte des geordneten Datensatzes. Das sind die oberen $25\,\%$ aller Datenpunkte.
Die Box umschließt die mittleren $50\,\%$ des Datensatzes. Durch das zweite Quartil, also den Median, wird die Box in zwei Teile geteilt, in der wiederum jeweils $25\,\%$ aller Datenpunkte liegen.
Fehleralarm
Viele Schülerinnen und Schüler verwechseln den Median bei Boxplots mit dem Mittelwert. Der Median teilt die Stichprobe in zwei Hälften mit gleich vielen Datenpunkten, während der Mittelwert den Wert der Summe aller Datenpunkte geteilt durch ihre Anzahl darstellt.
Die Quartile teilen den Datensatz also in vier gleichgroße Bereiche hinsichtlich der Anzahl der Datenpunkte. Das bedeutet allerdings nicht, dass diese vier Bereiche auch die gleiche Länge haben. Denn je nachdem, wie die Daten verteilt sind, also wieviel Streuung es gibt, kann es sein, dass in einem Bereich viele Datenpunkte eng beieinander liegen oder die Datenpunkte über eine große Spanne von Werten gestreut sind.
Liegen viele Datenpunkte eng beieinander, ist der entsprechende Bereich eher schmal, liegen die Datenpunkte hingegen weit auseinander, wird der Bereich entsprechend größer.
So dient ein Boxplot hauptsächlich dazu, auf den ersten Blick erfassen zu können, wie die Datenpunkte verteilt bzw. wie stark sie gestreut sind und in welchen Bereichen die Datenpunkte besonders konzentriert sind.
Nur bei einer sehr gleichmäßigen Verteilung der Datenpunkte sind auch alle vier Bereiche nahezu gleich lang. Das heißt, die beiden Whiskers sind dann jeweils gleich lang und die Box bzw. der Interquartilsabstand ist so groß wie die beiden Whiskers zusammen.
Quartile sind Lagemaße, die einen Datensatz bzw. eine Verteilung in vier Bereiche teilen. Es sind auch andere Lagemaße denkbar, die einen Datensatz in fünf, zehn oder einhundert Bereiche teilen. Der Oberbegriff solcher Lagemaße lautet Quantile.
Quartile sind also auch Quantile: Das untere Quartil ist das $25\,\%$-Quantil, das obere Quartil ist das $75\,\%$-Quantil und der Median ist das $50\,\%$-Quantil.
Boxplot – Beispiel
Beschäftigen wir uns im Folgenden noch etwas genauer mit dem Boxplot, indem wir ein konkretes Beispiel betrachten:
Die Schülerinnen und Schüler einer Kampfkunstschule müssen mit einem Handkantenschlag möglichst viele Holzbretter auf einmal durchschlagen. Natürlich kann man dabei auch einmal Glück haben und ein paar morsche Bretter erwischen. Damit wirklich die beste Schülerin bzw. der beste Schüler ermittelt werden kann, soll eine möglichst konsistente, also beständige, Leistung erbracht werden. Dazu werden mehrere Versuche ausgewertet. Das geht mit einem Boxplot.
Boxplot zeichnen
Um selbst einen Boxplot zu zeichnen, brauchen wir zuerst einen Datensatz. Dann können wir die einzelnen Schritte durchgehen.
In unserem Beispiel der Kampfkunstschule beziehen sich die Daten auf die Anzahl durchgeschlagener Bretter einer einzelnen Schülerin bzw. eines einzelnen Schülers. Das könnte so aussehen:
Versuch Nr. |
Anzahl der durchgeschlagenen Bretter |
1. |
1 |
2. |
2 |
3. |
2 |
4. |
3 |
5. |
4 |
6. |
4 |
7. |
6 |
8. |
7 |
9. |
8 |
10. |
9 |
Wir haben hier die zehn Versuche der Schülerin bzw. des Schülers bereits nach der Anzahl der durchgeschlagenen Bretter sortiert und entsprechend durchnummeriert. Nur so können wir die Daten sinnvoll statistisch auswerten.
Schritt 1: Minimum und Maximum
Das Minimum ist $1$ und das Maximum ist $9$. Das bedeutet, es wurde pro Versuch mindestens $1$ Brett durchgeschlagen und maximal $9$. Damit haben wir bereits die beiden Endpunkte der Antennen (Whiskers).
Schritt 2: Quartile
Um den Boxplot erstellen zu können, müssen wir außerdem den Median und die kleinen Mediane bzw. die Quartile bestimmen. Diese Quartile nennen wir $Q1$, $Q2$ und $Q3$.
Der Median ist die Zahl in der Mitte des Datensatzes (bei einer ungeraden Anzahl) oder der Mittelwert der beiden Zahlen in der Mitte (bei einer geraden Anzahl).
In unserem Beispiel ist der Median $\left( Q2 \right)$ also $4$, denn das ist der Mittelwert des fünften und sechsten Datenpunktes.
Der Median der kleineren Hälfte der Daten, also das untere Quartil $Q1$, beträgt $2$, denn die Zahl $2$ liegt genau in der Mitte der unteren Hälfte des Datensatzes (also der unteren fünf Werte).
Das obere Quartil $Q3$ ist entsprechend $7$, denn dieser Wert liegt in der Mitte der oberen Hälfte des Datensatzes (also der oberen fünf Werte).
Schritt 3: Box und Antennen zeichnen
Jetzt können wir den Boxplot zeichnen. Über einem Zahlenstrahl, der alle auftretenden Werte einschließt, tragen wir zunächst das Minimum auf, also den kleinsten Wert $\left( 1 \right)$, und das Maximum, also den größten Wert $\left( 9 \right)$. Das sind die kurzen roten Linien in unserer Skizze:

Die namensgebende Box zeichnen wir zwischen den Quartilen $Q1$ und $Q3$ ein, deren Werte wir schon bestimmt haben.
In der Box sind die mittleren $50\,\%$ der Messwerte enthalten. Hier brauchen wir noch den Median. Dieser wird als vertikale Linie beim entsprechenden Wert $\left( 4 \right)$ eingezeichnet.
Anmerkung:
Es wäre genauso gut möglich, den Zahlenstrahl von unten nach oben aufzutragen, dann wären die Box und die Antennen entsprechen vertikal ausgerichtet und die Quartile würden wir als waagerechte Linien einzeichnen.
Schritt 4: Interquartilsabstand berechnen
Die Differenz zwischen dem oberen (rechten) und dem unteren (linken) Quartil ist der Interquartilsabstand $IQA$:
$IQA = Q3-Q1$
In unserem Beispiel beträgt der Interquartilsabstand $5$, denn es gilt:
$7-2=5$.
Boxplot interpretieren
Wir können den Boxplot nun nutzen, um einen Überblick über die Daten zu gewinnen. Die unterschiedlichen Komponenten und Bereiche der Kastengrafik ermöglichen dabei Aussagen zu verschiedenen Eigenschaften des Datensatzes.
- Die Länge der Box wird durch den Interquartilsabstand bestimmt, also die Differenz zwischen oberem und unterem Quartil. Sie liefert einen ersten Eindruck über die Streuung der Daten: Je schmaler die Box, desto weniger breit sind die Daten gestreut. In unserem Beispiel bedeutet das: Je schmaler die Box, desto konstanter ist die Leistung der Schülerin bzw. des Schülers.
- Der Median zeigt, ob die Daten symmetrisch streuen oder ob ihre Verteilung schief ist. Je weiter der Median von der Mitte der Box abweicht, desto schiefer ist die Verteilung. In unserem Beispiel gibt es eine leichte Tendenz zu weniger durchgeschlagenen Brettern, denn die Mitte der Box liegt bei $4{,}5$, der Median aber bei $4$.
-
Minimum und Maximum geben die maximale Spannweite der Daten an. Die außerhalb der Box liegenden Abschnitte (Antennen/Whiskers) haben je nach Boxplot eine unterschiedliche Definition. Manchmal umfassen sie nicht alle Daten, sondern sind so definiert, dass der Boxplot insgesamt nur $95\,\%$ der Daten enthält. Manchmal ist die Länge der Antennen auf das $1{,}5$-fache des Interquartilsabstands begrenzt. So sind im Boxplot Ausreißer leichter erkennbar. In unserem Beispiel gibt es jedoch keine solchen Ausreißer. Antennen und Box zusammen enthalten den gesamten Datensatz.
Die Tatsache, dass die Box insgesamt länger ist als die beiden Antennen zusammen, zeigt, dass die Verteilung der Datenpunkte nicht gleichmäßig ist. Stattdessen streut die mittlere Hälfte der Datenpunkte (die Daten in der Box) über einen relativ großen Bereich und es besteht eine leichte Tendenz zu niedrigeren Werten. Die Leistung dieser Schülerin bzw. dieses Schülers ist also weder gleichmäßig verteilt, noch relativ konstant (bzw. eng) um einen bestimmten Wert gruppiert. Es gibt eine Tendenz zu eher weniger durchgeschlagenen Brettern.
Wie gut die Leistung der Schülerin bzw. des Schülers letztendlich ist, hängt von den Erwartungen und den Vergleichswerten ab. Um die Leistung mehrerer Schülerinnen und Schüler miteinander vergleichen zu können, müssen Boxplots zu allen Datensätzen erstellt und miteinander verglichen werden.
Bei einem Gruppenvergleich sind Boxplots besonders nützlich, weil damit die relevanten Vergleichswerte schnell überblickt werden können. In unserem Beispiel würden wir insbesondere auf die Interquartilsabstände (also die Längen der Boxen der verschiedenen Schülerinnen und Schüler) achten und wie weit rechts sich der Median darin jeweils befindet.
Die beste Schülerin bzw. der beste Schüler ist die-/derjenige mit der geringsten Streuung um den höchsten Wert, also mit der schmalsten Box um den größten Median.
Boxplot – Aufgaben
Im Folgenden gehen wir drei Aufgaben zum Boxplot durch. Versuche erst selbst, die Aufgaben zu lösen und sieh dir dann die Lösungen an.

Die Abbildung zeigt einen Boxplot. Es ist dargestellt, wie viele Tore bei zehn Fußballspielen jeweils gefallen sind.
Bestimme die fünf Komponenten Minimum, Maximum, Median sowie linkes/unteres und rechtes/oberes Quartil und erkläre deren Bedeutung.
Das Minimum ist der kleinste Wert der Datenreihe. Das ist hier der Wert $1$. Das bedeutet, dass in keinem der zehn Spiele weniger als $1$ Tor gefallen ist.
Das Maximum ist der größte Wert der Datenreihe. Das ist hier der Wert $8$. Das bedeutet, dass in keinem der zehn Spiele mehr als $8$ Tore gefallen sind.
Der Median ist innerhalb der Box eingezeichnet. Er liegt hier beim Wert $5$. Das bedeutet, genau in der Mitte der Datenreihe liegt ein Spiel, bei dem $5$ Tore gefallen sind. Da es sich allerdings bei zehn Spielen um eine gerade Anzahl handelt, wurde hier offensichtlich ein Mittelwert aus den Spielen gebildet, die hinsichtlich der Anzahl der Tore an fünfter und sechster Stelle liegen – oder in beiden dieser Spiele sind jeweils genau $5$ Tore gefallen.
Das linke/untere Quartil ist das linke Ende der Box. Es liegt hier beim Wert $2$. Das bedeutet, dass in einem Viertel der Spiele entweder $1$ oder $2$ Tore gefallen sind, während in den restlichen drei Vierteln der Spiele $2$ oder mehr Tore gefallen sind.
Das rechte/obere Quartil ist das rechte Ende der Box. Es liegt hier beim Wert $6$. Das bedeutet, dass in einem Viertel der Spiele $6$, $7$ oder $8$ Tore gefallen sind, während in den restlichen drei Vierteln der Spiele $6$ oder weniger Tore gefallen sind.
Bestimme den Interquartilsabstand der obigen Verteilung und interpretiere die Länge und Lage der Box in der Abbildung.
Der Interquartilsabstand $\left( IQA \right)$ ist die Differenz aus oberem und unterem Quartil. Es gilt also:
$IQA = 6-2 = 4$
Der Interquartilsabstand entspricht der Länge der Box. Die Box ist damit etwas länger als die Summe der beiden Antennen. Das heißt, die mittleren $50\,\%$ der Datenpunkte sind etwas breiter gestreut als die $50\,\%$ an den Rändern der Verteilung.
Interessant ist außerdem, dass der Median $\left( =5 \right)$ etwas weiter rechts der Mitte der Verteilung liegt, aber der rechte Bereich der Box deutlich kleiner ist als der Bereich der Box links vom Median. Das bedeutet, dass in relativ vielen Spielen $5$ oder $6$ Tore gefallen sind, während die Spiele mit weniger Toren breiter gestreut sind.
Zeichne den Boxplot zum Datensatz [2, 4, 3, 2, 6, 3, 4, 7, 3, 5]. Die Daten stellen wieder die Anzahl der gefallenen Tore in zehn Fußballspielen dar.
Zuerst müssen die Daten in eine geordnete Reihenfolge gebracht werden, also nach der Anzahl gefallener Tore sortiert werden. Das sieht so aus:
1. |
2. |
3. |
4. |
5. |
6. |
7. |
8. |
9. |
10. |
2 |
2 |
2 |
3 |
3 |
4 |
4 |
5 |
6 |
7 |
Um den Boxplot zu zeichnen benötigen wir fünf Komponenten:
Das Minimum liegt beim Wert $2$. Es sind also pro Spiel mindestens $2$ Tore gefallen.
Das Maximum liegt beim Wert $7$. Es sind also pro Spiel höchstens $7$ Tore gefallen.
Der Median muss aus den Werten der Spiele an fünfter und sechster Stelle berechnet werden, da es sich insgesamt um eine gerade Anzahl an Spielen handelt. Der Median liegt demnach bei:
$3 + 4 : 2 = 3{,}5$.
Das linke/untere Quartil ist der Median der unteren fünf Spiele. Das ist der Wert $2$, da im Spiel an dritter Stelle $2$ Tore gefallen sind.
Das rechte/obere Quartil ist der Median der oberen fünf Spiele. Das ist der Wert $5$, da im Spiel an achter Stelle $5$ Tore gefallen sind.
Mit diesen Punkten können wir den Boxplot zeichnen:

Der Interquartilsabstand beträgt $5 - 2 = 3$. Das heißt, die Box hat eine Länge von $3$. Die linke Antenne ist nicht zu sehen, da bei allen Spielen im unteren Viertel der Verteilung genau $2$ Tore gefallen sind. In diesem Bereich gibt es also keine Streuung.
Die rechte Antenne hat eine Länge von $2$. Auf der rechten Seite des Medians ist die Streuung also deutlich größer als links vom Median. In diesem Fall bedeutet das, dass in der Hälfte aller Spiele $2$ oder $3$ Tore gefallen sind, während die Ergebnisse der anderen Hälfte der Spiele breiter gestreut sind.
Das können wir natürlich auch direkt aus dem Datensatz ablesen. Insbesondere bei größeren Datenmengen ist der Boxplot allerdings deutlich übersichtlicher.
Ausblick – das lernst du nach Boxplots
Deine nächste Herausforderung ist die Durchführung von Hypothesentests. Lerne die Bedeutung des Signifikanzniveaus kennen und sieh dir an, wie man einen Signifikanztest durchführt. Erweitere dein Wissen in der Statistik!
Zusammenfassung – Boxplot
- Ein Boxplot ist eine bestimmte Darstellungsweise eines statistischen Datensatzes, der die Auswertung und Einordnung vorsortierter Datenpunkte vereinfacht.
- Durch fünf Komponenten wird ein Boxplot bestimmt: Minimum und Maximum, Median sowie zwei kleine Mediane, die sogenannten Quartile.
- Durch die fünf Komponenten wird der Datensatz in vier Bereiche geteilt, die jeweils $25\,\%$ der Datenpunkte enthalten.
- Die beiden mittleren Bereiche bilden die Box. Die beiden äußeren Bereiche werden durch die Antennen (Whiskers) gekennzeichnet.
Häufig gestellte Fragen zum Thema Boxplot
Ein Boxplot ist eine Darstellungsweise statistischer Daten. Ein Boxplot vereinfacht die Auswertung und Interpretation eines Datensatzes. So können unter anderem der Median, die Quartile, das Minimum und das Maximum der Datenpunkte abgelesen werden. Insbesondere die Streuung der Datenpunkte lässt sich anhand der Antennen (Whiskers) und des Interquartilsabstands relativ leicht einschätzen.
Was sagt der Boxplot aus?
Das hängt natürlich von den Datenpunkten ab, die im Boxplot enthalten sind. Ein Boxplot kann verschiedene Formen annehmen. Allgemein gesehen kann ein Boxplot schnell einen Eindruck darüber vermitteln, in welchem Bereich die untersuchten Daten liegen und wie sie sich über diesen verteilen, also gestreut sind.
Wie berechnet man den Boxplot?
Um einen Boxplot zu zeichnen, müssen zunächst die Datenpunkte des Datensatzes geordnet, also in eine Rangfolge gebracht werden. Aus der Datenreihe sind dann fünf Komponenten herauszulesen bzw. zu berechnen: das Minimum, das Maximum, der Median und das linke/untere Quartil sowie das rechte/obere Quartil. Aus diesen Quartilen $Q1$ und $Q3$ kann dann der Interquartilsabstand $\left( IQA \right)$ berechnet werden:
$IQA = Q3 - Q1$
Der Interquartilsabstand beschreibt die Länge der Box. Die Antennen (Whiskers) reichen vom linken bzw. rechten Ende der Box bis zum Minimum bzw. Maximum.
Für was braucht man einen Boxplot?
Der Boxplot stellt die Lage und Streuung von Datenpunkten dar. Er macht auch die Schiefe und eventuelle Ausreißer sichtbar. Für Gruppenvergleiche ist der Boxplot besonders nützlich, denn entsprechende Unterschiede sind relativ leicht auf den ersten Blick zu erkennen und zu interpretieren.
Wie rechnet man das 1. Quartil aus?
Um ein Quartil zu bestimmen, müssen die Daten zunächst sortiert, also in eine Rangfolge gebracht werden. Üblicherweise vom kleinsten Wert links bzw. unten zum größten Wert rechts bzw. oben. Das 1. Quartil ist dann der Median der ersten Hälfte des Datensatzes, also der Datenpunkt, der in der Mitte der ersten Hälfte des Datensatzes liegt. Liegen zwei Werte in der Mitte (weil es eine gerade Anzahl an Datenpunkten gibt), muss der Mittelwert dieser zwei Werte berechnet werden, um den korrekten Median zu erhalten.
Was ist das obere und untere Quartil?
Durch den Median wird ein geordneter Datensatz in zwei gleich große Mengen von Datenpunkten geteilt. Diese beiden Mengen können nun ebenfalls durch weitere, sogenannte kleine Mediane in zwei Hälften geteilt werden.
Der kleine Median der ersten Hälfte des Datensatzes ist das 1. Quartil, auch unteres Quartil genannt.
Der kleine Median der zweiten Hälfte des Datensatzes ist das 3. Quartil, auch oberes Quartil genannt.
Das 2. Quartil ist der Median des gesamten Datensatzes. Durch die drei Quartile wird der gesamte Datensatz in vier Bereiche unterteilt. In den Bereichen befinden sich jeweils $25\,\%$ aller Datenpunkte, die vier Bereiche sind also gemessen an der Anzahl an Datenpunkten allesamt gleich groß. Sie können sich allerdings hinsichtlich der Streuung der Datenpunkte unterscheiden.
Im Boxplot werden die Bereiche unterhalb des unteren Quartils und oberhalb des oberen Quartils als Antennen (Whiskers) dargestellt. Die beiden mittleren Bereiche (links und rechts des Medians) bilden die Box.
Was ist der Unterschied zwischen Quartilen und Quantilen?
Quantil ist der Oberbegriff für bestimmte Punkte (Lagemaße) einer Verteilung. Der Median und die Quartile sind allesamt Quantile. Die Quartile sind spezielle Quantile, die einen Datensatz in vier Bereiche teilen – daher kommt die Bezeichnung Quartil.