Boxplots
Boxplots
Beschreibung Boxplots
Nach dem Schauen dieses Videos wirst du in der Lage sein, Boxplots zu zeichnen.
Zunächst lernst du, deine Daten auf einem Zahlenstrahl einzutragen und zu Ordnen. Anschließend lernst du die Kennwerte zu bestimmen (Minimum, Maximum, Median, 1. und 3. Quartil). Abschließend lernst du, anhand der Kennwerte einen Box Plot zu zeichnen und den Interquartilsabstand zu bestimmen.
Lerne etwas über das Erstellen von Boxplots durch das Auswerten der Leistung der Kampfsportschüler.
Das Video beinhaltet Schlüsselbegriffe, Bezeichnungen und Fachbegriffe wie Sortieren, Ordnen, Kennwerte, Minimum, Maximum, Median, 1. Quartil, 3. Quartil, Interquartilsabstand, Antennen, Datenpunkte, Datensatz, Variation.
Bevor du dieses Video schaust, solltest du bereits wissen, welche Kennwerte es gibt und wie man selbige bestimmt. Auch das Eintragen von Daten auf dem Zahlenstrahl sollte dir bekannt sein.
Nach diesem Video wirst du darauf vorbereitet sein, Boxplots und andere statistische Daten auswerten zu lernen.
Transkript Boxplots
Hoch im Gebirge am Faustfußpfad 5 liegt eine Kampfkunstschule, die sich auf das Zerschlagen von Holzbrettern spezialisiert hat. Alle Schüler müssen mit einem Hieb so viele Bretter wie möglich zerschlagen. Die Schüler notieren ihre Ergebnisse und zeigen sie am Ende der Woche ihrem Meister. Der Schüler mit den besten und beständigsten Leistungen muss eine Woche lang keinen Putzdienst verrichten. Aber wie kann der Meister bestimmen, wessen Leistungen am beständigsten waren? Natürlich indem er einen Box Plot verwendet. Um die Ergebnisse der Schüler in einen Box Plot eintragen zu können, müssen sie sortiert sein. Schüler Nummer 1 muss das noch erledigen. Nachdem wir die Ergebnisse geordnet haben, müssen wir 5 Kennwerte herausfinden: das Minimum, das 1. Quartil, auch Q1 genannt, den Median, das 3. Quartil, auch Q3 genannt, und das Maximum. Den Anweisungen seines Meisters folgend ordnet Schüler Nummer 1 seine Ergebnisse. Das Minimum, also die kleinste Zahl, für Schüler Nummer 1 ist die 1. Das Maximum, also die größte Zahl, ist die 9. Als Nächstes suchen wir den Median. Das ist die Zahl, die im Datensatz genau in der Mitte steht. Da wir eine gerade Anzahl an Datenpunkten haben, gibt es zwei mittlere Zahlen. In diesem Fall solltest du den Mittelwert dieser beiden Zahlen bilden. Für 4 und 4 beträgt er ebenfalls 4. Das Minimum ist also 1, der Median ist 4, das Maximum ist 9. Um die Quartile zu finden, müssen wir den Datensatz halbieren. Q1 ist der Median der ersten Hälfte des Datensatzes, also 1, 2, 2, 3, 4. Die Mitte dieses Abschnitts ist die 2. Das ist also Q1. Q3 ist der Median der zweiten Hälfte des Datensatzes, also 4, 6, 7, 8, 9. Die Mitte dieses Abschnitts ist 7. Das ist also Q3. Jetzt haben wir alle 5 Kennwerte und können den Box Plot auf unserem Zahlenstrahl eintragen. Zeichne stets das Minimum, Q1, den Median, Q3 und das Maximum ein. Die sogenannte Box im Box Plot wird gezeichnet, indem man vertikale Linien durch den Q1- und den Q3-Wert zieht und diese dann horizontal verbindet. In der Box markiert man dann mit einer vertikalen Linie den Median. Der sogenannte Interquartilsabstand, kurz IQA, wird berechnet, indem man Q1 von Q3 subtrahiert. Im Fall von Schüler Nummer 1 ist das 7 minus 2, also 5. Von der Box aus zeichnet man horizontale Linien, sogenannte Antennen, zum Minimum und zum Maximum. Werfen wir einen Blick auf Schüler Nummer 2. Sortieren wir zuerst die Zahlen. Nun suchen wir wieder die 5 Kennwerte. In diesem Fall liegt das Minimum bei 1 und das Maximum bei 8. Nun zum Median. Auch hier haben wir eine gerade Anzahl an Datenpunkten, also müssen wir die Werte wieder mitteln. Die beiden mittleren Zahlen sind 5 und 5, was einen Mittelwert von ebenfalls 5 ergibt. Nun halbieren wir den Datensatz, um Q1 und Q3 herauszufinden. Die erste Hälfte des Datensatzes lautet 1, 1, 2, 3, 5. Q1 ist also 2, da 2 der Median dieses Abschnittes ist. Die zweite Hälfte des Datensatzes lautet 5, 6, 6, 8, 8. 6 ist der Median dieses Abschnittes, das ist also unser Q3. Nun haben wir unsere 5 Kennwerte und können den Box Plot zeichnen. Wir zeichnen eine Box von Q1 nach Q3. Dann zeichnen wir die Antennen, indem wir Q1 beziehungsweise Q3 mit dem Minimum beziehungsweise dem Maximum verbinden. Um den Interquartilsabstand zu berechnen, müssen wir nur Q1 von Q3 abziehen: Der IQA ist 6 Minus 2, also 4. Sortieren wir den Datensatz von Schüler Nummer 3. Dieser emsige Schüler hat seinen Box Plot schon gezeichnet. Schauen wir mal, ob er vollständig ist. Das Minimum liegt bei 0, das Maximum bei 9. In diesem Fall sind die beiden Zahlen in der Mitte zwar unterschiedlich, aber wir nehmen trotzdem wieder den Mittelwert. Für 3 und 4 liegt der bei 3,5. Das ist also der Median. Q1 liegt bei 1 und Q3 bei 7 und der Interquartilsabstand liegt bei 6. Nun können wir die Grafiken vergleichen und schauen, welcher Schüler die beständigsten Leistungen gezeigt hat. Die drei Box Plots ähneln sich zwar sehr, es gibt aber einige Unterschiede. Die Box von Schüler Nummer 2 ist am kürzesten. Das bedeutet, die Datenpunkte dieses Schülers liegen eng beieinander. Man kann auch sagen: Der Schüler hat eine geringe Variation in seinen Werten. Du siehst bestimmt auch, dass sich einige der Kennwerte der drei Grafiken unterscheiden. Ein Kennwert mit besonders großen Unterschieden ist der Median. Der Median von Schüler Nummer 1 liegt bei 4, der von Schüler Nummer 2 bei 5 und der von Schüler Nummer 3 bei 3,5. Obwohl also die Schüler Nummer 1 und 3 die höheren Maxima von 9 haben, liegen ihre Mediane niedriger als die von Schüler Nummer 2. Schlussendlich wird der IQA dem Meister zeigen, welcher Schüler am beständigsten war. Schüler Nummer 1 hat einen IQA von 5, Nummer 2 einen von 4 und Nummer 3 einen von 6. Damit ist klar, dass Schüler Nummer 2 die beständigsten Leistungen erbracht hat. Der Meister will nun den beständigsten Schüler küren. Vorher soll er aber noch auf Bitten seiner Schützlinge zeigen, was er drauf hat. Ähm. Hoch im Gebirge am Faustfußpfad 'ein fünftel' liegt eine Kampfkunstschule, die sich auf das Zerschlagen von Holzbrettern, Straßen, Bäumen und Bergen …
Boxplots Übung
-
Gib Eigenschaften von Boxplots wieder.
TippsVergleiche mit dieser Abbildung eines Boxplots:
Der Median wird auch Zentralwert genannt und bezeichnet die Zahl, die sich „im Zentrum“ des Datensatzes befindet.
LösungBoxplots sind grafische Darstellungen von Häufigkeitsverteilungen. Sie zeigen dabei nicht nur einzelne Daten, sondern auch deren Streuung. Boxplots eignen sich vor allem für den Vergleich von zwei verschiedenen Datensätzen. Wegen ihrer Einfachheit und Vielseitigkeit haben sie auch ihren Weg in den Schulunterricht gefunden.
- Zuerst werden die Werte in aufsteigender Reihenfolge sortiert sowie Minimum und Maximum, also der kleinste und größte Wert des Datensatzes, bestimmt. Hier ist das Minimum $1$ und das Maximum $9$.
- Man braucht auch den Median. Dieser ist die Zahl, die im Datensatz genau in der Mitte steht. Setzt sich der Datensatz aus einer geraden Anzahl an Daten zusammen, stehen zwei Zahlen in der Mitte. In so einem Fall nimmt man den Mittelwert der mittleren beiden Zahlen. In diesem Fall ist der Median $4$.
- Außerdem benötigt man das erste Quartil $Q1$. Das ist der Median der ersten Hälfte des Datensatzes und bei diesem Boxplot die $2$.
- Man braucht auch das dritte Quartil $Q3$, das ist der Median der zweiten Hälfte des Datensatzes, hier die $7$.
- Zum Schluss verbindet man $Q1$ und $Q3$ miteinander, diese bilden die Box. Und man zieht sogenannte Antennen zu dem Minimum und Maximum.
- Außerdem bildet man noch den Interquartilsabstand IQA, indem man $Q1$ von $Q3$ subtrahiert. In diesem Fall sieht das so aus: IQA$=Q3-Q1=7-2=5$.
-
Nenne die passenden Aussagen zu den Boxplots der Schüler.
TippsJe weniger Variation es bei den Werten gibt, desto beständiger sind sie.
Die beständigsten Leistungen zeigt jemand, dessen IQA klein ist.
LösungDer Median ist der Wert, der in einem Datensatz genau in der Mitte steht. Bei einer geraden Anzahl an Daten ist der Median der Mittelwert der beiden Werte in der Mitte des Datensatzes. Das erste Quartil $Q1$ ist der Median der ersten Hälfte des Datensatzes und $Q3$ ist der Median der zweiten Hälfte des Datensatzes. Den Abstand von $Q1$ und $Q3$ nennt man Interquartilsabstand oder $IQA$. Je kleiner der $IQA$ ist, desto beständiger sind die Werte. Außerdem beschreibt Minimum den kleinsten Wert des Datensatzes und Maximum den größten Wert.
Demnach sind folgende Aussagen über die abgebildeten Boxplots richtig:
- Schüler $2$ hat einen Median von $3,5$.
- Ein Grund dafür, dass Schüler $1$ der Beste ist, ist sein hoher Median von $5$. Er erbringt im Schnitt gute Leistungen.
- Schüler $1$ hat einen kleinen IQA von $4$ und damit eine geringe Variation in seinen Werten. Er zeigt also die beständigsten Leistungen.
Und diese Aussagen sind falsch:
- Schüler $2$ hat das höchste Maximum von $9$ und ist deshalb der Beste.
- Schüler $2$ hat das kleinste $Q1$ und ist deshalb der Schlechteste.
-
Ordne die Eigenschaften der passenden Stelle im Boxplot zu.
TippsVergleiche mit dieser Darstellung.
Die beständigsten Ergebnisse finden wir im Bereich von $Q1$ bis $Q3$.
Der Median ist derjenige Wert, der im Zentrum des Datensatzes liegt.
Das beste Ergebnis ist hier das Maximum.
LösungZunächst einmal „übersetzen“ wir die Fragen von Team und Trainer in mathematische Sprache.
Was war das beste und das schlechteste Ergebnis?
- Maximum und Minimum bestimmen
- Median bestimmen
- $Q1$ und $Q3$ bestimmen, sie umschließen den Bereich mit den beständigsten Ergebnissen
- Minimum $=3$,
- Maximum $=10$,
- Median $=7~\rightarrow$ der Mittelwert aus $6$ und $8$ ist $\frac{6+8}2=7$,
- $Q1=4$ und
- $Q3=9$.
-
Deute die Größe mithilfe des Boxplots.
TippsIm Bereich des $IQA$ liegen die mittleren $50\%$ der Werte des Datensatzes.
Der $IQA$ ist der Interquartilsabstand zwischen $Q1$ und $Q3$.
LösungAm Boxplot lässt sich ablesen, dass der Median der Größen der Schülerinnen und Schüler bei $155\ \text{cm}$ liegt. Im Bereich des $IQA$ von $Q1$ bis $Q3$ liegen die mittleren $50\%$ der Werte des Datensatzes. Weiterhin liegt das Minimum bei $135\ \text{cm}$ und das Maximum bei $170\ \text{cm}$.
Daraus lassen sich folgende Schlussfolgerungen ziehen.
Marc ist $166\ \text{cm}$ groß. Er hat eine seltene Größe. Das sieht man daran, dass seine Größe in den oberen $25\%$ liegt. Somit ist er auch größer als die meisten.
Debbie ist $152\ \text{cm}$ groß. SIe hat eine häufige Größe. Das erkennt man daran, dass ihre Größe in der Box liegt. Außerdem findet man ihre Größe in den unteren $50\%$, also ist mehr als die Hälfte der Mitschüler größer als sie.
Karl ist $135\ \text{cm}$ groß. Er hat eine seltene Größe. Er ist nämlich die kleinste Person. Das erkennt man daran, dass seine Größe das Minimum ist.
-
Bestimme den Median.
TippsHat ein Datensatz eine gerade Anzahl Werte, wird der Median aus den zwei Werten gebildet, die genau in der Mitte des Datensatzes stehen.
Bei einem Datensatz mit $10$ Werten wird der Median aus dem $5.$ und $6.$ Wert gebildet.
Sieh dir an, welche Zahlen bei Schüler $2$ zur Errechnung des Medians verwendet wurden.
LösungWir betrachten den folgenden Datensatz:
- $0;1;1;3;3;4;5;7;7;9$.
Besteht der Datensatz aus einer geraden Anzahl an Werten, muss der Median aus den zwei Werten, die in der Mitte stehen, ermittelt werden. Dazu bildet man aus diesen beiden Werten den Mittelwert.Diese beiden Werte stehen genau in der Mitte: $3;4$.
Nun wird der Mittelwert dieser beiden Werte gebildet, indem sie addiert und anschließend durch $2$ dividiert werden.
$3+4=7$
$7:2=3,5$Schüler $3$ hat also einen Median von $3,5$.
-
Arbeite eine Interpretation für die Boxplots heraus.
TippsJe kleiner der Abstand zwischen dem ersten und dritten Quartil, desto beständiger sind die Werte.
Ist der $IQA$ der Box klein und liegt diese in der zweiten Hälfte des Zahlenstrahls, kommt die Person oft viele Minuten zu spät.
LösungTom hat die unbeständigsten Ergebnisse, das zeigt sein $IQA$ von $7$. Der Median für seine Verspätungen liegt bei $5,5$ Minuten.
Der Median für die Verspätungen von Max liegt bei $6,5$ Minuten. Außerdem sind seine Ergebnisse am beständigsten. Das sieht man an dem kleinen $IQA$ von $1$, der in der ersten Hälfte des Datensatzes liegt.
Jonas hat den kleinsten Median mit $3,5$ Minuten. Außerdem befindet sich sein $IQA$ von $3$ in der ersten Hälfte des Datensatzes, das heißt er kam beständig wenig zu spät.
Jonas kommt also noch einmal ungeschoren davon. Ein Glück!
4 Kommentare
Sehr gutes Video unterhaltsam und informativ👍
@ A Volberg:Das 2. Quartil ist der Median
Was ist mit dem dritten Quartil gemeint?Wo ist das 2 Quartil?
GeilesVideoman