30 Tage kostenlos testen:
Mehr Spaß am Lernen.

Überzeugen Sie sich von der Qualität unserer Inhalte.

Mittelwert, Median und Boxplot 08:37 min

Textversion des Videos

Transkript Mittelwert, Median und Boxplot

Die Themen dieses Films sind Methoden zur Beschreibung statistischer Daten: arithmetisches Mittel, Median und verwandte Maße. Das arithmetische Mittel einer Datensammlung dient als Maß für den Durchschnittswert. Es gibt jedoch Fälle, in denen es zur Beschreibung des Durchschnittswertes nicht geeignet ist. Etwa in diesem Beispiel: Eine anonyme Umfrage in einer kleinen Klasse hat ergeben, dass die Schüler durchschnittlich etwas mehr als 31 Euro Taschengeld im Monat bekommen. Die Schüler sind überrascht von diesem Ergebnis. Fast alle sagen, dass sie tatsächlich gerade einmal halb so viel bekommen. Wie kann das sein? Sehen wir uns die Daten genauer an. Sechs Schüler haben angegeben, dass sie 15 Euro Taschengeld bekommen, zwei bekommen 20 Euro im Monat, aber einer tanzt mit sagenhaften 150 Euro aus der Reihe. Egal, ob das stimmt oder ein Angeber dabei ist, zusammen macht das 280 Euro. Geteilt durch neun Schüler ergibt das 31,11 Euro Durchschnittstaschengeld. Rechnerisch richtig, sachlich Quatsch. Aber warum? Die Tabelle gibt schon einen ersten Hinweis, aber die graphische Darstellung macht es noch deutlicher. Einer der Werte unterscheidet sich stark von allen anderen Werten. In der Statistik nennt man einen solchen Fall ein Ausreißerproblem. Trotzdem kann dieser Wert aber nicht einfach weggelassen werde. Das wäre eine Verfälschung der Daten. Stattdessen lässt sich jedoch eine andere Kennzahl für das durchschnittliche Taschengeld bestimmen. Dazu wird zunächst der Wert gesucht, der das gesamte Spektrum halbiert, sodass genauso viele Schüler mehr und weniger als diesen Betrag als Taschengeld erhalten. Um diesen Wert zu ermitteln nehmen wir uns die Tabelle vor und streichen jeweils den höchsten und den niedrigsten Wert. Und zwar so lange, bis nur noch ein Wert übrig ist. Dieser Wert heißt Median. In unserem Beispiel landen wir so bei 15 Euro. Hier gibt es nun gleich viele Schüler, die mehr und die weniger als diesen Betrag als Taschengeld erhalten. Mit dieser Aussage sieht sich die Klasse viel besser gespiegelt. Denn der Median hat gegenüber dem arithmetischen Mittel den Vorteil, nicht so anfällig gegen Ausreißer zu sein. Wie funktioniert dies aber bei diesem Datensatz? Wenn man genauso vorgeht wie im letzten Beispiel, bleibt kein Wert übrig. Oder es bleiben zwei Werte übrig. Tatsächlich ist der Median dann das arithmetische Mittel der beiden übriggebliebenen Werte. Genau dann teilt er unsere Daten so in zwei Hälften, dass die Werte der einen Hälfte größer und die der anderen Hälfte kleiner sind als der Median. Der Median selbst muss also gar nicht als Wert in unseren Daten vorkommen. Auf dieser Basis lassen sich einfach noch zwei weitere Maßzahlen ermitteln, mit denen man sich einen Überblick über die gesammelten Daten verschaffen kann. So kann man für jede der beiden Hälften, in die der Median die Daten teilt, wiederum den Median ermitteln. Mittels der gerade beschriebenen Methode findet sich hier der Median 335. Am Median wird nun die Tabelle in zwei Hälften aufgeteilt. Der Median der ersten Hälfte ist 240, der der zweiten 360. Diese beiden Mediane teilen die Tabellenhälften in wiederum gleiche Hälften. Bezogen auf die Ursprungstabelle bedeutet dies, dass sie von den insgesamt drei Maßzahlen in vier gleiche Viertel unterteilt wird. Darum heißen die Mediane der beiden Tabellenhälften auch Quartile. Hier ist der Wert 240 also das untere oder 25-Prozent-Quartil. 335 ist der Median und 360 ist das obere oder 75-Prozent-Quartil. Genau die Hälfte der Daten liegt damit zwischen dem unteren und dem oberen Quartil. Diesen Bereich, also die Differenz zwischen oberem und unterem Quartil, nennt man Quartilsabstand oder Interquartilsabstand. Im Beispiel beträgt er 120. Der Quartilsabstand ist, genau wie die Spannweite und die mittlere absolute Abweichung, ein Maß für die Streuung von Daten. Zusätzlich wird noch das arithmetische Mittel der Daten errechnet. Die Summe aller Werte geteilt durch die Anzahl der Werte ergibt 314. Mithilfe dieser vier Maßzahlen können Daten sehr übersichtlich graphisch dargestellt werden. Dazu werden das arithmetische Mittel, die beiden Quartile und der Median auf dem Zahlenstrahl aufgetragen. Die beiden Quartile werden zu einem Kasten ergänzt, den der Median als Linie durchschneidet. Dann ziehen wir noch Linien von den Quartilen zum niedrigsten beziehungsweise höchsten Wert. Diese Linien heißen Antennen. Die Darstellung nennt man Boxplot und man kann einiges aus ihr herauslesen. Wir sehen, dass unsere Daten nicht stark um einen Wert herumgruppiert sind. In einem solchen Fall wäre die Box nämlich sehr schmal und die Antennen wären sehr lang. Die Daten sind aber auch nicht übermäßig stark gestreut, denn dann wäre die Box sehr breit und die Antennen wären sehr kurz. In unserem Beispiel ist die Box, die dem Quartilsabstand entspricht, in der sich also die Hälfte unserer Daten befindet, nur wenig kleiner als das gesamte Datenfeld. Dies entspricht der tabellarischen Beobachtung, dass der Quartilsabstand von 120 sehr nahe an 50 Prozent der Spannweite liegt. Diese beträgt 220 durch zwei, also 110. Allerdings ist der Median stark zu einem Rand der Quartilsabstandsbox verschoben. Das weist darauf hin, dass die Verteilung der Daten schief ist. Fassen wir zusammen: Wenn sich in einer Datensammlung Ausreißer befinden, also Werte, die sich erheblich von allen anderen unterscheiden, ist das arithmetische Mittel ungeeignet, um Aussagen über den Durchschnitt der Daten zu machen. In einem solchen Fall eignet sich dazu besser der Median. Dieser teilt Datensammlungen so in zwei Hälften, dass die eine Hälfte der Daten größer und die andere kleiner ist als der Median. Die Mediane der beiden Tabellenhälften, die durch den Median gebildet werden, heißen Quartile. Der Abstand zwischen oberem und unterem Quartil ist der Quartilsabstand. Er dient als ein weiteres Maß für die Streuung der Daten. Mittels der Quartile und des Medians kann als graphische Darstellung auf dem Zahlenstrahl ein Boxplot gezeichnet werden. Dieser erlaubt Rückschlüsse auf den Durchschnitt, die Streuung der Daten und die Schiefe ihrer Verteilung.

21 Kommentare
  1. ja moin servus moin

    Von Pedram H., vor 19 Tagen
  2. Ging so

    Von Simonsusanne, vor 6 Monaten
  3. das video ist meiner Meinung nach zu lang und es kommen die wichtigen dinge viel zu kurz vor

    Von Lorelei Hofreiter, vor 7 Monaten
  4. Hallo Nadiakhou,
    das ist eine gute Frage!
    Ausreißer ermittelt man über den sogenannten "Interquartilsabstand (IQR)".
    Eine oft genutzte Regel lautet, dass ein Wert ein Ausreißer ist, falls er mehr als 1,5·IQR oberhalb des oberen Quartils oder unterhalb des unteren Quartils liegt.
    Aber wie berechnet man den IQR?
    Dafür ermitteln wir den Abstand des oberen und unteren Quartils, also die Differenz. In dem Beispiel im Video ist IQR = 120, weil das untere Quartil 240 und das obere 360 ist.
    Ausreißer sind nun die Werte, die kleiner sind als 240 - 1,5·120 = 60 und größer als 360 + 1,5·120 = 540.
    Liebe Grüße aus der Redaktion!

    Von Florian H., vor 8 Monaten
  5. voll gut erklärt aber wir erkennt man einen Ausreißer anhand eines boxplots ?

    Von Nadiakhou, vor 8 Monaten
  1. Ok...

    Von Leon L., vor 9 Monaten
  2. 79 und nicht 69 yea

    Von Sandhas, vor 10 Monaten
  3. naja



    Von amy a., vor etwa einem Jahr
  4. 😀😃😄😁😆😅😂🤣😊☺️😇🙂🙃😉😌😍😘😗😙😚😋😛😝😜🤪🤨🧐🤓😎🤩

    Von Xmina Xp, vor mehr als einem Jahr
  5. Danke für die *sehr gute* Hilfe:)

    Von Jelte v., vor mehr als einem Jahr
  6. SUPER GUT ERKLÄRT!!!

    Von Xmina Xp, vor mehr als einem Jahr
  7. gut

    Von Nell, vor fast 2 Jahren
  8. Gute Erklärung

    Von Traeumer04, vor etwa 2 Jahren
  9. sehr gut ;)

    Von rouven s., vor etwa 2 Jahren
  10. Gut erklärt :)

    Von Lara W., vor mehr als 2 Jahren
  11. Gut erklärt : )

    Von Leni G., vor mehr als 2 Jahren
  12. super erklärt ;)

    Von Gian-Luca G., vor fast 3 Jahren
  13. Hallo zusammen, ich bin 38 J und habe mich spät für ein Psychologiestudium entschieden.Hier und jetzt hat es gerade KLICK gemacht> zumindest was d. Boxplot angeht. Ich schließe mich den anderen an: guter und systematischer Aufbau. Danke! :-)

    Von Betti Rankenburg, vor fast 3 Jahren
  14. Danke,hat mir sehr weitergeholfen

    Von Familie Sting Erler, vor mehr als 3 Jahren
  15. fand ich auch die Beste Erklärung bis jetzt! mehr davon!

    Von Jens Aha, vor mehr als 3 Jahren
  16. echt super erklärt

    Von Leo 2004, vor mehr als 3 Jahren
Mehr Kommentare

Mittelwert, Median und Boxplot Übung

Du möchtest dein gelerntes Wissen anwenden? Mit den Aufgaben zum Video Mittelwert, Median und Boxplot kannst du es wiederholen und üben.

  • Beschreibe dein Vorgehen bei einem Ausreißerproblem.

    Tipps

    Betrachte die Werte:

    $1, 4, 5, 8, 8, 8, 9, 11, 230$

    Das arithmetische Mittel beträgt: $(1+ 4+ 5+ 8+ 8+ 8+ 9+ 11+ 230):9=284:9\approx 31,56$

    Betrachte die Werte:

    $1, 4, 5, 8, 8, 8, 9, 11, 230$

    Der Median beträgt $8$.

    Der Median repräsentiert beim Ausreißerproblem das durchschnittliche Taschengeld der Kinder viel besser als das arithmetische Mittel. Das liegt daran, dass ein Median weniger anfällig für Ausreißer ist.

    Lösung

    Schauen wir uns die Werte doch einmal genau an. Wir stellen fest, dass $8$ der insgesamt $9$ Werte niedriger als $31,11~€$ sind. Ein Wert ist mit $150~€$ aber deutlich höher.

    Für das arithmetische Mittel teilen wir die Summe aller Werte durch die Anzahl der Werte. Also:

    • $280~€:9= 31,11~€$
    Am Diagramm siehst du noch deutlicher, dass es sich hier um ein Ausreißerproblem handelt. Wir können nicht sagen, ob einer der Schüler vielleicht etwas übertrieben hat, aber ein Wert passt eindeutig nicht zu den anderen. Wir dürfen ihn aber nicht weglassen, da wir sonst die Statistik fälschen würden. Wir betrachten also eine andere Kennzahl für das durchschnittliche Taschengeld.

    Wir suchen den Wert, sodass genauso viele Kinder mehr und weniger als diesen Betrag an Taschengeld bekommen. Dazu betrachten wir die Tabelle und streichen Schritt für Schritt den niedrigsten und den höchsten Wert. Übrig bleibt der Median. Er beträgt in diesem Fall $15~€$. Dieser Wert repräsentiert das durchschnittliche Taschengeld der Kinder viel besser. Das liegt daran, dass ein Median weniger anfällig für Ausreißer ist.

    Haben wir eine gerade Anzahl an Werten, streichen wir zunächst erneut Schritt für Schritt den niedrigsten und den höchsten Wert bis noch zwei Werte übrig sind. Der Median ist dann das arithmetische Mittel dieser beiden Werte. In diesem Fall $(400+300):2=350$.

  • Nenne die Eigenschaften des Medians.

    Tipps

    $1, 1, 1, 1, 1001$

    Bei diesen Werten liegt der Median bei $1$ und das arithmetische Mittel bei $201$.

    $2, 4, 6, 10$

    Hier ist der Median $5$.

    Lösung

    Folgende Aussagen sind korrekt:

    • Der Median hat gegenüber dem arithmetischen Mittel den Vorteil, nicht so anfällig gegen Ausreißer zu sein.
    • Man kann für jede der beiden Hälften, in die der Median die Daten teilt, wiederum den Median ermitteln. Diese Mediane der Hälften werden als Quartile bezeichnet.
    • Für den Median sortieren wir die Werte der Größe nach und streichen Schritt für Schritt immer den niedrigsten und den höchsten Wert.
    Diese Aussagen sind falsch:

    • Bei einer geraden Anzahl an Werten haben wir immer zwei Mediane.
    Bei einer geraden Anzahl an Werten, gehen wir zunächst wie gewohnt vor und streichen Schritt für Schritt den niedrigsten und den höchsten Wert bis noch zwei Werte übrig bleiben. Wir berechnen nun das arithmetische Mittel dieser beiden Werte, um den Median zu erhalten. Der Median muss also nicht immer in unseren Daten vorkommen.

    • Den Median berechnen wir, indem wir die Summe der Werte durch die Anzahl der Werte teilen.
    Mit dieser Berechnung erhalten wir das arithmetische Mittel.

  • Beschrifte den Boxplot.

    Tipps

    Mit einem Boxplot kannst du anhand des Abstands zwischen den beiden Quartilen Rückschlüsse auf die Streuung der Daten ziehen.

    Während du für das arithmetische Mittel die Summe aller Werte durch die Anzahl aller Werte teilst, suchst du beim Median den Wert, bei dem es gleich viele niedrigere und höhere Werte gibt.

    Die Antennen markieren die kleinsten und größten Werte der Datenmenge.

    Lösung

    Bei einem Ausreißerproblem, also einer Datenmenge, bei der zum Beispiel ein Wert deutlich höher ist als alle anderen, kann es sein, dass das arithmetische Mittel nicht repräsentativ für den Durchschnittswert ist. Dann bildet man zum Vergleich den Median.

    Dafür werden zunächst alle Werte aufsteigend sortiert. Dann streicht man Schritt für Schritt immer den kleinsten und den größten Wert bis am Ende nur noch ein Wert übrig ist. Dieser ist dann unser Median. Ist die Anzahl der betrachteten Werte gerade, bleiben am Ende zwei Werte übrig. Der Median ist dann das arithmetische Mittel dieser beiden.

    Der Median teilt die Datenmenge in zwei Hälften. In diesen können wir jeweils erneut den Median bestimmen. Den der linken nennen wir unteres Quartil und den der rechten oberes Quartil. Der Abstand dieser beiden Werte wird als Interquartilsabstand bezeichnet und gibt Aufschluss über die Verteilung der Daten.

    Die Antennen markieren den Abstand von den Quartilen bis zum größten und kleinsten Wert.

  • Ermittle die Werte anhand des Boxplots.

    Tipps

    Die geringste Spannweite hat das Reiten mit $9$.

    Der Quartilsabstand beim Singen beträgt $5$.

    Lösung

    Reiten

    Die Antennen des Boxplots vom Reiten reichen von Min. $4$ bis Max. $13$. Die Spannweite beträgt also $13-4=9$ Punkte.

    Das untere Quartil liegt bei $6$ Punkten und das obere bei $11$. Damit beträgt der (Inter-)quartilsabstand $11-6=5$ Punkte.

    Der Median und damit die durchschnittliche Punktzahl liegt bei $8$.

    Singen

    Die Antennen des Boxplots vom Singen reichen von Min. $-3$ bis Max. $17$. Die Spannweite beträgt also $20$ Punkte.

    Das untere Quartil liegt bei $2$ Punkten und das obere bei $7$. Damit beträgt der (Inter-)quartilsabstand $5$ Punkte. Ist also gleich dem des Reitens.

    Der Median und damit die durchschnittliche Punktzahl liegt bei $4$.

    Bodenturnen

    Die Antennen des Boxplots vom Bodenturnen reichen von Min. $6$ bis Max. $15,5$. Die Spannweite beträgt also $9,5$ Punkte.

    Das untere Quartil liegt bei $8$ Punkten und das obere bei $11$. Damit beträgt der (Inter-)quartilsabstand $3$ Punkte.

    Der Median und damit die durchschnittliche Punktzahl liegt bei $9,5$.

    Die größte Punktedifferenz gab es also beim Singen. Beim Bodenturnen lagen die Punkte am nächsten zusammen und auch die Durchschnittspunktzahl war am höchsten.

  • Bestimme die Werte, die du für ein Boxplot brauchst.

    Tipps

    Um den Median zu ermitteln streichst du abwechselnd den höchsten und niedrigsten Wert. Der Median ist der letzte Wert der übrig bleibt. Bleiben zwei Werte übrig, ist der Median das arithmetische Mittel der beiden übrigen Werte.

    $0~€, 0~€, 2~€, 3~€, 5~€, 5~€, 13~€$

    Für diese Daten lautet die Sortierung der Werte:

    Unteres Quartil: $0~€$; Median: $3~€$; Arithmetisches Mittel: $4~€$; Oberes Quartil: $5~€$

    Lösung

    Werte der Klasse A:

    • $0~€$
    • $1~€$
    • $5~€$
    • $6~€$
    • $7~€$
    • $10~€$
    • $25~€$
    Streichen wir nun Schritt für Schritt immer den niedrigsten und den höchsten Wert, erhalten wir den Median $6~€$.

    Betrachten wir nun die untere Hälfte:

    • $0~€$
    • $1~€$
    • $5~€$
    Der Median und somit das untere Quartil ist hier $1~€$.

    Die obere Hälfte ist gegeben durch:

    • $7~€$
    • $10~€$
    • $25~€$
    Hier erhalten wir $10~€$ als oberes Quartil.

    Das arithmetische Mittel ist die Summe der Daten geteilt durch die Anzahl an Daten.

    $(0~€+1~€+5~€+6~€+7~€+10~€+25~€):7=54~€:7\approx7,71~€ $

    So erhalten wir folgende Sortierung:

    • Unteres Quartil: $1~€$
    • Median: $6~€$
    • Arithmetisches Mittel: $\approx7,71~€$
    • Oberes Quartil: $10~€$
    Nun das gleiche für Klasse B:

    • $1~€$
    • $2~€$
    • $6~€$
    • $10~€$
    • $15~€$
    • $50~€$
    Da die Anzahl der Daten gerade ist, müssen wir das arithmetische Mittel von $6~€$ und $10~€$ bestimmen. Somit ist der Median: $(6~€+10~€):2=16~€:2=8~€$.

    Das untere Quartil ist der Median von:

    • $1~€$
    • $2~€$
    • $6~€$
    Wir erhalten also das untere Quartil $2~€$.

    Und das obere Quartil erhalten wir aus:

    • $10~€$
    • $15~€$
    • $50~€$
    Dieses beträgt $15~€$.

    Das arithmetische Mittel ist die Summe der Daten geteilt durch die Anzahl an Daten.

    $(1~€+2~€+6~€+10~€+15~€+50~€):6=84~€:6=14~€ $

    Somit erhalten wir:

    • Unteres Quartil: $2~€$
    • Median: $8~€$
    • Arithmetisches Mittel: $14~€$
    • Oberes Quartil: $15~€$
  • Ordne den Daten den passenden Boxplot zu.

    Tipps

    Zeichne dir die Boxplots anhand der gegebenen Werte und vergleiche sie mit den gegebenen Boxplots.

    Die Box eines Boxplots markiert den Interquartilsabstand, also den Abstand von dem unteren zum oberen Quartil.

    Lösung

    Auf dem Bild siehst du exemplarisch einen Boxplot. Das untere Quartil ist das linke Ende der Box und das obere Quartil das rechte Ende. Die Box markiert den Interquartilsabstand.

    In der Box wird der Median markiert. Er zeigt an, wie stark die Streuung der Daten ist. Damit gilt für diesen Boxplot:

    • Unteres Quartil: $2$
    • Median: $5$
    • Oberes Quartil: $6$