30 Tage kostenlos testen:
Mehr Spaß am Lernen.

Überzeugen Sie sich von der Qualität unserer Inhalte.

Mittelwert, Median und Boxplot 08:37 min

Textversion des Videos

Transkript Mittelwert, Median und Boxplot

Die Themen dieses Films sind Methoden zur Beschreibung statistischer Daten: arithmetisches Mittel, Median und verwandte Maße. Das arithmetische Mittel einer Datensammlung dient als Maß für den Durchschnittswert. Es gibt jedoch Fälle, in denen es zur Beschreibung des Durchschnittswertes nicht geeignet ist. Etwa in diesem Beispiel: Eine anonyme Umfrage in einer kleinen Klasse hat ergeben, dass die Schüler durchschnittlich etwas mehr als 31 Euro Taschengeld im Monat bekommen. Die Schüler sind überrascht von diesem Ergebnis. Fast alle sagen, dass sie tatsächlich gerade einmal halb so viel bekommen. Wie kann das sein? Sehen wir uns die Daten genauer an. Sechs Schüler haben angegeben, dass sie 15 Euro Taschengeld bekommen, zwei bekommen 20 Euro im Monat, aber einer tanzt mit sagenhaften 150 Euro aus der Reihe. Egal, ob das stimmt oder ein Angeber dabei ist, zusammen macht das 280 Euro. Geteilt durch neun Schüler ergibt das 31,11 Euro Durchschnittstaschengeld. Rechnerisch richtig, sachlich Quatsch. Aber warum? Die Tabelle gibt schon einen ersten Hinweis, aber die graphische Darstellung macht es noch deutlicher. Einer der Werte unterscheidet sich stark von allen anderen Werten. In der Statistik nennt man einen solchen Fall ein Ausreißerproblem. Trotzdem kann dieser Wert aber nicht einfach weggelassen werde. Das wäre eine Verfälschung der Daten. Stattdessen lässt sich jedoch eine andere Kennzahl für das durchschnittliche Taschengeld bestimmen. Dazu wird zunächst der Wert gesucht, der das gesamte Spektrum halbiert, sodass genauso viele Schüler mehr und weniger als diesen Betrag als Taschengeld erhalten. Um diesen Wert zu ermitteln nehmen wir uns die Tabelle vor und streichen jeweils den höchsten und den niedrigsten Wert. Und zwar so lange, bis nur noch ein Wert übrig ist. Dieser Wert heißt Median. In unserem Beispiel landen wir so bei 15 Euro. Hier gibt es nun gleich viele Schüler, die mehr und die weniger als diesen Betrag als Taschengeld erhalten. Mit dieser Aussage sieht sich die Klasse viel besser gespiegelt. Denn der Median hat gegenüber dem arithmetischen Mittel den Vorteil, nicht so anfällig gegen Ausreißer zu sein. Wie funktioniert dies aber bei diesem Datensatz? Wenn man genauso vorgeht wie im letzten Beispiel, bleibt kein Wert übrig. Oder es bleiben zwei Werte übrig. Tatsächlich ist der Median dann das arithmetische Mittel der beiden übriggebliebenen Werte. Genau dann teilt er unsere Daten so in zwei Hälften, dass die Werte der einen Hälfte größer und die der anderen Hälfte kleiner sind als der Median. Der Median selbst muss also gar nicht als Wert in unseren Daten vorkommen. Auf dieser Basis lassen sich einfach noch zwei weitere Maßzahlen ermitteln, mit denen man sich einen Überblick über die gesammelten Daten verschaffen kann. So kann man für jede der beiden Hälften, in die der Median die Daten teilt, wiederum den Median ermitteln. Mittels der gerade beschriebenen Methode findet sich hier der Median 335. Am Median wird nun die Tabelle in zwei Hälften aufgeteilt. Der Median der ersten Hälfte ist 240, der der zweiten 360. Diese beiden Mediane teilen die Tabellenhälften in wiederum gleiche Hälften. Bezogen auf die Ursprungstabelle bedeutet dies, dass sie von den insgesamt drei Maßzahlen in vier gleiche Viertel unterteilt wird. Darum heißen die Mediane der beiden Tabellenhälften auch Quartile. Hier ist der Wert 240 also das untere oder 25-Prozent-Quartil. 335 ist der Median und 360 ist das obere oder 75-Prozent-Quartil. Genau die Hälfte der Daten liegt damit zwischen dem unteren und dem oberen Quartil. Diesen Bereich, also die Differenz zwischen oberem und unterem Quartil, nennt man Quartilsabstand oder Interquartilsabstand. Im Beispiel beträgt er 120. Der Quartilsabstand ist, genau wie die Spannweite und die mittlere absolute Abweichung, ein Maß für die Streuung von Daten. Zusätzlich wird noch das arithmetische Mittel der Daten errechnet. Die Summe aller Werte geteilt durch die Anzahl der Werte ergibt 314. Mithilfe dieser vier Maßzahlen können Daten sehr übersichtlich graphisch dargestellt werden. Dazu werden das arithmetische Mittel, die beiden Quartile und der Median auf dem Zahlenstrahl aufgetragen. Die beiden Quartile werden zu einem Kasten ergänzt, den der Median als Linie durchschneidet. Dann ziehen wir noch Linien von den Quartilen zum niedrigsten beziehungsweise höchsten Wert. Diese Linien heißen Antennen. Die Darstellung nennt man Boxplot und man kann einiges aus ihr herauslesen. Wir sehen, dass unsere Daten nicht stark um einen Wert herumgruppiert sind. In einem solchen Fall wäre die Box nämlich sehr schmal und die Antennen wären sehr lang. Die Daten sind aber auch nicht übermäßig stark gestreut, denn dann wäre die Box sehr breit und die Antennen wären sehr kurz. In unserem Beispiel ist die Box, die dem Quartilsabstand entspricht, in der sich also die Hälfte unserer Daten befindet, nur wenig kleiner als das gesamte Datenfeld. Dies entspricht der tabellarischen Beobachtung, dass der Quartilsabstand von 120 sehr nahe an 50 Prozent der Spannweite liegt. Diese beträgt 220 durch zwei, also 110. Allerdings ist der Median stark zu einem Rand der Quartilsabstandsbox verschoben. Das weist darauf hin, dass die Verteilung der Daten schief ist. Fassen wir zusammen: Wenn sich in einer Datensammlung Ausreißer befinden, also Werte, die sich erheblich von allen anderen unterscheiden, ist das arithmetische Mittel ungeeignet, um Aussagen über den Durchschnitt der Daten zu machen. In einem solchen Fall eignet sich dazu besser der Median. Dieser teilt Datensammlungen so in zwei Hälften, dass die eine Hälfte der Daten größer und die andere kleiner ist als der Median. Die Mediane der beiden Tabellenhälften, die durch den Median gebildet werden, heißen Quartile. Der Abstand zwischen oberem und unterem Quartil ist der Quartilsabstand. Er dient als ein weiteres Maß für die Streuung der Daten. Mittels der Quartile und des Medians kann als graphische Darstellung auf dem Zahlenstrahl ein Boxplot gezeichnet werden. Dieser erlaubt Rückschlüsse auf den Durchschnitt, die Streuung der Daten und die Schiefe ihrer Verteilung.

20 Kommentare
  1. Ging so

    Von Simonsusanne, vor 4 Monaten
  2. das video ist meiner Meinung nach zu lang und es kommen die wichtigen dinge viel zu kurz vor

    Von Lorelei Hofreiter, vor 5 Monaten
  3. Hallo Nadiakhou,
    das ist eine gute Frage!
    Ausreißer ermittelt man über den sogenannten "Interquartilsabstand (IQR)".
    Eine oft genutzte Regel lautet, dass ein Wert ein Ausreißer ist, falls er mehr als 1,5·IQR oberhalb des oberen Quartils oder unterhalb des unteren Quartils liegt.
    Aber wie berechnet man den IQR?
    Dafür ermitteln wir den Abstand des oberen und unteren Quartils, also die Differenz. In dem Beispiel im Video ist IQR = 120, weil das untere Quartil 240 und das obere 360 ist.
    Ausreißer sind nun die Werte, die kleiner sind als 240 - 1,5·120 = 60 und größer als 360 + 1,5·120 = 540.
    Liebe Grüße aus der Redaktion!

    Von Florian H., vor 6 Monaten
  4. voll gut erklärt aber wir erkennt man einen Ausreißer anhand eines boxplots ?

    Von Nadiakhou, vor 6 Monaten
  5. Ok...

    Von Leon L., vor 7 Monaten
  1. 79 und nicht 69 yea

    Von Sandhas, vor 8 Monaten
  2. naja



    Von amy a., vor etwa einem Jahr
  3. 😀😃😄😁😆😅😂🤣😊☺️😇🙂🙃😉😌😍😘😗😙😚😋😛😝😜🤪🤨🧐🤓😎🤩

    Von Xmina Xp, vor mehr als einem Jahr
  4. Danke für die *sehr gute* Hilfe:)

    Von Jelte v., vor mehr als einem Jahr
  5. SUPER GUT ERKLÄRT!!!

    Von Xmina Xp, vor mehr als einem Jahr
  6. gut

    Von Nell, vor mehr als einem Jahr
  7. Gute Erklärung

    Von Traeumer04, vor etwa 2 Jahren
  8. sehr gut ;)

    Von rouven s., vor etwa 2 Jahren
  9. Gut erklärt :)

    Von Lara W., vor mehr als 2 Jahren
  10. Gut erklärt : )

    Von Leni G., vor mehr als 2 Jahren
  11. super erklärt ;)

    Von Gian-Luca G., vor mehr als 2 Jahren
  12. Hallo zusammen, ich bin 38 J und habe mich spät für ein Psychologiestudium entschieden.Hier und jetzt hat es gerade KLICK gemacht> zumindest was d. Boxplot angeht. Ich schließe mich den anderen an: guter und systematischer Aufbau. Danke! :-)

    Von Betti Rankenburg, vor mehr als 2 Jahren
  13. Danke,hat mir sehr weitergeholfen

    Von Familie Sting Erler, vor mehr als 3 Jahren
  14. fand ich auch die Beste Erklärung bis jetzt! mehr davon!

    Von Jens Aha, vor mehr als 3 Jahren
  15. echt super erklärt

    Von Leo 2004, vor mehr als 3 Jahren
Mehr Kommentare