Advent, Advent, 1 Monat weihnachtliche Laufzeit geschenkt.

Nicht bis zur Bescherung warten, Aktion nur gültig bis zum 18.12.2016!

Textversion des Videos

Transkript Statistik Video 12: Median und Modalwert Übung

Hallo, ich freue mich, euch alle wieder begrüßen zu dürfen. Wir machen heute die Übungen zum Modus und zum Median. Das sollte eigentlich keine großen Schwierigkeiten bedeuten, weil Modus und Median, das wirklich immer Schema F, wenn man es einmal verstanden hat, bekommt man die beiden eigentlich immer heraus. Sollte euch also keine Probleme bereiten. Ich habe mal ein 1. Beispiel vorbereitet: Wir haben eine sogenannte sortierte Urliste und wollen daraus jetzt Modus und Median bestimmen. Wir erinnern uns: Der Modus, das war der Wert, der am häufigsten vorkommt in unserer Datenreihe. Wir gucken also: Aha, wir haben die 1 zweimal und alle anderen nur einmal. Der Wert, der am häufigsten vorkommt, ist also die 1. Unser Modus: x Kreis=1. Das war's, so leicht bestimmt man den Modus. Kein Problem, oder? Unser Median: Das war schon etwas unterschiedlich. Und zwar, wir erinnern uns, wir haben unterschieden zwischen einem geraden Stichprobenumfang und einem ungeraden Stichprobenumfang. Hier haben wir einen ungeraden Stichprobenumfang, das ist eigentlich der Fall, der uns sehr viel besser gefällt, weil da haben wir genau einen Wert in der Mitte und den suchen wir. Wir erinnern uns, wenn n ungerade war, war unser x, unser Median, das x an der Stelle ((n+1)/2), wir haben hier ein n von 7, also (7+1)/2=4, wir suchen also das x an der Stelle 4. Wir zählen ab, 1, 2, 3, 4. Aha, x Median=5. Nicht 4, 4 ist ja der Rangplatz, 5. Wenn wir jetzt unser Beispiel ein bisschen variieren, ich mache das mal in Rot, damit ihr wisst: Aha, das ist schon die Varation. Alles, was in Schwarz ist, gehört also zum 1. Beispiel und das ist jetzt zur Variation. Wir hängen hier also einfach nochmal eine 10 hinten dran. Wir gucken, ändert das irgendetwas an unserem Modus? Der Modus war der Wert, der am häufigsten vorkommt. Weiterhin kommt nur die 1 zweimal vor, der Modus bleibt also gleich. Das ändert aber natürlich etwas an unserem Stichprobenumfang. Wir haben jetzt ein neues n von 8. Und damit ändert es natürlich auch etwas an unserem Median. Wir haben jetzt nämlich nicht mehr unser Median, das nicht mehr (n+1)/2, sondern wir nehmen die andere Formel, die wir benutzt haben. Unser Median ist jetzt also (x(n/2)+x((n/2)+1))/2. n/2, n=8, n/2, 4. Wir haben also x(4)+((n/2)+1), 4+1=5, +(x(5))/2, also wenn wir es mal mit Leben füllen: Hier oben ist die 4, hier ist die 5, wir haben also (5+6)/2. Der Median, der also hierzwischen liegt: x=5,5. So bestimmt man den Median bei einem geraden n. Nun wollen wir einmal Median und Modus aus sortierten Daten bestimmen. Füllen wir erst einmal die Tabelle aus, wie das geht, sollte ja seit einigen Videos bekannt sein. Offen sind hier noch die absoluten kumulierten Häufigkeiten. Für 0 5, dann 5+10=15, 15+11=26 und 26+3=29. Die Rangplätze, die vergeben sind, also hier 1 bis 5, 6 bis kumulierte Häufigkeit 15, 16 bis 26 und 27 bis 29. Gucken wir also erst einmal an, was ist der Modus? Der Modus, die Ausprägung, die am häufigsten auftaucht, also hier, die 11. Ganz einfach, ganz eindeutig, x Kreis=2. Nicht 11, 11 ist ja nur die Häufigkeit. Das Merkmal, das wir beim Modus suchen, ist die 2. Unser x ist bei ungeraden n, n wie wir es ja haben, das x an der Stelle n+(1/2), also das x an der Stelle 15. Gucken wir einmal, 15, wir haben hier 1 bis 5, 6 bis 15, aha! Hier, der Rangplatz 15 ist also noch bei Merkmal 1. Unser x=1. So weit, so gut. Variieren wir mal wieder unser Beispiel und sagen wir, wir haben nicht n=29, sondern n=30. Dazu sagen wir: Aha, die Merkmalsausprägung 3 hat nicht die Häufigkeit 3, sondern 4. Wir bauen das also hier auch um, müssen natürlich bei den kumulierten Häufigen am Ende dann auch bei der 30 landen. Und die Rangplätze gehen logischerweise auch bis 30. Wie berechnen wir jetzt also unser x', also unseren neuen Median im neuen Beispiel? Der Strich zeigt, jetzt nehmen wir die roten Daten. Wir haben jetzt also, wie wir im letzten Video gelernt haben, (x(n/2)+x((n/2)+1))/2. n=30, n/2, also 15. (n/2)+1, also 16. Wir haben jetzt also das (x(15)+x(16))/2, unser neuer Median. x(15), gucken wir nach, gehört zur Merkmalsausprägung 1. Also 1+x(16) gehört zur Ausprägung 2 und das ganze durch 2, also 1,5. Unser x'=1,5. Unser neuer Median. Wenn wir jetzt hier an dieser Stelle sehen würden, dass x an der Stelle 15 und x an der Stelle 16 zur gleichen Merkmalsausprägung gehören, können wir eigentlich sofort aufhören zu rechnen, weil wir dann einfach einen von den beiden Werten nehmen können. Das macht ja keinen Unterschied, sind ja eh beide gleich. Wenn jetzt also x(15) 1 wäre und x(16) 1, könnten wir sagen: Ok, Median, x=1. Ok, nächstes Beispiel. Es wird ein bisschen schwieriger, wir haben nämlich diesmal nur die relativen kumulierten Häufigkeiten angegeben, wobei wir natürlich auch die absoluten kummulierten Häufigkeiten brauchen und für den Modus die absoluten Häufigkeiten. Wir haben aber unseren Stichprobenumfang n=100, sollten also alles andere in dieser Tabelle auch rauskriegen. Zuerst berechnen wir die absoluten kumulierten Häufigkeiten. Wir wissen ja, es waren relative Häufigkeiten × Stichprobenumfang. Also 0,1×100=10. Da wir hier ja bei den kumulierten Häufigkeiten sind, müssen wir hier auch wieder die kumulierten Häufigkeiten nehmen. 0,15×100=15. 0,4×100=40. 0,7×100=70. Und hier müssen 100 stehen. Das sind also unsere kumulierten absoluten Häufigkeiten. Die übertragen wir jetzt in unsere absoluten Häufigkeiten. Die 1. können wir übernehmen, dann müssen wir rechnen. 15-10=5. 40-15=25. 70-40=30 und 100-70=30. Zur Vollständigkeit halber füllen wir also erst die komplette Tabelle aus und machen jetzt die Rangplätze. Wir haben hier also 1 bis 10, hier dann 11 bis 15, 16 bis 40, 41 bis 70 und 71 bis 100. So, was wir jetzt herausfinden wollen, wie immer Modalwert, Modus und Median. Also zuerst unseren Modus. Wir haben hier 2 Merkmalsausprägungen mit der größten Häufigkeit, nämlich 30. Das heißt, entweder geben wir beide an, wir sagen also x Kreis=79 oder x Kreis=91. Oder wir sagen: x Kreis ist nicht eindeutig, geben wir gar nicht an. Kommen wir also zum Median. x, wie berechnen wir den? Wir haben einen geraden Stichprobenumfang. Wir nehmen also, wie schon gezeigt: (x(n/2)+x((n/2)+1))/2. Hier haben wir aber Glück, das x(n/2), also x(50) fällt in die Gruppe 79 oder gehört zur Merkmalsausprägung 79, es sind ja keine gruppierten Daten und das x an der Stelle 51 auch, das heißt, hier müssen wir nichts ausrechnen, wir können einfach sagen: x=79 und sind damit schon fertig. Ok, jetzt also das 4. und letzte Beispiel. Wir haben wieder gruppierte Daten, metrische gruppierte Daten, und suchen zuerst einmal den Modus, also die Gruppe mit der höchsten Ausprägung. Höchste Ausprägung 16, die Gruppe 40 bis 45. Wir erinnern uns, wie geben wir den Modus an bei gruppierten metrischen Daten? Als Modus geben wir die Gruppenmitte an unserer Gruppe, in die der Modus fällt. Also mj, die Mitte von 40 bis 45, also unser Modus ist hier 42,5. Das war der Modus, war doch gar nicht so schwer. Unser Median, wir haben 3 Möglichkeiten ihn anzugeben: x sagen wir mal 1. 1. Möglichkeit ihn anzugeben: Wir geben die Klasse an, in die er fällt. Gucken wir erst einmal, in welche Klasse fällt er eigentlich? Wir haben eine ungerade Anzahl bei unserem Stichprobenumfang und unser x=x((n+1)/2), also x(25). So, unser x(25), also mit dem Rangplatz 25 fällt also, wir gucken, 19 bis 33, aha, passt! Fällt also in diese Gruppe. Wir sagen also: x1=20 bis 40, ist dann also unsere Median-Gruppe. Ist natürlich unschön. Weil wir, obwohl wir metrische Daten haben, keine Zahl angeben, sondern in Intervallen. Kann man sicher besser machen. Jetzt kommt die 2. Möglichkeit: x2. Wir geben auch hier, wie schon beim Modus, die Gruppenmitte unsere Mediangruppe an. Also die Gruppenmitte von 20 bis 40, also hier 30. Oder, die 3. und wahrscheinlich beste, weil präziseste Möglichkeit: Wir nehmen an, dass all unsere Daten, die in unsere Mediangruppe fallen, gleichmäßig verteilt sind und suchen also genau den Punkt, wo unser x an der Stelle 25 liegt. Wir erinnern uns, was war nochmal die Formel dafür? Ich schreib die mal hier hin x war die obere Gruppengrenze xj-1 obere Gruppengrenze der Gruppe,+bj, die vor unserer Mediangruppe liegt +bj, die Gruppenbreite unserer Mediangruppe, ×(n+1)/2, also genau der Rangplatz, wo unser Median liegt, - die kumulierte Häufigkeit der Gruppe, die vor unserer Mediangruppe liegt / die absolute Häufigkeit unserer Mediangruppe. Füllen wir das Ganze also mit Zahlen. Die obere Gruppengrenze der Gruppe, die vor unserer Mediangruppe liegt. Unsere Mediangruppe, 20 bis 40, die Gruppe davor, 10 bis 20. Also: 20+ unsere Gruppenbreite. Gruppenbreite unserer Gruppe 20 bis 40=40×n(n/2). n=49+1=50/2, 25- die kumulierte Häufigkeit der Gruppe, die vor unserer Mediangruppe liegt, also hier -18 / die absolute Häufigkeit unserer Mediangruppe, geteilt durch 15. Wir kommen also auf 20+20×7/15=29,33. Ja, das war auch schon die Übung zum Modus und zum Median. Wie ihr gesehen habt, es ist alles ganz simpel und es birgt wirklich keine großen Schwierigkeiten. Ich bedanke mich fürs Zuschauen und sage: Bis zum nächsten Mal und tschüss.

Informationen zum Video
4 Kommentare
  1. Default

    Der Statistik I Kurs ist abgeschlossen, daher werden keine neuen Videos mehr hinzukommen.

    Von Statistik Jona, vor fast 4 Jahren
  2. Default

    lieber Tutor, kannst du evtl. ein Video zur additiven und multiplikativen Verteilung hochladen ?
    Ist eigtl das Einzige was fehlt

    Von Binguelaskar, vor fast 4 Jahren
  3. Default

    Stimmt, hab ich mich wohl versprochen.

    Von Statistik Jona, vor etwa 4 Jahren
  4. Default

    An der Stelle 5:28 in diesem Video spricht Jona ''... Der Rangplatz 15 ist also noch bei Merkmal 1" . Muss es nicht lauten : " ... Der Rangplatz 15 ist also noch bei Ausprägung 1 (zu dem beobachteten Merkmal)" ?

    Von Hestero, vor etwa 4 Jahren