Advent, Advent, 1 Monat weihnachtliche Laufzeit geschenkt.

Nicht bis zur Bescherung warten, Aktion nur gültig bis zum 18.12.2016!

Textversion des Videos

Transkript Geometrisches und harmonisches Mittel, Modalwert und Median

Hallo! Es gibt nicht nur das arithmetische Mittel es gibt auch andere Mittelwerte. Die spielen aber keine so große Rolle wie das arithmetische Mittel und deshalb hat man sich drauf geeinigt, wenn nichts anderes gesagt wird und vom Durchschnitt die Rede ist, oder vom Mittelwert oder einfach vom Mittel, dann meint man immer das arithmetische Mittel. Wenn man andere Mittelwerte meint, dann sagt man das auch, welche man da genau meint. Es gibt das geometrische Mittel. Das entsteht, indem man die Messwerte alle multipliziert und dann die n'te Wurzel aus diesem Produkt zieht. Hier hat man sich drauf geeinigt, das alle Messwerte, wenn man dieses geometrische Mittel verwenden möchte, größer als 0 sein sollen. Das habe ich hier auch noch mal anders aufgeschrieben, das geometrische Mittel. Dieses ∏ hier ist das Produktzeichen ähnlich des Summenzeichens. Nur das eben hier nicht addiert, sondern multipliziert wird. Das geht auch von i=1 bis n. Das heißt, alle Messwerte werden multipliziert und dann kann man auch auf das Wurzelzeichen verzichten, wenn man weiß das ja gebrochene Exponenten Wurzeln sind. Das heißt, wenn ich die n'te Wurzel ziehen möchte dann kann ich dieses Produkt hier auch mit 1÷n potenzieren. Das habe ich hier gemacht. Also das ist gleiche egal, in welcher Form das aufgeschrieben wird. Ich wollte das nur mal gezeigt haben. Dann gibt es noch das harmonische Mittel. Das geht dann so, man nimmt nicht die Messwerte selber, sondern bildet das Reziproke dazu. Das eins durch Messwert. Diese werden dann alle addiert, die reziproken Werte der Messwerte, und dann teilt man die Anzahl der Messwerte durch diese Summe. Das ist das harmonische Mittel. Ich erkläre jetzt nicht weiter, wie man darauf kommt und so. Das ist einfach, möchte ich mal so stehen lassen. Hier ist es natürlich nötig das die xi Werte also alle Messwerte ≠= sind. Denn sonst ist ja ein Quotient gar nicht definiert. Dann gibt es noch den Modalwert, auch Mo abgekürzt, oder wie auch immer. Da gibt es viele Bezeichnungen. Die kann ich jetzt nicht alle aufführen. Der Modalwert ist der am häufigsten vorkommende Wert. Den kann man verwenden, wenn man Messwerte hat, die auch dafür geeignet sind. Also ich hatte ja mal das Beispiel gebracht von einem korrupten Staat, in dem sehr viele Menschen arm sind und nur sehr wenige sehr reich sind. Wenn man dann zum Beispiel mal das Jahreseinkommen statistisch erheben würde, könnte es durchaus Sinn machen, das am häufigsten vorkommende Jahreseinkommen herauszuheben und zu benennen. Denn das arithmetische Mittel könnte ja irreführend sein, denn wenn sehr viele wenig haben und ganz wenige sehr viel haben, kommt als Durchschnitt immer noch was, ein ganz vernünftiges Einkommen heraus. Wenn man allerdings dann den häufigsten vorkommenden Wert nimmt, dann sieht man das schon wieder ganz anders aus. Der würde dann in so einer Konstellation sehr gering sein. Zweites Problem, da kann ich gleich bei diesem Beispiel bleiben ist, wenn man sehr viele Messwerte hat. Sehr viele unterschiedliche Messwerte. Das wollte ich sagen. Auf die Unterschiedlichkeit kommt es dabei an. Wenn wir jetzt ein Jahreseinkommen nehmen, das jetzt zum Beispiel mal auf Euro und Cent ausrechnen, dann hätten wir wahrscheinlich sehr viele unterschiedliche Jahreseinkommen und dann könnte es sein, das irgendwo ein Jahreseinkommen 2 Mal vorkommt und das ist dann der am häufigsten vorkommende Wert. Der muss aber nichts irgendwie mit einem Mittelwert oder so was zutun haben. Wenn man so was hat, dann bildet man erst mal Kategorien oder man bildet Klassen. Das heißt das man bestimmte Einkommen in eine Gruppe und andere Einkommen kommen in die andere Gruppe und dann zählt man einfach, wie oft kommt diese Einkommengruppe vor und wie oft kommt diese Einkommensgruppe vor. Und diese und diese, und diese. Und dann kann es durchaus Sinn machen hier den Modalwert zu ermitteln und der kann dann durchaus aussagekräftig sein. Das funktioniert übrigens bei allen Merkmalen. Das wollte ich dazu sagen. Dann gibt es noch den Median. Den bezeichnet man auch schon mal als x Schlange. Ja, das hier oben, diese Welle, diese Schlange oder Tilde auch. Oder man sagt Md. Oder andere Bezeichnungen für den Median. Ist egal. So und das ist der Wert in der Mitte. Was braucht man dazu? Man braucht erst mal ein ordinal skaliertes Merkmal. Denn um den Median zu finden müsste man zumindest mal theoretisch jetzt im Kopf die Messwerte alle anordnen zu können, und zwar der Größe nach. Das habe ich hier mal angedeutet. x(1) soll jetzt nicht der Messwert sein, den man als Erstes ermittelt hat. Sondern es ist in der Ordnung dieser Messwerte, der der am weitesten links steht. Oder der Kleinste. Und das macht man üblicherweise so, wenn man Messwerte hat, von 1-n, und ordnet die um. Dann heißt das erste Element oder der erste Messwert, der in der Ordnung dann als Erstes steht. Da als Erste, ist ja eh egal. Den bezeichnet man dann auch als x(1). Aber die 1 kriegt dann ne Klammer. Das heißt, es ist umgeordnet worden. Bei x(2) genauso hier. O.k., also man ordnet die Messwerte alle der Größe nach an, und wenn man jetzt eine ungerade Anzahl von Messwerten hat, dann nimmt man einfach den in der Mitte, den mittleren Wert, und das ist dann der Median. Wenn man eine gerade Anzahl von Messwerten hat, dann nimmt man die beiden in der Mitte und bildet das arithmetische Mittel aus beiden. Und das ist dann der Median. Zwei Anmerkungen muss ich dazu noch machen. Der Median wird schon mal unterschiedlich beschrieben. Und zwar geht es dabei immer, was macht man, wenn man eine gerade Anzahl von Messwerten hat. Manche Sagen auch, manche Autoren, dass jeder Wert zwischen den beiden mittleren Werten bei einer geraden Anzahl an Messwerten der Median sein kann. Die meisten sagen tatsächlich, soweit ich das jetzt überblicken kann, das arithmetische Mittel aus den beiden mittleren Werten, ist der Median. Manche sagen eben jeder Wert dazwischen. Oder manche sagen auch, entweder der oder der. Das kann man sich dann aussuchen. Und zwar muss es einer der Messwerte sein. Normalerweise, in Anführungszeichen normalerweise, wenn man viele Messwerte hat, ist das nicht so tragisch. Die Unterschiede sind dann sehr gering. Allerdings muss man dann schon mal bei manchen extremen Messwerten, bei extremen Messreihen, bei wenig Datenmaterial, muss man dann schon mal gucken, was man da als Median sinnvollerweise verwenden kann. Die zweite kleine Anmerkung dazu ist noch, dass es eine Minimalitätseigenschaft des Medians gibt. Und zwar können wir Folgendes machen. Wir nehmen den Median und wir bilden, wir rechnen einfach Messwert - Median. Davon bilden wir den Betrag. Das heißt, wir machen das immer positiv und diese Beträge werden alle addiert. Und das, was da rauskommt, das ist minimal. Das bedeutet, ich könnte hier auch eine andere Zahl nehmen, oder einen anderen Messwert nehmen. Und auch diese Beträge bilden und die alle addieren. Aber wenn ich eine andere Zahl nehme, dann kommt bei der Summe hier etwas Größeres raus als wenn ich hier den Median verwende. Übrigens diese Minimaltiätseigenschaft gibt es nur dann, wenn man den Median bei geraden Anzahlen von Messwerten als arithmetisches Mittel der beiden in der Mitte liegenden Messwerte definiert. Sonst gilt diese Eigenschaft nicht oder sonst gilt sie nur annähernd. Ich möchte kurz zeigen, wie man sich das vorstellen kann. Warum hier wirklich so etwas herauskommt. Und zwar nehme ich jetzt hier irgendwelche Messwerte. Ich nehme jetzt eine gerade Anzahl von Messwerten, damit das nicht weiter kompliziert wird, 1, 2, 3, 4, 5, 6, 7. Habe ich gesagt gerade Anzahl? Ungerade Anzahl von Messwerten. Ist egal. 7 Messwerte ist eine ungerade Anzahl. Und der Median ist hier. Und was man jetzt macht, wenn man diese Summe bildet, ist, man nimmt diese Strecke hier, diesen Abstand. Plus dieser Abstand, plus dieser Abstand. Die Abstände sind immer positiv, nicht wahr. Plus dieser Abstand, dieser und dieser. Na, das ist ein bisschen krumm geworden. Ja, das soll hier nur die Andeutung sein, wie man sich das vorstellen kann. Das, das wirklich minimal ist. Ist immer noch krumm. Macht nix. So, das sind erst mal diese Abstände, die man bildet. Also diese Abstände, die man addieren muss, wenn man diese Summe hier bilden möchte. Jetzt könnte man natürlich sagen. O.k., ich nehme einen anderen Messwert. Also nur mal so für die Idee. Ich könnte den nehmen hier. Dann bilde ich den Abstand hier hin und dahin, und den Abstand hierhin und dann zu den weiteren Messwerten. So, was ist jetzt passiert? Diese Distanz hier, kommt bei dem regelgerechten Gebrauch hier, bei der blauen Situation, 3 Mal vor. Wenn ich einen Messwert nehme, der weiter links liegt, dann kann ich hier bei den weiter links liegenden Messwerten, diesen Abstand einsparen. Und zwar 2 Mal in dem Fall, weil jetzt hier 2 Messwerte noch weiter links liegen als der hier. Allerdings liegen 4 Messwerte rechts von diesem Messwert, der ja jetzt nicht der Median ist. Das heisst, ich muss diese Distanz hier 4 Mal überwinden und hier bei der blauen Situation, kommt diese Distanz nur 3 Mal vor. Ansonsten ändert sich nichts. Diese 3 hier, kommen auch hier wieder vor. Das sind die 3. Diese beiden hier, kommen da wieder vor. Aber diese Strecke kommt bei der roten Situation hier, wo ich nicht den Median genommen habe, 4 Mal vor, da kommt sie nur 3 Mal vor. Und ja, so kann man sich ungefähr vorstellen, warum der Median diese Minimalitätseigenschaft hat. Das kann man natürlich noch jetzt die anderen sich auch vorstellen. Oder auch für gerade Anzahlen von Messwerten. Hier soll es erst mal dabei belassen werden. Viel Spaß damit. Tschüss!

Informationen zum Video