Advent, Advent, 1 Monat weihnachtliche Laufzeit geschenkt.

Nicht bis zur Bescherung warten, Aktion nur gültig bis zum 18.12.2016!

Mittelwert 11:38 min

Textversion des Videos

Transkript Mittelwert

Hallo, wenn man statistische Erhebungen macht, sammelt man Daten und diese Daten, die man gesammelt hat, lassen sich beschreiben mit verschiedenen Möglichkeiten. Zum Beispiel auch mit Kennwerten. Es gibt Kennwerte, die sich auf die zentrale Tendenz beziehen, Maße der zentralen Tendenz heißen diese, und welche, die sich auf die Streuung beziehen, das sind Streuungsmaße oder man sagt auch Dispersionsmaße. Ich will ganz kurz zeigen, wie man sich das vorstellen kann. Das ist hier ein Säulendiagramm und Maße der zentralen Tendenz sagen aus, wo hier, ganz vereinfacht gesagt, die Mitte liegt. Zum Beispiel die Mitte dieses Säulendiagramms liegt nicht hier, sie liegt nicht da, sondern hier. Da ist das meiste quasi, so kann man das ganz locker mal sagen. Hier liegt das bei 25 auf dieser Skala. Streuungsmaße beschäftigen sich damit, wie breit ist das Ganze hier oder wie schmal ist das Ganze. Darüber sagen Streuungsmaße etwas aus. Kommt später noch genauer, nur dass du eine ganz sachte Vorstellung hast.

Eins der wichtigsten Maße der zentralen Tendenz ist das arithmetische Mittel oder man sagt einfach der Mittelwert. Der nennt sich "x quer" und den bildet man, indem man alle Messwerte x1, x2, x3 und so weiter bis xn addiert und die gesamte Summe durch die Anzahl der Messwerte teilt. Ich möchte das kurz veranschaulichen: Wir haben hier Messwerte. Wir haben dreimal die 1 gemessen, wir haben 12-mal die 2 gemessen, 22-mal die 3 und so weiter. Wenn wir jetzt davon das arithmetische Mittel bilden wollten, dann müssten wir Folgendes machen:

Wir nehmen die drei Messwerte, die 1 sind und schreiben die hierhin, dann steht da 1+1+1. Dann nehmen wir die 12 Messwerte, die 2 sind und schreiben sie auch dahinter, also ...+2+2+2+2+2+2+2+2+2+2+2+2. 12-mal steht dann da +2 und dann kommt 22-mal der Summand 3, also ...+3+3+3+..., 22-mal, und so weiter bis zur 5. Da muss man einmal genau wissen, was wird da eigentlich jetzt konkret eingesetzt. Also die einzelnen Messwerte, die dann hier also mehrfach vorkommen, stehen dann hier oben im Zähler. Geteilt wird das Ganze in dem Fall durch 40, weil wir 40 Messwerte da stehen haben.

Das Ganze kann man jetzt auch anders schreiben. Man kann diese Summe, die hier oben steht, also die Summe aller Messwerte, kann man ja auch mit dem Summenzeichen schreiben. Der Laufindex ist jetzt i, also die Summe von i=1 bis n der xi. Gemeint ist damit, man setzt zunächst mal hier 1 ein und hat dann x1, dann schreibt man ein +-Zeichen und setzt dann die nächstgrößere Zahl ein, also 2, dann hat man hier x2 stehen, also der zweite Messwert, der steht dann da und dann addiert man so lange, bis der Laufindex i bei n angekommen ist, also der Anzahl aller Messwerte. Und das kann man auch so schreiben, man kann 1/n rechnen oder durch n teilen, das ist ja dann egal, das ist das Gleiche. Ich habe es nur aufgeschrieben, weil sie in diesen Formen vorkommen.

Ein ganz kleines bisschen komplizierter und für manchen Lernenden auch etwas verwirrender sieht die Sache dann aus, wenn man Kategorien verwendet. Verwirrend ist es dann öfter, weil die Bezeichnungen in der Literatur sehr unterschiedlich sind. Also ich versuch das mal aufzuklären: Mal angenommen, wir haben Messwerte, die hier irgendwo sind. Da uns das zu viele Messwerte sind, die zu viele unterschiedliche Ausprägungen haben, teilen wir die in Kategorien ein, also in Intervalle. Einfach so, ich habe gesagt, das Intervall soll 25 heißen, das soll 50 heißen, das soll 75 heißen und das 100. Das sind unsere Kategorien hier, diese Intervalle, und die Frage ist jetzt, wie können wir hier das arithmetische Mittel bilden? Also, vielleicht noch zur konkreten Vorstellung, man muss sich das dann so vorstellen, dass wir hier einmal den Messwert 25 haben, hier haben wir 9-mal den Messwert 50, egal wie der jetzt zustande kommt, hier haben wir 6-mal den Messwert 75 und 4-mal den Messwert 100. Also jetzt gibt es mehrere Formeln, wie man das arithmetische Mittel errechnen kann. Und zwar können wir die Anzahl der Kategorien nehmen, das ist hier dieses c, bei uns sind das 4, und wir können die relative Häufigkeit der Messwerte einer Kategorie nehmen, hier ist das dann fk, entsprechend der relativen Häufigkeit hier fk. Das ist hier die relative Häufigkeit der Kategorie 25 ist 1/20, denn wir haben 20 Messwerte und einer davon ist die 25. Die relative Häufigkeit der Kategorie 2, das ist die Kategorie 2, also die relative Häufigkeit f2, ist 9/20, denn wir haben 20 Messwerte und wir haben 9-mal den Messwert 50. Und so geht das hier weiter. Das sind diese relativen Häufigkeiten. Und hier sind die Messwerte, die wir erhalten haben. Also x1 ist 25, x2 ist 50, x3 ist 75 und x4 ist 100. Und wenn wir das dann so aufsummieren, wie es da steht, als (f1 × x1) + ((f2 × x2) + (f3 × x3) + (f4 × x4), dann erhalten wir das arithmetische Mittel. Ich sage das deshalb so deutlich, weil manchmal dieses f auch eben nicht für die relative Häufigkeit eines Messwertes steht oder einer Merkmalsausprägung, sondern für die absolute Anzahl der Messwerte, die sich in einer Kategorie befinden. Die absolute Anzahl der Messwerte in der Kategorie 50 ist 9. Wenn man hier 9 einsetzt, dann funktioniert das natürlich nicht, dann ist diese Formel so nicht richtig. Diese Formel ist dann richtig, wenn fk die relative Häufigkeit ist, in unserem Fall hier bei f2 also 9/20. Man kann das Ganze auch so schreiben. Und zwar wenn hk die absolute Häufigkeit ist, entsprechend der Bezeichnung wie wir sie hier haben. Wir können 1/n davor schreiben, habe ich hier schon mal gezeigt, und können dann nicht die einzelnen Messwerte alle hinschreiben, sondern wir können die absolute Häufigkeit eines Messwertes mit dem Messwert selber multiplizieren. Das würde also in dem Fall hier bedeuten, zum Beispiel, dass wir 3 × 1 hinschreiben. 3 ist die absolute Häufigkeit h1, also des Messwertes 1 und hier x1 ist dann der erste Messwert, also 1, also die erste Merkmalsausprägung müsste ich genauer sagen in diesem Fall. h2 ist die absolute Häufigkeit des Messwertes 2, also bei uns 12 × 2, müssten wir dann hier rechnen, x2 = 2. Das führt dann dazu, dass man nicht 2+2+2+2+... schreiben muss, sondern das einfach zusammenfasst zu 12 × 2.

Ich zeige das für dieses Beispiel auch noch mal ganz genau. Und zwar, wenn wir hier h1 einsetzen, dann ist das die absolute Häufigkeit der Messwerte in der Kategorie 25, also steht hier 1 für h1 und x1 ist unsere Kategorie 25, also steht hier für x1 25. h2 ist die absolute Häufigkeit 9 der zweiten Kategorie, also der Anzahl der Messwerte in der zweiten Kategorie und die Messwerte selber x2 sind ja jeweils gleich 50, wir haben 9-mal 50 gemessen. Und bei den anderen beiden ist das genauso. c ist wieder die Anzahl der Kategorien hier, also 4. Wenn man hier die absoluten Häufigkeiten stehen hat, dann muss man hier noch durch n teilen, durch die Anzahl aller Messwerte, in dem Fall hier also durch 20.

Jetzt kommt es vor, dass hk öfter für die relative Häufigkeit steht. Wenn hier die relative Häufigkeit steht, dann muss man hier nicht mehr durch n teilen. So funktioniert das nur, wenn hier die absolute Häufigkeit steht und so funktioniert es nur, wenn hier die relative Häufigkeit steht. Und wenn du also andere Bezeichnungen hast, dann schlage ich vor, dass du die einsetzt und dann ist die Wiese wieder grün. Ich glaube, das war deutlich genug. Viel Spaß trotzdem. Tschüss!

Informationen zum Video
4 Kommentare
  1. Sarah2

    @T Rogge: Danke für deinen Hinweis! Du hast Recht, im Nenner müsste 50 stehen. Ein entsprechender Hinweis wird nun an der Stelle eingeblendet. Viele Grüße!

    Von Sarah Kriz, vor mehr als einem Jahr
  2. Default

    Ihnen ist am Anfang, bei der Rechnung: x1 + x2 +… +xn durch n
    ein Fehler unterlaufen. Sie haben gesagt, dass das "n" unter dem Bruchstrich den Wert 40 hat, "n" hat aber den Wert 50

    Von T Rogge, vor mehr als einem Jahr
  3. Sava

    mensch du bist also wirklich Lehrer geworden wie du es immer gesagt hast

    Von Serhat B., vor etwa 2 Jahren
  4. Sava

    he Martin du bists wirklich ich bins, aus deiner alten klasse

    Von Serhat B., vor etwa 2 Jahren