Textversion des Videos

Transkript Kumulierte Häufigkeiten

Hallo, wir haben schon die absoluten Häufigkeiten besprochen hk, die relativen Häufigkeiten fk und die prozentualen Häufigkeiten pk und kommen jetzt zu den kumulierten Häufigkeiten. Da gibt es die kumulierten absoluten Häufigkeiten, die kumulierten relativen Häufigkeiten und die kumulierten prozentualen Häufigkeiten und zusammen heißen die einfach Summenhäufigkeiten. Das sieht dann so aus, dass hier z.B. in der 3. Zeile der relativen Häufigkeiten nicht nur die relative Häufigkeit dieser Merkmalsausprägung steht, sondern man addiert die 1., 2. und 3. Zeile und trägt die Summe dann in der 3. Zeile ein, bei den kumulierten relativen Häufigkeiten. Das funktioniert an diesem Beispiel aber nicht und zwar deshalb, weil diese Farben um die es ja hier in diesem Beispiel ging, so wie wir sie benutzt haben keine vernünftige Reihenfolge haben. Man kann die natürlich physikalisch von den Wellenlängen her in eine Reihenfolge bringen, haben wir hier aber nicht gemacht und deshalb steht hier keine sinnvolle Reihenfolge, deshalb macht es auch keinen Sinn von oben nach unten hier irgendetwas aufzusummieren. Also dafür brauchen wir ein anderes Beispiel. Ich habe mir hier mal eines zusammengebastelt. Wie könnte die Situation sein? Wir sitzen in einer Vorlesung und sage ich mal 50 Studenten werden gefragt "Wie zufrieden sind sie mit dieser Lehrveranstaltung?" und zwar sollen die Schulnoten von 1 bis 5 vergeben werden. Dann könnte es sein, dass 3 Studenten die Lehrveranstaltung mit 1 beurteilen und 12 mit 2 beurteilen und so weiter. Hier habe ich dann also die absoluten Häufigkeiten hingeschrieben, zusammen sind es 50 Studenten die befragt werden. Dann kann man die relativen Häufigkeiten ausrechnen, einfach diese Zahlen hier jeweils durch 50 teilen, also durch die Anzahl der befragten Personen, dann kommen diese Zahlen raus. Wenn man die mit 100 multipliziert hat man die prozentualen Häufigkeiten, manchmal steht hier ein Prozentzeichen und manchmal eben nicht. Das ist egal, prozentuale Häufigkeiten ist ja auch so klar, glaube ich. Dann kommen wir zu den kumulierten Häufigkeiten. Wir haben jetzt eine vernünftige Reihenfolge hier, 1 ist das Beste, 5 ist das Schlechteste, das macht Sinn und jetzt können wir hier bei den kumulierten absoluten Häufigkeiten, hck heißen die, folgendes bemerken: In der 1. Zeile steht das Gleiche wie hier in der 1. Zeile. In der 2. wird die 1. und 2. absolute Häufigkeit, also h1 und h2 addiert und hier hingeschrieben und das ist dann hc2, die kumulierte absolute Häufigkeit hier bei dem 2. Wert in dieser natürlichen Reihenfolge. Der 3. kommt zustande, also hc3 kommt zustande, indem man h1 und h2 und h3 addiert. Unten sind wir dann bei der 50, weil wir dann hier alle absoluten Häufigkeiten addiert haben. Solche kumulierten Häufigkeiten sind dann ganz praktisch, wenn man z.B. wissen will, wie viele Studenten beurteilen die Lehrveranstaltung mit 3 oder besser, dann kann man das gleich hier ablesen, es sind 37. Ähnlich verhält es sich mit den relativen Häufigkeiten, man muss hier jetzt einfach jeweils diese kumulierten absoluten Häufigkeiten durch 50 teilen und erhält dann diese Werte. Man kann auch einfach diese relativen Häufigkeiten hier addieren, z.B. erhält man 0,65 wenn man 0,06+0,24+0,44 rechnet. Unten steht dann die 1, wenn man alle relativen Häufigkeiten addiert kommt man ja zu der 1. Bei den prozentualen Häufigkeiten ist es so, dass man dann am Ende zu 100 kommt, das ist das gleiche Verfahren. Hier kann man auch ganz gut sehen, dass 65% der Studenten mit der Lehrveranstaltung ganz zufrieden sind, so kann man das wohl sagen, wenn sie mit 3 oder besser beurteilen oder sie sind mindestens zufrieden sage ich mal, das sind 65%. Ich weiß nicht ist das ein guter Wert oder nicht? Keine Ahnung. Ich werde zwar auch oft beurteilt bei meinen Lehrveranstaltungen, die Beurteilungen sind dann aber für mich nicht ganz brauchbar, weil z.B. manche dann schreiben, dass es ganz schlecht war und wenn ich dann frage warum, dann sagt man "Ja ich mag Mathe eben nicht.". Hier habe ich noch mal aufgeschrieben, wie das dann formal aussieht, wie man z.B. die kumulierten absoluten Häufigkeiten hck ausrechnen kann. Man braucht zunächst mal die absoluten Häufigkeiten h1, h2, h3, h4 und so weiter und wenn man jetzt z.B. die kumulierte absolute Häufigkeit hc4 bestimmen möchte, dann nimmt man zunächst mal h1, also man setzt hier für das q zunächst mal 1 ein, dann rechnet man +h2, als nächstes setzt man dann für q dann hier 2 ein, so ist das gemeint mit dem Summenzeichen und das macht man so lange, bis man k erreicht, k habe ich gesagt soll hier 4 sein, also muss man hier die absoluten Häufigkeiten h1, h2, h3 und h4 alle addieren, so ist dieses Summenzeichen hier zu lesen. Da habe ich das mal mit 3 noch mal hingeschrieben, wenn wir hc3 bestimmen wollen setzen wir erst für q 1 ein, dann 2, dann 3, addieren alle absoluten Häufigkeiten und dann müsste man das noch ausrechnen, aber das ist ja hier schon in der Tabelle drin. Das zu den kumulierten absoluten Häufigkeiten und die kumulierten relativen Häufigkeiten hck und die kumulierten prozentualen Häufigkeiten pck errechnet man dann ganz genau so. Eine kleine Sache noch zu sekundären Häufigkeiten, da kann ich mich kurz fassen und zwar kann folgendes passieren: Wenn wir z.B. wie das letztens in einer TV-Show gemacht wurde, zumindest wurde es da eingeblendet, wenn man Leute danach fragt, wie viele Menschen in Deutschland wohnen, dann kann man sehr unterschiedliche Antworten bekommen. Man müsste zunächst mal sagen ok von wo bis wo soll das denn gehen, also hier würde ich sagen ist erst mal 0 und hier z.B. müsste dann der höchste anzunehmende Wert sein, ich sage mal 10000000000 vielleicht. Dann hat man eine große Skala hier also und dann würden hier irgendwelche Nennungen bei 1000000000 oder bei 80000000, hoffe ich manche sagen 80000000 und ich glaube irgendwie 12000 ist auch schon vorgekommen. Das müsste man dann alles hier ordnungsgemäß verteilen und man hätte dann irgendwann die Situation, dass man solche Werte hier bekommt und dass vielleicht nicht allzu viele Werte mehrmals genannt werden, vielleicht wird 80000000 mehrmals genannt, aber andere vielleicht nicht, die werden nur ein Mal genannt. Wenn man jetzt also die einzelnen Merkmalsausprägungen hier auflisten würde, dann hätte man einen schlechten Überblick über die ganze Situation hier und deshalb macht man in so einem Fall folgendes: Man teilt die ganze Skala in Intervalle ein und dann hat man z.B. hier ein Intervall und da ein Intervall und da eins und da eins und da eins und da oben auch noch eins. Meistens sollen die dann gleich breit sein, da ich das jetzt hier nur mal eben schnell andeutungsweise mache sind die vielleicht nicht ganz gleich breit. Dann fasst man alle Nennungen die jetzt z.B. in diesem Intervall liegen zusammen zu einer absoluten Häufigkeit, alle Nennungen die in diesem Intervall liegen auch zu einer absoluten Häufigkeit zusammen und hat dann so einen besseren Überblick über die Zahlen die genannt wurden und man kann dann eben auch besser damit arbeiten. Die Frage ist immer, wie viele Intervalle braucht man, wie viele Intervalle sind sinnvoll? Da kann ich nur sagen, das hängt von dem Zusammenhang ab, allgemein kann man das nicht sagen. Der Zusammenhang bezieht sich dann nicht nur auf die Frage die gestellt wird also hier in dem Fall z.B. "Wie viele Menschen leben in Deutschland?", sondern hängt auch davon ab, was man daraus schließen will und was man mit diesen Daten nun eigentlich anfangen will. Deswegen kann ich hier allgemein nichts dazu sagen, außer es muss sinnvoll sein. Das war es dazu, viel Spaß damit. Tschüss!  

Informationen zum Video
6 Kommentare
  1. Default

    Trotzdem gutes !

    Von Niklas T., vor 8 Monaten
  2. Default

    @Giuliano Murgo
    Tut mir Leid, dass ich diese 9 Monate vergangene Diskussion nochmal wiederbelebe :D
    Auf der rechten Tafel, von der Joschua Ribow schon geredet hat steht bei der absoluten Häufigkeit 3 (von 50) die relative Häufigkeit 0.15. Nach der Formel 3/50 müsste da wohl auch 0.06 stehen und 3 sind auch nicht 15% von 50, wie in der ersten Zeile behauptet, das stimmt einfach nicht.
    Grüße

    Von Timart, vor mehr als einem Jahr
  3. Default

    Alles klar, vielen Dank für die Info und die schnelle Antwort!

    Von Joshua Tibow 1, vor mehr als 2 Jahren
  4. Giuliano test

    @Joshua Tibow:
    Die rechte Tafel bezieht sich auf den vorherigen Versuch mit den alten Wahrscheinlichkeiten.
    Die kumulierte Tabelle auf der zweiten Tafel bezieht sich noch auf die kumulierten relativen Wahrscheinlichkeiten des vorherigen Versuchs (das siehst du an den absoluten Häufigkeiten h_k). Die kumulierte Tabelle hier ist richtig:
    f_ck
    0,15
    0,15+0,3 = 0,45
    0,45+0,2 = 0,65
    0,65+0,1 = 0,75
    0,75+0,25 = 1

    Die kumulierte Tabelle der relativen Häufigkeiten zu der linken Tafel ist hier nicht zu sehen. Diese müsste so aussehen:
    f_ck
    0,06
    0,06+0,24 = 0,30
    0,3+0,44 = 0,74 (!)
    0,74+0,14 = 0,88
    0,88+0,12 = 1

    Allerdings hat er gesagt, dass sich der Wert 0,65 aus den relativen Häufigkeiten f_k auf der linken Tafel berechnen lässt. Das war leider nicht korrekt. Die Tafel mit den nicht kumulierten relativen Häufigkeiten ist hier leider nicht mehr im Bild.
    Vielen Danl für deinen Kommentar. Ich hoffe, ich konnte dir weiterhelfen.

    Von Giuliano Murgo, vor mehr als 2 Jahren
  5. Default

    Kleine Anmerkung zu 4:17-4:33... die rechnung ist falsch.
    0,06+0,24+0,44= 0,74 und nicht 0,65 wie erwartet.

    Von Joshua Tibow 1, vor mehr als 2 Jahren
  1. 380812 10150428217592691 530367690 9029051 1202273292 n

    gibt es auch kumulierte wahrscheinlichkeit??

    Von Mathe 12, vor mehr als 4 Jahren
Mehr Kommentare