Advent, Advent, 1 Monat weihnachtliche Laufzeit geschenkt.

Nicht bis zur Bescherung warten, Aktion nur gültig bis zum 18.12.2016!

Textversion des Videos

Transkript Absolute, relative und prozentuale Häufigkeit

Hallo! Wir machen Statistik. Die Statistik gliedert sich in 2 große Bereiche: die deskriptive Statistik und die Inferenzstatistik. Die deskriptive Statistik ist die beschreibende Statistik. Die enthält die Mittel, mit denen man Datenmengen beschreiben kann, die bei statistischen Untersuchungen so anfallen. Die Inferenzstatistik enthält die Mittel, mit denen man aus den gewonnenen Datenmengen Schlüsse ziehen kann. Deshalb heißt sie die Inferenzstatistik, eben auch schließende Statistik. Es geht los mit der deskriptiven Statistik oder der beschreibenden Statistik. Und da möchte ich hier exemplarisch eine statistische Untersuchung durchführen, oder das zumindest andeuten. Wir haben Objekte, oder auch Menschen werden manchmal untersucht. Hier habe ich jetzt einfach Objekte. Wir können festlegen, welches Merkmal wir untersuchen wollen, das heißt, nach welcher Eigenschaft wir diese Objekte jetzt befragen, zum Beispiel könnte das die Farbe sein. Dann müssen wir festlegen, welche Merkmalsausprägungen gibt es, also welche verschiedenen Farben sind denn hier möglich. Da sage ich jetzt mal lila, blau, gelb, grün, rot. Habe ich was vergessen? Ist egal, werden wir gleich sehen. Dann geht es los mit der statistischen Untersuchung. Ich frage also dieses Objekt: "Welche Farbe hast du?", und dann stelle ich fest, es ist blau. Und dann nehme ich noch eins, das ist grün, stelle ich fest. Ich schreibe das hier jetzt auf: b für blau, gr für grün. Und dann habe ich eins, das ist auch blau. Das ist zwar ein unterschiedliches blau hierzu, aber wenn ich zum Beispiel vorher festgelegt habe, für mich gibt es nur blau, ich möchte nicht zwischen dunkel- und hellblau unterscheiden, dann ist das eben auch wieder blau und dann schreibe ich ein b auf. Dann gibt es noch lila hier. Das ist lila, l. Und dann haben wir noch gelb, für g, und so weiter. Das müsste ich hier jetzt alles aufschreiben. Mache ich jetzt nicht vor. Habe nicht hier alle untersucht und habe hier einfach die Farben aufgeschrieben oder eben die Merkmalsausprägungen aufgeschrieben. Das, was dann hier entstünde, wenn ich das alles aufgeschrieben hätte, das ist die Urliste. In der Urliste sind einfach die Daten drin, die man bei der statistischen Untersuchung gewonnen hat, und zwar einfach in der Reihenfolge, in der sie auftreten, wie sie anfallen in dieser Untersuchung. Sie sind schlicht und ergreifend nicht weiter geordnet. Solche Urlisten sind für uns Menschen nicht besonders anschaulich, wir können nicht viel daraus erkennen. Und deshalb gibt es ja die deskriptive Statistik. Da gibt es ja mehrere Möglichkeiten, wie man eine solche Urliste aufbereiten kann, damit man was erkennen kann. Eine Möglichkeit ist es, aufzuschreiben, wie oft zum Beispiel lila in dieser Urliste vorkommt. Ich müsste einfach zählen, wie viele l da stehen. Das habe ich hier schon mal vorbereitet. Wenn ich das also nachzählen würde, oder ich kann auch hier nachzählen, wie viele dieser Objekte sind lila, dann stelle ich fest: Es sind 6 Objekte. Hier: Wie viele Objekte sind blau? Dann stelle ich fest: Es sind 12 Objekte. Das heißt, ich kann einfach die Anzahl der Objekte, die eine bestimmte Merkmalsausprägung haben, hier hinschreiben, das in so einer Liste zusammenfassen. Das, was ich hier dann erhalte, ist die Häufigkeitsverteilung. Also diese beiden Spalten zusammen hier, das ist die Häufigkeitsverteilung. Jetzt habe ich hier Pfeile hingeschrieben, und zwar deshalb, weil man häufig auch sagt, dass eine Häufigkeitsverteilung eine Funktion ist. Man kann das Ganze hier auch als Funktion sehen, ist in vielen Bereichen dann praktischer. Also: Der Merkmalsausprägung lila wird die Anzahl der Objekte zugeordnet, die hier lila sind, oder die Anzahl der l in dieser Urliste wird dieser Merkmalsausprägung zugeordnet. Der Merkmalsausprägung blau wird die Anzahl der b, die in dieser Urliste auftreten, zugeordnet. Das ist eine Funktion. Und so kann man auch die Häufigkeitsverteilung hier als Funktion sehen. Die Häufigkeiten heißen hk. Für k kann man die verschiedenen Merkmalsausprägungen einsetzen. K nimmt man deshalb, weil hier oft natürliche Zahlen stehen. Merkmalsausprägungen nummeriert man häufig, man könnte jetzt auch 1,2,3,4,5 hier hinschreiben, und dann wäre h3, wenn 3 hier steht, also gleich 8. H3=8, weil die absolute Häufigkeit der Merkmalsausprägung Nummer 3 = 8 ist. Absolute Häufigkeit sagt man deshalb - also Häufigkeit ist klar, weil das die Häufigkeit ist, mit der ein bestimmtes Merkmal auftritt, absolut deshalb, weil hier einfach nur die Zahl steht und nichts weiter, die steht absolut für sich da. Es gibt auch andere Häufigkeiten, nämlich relative Häufigkeiten. Die stehen hier und die werden mit fk bezeichnet. Relative Häufigkeiten erhält man, wenn man die Anzahl der Objekte mit einer bestimmten Merkmalsausprägung durch die Anzahl aller Objekte teilt - Elemente haben wir nur, wenn wir das ordentlich mit Mengen machen. In dem Fall könnte ich zum Beispiel die Anzahl der lila Objekte durch die Anzahl aller Objekte teilen. Das ist dann also geteilt durch 40, weil man hier alle absoluten Häufigkeiten zusammenzählen kann und dann erhält man ja alle Objekte, die untersucht wurden. Das sind dann 40. Also: 6÷40=0,15. Das steht hier. Das ist die relative Häufigkeit f für die Eigenschaft l, also für die Eigenschaft lila. Allgemein kann man sagen, dass man fk bestimmt, indem man hk nimmt, also die absolute Häufigkeit, und durch die Anzahl aller untersuchten Objekte teilt, also geteilt durch n. Die Anzahl aller untersuchten Objekte hat in der Regel den Buchstaben n. Dann kann man diese relativen Häufigkeiten, die jetzt hier stehen, für diese ganzen Merkmalsausprägungen auch noch anders schreiben, und zwar als Prozentzahlen. Dazu muss man diese relativen Häufigkeiten einfach mit 100 multiplizieren. Und ich glaube, es ist kein großes Geheimnis, wenn ich sage, 0,15 ist das gleiche wie 15%, 0,3 ist das gleiche wie 30%. Und das sind hier die Prozentzahlen, die da stehen. Ich habe es auch gesehen, dass da das Prozentzeichen jeweils dahinter steht, das kann man natürlich auch machen, je nachdem, wie man das haben will. Ich habe es jetzt hier als zahl einfach geschrieben, ohne das Prozentzeichen, aber gemeint sind natürlich Prozente und ich glaube, das sollte kein großes Problem sein. Das sind schon mal 3 verschiedene Ansätze, mit denen man Daten beschreiben kann. Wir wissen, wenn wir das hier so sehen, mehr als vorher. Zum Beispiel können wir hier bei den absoluten Häufigkeiten sehen, dass es weniger rote als lila Objekte gibt. In so einer Urliste ist so etwas nicht so einfach zu sehen. Und wenn man diese Objekte hier vor sich hat, dann ist das, glaube ich, auch nicht zu erkennen. Hier bei den relativen Häufigkeiten sehen wir, wie groß der Anteil zum Beispiel der gelben Objekte an der Gesamtheit ist. Wir wissen, es ist 0,2, also 1/5 dieser Objekte sind gelb. Auch das kann man so nicht sehen, aber in der Liste dieser relativen Häufigkeit kann man das sehen. Und wenn wir das als Prozente schreiben, als Prozentzahlen, dann ist es ganz besonders eingängig. Weil wir es eben gewohnt sind, mit Prozenten umzugehen. Kleine Anmerkung noch zu den Spaltensummen: Hier habe ich es schon gesagt. Wenn man alle absoluten Häufigkeiten addiert, dann erhält man die Anzahl aller untersuchten Objekte, beziehungsweise man kann auch sagen: die Anzahl aller Einträge hier in der, mittlerweile etwas verwischten Urliste. Wenn man alle relativen Häufigkeiten addiert, dann erhält man 1. Liegt an der Sache, dass man durch die Anzahl aller Objekte geteilt hat. Wenn man sich das als Brüche vorstellt, und die ganzen Brüche addiert, hat man im Zähler die Summe aller absoluten Häufigkeiten und im Nenner steht ja jeweils die Anzahl aller untersuchten Objekte. Und dann steht da letzten Endes n/n und das ist 1. Da wir zu diesen Zahlen kommen, indem wir diese mit 100 multiplizieren, können wir hier auch alle Zahlen addieren und erhalten dann als Spaltensumme die Zahl 100, wenn wir es richtig gemacht haben. Ja, das war es zu diesen Begriffen. Als erstes mal viel Spaß damit. Tschüss.  

Informationen zum Video
6 Kommentare
  1. Default

    Dank Ihnen macht mir Statistik langsam Spass!
    Hätte nie gedacht :)

    Von Ibususa, vor 21 Tagen
  2. Koala

    Bald mündliches Abi. Gut aufgebautes Video! Toller Start in die Stochastik! :)

    Von Madina , vor mehr als einem Jahr
  3. Default

    Das Thema endlich verständlich erklärt, vielen Dank!

    Von Deleted User 16852, vor etwa 6 Jahren
  4. Img 4451

    ich meine damit das die grundregeln im thema auf ein bord geschrieben werden könnten .dann kann man wenn man einmal nicht genau aufgepasst hat ,kann man dann alle grundregeln sich nochmal durchlesen und sich besser einprägen
    trotzdem gutes video

    Von Driemeyer, vor etwa 6 Jahren
  5. Flyer wabnik

    Oh, konstruktive Kritik. Schön!
    Mir ist aber noch nicht ganz klar, was du genau meinst. Könntest du ein konkretes Beispiel dafür nennen, was du in diesem Film gerne noch schriftlich gesehen hättest? Dann kann ich es in den folgenden Filmen besser berücksichtigen.

    Von Martin Wabnik, vor etwa 6 Jahren
  1. Img 4451

    gut erklärt
    daumen hoch.du könntest die wichtigen sachen aber noch aufschreiben damit man sich daran halten kann

    Von Driemeyer, vor etwa 6 Jahren
Mehr Kommentare