Advent, Advent, 1 Monat weihnachtliche Laufzeit geschenkt.

Nicht bis zur Bescherung warten, Aktion nur gültig bis zum 18.12.2016!

Textversion des Videos

Transkript Statistik II - Video 1: Normalverteilung - Teil I

Herzlich willkommen werte Zuschauer. Ich bin der Konrad und mir wird die große Ehre zuteil, euch die nächste Zeit durch das allerorts beliebte Fach Statistik II begleiten zu dürfen. Zu diesem Fach werden wir vorab uns mit stetigen Wahrscheinlichkeitsverteilungen beschäftigen, zu denen auch die Normalverteilung gehört. Um euch das Ganze näher zu bringen, werden wir zunächst einen Ausflug machen zurück zu den Zufallsvariablen. Da kennt ihr bestimmt schon die diskreten Zufallsvariablen. Diese werden wir erweitern mit den stetigen, und dann werden wir die Normalverteilung an sich kennenlernen, ihre Parameter und ihre Spezifikationen. So, das heißt, wir beginnen jetzt mit den Zufallsvariablen. Ein bisschen Grundwissen bringt ihr in diese Richtung bestimmt schon mit. Was wichtig ist, ist einfach zu wissen, dass die Zufallsvariablen einfach eine Zuordnung von Ereignissen eines Zufallsexperimentes zu Zahlen hin ist. So, und hier ist nämlich der Unterschied: Was heißt jetzt hier zu Zahlen? Wir haben diskrete Zufallsvariablen, denn wir sehen hier, wir haben in den diskreten Zufallsvariablen endlich viele oder unendlich abzählbar viele Merkmalsausprägungen, sprich ganze Zahlen, 1, 2, 3, nichts dazwischen. Im Gegensatz dazu haben wir stetige Zufallsvariablen. Diese stetigen Zufallsvariablen können innerhalb eines Intervalls jeden beliebigen Wert annehmen. Das heißt, gehen wir ein bisschen näher zu den diskreten Zufallsvariablen. Wir erinnern uns an das einfachste Beispiel, an den Münzwurf. Ein Münzwurf hat die Merkmalsausprägungen, das heißt, die möglichen Ereignisse, die eintreten können, Kopf oder Zahl. Diese Kopf oder Zahl, diese Merkmalsauprägung, wollen wir nun aber in Zahlen umformen. Wie machen wir das? Indem wir beispielsweise die Merkmalsausprägungen definieren als Anzahl von Kopf. Das heißt beispielsweise, ich werfe die Münze 10× und mich interessiert jetzt persönlich in diesem Experiment, wie hoch ist die Wahrscheinlichkeit, dass beispielsweise maximal Kopf auftritt. Das heißt, mit dieser Fragestellung haben wir eine Merkmalsausprägung Kopf/Zahl in eine Zahl umgeformt. Im Gegensatz dazu haben die stetigen Wahrscheinlichkeitsverteilungen eben innerhalb eines Intervalls alle möglichen Zahlen, also nicht wie bei den diskreten Zufallsvariablen, von wegen das Ereignis trifft 1× zu, 2× oder 3×, sondern wir können beispielsweise bei einer stetigen Zufallsvariablen x= das Gewicht eines Neugeborenen definieren. In diesem Fall kann diese Merkmalsausprägung alle Werte annehmen, denn Gewicht kann beispielsweise auch ein Dezimalbruch sein, mit unendlich vielen Stellen. Anhand dieses Überblicks könnt ihr entnehmen, welche Wahrscheinlichkeitsverteilung zu welchen Zufallsvariablen zugehörig sind. So, wir sehen also die uns bereits bekannten Wahrscheinlichkeitsverteilungen, die zur diskreten Zufallsvariablen hinzukommen und die stetigen Wahrscheinlichkeitsverteilungen, die wir im Laufe der nächsten Videos kennenlernen werden. Ein kurzer Ausflug zu den uns bekannten Wahrscheinlichkeitsverteilungen: Wir wissen, welche Gemeinsamkeiten die Binomialverteilung und die hypergeometrische Verteilung haben, genau, sie sind anzuwenden bei einer dichotomen Grundgesamtheit. Dichotome Grundgesamtheit bedeutet nichts anderes, als das wir 2 mögliche Merkmalsausprägungen haben wie: trifft zu, trifft nicht zu, beispielsweise Kopf oder Zahl. Das wären Zufallsexperimente, zu denen eine dichotome Grundgesamtheit dazugehört. Der Unterschied zwischen Binomialverteilung und hypergeometrischer Verteilung ist einfach nur, dass wir bei der hypergeometrischen Verteilung ohne Zurücklegen spielen, in Anführungsstrichen. Sprich, wenn wir das beliebte Urnenspiel spielen, dass wir die gezogenen Kugeln nicht wieder zurücklegen und sich damit die Wahrscheinlichkeitsverteilung selbstverständlich ändert, weil die Grundgesamtheit sich ändert. Dann haben wir noch die geometrische Verteilung, die ist anzuwenden, wenn wir die Wahrscheinlichkeit dafür haben wollen, dass ein bestimmtes Ereignis das 1. Mal eintrifft, nach so und so viel Durchführungen eines Experimentes. Dann die Poissonverteilung, wird angewendet, wenn wir ein Ereignis betrachten, das sehr selten eintritt. Zu den Wahrscheinlichkeitsverteilungen bezüglich der stetigen Zufallsvariablen will ich jetzt an dieser Stelle nicht zu viel vorwegnehmen, möchte euch nicht unnötig verwirren. Es ist einfach der Überblick, der uns die nächsten Videos verfolgen wird und wir werden im Laufe der nächsten Veranstaltungen nach und nach die Wahrscheinlichkeitsverteilungen kennenlernen. Lasst uns an dieser Stelle noch mal gemeinsam den Unterschied zwischen diskreten und stetigen Zufallsvariablen verdeutlichen, in Form ihrer speziellen Wahrscheinlichkeitsfunktionen. Ja, das heißt, wir haben kennengelernt, was diskrete Zufallsvariablen sein können und was stetige Zufallsvariablen sein können. Nun ist es so, beispielsweise können wir hier bei der diskreten Zufallsvariable das Experiment eines Würfelwurfs nehmen. Für einen Würfelwurf haben wir die Merkmalsausprägungen 1, 2, 3 bis 6 und diese sollten offiziell, rein theoretisch und legal mit der Wahrscheinlichkeit 1/6 gleich verteilt sein. Also jedes Ereignis trägt die Wahrscheinlichkeit 1,6. Wir haben aber keine Wahrscheinlichkeit für einen Wert von 1,5, beispielsweise. So gesehen haben wir das hier eingezeichnet für die einzelnen Ereignisse 1 bis 6, die Wahrscheinlichkeit 1/6 für die diskrete Zufallsvariable in Form einer Wahrscheinlichkeitsfunktion. Gehen wir nun rüber zu den stetigen Zufallsvariablen. Hier müssen wir uns vorab ein paar Dinge merken. Zunächst hat jedes Ereignis x per Definition die Wahrscheinlichkeit = 0. Das heißt, wir sprechen hier in der Regel nicht von der Wahrscheinlichkeit für ein Ereignis x, sondern, wenn wir im späteren Verlauf Wahrscheinlichkeit für ein Ereignis x sagen, meinen wir aber die Wahrscheinlichkeitsdichte. Denn, die Wahrscheinlichkeit in der Dichtefunktion ergibt sich durch die Fläche, durch ein Integral. Integral innerhalb zweier Werte innerhalb eines Intervalls. Das Intervall kann man sehr klein legen, deswegen sagen wir an sich per Definition 0, aber wenn wir im weiteren Verlauf davon reden, meinen wir die Wahrscheinlichkeitsdichte. Die entspricht einer Fläche unter diesem Integral und somit einer Wahrscheinlichkeit für eine stetige Zufallsvariable. Gut, was hat die Verteilungsfunktion für einen Sinn? Anhand der Verteilungsfunktion können wir beispielsweise Wahrscheinlichkeiten bestimmen, die sagen: Wie groß ist die Wahrscheinlichkeit, dass ein Ereignis zwischen 1 und 3 eintrifft, oder einfach > 4, < 2? Können wir beliebige Wahrscheinlichkeiten hier aufstellen? Wie bekommen wir die Verteilungsfunktion nun? Hier wird auch wieder unterschieden zwischen diskretem Fall und stetigem Fall. Im diskreten Fall ist es so, dass die Verteilungsfunktion nichts anderes ist, als die Summe der einzelnen Wahrscheinlichkeiten. Sprich, wenn wir sagen, wie wahrscheinlich ist es, dass ein Ereignis ≤ 3 auftrifft, summieren wir einfach die einzelnen Wahrscheinlichkeiten auf für die Ereignisse 1 bis 3 und haben dementsprechend die Wahrscheinlichkeit für dieses Ereignis. So, wie sieht es im stetigen Fall aus? Im stetigen Fall, wie gerade gesagt, haben wir jetzt nicht die einzelne Summe von Wahrscheinlichkeiten der einzelnen Ausprägungen, sondern wir brauchen die Fläche, weil wir hier eine Wahrscheinlichkeitsdichte haben. Das heißt, die Verteilungsfunktion an sich ist nichts anderes, als das Integral der Dichtefunktion. Und somit, wie wir wissen, nähert sich dann also asymptotisch die Verteilungsfunktion dem Wert =1. Das ist so gesehen die Sättigung mit einer Wahrscheinlichkeit von 100%. So, also wir haben hier noch mal die Unterschiede. Das hier ist so gesehen die Wahrscheinlichkeitsfunktion bei den diskreten Zufallsvariablen. Das Pendant dazu im stetigen Bereich ist die Dichtefunktion. Die Verteilungsfunktion werden wir später ganz häufig noch brauchen, die lautet im diskreten Fall und im stetigen Fall gleich von der Namensgebung her: Verteilungsfunktion. Wie wir doch gerade kennengelernt haben, ergibt sich die auf unterschiedlichem Wege. Bevor wir uns nun die Normalverteilung en détail anschauen, noch einen kurzen Ausflug zu den stetigen Wahrscheinlichkeitsverteilungen an sich. Wozu brauchen wir die denn? Wir müssen uns folgendes Szenario vorstellen: Wir haben eine Grundgesamtheit, eine große Grundgesamtheit, über die wir recht wenig wissen. Was machen wir? Wir entnehmen dieser großen Grundgesamtheit eine Stichprobe, analysieren diese Stichprobe. Das erfolgt, indem wir diese Stichproben, dieses komplette Experiment, einer gewissen Wahrscheinlichkeitsverteilung zuordnen. Die Normalverteilung ist ja nur 1 Vertreter. Wir haben ja verschiedene Experimente. Wir können sagen, Münzwurf ist ein Experiment und wir können sagen, wir haben eine große Produktion und müssen testen, wie die Ergebnisse dieser Produktion sind. Sprich, entsprechend des Experimentes haben wir verschiedene Verteilungen gegeben, die wir nutzen können, um Rückschlüsse auf die Grundgesamtheit zu ziehen. Das ist unser Hauptziel. Die Normalverteilung an sich sehen wir hier, das heißt, als Beispiel noch mal zu den stetigen Wahrscheinlichkeitsverteilungen. Wir haben gewisse Merkmalsausprägungen, x1, x2, beispielsweise. Dieser Merkmalsausprägung ist nun eine Wahrscheinlichkeitsdichte zugeordnet. Ich betone hier Dichte, weil wir uns in den stetigen Wahrscheinlichkeitsverteilungen in dem Rahmen bewegen, dass wir einer Merkmalsausprägung keine bestimmte Wahrscheinlichkeit zuordnen können, sondern nur eine Dichte. Das können wir hier dieser Formel auch entnehmen, dass es keinen konkreten Punkt dafür gibt. Das heißt, mit der Dichtefunktion ordnen wir der Merkmalsausprägung eine gewisse Wahrscheinlichkeitsdichte zu. Mit der Verteilungsfunktion hingegen können wir jeder Merkmalsausprägung eine kumulierte Wahrscheinlichkeitsdichte zuordnen. Wir erinnern uns nämlich, dass die Dichtefunktion die Ableitung der Verteilungsfunktion ist. Oder sprich, um auf die Verteilungsfunktion zu kommen, müssen wir die Dichtefunktion integrieren. So viel allgemein zu den Wahrscheinlichkeitsverteilungen. Jetzt schauen wir uns die Formel ein bisschen genauer an. Das hier ist nun die Formel für die Dichtefunktion der Normalverteilung. Wir sehen, die Normalverteilung hat, wie alle anderen Wahrscheinlichkeitsverteilungen, bestimmte Parameter. Die Parameter sind hier unten noch mal aufgeführt. Das heißt, die Zufallsvariable X besitzt eine Verteilung, und zwar N, steht für Normalverteilung, mit den Parametern μ, der Erwartungswert, und σ2, die Varianz. Sprich, eine Normalverteilung ist dementsprechend verteilt, wie diese Parameter hier die Werte aufweisen. Dann haben wir die Verteilungsfunktion. Wir sehen hier das Integral, das entspricht eben einfach dem Integral der Dichtefunktion. Nun ist es allerdings so, dass diese Parameter μ und σ2 unterschiedliche Werte annehmen können. Dementsprechend können wir nun nicht die Normalfunktion explizit bestimmen. Das ist nicht möglich, wegen des Exponenten x2. Also wir haben ex2 und das lässt sich nur durch Iteration bestimmen, sprich, nicht genau. Dementsprechend haben wir nicht spezielle Werte nur vorliegen, sondern wir benutzen letztendlich, um für die Normalverteilung Wahrscheinlichkeiten zu bestimmen, bestimmte Tabellen. Gut, das heißt, hier sehen wir nun, E(x), das ist unser Erwartungswert für die Normalverteilung, entspricht μ. Das heißt im Endeffekt, der wahrscheinlichste Wert, der eintreten kann, ist unser μ hat hier die höchste Wahrscheinlichkeitsdichte aufzuweisen in der Dichtefunktion. Rundherum wird jetzt eine Art Intervall gebildet, und zwar die Varianz=σ2, sprich, die Wurzel aus unserer Varianz ist die Standardabweichung. Also haben wir eine recht hohe Verteilung der Wahrscheinlichkeitsdichte um den Erwartungswert an sich, und zwar eben mit dem Abstand σ, σ links und σ rechts. Das heißt, das müssen wir uns vor Augen halten, das sind die Parameter, die die Normalverteilung bestimmen. Nachdem wir uns die formalen Definitionen für die Normalverteilung angeschaut haben, sprich, die Formeln für die Dichtefunktion und die Verteilungsfunktion, gehen wir nun noch etwas genauer auf den Verlauf der Normalverteilung ein. Warum ist der so wichtig? Ich sage mal, wir werden mit den Formeln recht wenig zu tun haben. Wir haben unsere Tabellen, denen können wir entsprechende Wahrscheinlichkeiten für unsere Ereignisse entnehmen. Sprich, für uns wird es im Grunde genommen wichtiger sein, dass wir die Verläufe interpretieren können und den Einfluss des Parameters auf die Funktion an sich einschätzen können. So, dazu die typische Form einer Normalverteilung ist, wie man hier sieht, glockenförmig um den Mittelpunkt μ, unseren Erwartungswert. Wie bereits angesprochen, hat μ den Wert der höchsten Wahrscheinlichkeitsdichte. Es ist also am wahrscheinlichsten, dass dieses Ereignis eintritt. Parameter Standardabweichung spannt unsere Glocke auf. Also, wir haben die Abszisse, merken wir uns, unsere Merkmalsausprägung und auf der Ordinate unsere entsprechende Wahrscheinlichkeitsdichte - Dichtefunktion. So, was kann sich jetzt verändern? Welchen Einfluss haben die Parameter auf den Verlauf der Funktion? Nun ja, es gibt diese 2 Parameter und es gibt eben nur die Möglichkeit, diese 2 Parameter entsprechend anzupassen. Die Auswirkungen derartiger Anpassungen sehen wir hier. Es gibt 2 Möglichkeiten: Entweder, wie wir hier sehen, wir haben 3 Möglichkeiten, bleibt unser Erwartungswert μ konstant. Das heißt, der Pik unserer verschiedenen Verläufe bleibt an der gleichen Stelle, die Glocke verschiebt sich nicht, sie spannt sich nur auf oder verkleinert sich wieder. Woran liegt das? Das liegt an dem Parameter σ, unsere Standardabweichung. Diese Standardabweichung verhält sich umgekehrt proportional zu unserer Wahrscheinlichkeitsdichte. Sprich, wir haben eine höhere Wahrscheinlichkeitsdichte bei μ, wenn unser Parameter σ klein ist. Wird unser Parameter σ groß, sprich, wird die Glocke aufgespannt, ist unser Pik bei μ entsprechend kleiner. Das ist die eine Variante, die sich verändern kann. Die andere Möglichkeit ist nun, dass sich unser Parameter μ, der Erwartungswert, verändert. Was hat das für einen Einfluss? Entsprechend wird sich die Glocke verschieben, entlang der Abszisse. Das bedeutet also, entsprechende Merkmalsausprägungen x werden sich verändern, werden beispielsweise runtergehen oder rauf. Sprich, das eine Mal ist μ1 wahrscheinlicher, dann bewegen wir uns hier mit unserer Glocke oder wir sagen, μ3, μ hat diesen Wert, dementsprechend ist unsere Glocke weiter rechts anzuwählen. Was verändert sich nicht in diesem Fall? Die Standardabweichungen lassen wir konstant. Was hat das für einen Einfluss, wie wir gerade gesehen haben? Hier verändert sich der Wert für die Wahrscheinlichkeitsdichte für den entsprechenden Erwartungswert, hier ändert sich unser Wert, unsere Wahrscheinlichkeitsdichte für entsprechendes μ nicht, ist also konstant. Das sollte nun langen für heute, wir haben heute einiges gelernt über die Normalverteilung. Woher die Normalverteilung kommt, sprich, dass wir über diskrete Zufallsvariablen hin zu stetigen Zufallsvariablen diskrete Wahrscheinlichkeitsverteilungen und stetige Wahrscheinlichkeitsverteilungen bekommen. Den prominentesten Vertreter der stetigen Wahrscheinlichkeitsverteilung haben wir heute kennengelernt, die Normalverteilung. Diese wird standardmäßig bei den meisten Experimenten gebraucht. Was heißt bei den meisten Experimenten? Wir haben nämlich verschiedene Wahrscheinlichkeitsverteilungen, die entsprechend bestimmten Experimenten zugeordnet werden, bzw. zum Einsatz kommen. Was brauchen wir speziell? Jede dieser Wahrscheinlichkeitsverteilungen ist abhängig von bestimmten Parametern, wie wir sie hier hatten. Der Erwartungswert und Standardabweichungen sind die typischen -, sind DIE Parameter der Normalverteilung. In weiteren Verteilungen werden wir weitere Parameter kennenlernen. Was erwartet uns nun das nächste Mal? Das nächste Video behandelt ebenso die Normalverteilung, nur noch eine gewisse Spezifikation, nämlich, die Standardnormalverteilung werden wir nächstes Mal kennenlernen. Das ist ein Spezialfall der Normalverteilung, sprich, hat die gleichen Parameter. Und ich will nicht zu viel vorwegnehmen, aber wir brauchen diese Standardnormalverteilung, um die Tabellen nutzen zu können und dementsprechend die Aufgaben zu lösen. Wem das alles ein bisschen arg theoretisch erscheinen mag, den kann ich beruhigen. Wir werden zum Ende hin der speziellen Wahrscheinlichkeitsverteilung noch einige Extrasitzungen machen, in denen wir uns wirklich nur mit Aufgaben auseinandersetzen und woraus wir dann schließen können, welche Verteilung brauchen wir wofür und wie sind die anzuwenden. In dem Sinne, viel Freude mit dem bisherigen Wissen. Danke für die Aufmerksamkeit und bis später.

Informationen zum Video
11 Kommentare
  1. Default

    Weshalb ist die Var(X) zur Normalverteilung sigma quadrat?

    Von Aliyanage, vor fast 2 Jahren
  2. Default

    gut hab alles verstanden und bin erst in der 4 klasse

    Von Rezvanghodrati, vor mehr als 2 Jahren
  3. Default

    Klasse Typ!

    Von Ostarke030, vor etwa 3 Jahren
  4. Img 5225 web

    Hallo Cuibono,

    da bist du mir zuvorgekommen. Du hast natürlich recht, der Buchstabe vor der Klammer steht für die jeweils der Variable zugeordneten Verteilung, Normalverteilung, F-Verteilung, t-Verteilung.... Wobei sich der Inhalt der Klammer, je nach Verteilung ändert. Die meisten Verteilungen sind von unterschiedlichen Parametern abhängig.

    Viel Erfolg bei den Prüfungen
    Konrad

    Von Dr. Konrad Hnatow, vor mehr als 3 Jahren
  5. Default

    Hat sich erledigt. Ist nicht das gleiche. Gibt ja zig verschiede Arten neben "N"ormalverteilt.

    Von Cuibono, vor mehr als 3 Jahren
  1. Default

    Eine Frage, leider konnte ich dazu noch keine Erklärung finden:
    In meinen Aufgaben wird statt X ~N(µ,sigma²) immer X ~R(µ,sigma²) verwendet. Ich nehme an R meint reele Zahlen, aber was ist genau der Unterschied zu N? Danke vorab!

    Von Cuibono, vor mehr als 3 Jahren
  2. Default

    Im ersten Moment machen Deine Videos einen etwas zu seriösen Eindruck, der einen an die meist unverständlichen, hochgestochenen und komplexen Erklärungen anderer Tutoren/Profs erinnert, danach wird einem aber schnell klar, dass es bei Dir nicht so ist.
    Absolut klar, deutlich, verständlich und auf den Punkt gebracht ohne unnötig in höhere Sphären abzuschweifen. Timing auch gerade mit den kleinen Pausen optimal. Besser geht's nicht! Davon könnten sich viele eine Scheibe abschneiden. Vielen Dank!!!

    Von Cuibono, vor mehr als 3 Jahren
  3. Default

    Vielen Dank. Sehr professionelle Erklärung.

    Von Pole1011, vor mehr als 4 Jahren
  4. Default

    bei 5:46 sagst du, das die Warscheinlichkeit bei einem Würfelwurf "ein sechstel" ist und dann bei 5:51 sagst du "eins-Komma-sechs" ff.
    ansonsten prima Video :)

    Von Val, vor mehr als 4 Jahren
  5. Default

    Danke! Leider gibt es (noch) keine Kurse mit deinen Videos.
    -> Dadurch nicht ganz so einfach zu finden.

    Von Deleted User 36276, vor mehr als 4 Jahren
  6. Passbild%20cdb

    Erstklassig erklärt, professionell daregstellt.

    Von Christian D., vor fast 5 Jahren
Mehr Kommentare