Textversion des Videos

Transkript Statistik Video 24: Lorenzkurve

Hallo. Schön, dass ihr alle wieder zuguckt. Wie fangen heute mit einem neuen Thema an und gehen erst mal von den Kennwerten der empirischen Statistik weg, hin zur Konzentrationsanalye. Die Konzentrationsanalyse, da gibt es zwei Felder, das statische und das dynamische. Wir beschäftigen uns ausschließlich mit der statischen Konzentrationsanalyse, die sich wiederum aufteilt. Und zwar in die relative Konzentrationsanalyse und in die absolute. Wir fangen an mit der relativen Analyse, heute mit der Lorenzkurve, wie ihr auch an der Überschrift seht. Danach mit dem Ginikoeffizienten und gehen dann über zur Absoluten und lernen da den Herfindahlindex kennen. Fangen wir also mit der Lorenzkurve an. Eine Lorenzkurve sieht üblicherweise so aus. Natürlich nicht ganz so geglättet, das ist jetzt nur eine Annäherung und eine Lorenzkurve tut Folgendes: Sie trägt den Anteil an der Bevölkerung oder der Grundgesamtheit oder auch unserer Stichprobe gegenüber, sagen wir mal dem Einkommen ab. Also sagen wir mal, wir hätten hier die Bevölkerung eines Landes und hier das Einkommen, das gesamte Volkseinkommen eines Landes. Da könnte man an der Lorenzkurve, an der roten, ablesen, wie viel Prozent der Ärmsten wie viel Prozent des Einkommens haben. Sagen wir mal, wir gucken jetzt mal bei 50 %. Die Ärmsten, 50 % dieses Landes haben, sagen wir mal, wir gehen jetzt hier rüber, ungefähr 20 % des Vermögens. Die Lorenzkurve zeigt also an, wie gerecht oder ungerecht unser Merkmal verteilt ist. Meistens nimmt man halt hier so etwas wie Einkommen oder Marktanteil, und hier ist üblicherweise die Bevölkerung oder auch wenn man Marktanteile nimmt, halt die unterschiedlichen Unternehmen. Diese 45 Grad Linie ist die perfekt gerechte Verteilung, jeder hat den gleichen Marktanteil, jeder bekommt das Gleiche. D. h., je bauchiger die Lorenzkurve ist, um so ungerechter ist es im Prinzip verteilt. Das Ganze machen wir bei metrischen Daten, bei allen anderen, würde es keinen Sinn ergeben. So. Das ist im Prinzip auch mal die grobe Einführung, und wir fangen jetzt sofort mal mit einem kurzen Beispiel an. Wenn wir jetzt also eine Lorenzkurve aufstellen wollen, dann fangen wir wie immer an mit eine Urliste. Wir haben jetzt eine Urliste bestehend aus 5 Daten: 1, 8, 5, 25, 11. Sagen wir mal, das wären die Umsätze von 5 Unternehmen. Das Erste, was wir machen müssen, ist, diese Urliste ordnen, und zwar der Größe nach. Also bekommen wir daraus eine geordnete Liste 1, 5, 8, 11, 25. Okay? Sieht schon mal ganz gut aus. Als Letztes müssen wir dann noch das Gesamtvolumen berechnen. Das Gesamtvolumen ist hierbei 50. Also einfach die Summe aller Beobachtungswerte, die wir haben. Dieses tragen wir dann in unsere Tabelle ein. Wir haben hier aj, also unsere realisierte Ausprägung, 1, 5, 8, 11, 25. Die relativen Häufigkeiten jeweils 0,2. Jedes taucht genau einmal auf, und wir haben unsere kumulierten Häufigkeiten 0,2, 0,4, 0,6, 0,8 und 1. Diese kumulierten Häufigkeiten bekommen, wenn wir bei der Lorenzkurve sind, eine neue Bezeichnung, und zwar ist das Ue. Also quasi der Anteil an unserer beobachteten Population. Wir haben hier also eine Population von 5 beobachtet und haben hier jeweils den Anteil, die unteren 20 %, die unteren 40 %, die unteren 60 % usw. Als Nächstes nehmen wir aj × h von aj, also quasi das Volumen für jede realisierte Ausprägung. Also unser h von aj ist jeweils 1, also ist hier aj × h von aj die gleiche Spalte wie hier: 1, 5, 8, 11, 25. Es gibt natürlich auch Fälle, wo wir unsere realisierten Ausprägungen, wo sie doppelt auftreten, wo wir dann wirklich von 1 verschiedene absolute Häufigkeit haben und da brauchen wir dann halt diese Spalte, dass wir quasi für jede realisierte Ausprägung ein Volumen ausrechnen, wie viel wirklich davon vorhanden ist. So. Als nächster Schritt: Wir berechnen jetzt den Anteil unserer realisierten Ausprägung × der absoluten Häufigkeit am Gesamtvolumen. Wir erinnern uns, unser Gesamtvolumen V war 50. Also hier die Summe aller realisierten Ausprägungen × ihrer absoluten Häufigkeit. So, wir haben also 1/50 = 0,02, 5/50 = 0,1, 8/50 = 0,16, so 0,22 und 0,5. Also der Anteil am Gesamtvolumen. Und hier, unser Ve, also das, was wir auf der y-Achse auftragen, ist dann quasi das kumulierte dieser Spalte. Also haben wir 0,02, 0,12, 0,28, 0,5 und 1. So, und jetzt können wir also Ue und Ve aufeinander auftragen und daraus unsere Lorenzkurve basteln. Gut, dann können wir jetzt auch die Lorenzkurve zeichnen. Ich habe aus unserer Tabelle gerade jetzt mal die beiden Spalten, die interessant sind, herausgenommen, Ue und Ve, und die zeichnen wir ein. Wir haben hier also unser Koordinatensystem, auf der y-Achse Ve, auf der x-Achse Ue, hier die Hauptdiagonale, die ja die perfekt gerechte Verteilung bedeuten würde und da können wir jetzt einzeichnen. Also die unteren 20 %, hier ein Ue von 0,2, also hier, besitzen gerade mal 0,02 des gesamten Umsatzes, also 2 %. So, 0,2 ist hier und da haben wir unseren 1. Punkt. Hier, die Ärmsten 20 % besitzen 2 Prozent des Umsatzes. Die nächsten 20 %, also die unteren 40 %, besitzen insgesamt 12 % des Umsatzes, 0,12 habe ich schon eingezeichnet, liegt hier. Also 0,12 abtragen und 0,4, sind wir hier. Die nächsten 20 % dazu genommen, also die unteren 60% besitzen 0,28 des gesamten Umsatzes, also 28 %. 28 % liegt hier, so das auf 0,6. So die nächsten 20 % dazu, die unteren 80 % besitzen insgesamt die Hälfte. Okay, hier 0,5, also können wir das hier auftragen, ungefähr hier. Und der letzte Punkt in einer Lorenzkurve ist immer (1, 1). Genauso wie der Startpunkt immer (0, 0) ist, also hier. Gut, was wir jetzt noch machen müssen, damit die Lorenzkurve vollständig ist, wir verbinden unsere Punkte. Bei euch, geht das wahrscheinlich etwas besser, als bei mir an der großen Tafel, aber sollte eigentlich auch funktionieren. Nun haben wir also unsere Lorenzkurve für unser hier vorliegendes Beispiel gezeichnet. Und wir sehen: Wir haben einen deutlichen Bauch, wie man das so schön nennt. D. h., unsere Daten sind eindeutig nicht gerecht verteilt, und es gibt eine klare Tendenz zur ungerechten Verteilung. Wir können uns jetzt so interessante Fragen fragen, wie wieviel des gesamten Einkommens besitzen die oberen 50 %. Was tun wir dazu? Die oberen 20 % meine ich natürlich. Was tun wir dazu? Wir gucken die oberen 20 %, dass also sind alle von 0,8 bis 1. Diesen Bereich suchen wir und dann gucken wir, okay. Die unteren 80 % besitzen 50 %, also besitzen die oberen 20 % die restlichen 50 %. Wir können also sagen, die oberen 20 % besitzen insgesamt 50 % des Gesamten. Gut. Schauen wir uns also die allgemeinen Eigenschaften der Lorenzkurve an. Die Lorenzkurve geht immer durch zwei Punkte. Sie geht immer durch (0,0) und sie geht immer durch (1,1). Das ist auch logisch, wenn man sich einmal klar macht, was diese Punkte überhaupt bedeuten. Der Punkt (0,0) bedeutet: Die Ärmsten, 0 % der Bevölkerung, haben 0 % des Gesamteinkommens, wenn man das jetzt als Merkmale betrachtet. D. h., niemand hat nichts, ist ja logisch. Was bedeutet der Punkt (1,1)? Der Punkt (1,1) bedeutet: Die oberen 100 % haben 100 % des Gesamteinkommens, d. h., alle haben alles. Das ist auch logisch. Also die Lorenzkurve geht immer durch diese zwei Punkte. Sie startet immer in (0,0) und endet immer in (1,1). Die 2. Eigenschaft: Die Lorenzkurve ist monoton wachsend. D. h., wir haben unsere Werte Ve, und die Werte werden nie kleiner. D. h., sie bleiben entweder gleich oder sie werden größer. Die 3. Eigenschaft: Die 1. Ableitung der Lorenzkurve ist auch monoton wachsend. Das bedeutet, dass innerhalb der Lorenzkurve auch die Steigung niemals kleiner wird. Die Steigung wird entweder größer oder sie bleibt gleich, aber sie wird niemals kleiner. Und daraus, aus genau dieser Eigenschaft, dass die 1. Ableitung auch monoton wachsend ist, folgt auch, dass die Lorenzkurve konvex ist. D. h., dass sie im Prinzip, wenn hier der Punkt (0,0) ist, immer eine solche Form bildet. D. h., wie ihr dann schon seht, die Steigung wird dann immer größer. Gut, das waren so weit die großen, wichtigen Eigenschaften der Lorenzkurve. Als Abschließendes fragen wir uns noch, wie können wir Lorenzkurven vergleichen? Wir können natürlich mehrere Lorenzkurven in eine Grafik zeichnen, das ist ja kein Problem. Die Frage ist nur, was für Aussagen können wir treffen? Gucken wir uns einmal das Obere an. Wir haben hier also die zwei Lorenzkurven, die rote, Lorenzkurve Nr. 1, die blaue Lorenzkurve Nr. 2. Wir sehen also, die blaue liegt immer innerhalb der roten, ist also permanent, die ganze Zeit, näher an der Diagonalen, die ja die perfekt gerechnete Verteilung, als die rote. D. h., hieraus können wir auch den Schluss ziehen: Aha, in Lorenzkurve Nr. 2, die Daten die der Lorenzkurve Nr. 2 zugrunde liegen. sind gerechter verteilt als die Daten, die Lorenzkurve Nr. 1 zugrunde liegen. Wir können einen klaren Schluss ziehen. Also unser Fazit wäre hier, so unsere Lorenzkurve 2 oder die Daten, die der Lorenzkurve 2 zugrunde liegen, ist gerechter verteilt. Gucken wir uns den anderen Fall an, wo das nicht so eindeutig ist. Wir haben hier also wieder unsre 2 Lorenzkurven, rot 1, blau 2. Diesmal aber mit der Besonderheit, dass sie sich kreuzen. Jetzt ist die Frage, können wir, rein anhand der Lorenzkurven trotzdem sagen, welche der beiden beobachteten Populationen, Märkte, was auch immer, gerechter verteilt ist oder nicht. Und hier müssen wir sagen, okay, anhand der Lorenzkurven können wir darüber keine Aussage treffen. Wir können nicht sagen, welche Kurve durchschnittlich näher an der 45 Grad Diagonalen ist und können deshalb auch nicht sagen, welche der Beobachtung jetzt gerechter verteilt ist. Also keine Aussage möglich. Um das jetzt genau zu bestimmen, welche dieser beiden stärker konzentriert ist, brauchen wir ein Konzentriertheitsmaß, also eine Maßzahl, aus der wir das klar herauslesen können. Das wird uns im nächsten Video beschäftigen, nachdem wir noch eine Übung zur Lorenzkurve gemacht haben, gucken wir uns nämlich den Ginikoeffizienten an, der sehr eng mit der Lorenzkurve zusammenhängt, aber eine Maßzahl bestimmt, um zu sagen, welche der beiden Populationen, die wir beobachtet haben, ist stärker konzentriert. Ich bedanke mich für das Zuschauen, wünsche euch allen noch eine angenehme Woche und freue mich auf das nächste Mal. Tschüss.

Informationen zum Video
4 Kommentare
  1. Default

    Ich verstehe nicht recht wie man auf h(aj) = 1 kommt ..

    Von Mehmetemre, vor fast 2 Jahren
  2. Default

    Philosophische Frage : Was ist "gerecht" und "gerechter"?
    Sollte es -ohne Wertung - nicht einfach "gleicher" heißen?

    Von Christel Hoffmann 1, vor etwa 2 Jahren
  3. Default

    Hallo, vielen dank erst einmal für das Video, es hat sehr geholfen. Ich habe jedoch eine Frage zu dem Ue, da die Formel ja lautet k/n. Da rechne ich ja 1/50,2/50,3/50 ... und 1/50 ist ja 0,02 und in dem Video ist es 0,2. Da verstehe ich nicht genau was ich falsch gemacht habe.
    Liebe Grüße

    Von Valentina A., vor etwa 2 Jahren
  4. Default

    Funktioniert nicht

    Von Nsteinfelder, vor fast 3 Jahren