Pommes der Pinguin hält einen großen gelben Stern in den Händen
30 Tage kostenlos testen
Über 1,6 Millionen Schüler*innen nutzen sofatutor
Lernpakete anzeigen
Lernpakete anzeigen

Daten erheben und auswerten

Das Erheben und Auswerten von Daten ist ein wichtiger Bestandteil der beschreibenden Statistik. Dies kannst du am Beispiel von Wahlen sehen.

Alle Klassen

Themenübersicht in Daten erheben und auswerten

Beschreibende Statistik

Die beschreibende Statistik hat das Ziel, Daten übersichtlich darzustellen. Dabei geht es unter anderem darum, durch Tabellen, Diagramme oder Grafiken und Lageparameter die Daten so aufzuarbeiten, dass die darin enthaltenen Informationen gut überschaut werden können.

Ein Beispiel für eine solche Darstellung sind die Auswertungen von Wahlen: Die prozentualen Anteile einzelner Parteien werden oft in Balken- oder Kreisdiagrammen dargestellt. Wichtige Informationen, wie zum Beispiel das Wechselverhalten von Wählern, werden in Schaubildern gezeigt.

Das Erheben von Daten

Um Daten darzustellen und auszuwerten, musst du erst einmal an solche Daten gelangen. Als Beispiel betrachten wir eine Erhebung darüber, wie viel Zeit Schülerinnen und Schüler an deiner Schule täglich mit ihrem Smartphone beschäftigt sind.

Du könntest jetzt alle Personen einzeln befragen. Das wäre jedoch sehr aufwendig. Deshalb betrachtest du eine sogenannte Stichprobe. Dabei musst du berücksichtigen, dass diese Stichprobe repräsentativ ist. Das bedeutet, dass du die verschiedenen Klassenstufen, Jungen sowie Mädchen usw. gemäß des jeweiligen Anteils an der Gesamtzahl der Schüler betrachtest.

Nun kannst du die Daten in Tabellen sammeln. Zum Beispiel kannst du Zeitintervalle für die Nutzungsdauer angeben. Die Art, wie du eine solche Einteilung vornimmst, hängt von den jeweiligen Daten ab. Es gibt verschiedene Skalen, deren Einsatzmöglichkeiten von den Daten abhängen.

Die Zeitdauer für die Smartphonenutzung ist zum Beispiel intervallskaliert. Wenn du nach dem jeweils verwendeten Hersteller des Smartphones fragen würdest, müsstest du eine Nominalskala verwenden. Von der jeweiligen Skalierung hängt auch ab, in welcher Form du die Daten darstellen kannst.

Lageparameter und Streuungsparameter

Die Lageparameter geben an, in welchem Bereich sich die erhobenen Daten befinden. Beispiele für Lageparameter sind der Mittelwert, der Median und der Modus oder auch Modalwert. Auch der Erwartungswert ist ein Lageparameter.

Die Streuungsparameter geben an, wie weit die tatsächlichen Daten von dem Lageparameter abweichen (streuen). Sie geben also eine zusätzliche Information, wie der Lageparameter zu interpretieren ist. Zu den Streuungsparametern gehören die Spannweite, die Standardabweichung und die Varianz.

Ein weiteres Beispiel für einen Lageparameter sind Quartile. „Quartil“ bedeutet „Viertelwert“. Die Daten werden in vier gleich große Teile aufgeteilt. Dies wird in einem Boxplot dargestellt.

Die Regressionsanalyse

Ziel der Regressionsanalyse ist, einen Zusammenhang zwischen einer abhängigen und einer (oder mehreren) unabhängigen Größen zu beschreiben.

Du kannst zum Beispiel untersuchen, welchen Einfluss die Temperatur auf den Verkauf von Speiseeis hat. Hier ist die Temperatur die unabhängige Größe. Hängt die Menge des verkauften Speiseeises von dieser Temperatur ab? Diese Menge ist dann die abhängige Größe.