30 Tage risikofrei testen

Überzeugen Sie sich von der Qualität unserer Inhalte im Basis- oder Premium-Paket.

Überzeugen Sie sich von der Qualität unserer Inhalte.

30 Tage risikofrei testen

Was ist eine Regressionsanalyse?

Die Regressionsanalyse wird angewendet um einen Zusammenhang zwischen einer abhängigen und einer (oder mehrerer) unabhängigen Variablen zu beschreiben. Dabei wird vorausgesetzt, dass solche Zusammenhänge existieren und dass diese quantitativ dargestellt werden können.

Schaue dir die folgenden Fragestellungen an:

  • Welchen Einfluss hat Lernen auf deine Noten? Hier ist die unabhängige Variable die Anzahl der Stunden, die du mit Lernen verbringst. Die abhängige Variable ist der in Noten messbare Lernerfolg.
  • „Hat die Temperatur einen Einfluss auf die Anzahl der Kinobesucher?“, könnte sich zum Beispiel die Besitzerin eines Kinos fragen. Die unabhängige Variable ist die Temperatur. Hängt die Anzahl der Kinobesucher (abhängige Variable) von dieser Temperatur ab?
  • Manchmal ist es nicht eindeutig, welche Größe abhängig und welche unabhängig ist. Du kannst dich fragen, ob der Bekanntheitsgrad eines Produktes von den Verkaufszahlen abhängt. Ebenso kannst du umgekehrt fragen, ob die Verkaufszahlen von dem Bekanntheitsgrad abhängen.

Dieser vermutete Zusammenhang kann durch eine Funktion(-sgleichung) dargestellt werden. Ist die Funktion eine lineare Funktion so spricht man von einer linearen Regression. Die zugehörige Gerade wird als Regressionsgerade bezeichnet.

Mit Hilfe dieser Funktion können Werte für die abhängige Variable geschätzt werden.

Beispiel für eine lineare Regressionsanalyse

Eine Eisdiele möchte herausfinden, welchen Einfluss der Preis einer Kugel Eis auf die Menge an verkauftem Eis hat. Die Besitzer haben bei verschiedenen Preisen die Anzahl der Kugeln pro Stunde notiert:

  • Bei einem Preis von $0,50~€$ konnten 60 Kugeln Eis verkauft werden.
  • Bei einem Preis von $0,80~€$ wurden 45 Kugeln,
  • für $1~€$ wurden 35 Kugeln,
  • für $1,20~€$ noch 30 Kugeln und
  • für $1,50~€$ nur noch 10 Kugeln Eis verkauft.

Dieser Zusammenhang ist hier zu sehen. Die unabhängige Größe, der Preis, steht auf der x-Achse und die abhängige Größe, die verkaufte Menge an Eiskugeln, auf der y-Achse.

1206_lineare_Regressionsanalyse_1.jpg

Du kannst schon einmal feststellen, dass die Erhöhung des Preises wohl zu einer Verminderung der Anzahl verkaufter Kugeln Eis führt.

Die Besitzer der Eisdiele wollen nun eine lineare Regressionsanalyse durchführen. Dabei wird eine lineare Funktionsgleichung $y=b_0+b_1x$ aufgestellt. Die Koeffizienten $b_0$ und $b_1$ lassen sich mithilfe der folgenden Formeln berechnen.

$b_1=\frac{\sum\limits_{i=1}^n(x_i-\bar x)(y_i-\bar y)}{\sum\limits_{i=1}^n(x_i-\bar x)^2}$

sowie

$b_0=\bar y-b_1\cdot \bar x$

Es müssen zunächst einmal die beiden Mittelwerte $\bar x$ sowie $\bar y$ berechnet werden. Hierfür werden die jeweiligen Werte addiert und die Summe durch die Anzahl der Werte dividiert.

$\bar x=\frac{0,50+0,80+1+1,20+1,50}{5}=1$

und

$\bar y=\frac{60+45+35+30+10}{5}=36$

Diese können nun in die obigen Formeln eingesetzt werden:

$\begin{array}{rcl}b_1&=&\frac{\sum\limits_{i=1}^n(x_i-1)(y_i-36)}{\sum\limits_{i=1}^n(x_i-1)^2}\\ &=&\frac{(0,50-1)(60-36)+(0,80-1)(45-36)+(1-1)(35-36)+(1,20-1)(30-36)+(1,50-1)(10-36)}{(0,50-1)^2+(0,80-1)^2+(1-1)^2+(1,20-1)^2+(1,50-1)^2}\\ &=&-\frac{28}{\frac{29}{50}}=-\frac{1400}{29}\approx -48,3\end{array}$

Damit kann $b_0$ berechnet werden:

$b_0=36+\frac{1400}{29}\cdot 1=\frac{2444}{29}\approx 84,3 $

Die lineare Funktionsgleichung lautet dann

$y=\frac{2444}{29}-\frac{1400}{29}x$.

Die zugehörige Regressionsgerade kannst du hier sehen.

1206_lineare_Regressionsanalyse_2.jpg

Interpretation dieser Regressionsgeraden

Zu den bekannten Werten können wir die Abweichung von der linearen Funktionsgleichung berechnen. Diese Abweichung wird als Residuum bezeichnet. Das Residuum für $x=0,80$ und dem zugehörigen $y=45$ wird wie folgt berechnet:

$r=45-\left(\frac{2444}{29}-\frac{1400}{29}\cdot 0,80\right)=-\frac{19}{29}$

Da die Steigung $b_1=-\frac{1400}{29}$ negativ ist, kannst du schlussfolgern, dass die Erhöhung des Preises für eine Kugel Eis einen negativen Einfluss auf die verkaufte Menge hat. Diese verringert sich.

Du kannst mithilfe der linearen Regression auch eine Vermutung darüber anstellen, wie viel Eis bei einem weiteren Preis verkauft werden wird. Wie viele Kugeln Eis sind bei einem Preis von $x=1,30~€$ zu erwarten?

$y=\frac{2444}{29}-\frac{1400}{29}\cdot 1,30=\frac{624}{29}\approx 21,5$

Durch Regressionsanalysen kann man also „vorhersagen“, dass ein Preis von $1,30~€$ pro Kugel Eis zu einer Verkaufsmenge von 21 bis 22 Kugeln Eis führen würde. Eine sinnvolle Frage wäre, welcher Preis für die höchsten Gewinn sorgt.