Korrelation und Regression ist nicht das Gleiche

Korrelation erfasst, wie stark zwei Parameter linear zusammenhängen, und ist oft schon mit dem bloßen Auge zu erkennen. Eine Korrelation, also einen Zusammenhang zwischen zwei Variablen, sollte daher immer auch in Form einer Graphik inspiziert werden. Als

  • PDF / 267,088 Bytes
  • 7 Pages / 467.717 x 685.984 pts Page_size
  • 90 Downloads / 185 Views

DOWNLOAD

REPORT


Korrelation und Regression ist nicht das Gleiche

▸ Korrelation erfasst, wie stark zwei Parameter zusammenhängen ▸ Wenn zwei Parameter voneinander abhängen, kann man durch Regression den einen Wert durch den anderen vorhersagen

11.1 Korrelation 11.1.1 Allgemeines zur Korrelation Korrelation erfasst, wie stark zwei Parameter linear zusammenhängen, und ist oft schon mit dem bloßen Auge zu erkennen. Eine Korrelation, also einen Zusammenhang zwischen zwei Variablen, sollte daher immer auch in Form einer Graphik inspiziert werden. Als Maßgröße dafür, wie stark diese Werte zusammenhängen, gilt der Korrelationskoeffizient und dieser misst, in welchem Ausmaß die Variabilität des einen Parameters durch den anderen erklärt wird. In anderen Worten ausgedrückt, er beschreibt, wie stark die Punkte von einem zugrunde liegenden linearen Trend abweichen. Der Korrelationskoeffizient – genannt r – kann einen Wert zwischen −1 und +1 annehmen. Ein Korrelationskoeffizient von +1 bedeutet maximal starker, positiver, linearer Zusammenhang (also je höher der eine Wert, desto höher der andere Wert) (Abbildung 11.1). Bei einem Korrelationskoeffizienten von +1 liegen alle Punkte auf einer von links unten nach rechts oben ansteigenden Geraden. Ein Korrelationskoeffizient von –1 bedeutet maximal starker, negativer, linearer Zusammenhang (je höher der eine Wert, desto niedriger der andere Wert) (Abbildung 11.2). In anderen Worten ausgedrückt, der eine Wert erklärt die Varianz des anderen vollkommen. Ein Korrelationskoeffizient in der Nähe von 0 (Null) bedeutet, dass kein (linearer) Zusammenhang besteht. Im Einzelfall hängt es von den Umständen ab, wie groß ein Korrelationskoeffizient sein soll, um relevant zu sein (siehe unten). Der Korrelationskoeffizient der in Abbildung 11.3 aufgetragenen Variablen ist −0,33, also nicht sehr groß, obwohl man einen eindeutigen Zusammenhang zwischen den Variablen sieht. Der Zusammenhang ist aber nichtlinear. H. Herkner et al., Erfolgreich wissenschaftlich arbeiten in der Klinik © Springer-Verlag/Wien 2011

88

11 Korrelation und Regression ist nicht das Gleiche

Y

10

5

0 0

5 A

10

Abb. 11.1 Perfekte, positive Korrelation (r = 1,00; n = 10)

Y

10

5

0 0

5 B

10

Abb. 11.2 Perfekte, negative Korrelation (r = −1,00; n = 10)

Y

10

5

0 0

1

2 C

3

4

Abb. 11.3 Nichtlinearer Zusammenhang; Korrelation sollte hier nicht verwendet werden

11.1 Korrelation

89

Y

10

5

0 2

6

4

8

D Abb. 11.4 Keine Korrelation; die Punkte scheinen zufällig verteilt zu sein

Der Korrelationskoeffizient der in Abbildung 11.4 aufgetragenen Variablen ist 0,01. Es besteht offensichtlich kein Zusammenhang zwischen den Variablen. Wenn man den Korrelationskoeffizienten quadriert, erhält man eine Proportion, die uns sagt, wie viel Variabilität des einen Wertes durch den anderen erklärt wird; auf Englisch variability explained (R 2 ). Dieser Wert liegt zwischen 0 und 1, mit 100 multipliziert erhält man die entsprechende Prozentangabe.

11.1.2 Ein paar Regeln zur Korrelation Zwei oder mehrere Werte darf man nur korrelieren, (1) wenn die Werte beide