WnioskowanieStatystyczne/Interpretacja współczynnika korelacji: Różnice pomiędzy wersjami

Aktualna wersja na dzień 09:37, 30 maj 2025

Interpretacja współczynnika korelacji

Rozważmy wariancję zmiennej [math]y[/math] z poprzedniego rozdziału. Niech [math]y_{i}^{p}=a+bx_{i}[/math]

[math] \underset{i=1}{\overset{N}{\sum }}(y_{i}-\overline{y})^{2}= \underset{i=1}{\overset{N}{\sum }}(y_{i}-y_{i}^{p}+y_{i}^{p}-\overline{y} )^{2}= [/math] [math] \underset{i=1}{\overset{N}{\sum }}(y_{i}-y_{i}^{p})^{2}+\underset{i=1}{ \overset{N}{\sum }}(y_{i}^{p}-\overline{y})^{2}+2\underset{i=1}{\overset{N}{ \sum }}(y_{i}-y_{i}^{p})(y_{i}^{p}-\overline{y}) [/math]

Całkowitą wariancję zmiennej [math]y[/math] można podzielić na dwa człony: wariancję estymaty [math]y_{i}^{p}[/math] wokół wartości średniej [math]\overline{y}[/math] i wariancję obserwowanych [math]y_{i}[/math] wokół estymaty [math]y_{i}^{p}[/math] (trzeci człon znika):

[math] \underset{i=1}{\overset{N}{\sum }}(y_{i}-\overline{y})^{2}= \underset{i=1}{\overset{N}{\sum }}(y_{i}-y_{i}^{p})^{2}+\underset{i=1}{ \overset{N}{\sum }}(y_{i}^{p}-\overline{y})^{2} [/math]

Współczynnik korelacji liniowej (Pearsona)

Rozważmy stosunek wariancji tłumaczonej przez model do całkowitej wariancji

[math] S^2 = \dfrac{\underset{i=1}{\overset{N}{\sum }}(y_{i}^{p}-\overline{y})^{2}} {\underset{i=1}{\overset{N}{\sum }}(y_i-\overline{y})^{2}} [/math]

podstawiając [math]y_i^p = a + b x_i[/math] dostajemy

[math] S^2 = \dfrac{\underset{i=1}{\overset{N}{\sum }}(a + b x_i-\overline{y})^{2}} {\underset{i=1}{\overset{N}{\sum }}(y_i-\overline{y})^{2}} [/math]

Ponieważ [math]\overline{y} = a + b \overline{x}[/math], czyli [math]a=\overline{y}-b\overline{x}[/math],

[math] S^2 = \dfrac{\underset{i=1}{\overset{N}{\sum }}(\overline{y}-b\overline{x} + b x_i-\overline{y})^{2}} {\underset{i=1}{\overset{N}{\sum }}(y_i-\overline{y})^{2}} = \dfrac{\underset{i=1}{\overset{N}{\sum }}b^2(x_i-\overline{x})^2} {\underset{i=1}{\overset{N}{\sum }}(y_i-\overline{y})^{2}} = b^2\dfrac{\underset{i=1}{\overset{N}{\sum }}(x_i-\overline{x})^2} {\underset{i=1}{\overset{N}{\sum }}(y_i-\overline{y})^{2}} [/math]

Skoro prosta [math]y= a + b x[/math] została dopasowana metodą największej wiarygodności, to [math] b=\frac{\underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x})(y_{i}- \overline{y})}{\underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x})^{2}} [/math], czyli

[math] S^2 = b^2 \,\,\, \dfrac{\underset{i=1}{\overset{N}{\sum }}(x_i-\overline{x})^2} {\underset{i=1}{\overset{N}{\sum }}(y_i-\overline{y})^{2}} = \dfrac {\left(\underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x})(y_{i}- \overline{y})\right)^2} {\left(\underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x})^{2}\right)^2} \;\;\; \dfrac{\underset{i=1}{\overset{N}{\sum }}(x_i-\overline{x})^2} {\underset{i=1}{\overset{N}{\sum }}(y_i-\overline{y})^{2}} [/math]

[math] S^2 = \dfrac {\left(\underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x})(y_{i}- \overline{y})\right)^2} {{\underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x})^{2}} \underset{i=1}{\overset{N}{\sum }}(y_i-\overline{y})^{2}} =\rho_{x,y}^2 [/math], czyli kwadrat współczynnika korelacji.

Przykładowe wartości współczynnika korelacji dla 300 par [math](x, y)[/math] o różnych stopniach współzależności.

Ciekawe przykłady korelacji liniowych dla zależności nieliniowych podaje artykuł z Wikipedii

Istotność statystyczna współczynnika korelacji

...to osobny problem :-)

@@ Linia 9: / Linia 9: @@
 [[Plik:Wsp kor war.png|500px]]
 <math>
@@ Linia 22: / Linia 21: @@
 </math>
-Całkowitą wariancię zmiennej <math>y</math> podzieliliśmy na dwa
+Całkowitą wariancję zmiennej <math>y</math> można podzielić na dwa
 człony: wariancję estymaty <math>y_{i}^{p}</math> wokół wartości
 średniej <math>\overline{y}</math> i wariancję obserwowanych
 <math>y_{i}</math> wokół estymaty <math>y_{i}^{p}</math> (trzeci człon
-[https://en.wikipedia.org/wiki/Explained_sum_of_squares#Simple_derivation znika]).
+[https://en.wikipedia.org/wiki/Explained_sum_of_squares#Simple_derivation znika]):
-===Współczynnik korelacji liniowej (Pearsona)===
-przypominamy wyprowadzone w poprzednim rozdziale zależności:
+<center>
+<math>
+\underset{i=1}{\overset{N}{\sum }}(y_{i}-\overline{y})^{2}=
+\underset{i=1}{\overset{N}{\sum }}(y_{i}-y_{i}^{p})^{2}+\underset{i=1}{
+\overset{N}{\sum }}(y_{i}^{p}-\overline{y})^{2}
+</math>
+</center>
-<math>
-b=\frac{\underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x})(y_{i}-
-\overline{y})}{\underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x})^{2}},
-\qquad a=\overline{y}-b\overline{x}
-</math>
-oraz wzór na estymator współczynnika korelacji liniowej
-<math>
+===Współczynnik korelacji liniowej (Pearsona)===
-r_{x, y}= \frac{\sigma_{x, y}}{\sigma_x \sigma_y}=
+Rozważmy stosunek wariancji tłumaczonej przez model do całkowitej wariancji
-\frac{E\left(	\left(x-\mu_{x})(y-\mu_{y}\right)\right)}
+<center>
-{\sqrt{E\left( (x-\mu_{x})^2\right) E\left( (y-\mu_{y})^2\right)}},
+:<math>
+S^2 =
+\dfrac{\underset{i=1}{\overset{N}{\sum }}(y_{i}^{p}-\overline{y})^{2}}
+{\underset{i=1}{\overset{N}{\sum }}(y_i-\overline{y})^{2}}
 </math>
+</center>
+podstawiając <math>y_i^p = a + b x_i</math> dostajemy
-jego kwadrat estymujemy jako
+:<math> S^2 =
+\dfrac{\underset{i=1}{\overset{N}{\sum }}(a + b x_i-\overline{y})^{2}}
-<math>
+{\underset{i=1}{\overset{N}{\sum }}(y_i-\overline{y})^{2}}
-r^{2}=\frac{\left( \underset{i=1}{\overset{N}{\sum }}(x_{i}-
-\overline{x})(y_{i}-\overline{y})\right) ^{2}}{\underset{i=1}{\overset{N}{
-\sum }}(x_{i}-\overline{x})^{2}\underset{i=1}{\overset{N}{\sum }}(y_{i}-
-\overline{y})^{2}}
 </math>
-Podstawiając
+Ponieważ <math>\overline{y} = a + b \overline{x}</math>, czyli <math>a=\overline{y}-b\overline{x}</math>,
-<math>
-\forall_i (y_i - \overline{y}) =
-b (x_i - \overline{x} )
-</math>, oraz
-<math>
-b=\frac{\underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x})(y_{i}-
-\overline{y})}{\underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x})^{2}}
-</math>
-do wyrażenia na wariancję tłumaczoną przez model
-:<math>\underset{i=1}{\overset{N}{\sum }}(y_{i}^{p}-\overline{y})^{2} </math>,
+:<math> S^2 =
-dostajemy:
+\dfrac{\underset{i=1}{\overset{N}{\sum }}(\overline{y}-b\overline{x} + b x_i-\overline{y})^{2}}
+{\underset{i=1}{\overset{N}{\sum }}(y_i-\overline{y})^{2}}
+=
+\dfrac{\underset{i=1}{\overset{N}{\sum }}b^2(x_i-\overline{x})^2}
+{\underset{i=1}{\overset{N}{\sum }}(y_i-\overline{y})^{2}}
+=
+b^2\dfrac{\underset{i=1}{\overset{N}{\sum }}(x_i-\overline{x})^2}
+{\underset{i=1}{\overset{N}{\sum }}(y_i-\overline{y})^{2}}
+</math>
-:<math>
+Skoro prosta <math>y= a + b x</math> została dopasowana metodą największej wiarygodności, to <math>
-\underset{i=1}{\overset{N}{\sum }}(y_{i}^{p}-\overline{y})^{2}
+b=\frac{\underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x})(y_{i}-
-= b \underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x})^{2}
+\overline{y})}{\underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x})^{2}}
-=\frac{\left(
+</math>, czyli
-\underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x})(y_{i}-\overline{y}
-)\right) ^{2}}{\left( \underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x}
-)^{2}\right) ^{2}}\underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x}
-)^{2}=\\
- =\frac{\left( \underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x}
+:<math> S^2 =
-)(y_{i}-\overline{y})\right) ^{2}}{\underset{i=1}{\overset{N}{\sum }}(x_{i}-
+b^2 \,\,\, \dfrac{\underset{i=1}{\overset{N}{\sum }}(x_i-\overline{x})^2}
-\overline{x})^{2}}\frac{\underset{i=1}{\overset{N}{\sum }}(y_{i}-\overline{y}
+{\underset{i=1}{\overset{N}{\sum }}(y_i-\overline{y})^{2}}
-)^{2}}{\underset{i=1}{\overset{N}{\sum }}(y_{i}-\overline{y})^{2}}=r^{2}
+=
-\underset{i=1}{\overset{N}{\sum }}(y_{i}-\overline{y})^{2}
+\dfrac
+{\left(\underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x})(y_{i}-
+\overline{y})\right)^2}
+{\left(\underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x})^{2}\right)^2}
+\;\;\;
+\dfrac{\underset{i=1}{\overset{N}{\sum }}(x_i-\overline{x})^2}
+{\underset{i=1}{\overset{N}{\sum }}(y_i-\overline{y})^{2}}
 </math>
+<math>
+S^2 =
+\dfrac
+{\left(\underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x})(y_{i}-
+\overline{y})\right)^2}
+{{\underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x})^{2}}
+\underset{i=1}{\overset{N}{\sum }}(y_i-\overline{y})^{2}}
+=\rho_{x,y}^2
+</math>,
+czyli kwadrat [[WnioskowanieStatystyczne/Momenty#Kowariancja_i_wsp.C3.B3.C5.82czynnik_korelacji|współczynnika korelacji]].
-czyli
-:<math>
-{r^{2}=\frac{\underset{i=1}{\overset{N}{\sum }}(y_{i}^{p}-
-\overline{y})^{2}}{\underset{i=1}{\overset{N}{\sum }}(y_{i}-\overline{y})^{2}
-}\ }
-</math>
+[[Plik:Korelacja.png|600px|thumb|center|<figure id="fig:rozw2"></figure>Przykładowe wartości współczynnika korelacji dla 300 par <math>(x, y)</math> o
+różnych stopniach współzależności.
+]]
-przykłady interpretacji podaje też [https://en.wikipedia.org/wiki/Correlation_and_dependence artykuł z Wikipedii]
+Ciekawe przykłady korelacji liniowych dla zależności nieliniowych podaje [https://pl.wikipedia.org/wiki/Zale%C5%BCno%C5%9B%C4%87_zmiennych_losowych artykuł z Wikipedii]
-[[Plik:Korelacja.png|600px|thumb|left|<figure id="fig:rozw2"></figure>Przykładowe wartości współczynnika korelacji dla 300 par <math>(x, y)</math> o
+===Istotność statystyczna współczynnika korelacji===
-różnych stopniach współzależności.
+...to osobny problem :-)
-]]

Anonimowy

Szukaj

WnioskowanieStatystyczne/Interpretacja współczynnika korelacji: Różnice pomiędzy wersjami

Przestrzenie nazw

Więcej

Działania na stronie

Aktualna wersja na dzień 09:37, 30 maj 2025

Interpretacja współczynnika korelacji

Współczynnik korelacji liniowej (Pearsona)

Istotność statystyczna współczynnika korelacji

Nawigacja

Nawigacja

Narzędzia Wiki

Narzędzia Wiki

Anonimowy

Szukaj

WnioskowanieStatystyczne/Interpretacja współczynnika korelacji: Różnice pomiędzy wersjami

Aktualna wersja na dzień 09:37, 30 maj 2025

Interpretacja współczynnika korelacji

Współczynnik korelacji liniowej (Pearsona)

Istotność statystyczna współczynnika korelacji

Nawigacja

Narzędzia Wiki

Narzędzia dla stron