Z Brain-wiki
Skocz do: nawigacja, szukaj

Wnioskowanie_Statystyczne_-_wykład


Interpretacja współczynnika korelacji

Rozważmy wariancję zmiennej y z poprzedniego rozdziału. Niech y_{i}^{p}=a+bx_{i}

\underset{i=1}{\overset{N}{\sum }}(y_{i}-\overline{y})^{2}=\underset{i=1}{\overset{N}{\sum }}(y_{i}-y_{i}^{p}+y_{i}^{p}-\overline{y})^{2}= \underset{i=1}{\overset{N}{\sum }}(y_{i}-y_{i}^{p})^{2}+\underset{i=1}{\overset{N}{\sum }}(y_{i}^{p}-\overline{y})^{2}+2\underset{i=1}{\overset{N}{\sum }}(y_{i}-y_{i}^{p})(y_{i}^{p}-\overline{y})

Całkowitą wariancię zmiennej y podzieliliśmy na dwa człony: wariancję estymaty y_{i}^{p} wokół wartości średniej \overline{y} i wariancję obserwowanych y_{i} wokół estymaty y_{i}^{p} (trzeci człon znika).

Współczynnik korelacji


\rho_{x, y}= \frac{\sigma_{x, y}}{\sigma_x \sigma_y}=\frac{E\left(	\left(x-\mu_{x})(y-\mu_{y}\right)\right)}{\sqrt{E\left( (x-\mu_{x})^2\right) E\left( (y-\mu_{y})^2\right)}},

jego kwadrat estymujemy jako

\rho ^{2}=\frac{\left( \underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x})(y_{i}-\overline{y})\right) ^{2}}{\underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x})^{2}\underset{i=1}{\overset{N}{\sum }}(y_{i}-\overline{y})^{2}}


Rozważmy

{ \underset{i=1}{\overset{N}{\sum }}(y_{i}^{p}-\overline{y})^{2}=b^{2}\underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x})^{2}=\frac{\left( \underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x})(y_{i}-\overline{y})\right) ^{2}}{\left( \underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x})^{2}\right) ^{2}}\underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x})^{2}=\ }

{ =\frac{\left( \underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x})(y_{i}-\overline{y})\right) ^{2}}{\underset{i=1}{\overset{N}{\sum }}(x_{i}-\overline{x})^{2}}\frac{\underset{i=1}{\overset{N}{\sum }}(y_{i}-\overline{y})^{2}}{\underset{i=1}{\overset{N}{\sum }}(y_{i}-\overline{y})^{2}}=\rho ^{2}\underset{i=1}{\overset{N}{\sum }}(y_{i}-\overline{y})^{2}\ }

czyli

{ \rho ^{2}=\frac{\underset{i=1}{\overset{N}{\sum }}(y_{i}^{p}-\overline{y})^{2}}{\underset{i=1}{\overset{N}{\sum }}(y_{i}-\overline{y})^{2}}\ }

przykłady interpretacji podaje też artykuł z Wikipedii


Przykładowe wartości współczynnika korelacji dla 300 par (x, y) o różnych stopniach współzależności.