Z Brain-wiki
Skocz do: nawigacja, szukaj

Wnioskowanie_Statystyczne_-_wykład


Rozkład F

Niech zmienne x i y mają rozkłady \chi^{2} o odpowiednio f_{1} i f_{2} stopniach swobody. Zmienna

F=\frac{\frac{1}{f_{1}} x}{\frac{1}{f_{2}}y}=\frac{f_{2}x}{f_{1}y}

posiada rozkład F z f_{1} i f_{2} stopniami swobody o wartości oczekiwanej E(f)=\frac{f_{2}}{(f_{2}-2)}

f(F)=\left( \frac{f_{1}}{f_{2}}\right) ^{\frac{f_{1}}{2}}\frac{\Gamma \left( \frac{1}{2}\left( f_{1}+f_{2}\right) \right) }{\Gamma \left( \frac{f_{1}}{2}\right) \Gamma \left( \frac{f_{2}}{2}\right) }F^{\frac{f_{2}}{2}-1}\left( 1+\frac{f_{1}}{f_{2}}F\right) ^{-\frac{f_{1}+f_{2}}{2}}

Rozkład F Fischera dla przykładowych liczb stopni swobody f_1 i f_2.

Dla próby z rozkładu normalnego wielkość

\chi ^{2}=\underset{i=1}{\overset{N}{\sum }}\frac{(x_{i}-\overline{x})^{2}}{\sigma ^{2}}

podlega rozkładowi \chi ^{2} o f=N-1 stopniach swobody. Jeśli dwie takie próby zostały pobrane z jednej populacji, to iloraz

F=\frac{\left( N_{y}-1\right) \underset{i=1}{\overset{N}{\sum (}}x_{i}-\overline{x})^{2}}{\left( N_{x}-1\right) \underset{i=1}{\overset{N}{\sum }}(y_{i}-\overline{y})^{2}}

podlega rozkładowi F o f_{y} i f_{x} stopniach swobody.

Analiza wariancji (ANalysis of VAriance — ANOVA)

N obserwacji \{x_{i}\}_{i=1..N} podzielonych na k grup wedle jakiegoś kryterium: N=n_{1}+n_{2}+...+n_{k}. Średnie wewnątrz grup

\overline{x}_{i}=\frac{1}{n_{i}}\underset{j=1}{\overset{n_{i}}{\sum }}x_{ij}

Rozważmy sumę kwadratów odchyleń wszystkich elementów próby od wartości średniej całej próby:

\begin{matrix}\underset{i=1}{\overset{k}{\sum }}\underset{j=1}{\overset{n_{i}}{\sum }}(x_{ij}-\overline{x})^{2}=\underset{i=1}{\overset{k}{\sum }}\underset{j=1}{\overset{n_{i}}{\sum }}(x_{ij}-\overline{x}_{i}+\overline{x}_{i}-\overline{x})^{2}=\\ =\underset{i=1}{\overset{k}{\sum }}\underset{j=1}{\overset{n_{i}}{\sum }}(x_{ij}-\overline{x}_{i})^{2}+\underset{i=1}{\overset{k}{\sum }}\underset{j=1}{\overset{n_{i}}{\sum }}(\overline{x}_{i}-\overline{x})^{2}+2\underset{i=1}{\overset{k}{\sum }}\underset{j=1}{\overset{n_{i}}{\sum }}(x_{ij}-\overline{x}_{i})(\overline{x}_{i}-\overline{x})\end{matrix}

\underset{i=1}{\overset{k}{\sum }}\underset{j=1}{\overset{n_{i}}{\sum }}(x_{ij}-\overline{x}_{i})(\overline{x}_{i}-\overline{x})=\underset{i=1}{\overset{k}{\sum }}(\overline{x}_{i}-\overline{x})\underset{j=1}{\overset{n_{i}}{\sum }}(x_{ij}-\overline{x}_{i})=0

\underset{i=1}{\overset{k}{\sum }}\underset{j=1}{\overset{n_{i}}{\sum }}(\overline{x}_{i}-\overline{x})^{2}=\underset{i=1}{\overset{k}{\sum }}n_{i}(\overline{x}_{i}-\overline{x})^2

\underset{i=1}{\overset{k}{\sum }}\underset{j=1}{\overset{n_{i}}{\sum }}(x_{ij}-\overline{x})^{2}=\underset{i=1}{\overset{k}{\sum }}\underset{j=1}{\overset{n_{i}}{\sum }}(x_{ij}-\overline{x}_{i})^{2}+\underset{i=1}{\overset{k}{\sum }}n_{i}(\overline{x}_{i}-\overline{x})^{2}

inaczej

\underset{i=1}{\overset{k}{\sum }}\underset{j=1}{\overset{n_{i}}{\sum }}(x_{ij}-\overline{x})^{2} = s_{wew}^{2}+s_{pom}^{2}

Jeśli wszystkie pomiary pochodzą z tej samej populacji o wariancji  \sigma ^{2}, to

\frac{s^2_{wew}}{\sigma ^{2}}\ i\ \ \frac{s^2_{pom}}{\sigma ^{2}}

podlegają rozkładom \chi ^{2} o odpowiednio n-k i k-1 stopniach swobody. Iloraz

 \frac{\left( n-k\right) s^2_{pom}}{\left( k-1\right)s^2_{wew}}

podlega rozkładowi F o k-1 i n-k stopniach swobody. Wyrażenia

 \frac{1}{n-k}\underset{i=1}{\overset{k}{\sum}}\underset{j=1}{\overset{n_{i} }{\sum}}(x_{ij}-\overline{x}_{i})^{2}\ oraz\ \ \frac{1}{k-1}\underset{i=1}{\overset{k}{\sum }}n_{i}(\overline{x}_{i}-\overline{x})^{2}

czyli

 \frac{s_{wew}^{2}}{n-k}\ \ oraz\ \ \frac{s_{pom}^{2}}{k-1}

są nieobciążonymi estymatami wariancji populacji.







Testy par a posteriori

Testowanie a posteriori (inaczej post hoc) -> porównania wielokrotne