WnioskowanieStatystyczne/Test Wilcoxona
Wnioskowanie_Statystyczne_-_wykład
Spis treści
Test rang Wilcoxona–Manna–Whitneya
W przykładzie sprawdzającym skuteczność remontu linii produkcyjnej w fabryce zetknęliśmy się z jedną z sytuacji najczęściej spotykanych w praktycznym stosowaniu statystyki, mianowicie pytaniem o istotność różnic między dwoma grupami. Bardzo często zdarza się, że nie mamy wystarczających informacji o rozkładach, z których pochodzą analizowane dane. Jeśli pomimo to zastosujemy np. test [math]t[/math] oparty na założeniu normalności populacji, to popełniamy poważny błąd metodologiczny, przez co możemy uzyskać nieprawdziwy wynik.
Dlatego od wielu lat ogromną popularnością — szczególnie w naukach biomedycznych — cieszą się odpowiedniki testu [math]t[/math], nie wymagające założeń normalności. Najpopularniejszym z nich jest test zwany czasami testem Wilcoxona, innym znów razem testem Manna–Whitneya. Niejasności wynikają z faktu, że statystyki testowe zaproponowane przez Wilcoxona w roku 1945 oraz przez Manna i Whitneya w roku 1947 są równoważne, czyli zastosowanie dowolnej z nich daje de facto ten sam test.
Statystyka Wilcoxona
Mamy dwie próby o liczebnościach odpowiednio [math]m[/math] i [math]n[/math] elementów. Elementy pierwszej grupy oznaczymy [math]\{x_i\}_{i=1\dots m}[/math], a drugiej — [math]\{y_j\}_{j=1\dots n}[/math]. Hipoteza zerowa zakłada ich pochodzenie z tej samej populacji.
Liczby z obydwu prób "wrzucamy do jednego worka", a następnie porządkujemy rosnąco. Każdej liczbie przypisujemy jej pozycję (rangę) [math]R(x)[/math]. Statystyką testową jest suma rang liczb pochodzących z pierwszej próby. Wartość statystyki Wilcoxona możemy zapisać jako
Dla ilustracji użyjemy raz jeszcze danych z przykładu:
pierwsza próba (a) | 12, 9, 21, 14, 7, 17; |
druga próba (b) | 5, 9, 3, 11, 8, 19, 7, 5, 9, 12, 5, 11, 9, 6, 8, 17, 9, 12 |
połączone próby:
liczba | 3 | 5 | 7 | 8 | 9 | 9 | 11 | 12 | 14 | 17 | 19 | 21 |
grupa | b | b | a | b | a | b | b | a | a | a | b | a |
ranga | 1 | 2 | 3 | 4 | 5,5 | 5,5 | 7 | 8 | 9 | 10 | 11 | 12 |
W tym przypadku suma rang dla pierwszej grupy (a) wyniesie 47,5.[1]
Statystyka Manna–Whitneya
Ponownie porządkujemy elementy obu prób w jeden rosnący ciąg. Jako inwersję definiujemy taką parę liczb z tego ciągu, w której liczba z próby drugiej poprzedza (czyli jest od niej mniejsza) liczbę z próby pierwszej. Wartość statystyki Manna–Whitneya jest ilością takich inwersji w ciągu utworzonym z badanych prób.
Ilość inwersji zliczamy kolejno dla każdego elementu pierwszej grupy i sumujemy. Możemy to zapisać jako
gdzie symbol [math]\#[/math] oznacza liczebność.
Równoważność statystyk [math]W_{m,n}[/math] i [math]M_{m,n}[/math]
Dla każdego elementu drugiej próby [math]x_i[/math] jego ranga jest równa liczbie poprzedzających go elementów (z obu prób) powiększonej o jeden. Z kolei w [math]i[/math]-tym składniku sumy (2) zliczamy wyłącznie poprzedzające [math]x_i[/math] elementy drugiej próby ([math]y_j[/math]) — do pełnej sumy rang brakuje ilości poprzedzających [math]x_i[/math] elementów tej samej próby. Aby uzyskać "pełną" rangę, musimy je dodać: dla [math]x_i[/math] będzie ich [math]i-1[/math].[2] Ostatecznie w (2) do pełnej sumy rang brakuje [math]\sum\limits_{i=1}^n i[/math]. Ponieważ [math] \sum\limits_{i=1}^m i = \frac{m(m+1)}{2} , [/math] dostajemy
[math] W_{m,n} =M_{m,n}+\frac{m(m+1)}{2}. [/math]
Ponieważ dla ustalonych liczebności grup wartości tych statystyk różnią się o czynnik zależny wyłącznie od liczebności jednej z grup, ich rozkłady będą jednakowe z dokładnością do przesunięcia o ten czynnik, czyli oparte na nich testy będą równoważne.
Oznacza to, że testy oparte na tych statystykach będą dawać dokładnie takie same wyniki, czyli nie ma sensu ich rozróżnianie. Pozostaje więc znaleźć postać rozkładu prawdopodobieństwa dla jednej z tych statystyk...
- -/
No tak, może faktycznie po ciężkich doświadczeniach z wyprowadzaniem postaci rozkładu z poprzedniego rozdziału byłoby to mało rozwijające. W dodatku w tym wypadku nie da się znaleźć tak "spójnej" postaci jak w poprzednim rozdziale,[3] więc zadowoliwszy się znajomością ogólnych reguł możemy spokojnie skorzystać z tablic lub odpowiednich programów komputerowych.
Spróbujmy zastosować ten test do danych z
przykładu sprawdzającego skuteczność remontu linii produkcyjnej w fabryce. Po obliczeniu wartości
statystyki (1) i porównaniu ze stablicowanymi
wartościami[4] okazuje się, że hipotezę o
pochodzeniu wyników przed i po remoncie z tej samej populacji można
przyjąć na poziomie 5% (graniczne prawdopodobieństwo wynosi 7,4%). Z
kolei stosowany przy pierwszej dyskusji tego przykładu
test permutacyjny odrzucił
hipotezę o braku zmian przy poziomie istotności
ok. 3,8%[5]
Zgodnie z oczekiwaniami sugeruje to mniejszą moc testu
Wilcoxona–Manna–Whitneya, jako opartego jedynie na
względnych wartościach. Zauważmy, że np. zastąpienie największej z
wartości (21) wartością dowolnie większą (np. 21000) nie zmieni
wartości statystyki (1)! Tak więc test ten nie wykorzystuje całej informacji zawartej w analizowanych danych — jest to cena za
niezależność od rozkładu.
Na koniec powinniśmy wziąć pod uwagę jeszcze jeden czynnik. Ponieważ rozkład statystyki (1) jest symetryczny względem zamiany grupy "pierwszej" i "drugiej", czyli [math]P(W_{m, n})=P(W_{n, m})[/math], implementacje tego testu w programach komputerowych podają zwykle wynik dla testu dwustronnego. Graniczne prawdopodobieństwo dla testu jednostronnego byłoby dwukrotnie mniejsze od podanego, co daje dowód hipotezy o wpływie remontu linii na ilość braków, podobnie jak w teście permutacyjnym i [math]t[/math]. Jednak fakt ten nie podważa ogólnej wartości rozważań poprzedniego akapitu.
<references>
- ↑ W przypadku występowania jednakowych wartości przypisujemy odpowiednie rangi ułamkowe.
- ↑ Przyjmujemy w tym miejscu, że [math]x_i[/math] są uporządkowane rosnąco.
- ↑ Za to rozkład statystyki (1) jest szybko zbieżny do rozkładu normalnego (por. z książką Probabilistyka. Rachunek Prawdopodobieństwa. Statystyka matematyczna. Procesy stochastyczne" Agnieszki i Edmunda Plucińskich) i zwykle korzysta się z tego przybliżenia.
- ↑ Tablice statystyk (1) czy dla testu serii można znaleźć praktycznie w każdym podręczniku statystyki, choć w praktyce korzystamy z programów komputerowych, zawierających te informacje. Tak naprawdę dla większych prób programy te korzystają z postaci asymptotycznych tych rozkładów, wyznaczonych analitycznie.
- ↑ Test Studenta dla tych samych danych dał wynik podobny do uzyskanego w teście permutacyjnym, jednak w tym przypadku nie mamy gwarancji spełnienia założeń.