Z Brain-wiki
Skocz do: nawigacja, szukaj

Wnioskowanie_Statystyczne_-_wykład


Rozkład równomierny

... zwany też jednostajnym, prostokątnym lub płaskim, przyjmuje jednakowe wartości dla wszystkich liczb z jakiegoś odcinka (na przykład między zero a jeden), a poza tym odcinkiem ma wartość zero:

\begin{matrix}p(x) =  1 & \textrm{ dla } & 0\leq x\leq 1\\ p(x) =  0 & \textrm{ dla } & x>1\ \textrm{  lub  }\ x<0.\end{matrix}

Rozkład równomierny określony na odcinku od zera do jedynki.

Wartość oczekiwana

\mu =E(x)=\int\limits_0^1 x dx=\left[\frac{x^{2}}{2}\right]_0^1=\frac{1}{2}.

Wariancja

\sigma ^{2}=E((x-\mu )^{2})= \int\limits_0^1 \left(x-\frac 1 2 \right)^2 dx =\int\limits_0^1\left(x^2 - x +\frac 14\right) dx = \left[\frac{x^3}3 - \frac{x^2}2 +\frac x 4\right]^1_0 = \frac 1 {12}.

Oczywiście rozkład jednostajny może być określony na dowolnym odcinku (a, b) — wystarczy przeskalować opisaną powyżej kanoniczną postać:

\begin{matrix}p(x) =  \frac{1}{b-a} & \textrm{ dla } & a\leq x\leq b\\ p(x) =  0 & \textrm{ dla } & x<a\ \textrm{  lub  }\ x>b.\end{matrix}

Proste modyfikacje przytoczonych powyżej całek wykażą, że jego wartość oczekiwana wynosi

\frac{a+b}{2},

a wariancja

\frac{(b-a)^2}{12}.

Rozkład dwumianowy

Powtarzamy n razy doświadczenie o dwóch możliwych wynikach A i \overline{A} oraz prawdopodobieństwach odpowiednio p i q, przy czym p+q=1. Wynik A nazywamy sukcesem i pytamy, jakie jest prawdopodobieństwo k sukcesów?

Liczba k-elementowych podciągów ciągu n-elementowego wynosi \frac{n!}{(n-k)!}, czyli n(n-1)(n-2)...(n-k+1); na pierwszym miejscu każdego z ciągów możemy ustawić każdy z n elementów, po jego ustaleniu na drugim miejscu każdy z n-1 elementów itd. Jeśli ponadto nie rozróżniamy podciągów o różnej kolejności elementów, to liczbę tę podzielić należy przez liczbę permutacji (przestawień) zbioru k-elementowego, czyli k!. W rezultacie dostajemy

\frac{n!}{k!(n-k)!}=\binom{n}{k}.


Niech P_{n}(k) oznacza prawdopodobieństwo wystąpienia k razy zdarzenia o prawdopodobieństwie p w serii n powtórzeń. Prawdopodobieństwo jednej serii k zdarzeń A i (n-k) zdarzeń \overline{A} wynosi p^k q^{(n-k)}. Zgodnie z powyższymi rozważaniami, takich serii, które różnią się kolejnością wystąpienia zdarzeń p i q, będzie \binom n k. Ostatecznie rozkład dwumianowy możemy opisać następującym wzorem:

P_{n}(k)=\binom{n}{k}p^{k}q^{n-k}=\frac{n!}{k!(n-k)!}p^{k}(1-p)^{n-k}.

Rysunek %i 3 przedstawia rozkłady dwumianowe dla różnych wartości p i n. Wartość oczekiwana \mu i wariancja \sigma^2 rozkładu dwumianowego wyrażają się następującymi wzorami:

\mu=np, \qquad \sigma^2=npq.

Dowód

Bezpośrednie rachunki są w tym przypadku żmudne, więc dla znalezienia wartości oczekiwanej i wariancji rozkładu dwumianowego posłużymy się zmienną losową x_{i}, opisującą wynik pojedynczego doświadczenia. Przyjmuje ona wartość 1, jeśli zaszło zdarzenie A (sukces) i 0 w przypadku porażki. Rozkład liczby sukcesów w serii n powtórzeń opisuje zmienna będąca ich sumą X=\sum\limits_{i=1}^n x_{i}.

Wartość oczekiwana zmiennej x_i, czyli wyniku pojedynczego doświadczenia, wynosi

E(x_i)=\sum\limits_i x_i P(X=x_i) = 1\cdot p + 0\cdot q = p.

Wartość oczekiwana sumy n zmiennych x_i, dającej wartość zmiennej opisywanej rozkładem dwumianowym, będzie (z liniowości wartości oczekiwanej) sumą wartości oczekiwanych — stąd wartość oczekiwana rozkładu dwumianowego wyniesie n p. Z kolei wariancja x_i wynosi

\sigma^2(x_i)=E((x_{i}-\mu)^{2})=\sum\limits_i (x_i-p)^2P(X=x_i)= (1-p)^{2}p+(0-p)^{2}q =q^{2}p+p^{2}q=pq(p+q)=pq.

Wariancja rozkładu dwumianowego będzie równa wariancji sumy n zmiennych x_i. Ponieważ zmienne te są niezależne,

\sigma^2\left(\sum_{i=1}^{n}x_i\right) = n\sigma^2(x_i) = npq.


Dwumianowe rozkłady prawdopodobieństwa dla p=\frac 16, \frac{1}{2}=\ i\ = 0.8 oraz n=5=\ i\ =20

Przykład: rozkład dwumianowy

Obliczmy rozkład prawdopodobieństwa wyrzucenia k szóstek w pięciu rzutach kostką (symulowany w rozdziale o metodzie Monte Carlo): p=\nicefrac{1}{6}, q=\nicefrac{5}{6}, \binom{5}{0}=1, \binom{5}{1}=5 i tak dalej.

k= 0 1 2 3 4 5
P_5(k)\approx 0,4019 0,4019 0,1608 0,0322 0,0032 0,0001

Wartości te przedstawione są na wykresie w lewym górnym rogu rysunku %i 3. Prawdopodobieństwo wyrzucenia przynajmniej dwóch (czyli od dwóch do pięciu) szóstek wynosi

0,1608+0,0322+0,0032+0,0001\approx 0,1962.


Przykład: trzy dziewczynki

Obliczmy prawdopodobieństwo, że wśród czworga dzieci będą co najmniej trzy dziewczynki — zakładając, że prawdopodobieństwa urodzenia dziecka każdej płci są równe.

"Co najmniej trzy dziewczynki" można zasymulować jako cztery lub trzy "sukcesy" w czterech "losowaniach płci" o prawdopodobieństwie sukcesu \frac{1}{2}, czyli

 P_4(4)+P_4(3)=\binom{4}{4}\left(\frac 12\right)^4 +\binom{4}{3}\left(\frac 12\right)^4 = (1+4)\left(\frac 12\right)^4 =\frac{5}{16}= 0,3125,

zgodnie z wynikiem symulacji z zadania.

Przykład:

W rzutach do kosza uzyskiwaliśmy średnio 6 trafień na 10 rzutów. Po zmianie techniki w pierwszych 10 rzutach uzyskaliśmy 9 trafień. Czy należy wnioskować, że nowa technika rzutów poprawia średnią trafień?

Jeśli zmiana techniki nie wpłynęła na skuteczność, to prawdopodobieństwo uzyskania 9 lub więcej trafień na 10 rzutów odpowiada 9 lub 10 sukcesom w 10 losowaniach o prawdopodobieństwie 0,6, czyli:

\begin{matrix}P_{10}(9)+P_{10}(10)=\binom{10}{9}(0,6)^9 0,4+\binom{10}{10}(0,6)^{10} = \\= (0,6)^9(10\cdot0,4+0,6) \approx0,0101\cdot 4,6=0,046.\end{matrix}

Czyli mniej niż 5% — zgodnie z wynikiem symulacji.

Rozkład Poissona

W granicy dużej liczby n zdarzeń o niskim prawdopodobieństwie p, tj. n\rightarrow \infty , np=\lambda =const., otrzymujemy z rozkładu dwumianowego rozkład Poissona:

 P_{n}(k)=P_{\lambda}(k)=\dfrac{\lambda ^{k}}{k!}e^{-\lambda }.

Dowód

\begin{matrix}P_{n}(k)&=&\dfrac{n!}{k!(n-k)!}p^{k}q^{n-k}=\dfrac{n!}{k!(n-k)!}\left(\dfrac{\lambda }{n}\right)^{k}\dfrac{(1-\frac{\lambda}{n})^{n}}{(1-\frac{\lambda }{n})^{k}}=\\ &=&\dfrac{\lambda ^{k}}{k!}\dfrac{n(n-1)...(n-k+1)(1-\frac{\lambda }{n})^{n}}{n^{k}(1-\frac{\lambda }{n})^{k}}=\\ &=&\dfrac{\lambda ^{k}}{k!}\left(1-\dfrac{\lambda }{n}\right)^{n}\dfrac{(1-\frac{1}{n})(1-\frac{2}{n})...(1-\frac{k-1}{n})}{(1-\frac{\lambda }{n})^{k}}.\end{matrix}

Ponieważ \underset{n\rightarrow \infty }{\lim }\frac{(1-\frac{1}{n})(1-\frac{2}{n})...(1-\frac{k-1}{n})}{(1-\frac{\lambda }{n})^{k}} =1, oraz \underset{n\rightarrow \infty }{\lim}(1-\frac{\lambda }{n})^{n}=e^{-\lambda},

dostajemy (2).

Sprawdźmy warunek P(\Omega)=1

Przestrzeń wszystkich możliwych zdarzeń wyczerpują tu liczby sukcesów k od zera do n (n\rightarrow\infty), czyli

P(\Omega)=\sum_{k=0}^{\infty} P_{\lambda }(k)=\sum_{k=0}^{\infty} \frac{\lambda ^{k}}{k!}e^{-\lambda }=e^{-\lambda }\sum_{k=0}^{\infty} \frac{\lambda ^{k}}{k!}=e^{-\lambda }e^{\lambda }=1

gdyż

\sum_{k=0}^{\infty} \frac{\lambda ^{k}}{k!} = e^{\lambda}.

Wartość oczekiwana i wariancja

wynoszą:

\mu(k)=\sigma^2(k)=\lambda.

Dowód

E(k)=\underset{k=0}{\overset{\infty }{\sum }}k\frac{\lambda ^{k}}{k!}e^{-\lambda }=\lambda e^{-\lambda }\underset{k=1}{\overset{\infty }{\sum }}\frac{\lambda ^{k-1}}{(k-1)!}=\lambda e^{-\lambda }\underset{l=0}{\overset{\infty }{\sum }}\frac{\lambda ^{l}}{l!}=\lambda e^{-\lambda } e^{\lambda }=\lambda,

\begin{matrix}\sigma ^{2}(k)&{=}&E(k^{2})-\{E(k)\}^{2}=\ \left(\underset{k=0}{\overset{\infty }{\sum}}k^{2}\frac{\lambda ^{k}}{k!}e^{-\lambda } \right) -\lambda ^{2}=\\ &=&\lambda e^{-\lambda}\underset{k=1}{\overset{\infty }{\sum }}\frac{k\lambda ^{k-1}}{(k-1)!}-\lambda ^{2}=\lambda \{e^{-\lambda }\underset{l=0}{\overset{\infty }{\sum }}(l+1)\frac{\lambda ^{l}}{l!}-\lambda \}=\\ &=&\lambda \{e^{-\lambda }\underset{l=0}{\overset{\infty }{\sum }}l\frac{\lambda ^{l}}{l!}+e^{-\lambda }\underset{l=0}{\overset{\infty }{\sum }}\frac{\lambda ^{l}}{l!}-\lambda\} =\end{matrix}

z (4)

= \lambda (\lambda +1-\lambda )=\lambda .

Jeśli wariancja rozkładu Poissona jest równa jego wartości oczekiwanej (\lambda), to odchylenie standardowe \sigma (czyli pierwiastek z wariancji) wyniesie

\sigma ^{2}(k)=\lambda \Rightarrow \sigma (k)=\sqrt{\lambda }=\sqrt{np}.

Wynik ten przytaczany bywa jako "prawo" określające błąd liczby zliczeń jako jej pierwiastek.

Rozkłady Poissona dla różnych wartości parametru \lambda.