Z Brain-wiki
Skocz do: nawigacja, szukaj

Wnioskowanie_Statystyczne_-_wykład


Definicje prawdopodobieństwa

Częstościowa definicja prawdopodobieństwa

Niech eksperyment \Omega ma N "równie prawdopodobnych" wyników A_{i}:

\Omega =A_{1},A_{2},...A_{N}.

Jeśli zdarzenie E określone jest przez podzbiór przestrzeni \Omega o liczebności M

 E=A_{1}\cup A_{2}...\cup A_{M}

to prawdopodobieństwo zdarzenia E określamy jako

 P(E)=\frac{M}{N}.

Jak widać, w tej definicji wykorzystane jest definiowane pojęcie (w odniesieniu do "równie prawdopodobnych" wyników), co z punktu widzenia teorii jest niewątpliwie poważnym defektem. Można go uniknąć, wprowadzając prawdopodobieństwo jako liczbę spełniającą po prostu poniższe aksjomaty (aksjomatyczna definicja prawdopodobieństwa[1]):

P(A)\geq 0
P(\Omega )=1

jeśli A i B wykluczają się nawzajem, to

P(A\cup B)=P(A)+P(B)

Oznaczmy symbolem \overline{A} dopełnienie zdarzenia A do przestrzeni \Omega. Wtedy (1) i (2) implikują:

1=P(\Omega )=P(A\cup \overline{A})=P(A)+P(\overline{A})

czyli

\ 0\leq P(A)\leq 1

(Ten wniosek bywa dołączany jako czwarty aksjomat.)

Ta definicja jest już formalnie poprawna, jednak nie dostarcza żadnego przepisu na sposób obliczania definiowanej wielkości, co uniemożliwia jej praktyczne zastosowanie. Z kolei różne od klasycznego, Bayesowskie podejście do statystyki określa prawdopodobieństwo jako miarę wiary w możliwość wystąpienia danego zdarzenia — jego obliczanie również bywa niełatwe.

Pojęcie prawdopodobieństwa leży u podstaw klasycznej teorii statystyki, stąd problemy z jego ścisłą definicją mogą rzucać cień na wiarę w jej spójność. Z drugiej strony, jak zauważa J.L. Simon:

(...)dyskusja ta przypomina kontrowersje wokół pojęcia czasu (czym czas naprawdę "jest"), które powstrzymywały postęp w fizyce, dopóki Einstein nie powiedział, że czas powinniśmy zdefiniować po prostu jako to, co odczytuje się z zegara.

Przykład

Spróbujmy określić prawdopodobieństwo zdarzenia, że poprowadzona w sposób przypadkowy cięciwa okręgu będzie miała długość większą od promienia.

Rozwiązanie:

Jak "przypadkowo" poprowadzić cięciwę? Narysujmy dowolną prostą i wybierzmy na niej losowo punkt. Przez ten punkt prowadzimy prostopadłą, której punkty przecięcia z okręgiem będą wyznaczać cięciwy. Oczywiście nie wszystkie punkty na prostej dadzą prostopadłe, które będą miały w ogóle punkty wspólne z okręgiem — tylko punkty z odcinka E–H rys.%i 1. Z tych punktów graniczną cięciwę o długości równej promieniowi będzie wyznaczał punkt F, dla którego trójkąt AOB będzie równoboczny. Analogicznie z drugiej strony dla punktu G i trójkąta COD. Tak więc wszystkie punkty z odcinka EH będą generować cięciwy, a punkty z odcinka FG — cięciwy dłuższe od promienia. Prawdopodobieństwo "wylosowania" cięciwy dłuższej niż promień będzie równe stosunkowi długości odcinka FG do EH. Jeśli pamiętamy wzór na wysokość trójkąta równobocznego, łatwo znajdziemy jego wartość: \frac{\sqrt{3}} 2.

Jak poprowadzić przypadkowo cięciwę okręgu: sposób pierwszy.

Inne rozwiązanie:

Wybieramy losowo punkt wewnątrz okręgu, i prowadzimy przez niego prostą prostopadłą do promienia przechodzącego przez ten sam punkt. Jak widać z rys.%i 2, prosta ta wyznaczy cięciwę dłuższą niż promień, jeśli punkt będzie położony w odległości mniejszej niż \frac{\sqrt{3}}{2} od środka. Wyznacza to wnętrze okręgu o promieniu \frac{\sqrt{3}}{2}, którego pole wyniesie \frac{3\pi}{4} (przyjmujemy jednostkowy promień ,,dużego okręgu). Szukane prawdopodobieństwo jest stosunkiem tej wielkości do pola ,,dużego okręgu, czyli wynosi \frac{3}{4}.

Jak poprowadzić przypadkowo cięciwę okręgu: sposób drugi.

Jeszcze inne rozwiązanie:

Wyznaczmy na okręgu punkt, z którego będziemy prowadzić cięciwy (punkt A na rys.%i 3). Parametrem określającym jednoznacznie cięciwę będzie kąt między styczną do okręgu w danym punkcie a jej kierunkiem, od 0^\circ do 180^\circ. Cięciwy o długości większej niż długość promienia będą wyznaczone przez kąty od 30^\circ do 150^\circ (trójkąty BOA i COA na rys.%i 3 są równoboczne). Stanowi to dwie trzecie zakresu kątów wyznaczających cięciwy, więc szukane prawdopodobieństwo wynosi \frac{2}{3}.

Jak poprowadzić przypadkowo cięciwę okręgu: sposób trzeci.

???

Co się nie zgadza? Przykład ten nie podważa bynajmniej idei geometrycznej interpretacji prawdopodobieństwa w ogóle; po prostu wynik zależy od przepisu na "przypadkowe" przeprowadzenie cięciwy — każde z rozwiązań zakłada losowanie według równomiernego rozkładu innego parametru (położenia punktu na prostej, położenia punktu wewnątrz okręgu, kąta). Można więc powiedzieć, że problem nie został ściśle sformułowany.

Prawdopodobieństwo warunkowe i zdarzenia niezależne

Zapis P(A\mid B) oznacza prawdopodobieństwo zdarzenia A liczone w sytuacji, gdy mamy pewność wystąpienia zdarzenia B. Odpowiada to w pewnym sensie wystąpieniu obydwu zdarzeń (A\cap B), jednak prawdopodobieństwo tej sytuacji należy obliczać inaczej niż P(A\cap B).

Przyklad

Niech A oznacza wyrzucenie szóstki, a B — wyrzucenie parzystej liczby oczek w rzucie kostką. Wtedy A\capB oznacza wyrzucenie szóstki, P(A\capB)=\frac{1}{6}. Jednak jeśli bierzemy pod uwagę tylko te przypadki, w których wyrzucono parzystą liczbę oczek (2, 4 lub 6), to P(A\mid B)=\frac{1}{3}.

Rozważmy P(A\mid\Omega); dla dowolnego A mamy

 P(A)=P(A\mid\Omega)=P(A\cap\Omega)

bo oczywiście A\in\Omega. Rozbijając przestrzeń wszystkich możliwych zdarzeń \Omega na część odpowiadającą zdarzeniu B i pozostałą \overlineB (\Omega=B\cup\overline{B}), dostajemy:

P(A)=P(A\mid\Omega)=P\left(A\cap(B\cup\overline{B})\right)=P\left((A\cap B)\cup(A\cap\overline{B})\right)=P(A\cap B) +P(A\cap\overline{B}),

czyli prawdopodobieństwo zdarzenia A jest równe sumie prawdopodobieństw zajścia A, jeśli zaszło również B, oraz prawdopodobieństwa zajścia A, jeśli B nie zaszło. Jeśli wiemy, że zaszło zdarzenie B (wszak liczymy P(\cdot\mid B)), to drugi człon znika (P(\overline{B})=0). Aby uzyskać wzór na P(A\mid B), pozostały człon musimy podzielić przez P(B) (aby dla B=A było P(A\midA)=1):

 P(A\mid B)=\frac{P(A\cap B)}{P(B)}

Jeśli wystąpienie zdarzenia B nie ma żadnego wpływu na prawdopodobieństwo wystąpienia zdarzenia A, czyli P(A\mid B)=P(A), to mówimy, że zdarzenia A i B są niezależne. Z (%i 5) wynika, że dla zdarzeń niezależnych A i B P(A\cap B)=P(A)P(B).



  1. Podana przez Kołmogorowa w roku 1933.