Z Brain-wiki
Skocz do: nawigacja, szukaj

Wnioskowanie_Statystyczne_-_wykład


Założenia i ograniczenia teorii klasycznej

Klasyczna statystyka powstawała w czasach, gdy obliczenia wykonywano wyłącznie na papierze — albo za pomocą suwaków logarytmicznych itp., ale bez komputerów. Analityczny opis prawdopodobieństw prowadzi, z wyjątkiem najprostszych przykładów, do skomplikowanych wzorów. W dodatku opiera się zwykle na silnie upraszczających założeniach — najczęściej punktem wyjścia jest przyjęcie, że dane podlegają rozkładowi Gaussa zwanemu też rozkładem normalnym lub krzywą dzwonową. [1]

Jednak "długie wzory" to nie jedyny problem statystyki klasycznej. Już na długo przed pojawieniem się współczesnych metod opartych na komputerach, podstawy teorii statystyki były przedmiotem gorących dyskusji — poczynając od samej definicji prawdopodobieństwa. Główną alternatywą dla najbardziej rozpowszechnionej statystyki klasycznej (zwanej również częstościową, od sposobu definiowania prawdopodobieństwa) jest podejście Bayesowskie. Jest ono bardziej eleganckie z filozoficznego punktu widzenia (choć dla niektórych immanentnie obecny element subiektywności jest trudny do zaakceptowania), jednak nie w każdym przypadku podaje konkretne recepty na obliczanie prawdopodobieństwa.

Wreszcie są również sytuacje, w których stopień skomplikowania uniemożliwia wyprowadzenie jakichkolwiek wzorów analitycznych, przez co powyższe podejścia stają się bezsilne i jako jedyna recepta pozostaje "brutalna siła" obliczeniowa.

Z drugiej strony, jeśli dla danego problemu znane jest poprawne rozwiązanie klasyczne, bywa ono nie tylko szybsze, ale i dokładniejsze niż symulacje czy repróbkowanie. Jeśli wynik wyraża się nawet bardzo skomplikowanym wzorem, można go obliczyć bez porównania szybciej,[2] niż setki czy tysiące powtórzeń znacznie prostszego wzoru, będące podstawą metod repróbkowania opisywanych w poprzedniej części.

Ponadto metody klasyczne są wciąż podstawowym językiem wyrażania istotności wyników i weryfikacji hipotez w większości zastosowań statystyki. Dlatego też współczesny kurs powinien zawierać zarówno elementy repróbkowania, jak i statystyki klasycznej. Ich znajomość pozwoli na wybranie metody odpowiedniej (lub najprostszej) dla konkretnego problemu.



  1. Oczywiście założenie to przyjmujemy, jeśli nie znamy rozkładu badanej populacji. Jego znajomość jest jednak w praktyce dość rzadka i dlatego pozostaje przyjąć wybór uzasadniony dla przypadków, w których mamy do czynienia z sumowaniem dużej liczby małych błędów, czyli rozkład Gaussa.
  2. Nawet jeśli we wzorach występują trudne do obliczenia całki, gdyż wartości częściej używanych całek zapisywano w tablicach. Jeszcze do niedawna większość podręczników statystyki zawierała tablice całek funkcji Gaussa, funkcji \Gamma, \chi^2 itp. Dziś wszystkimi obliczeniami zajmuje się komputer, my możemy skupić się na sednie problemu i poprawnym wyborze metody.