WnioskowanieStatystyczne/Klasyczna teoria: Różnice pomiędzy wersjami

Z Brain-wiki
 
Linia 10: Linia 10:
 
dodatku opiera się zwykle na silnie upraszczających założeniach —
 
dodatku opiera się zwykle na silnie upraszczających założeniach —
 
najczęściej punktem wyjścia jest przyjęcie, że dane podlegają
 
najczęściej punktem wyjścia jest przyjęcie, że dane podlegają
[[WnioskowanieStatystyczne/Przykładowe_rozkłady#Rozk.C5.82ad_Gaussa|rozkładowi Gaussa]]
+
[[WnioskowanieStatystyczne/CLT|rozkładowi Gaussa]]
 
zwanemu też rozkładem normalnym lub krzywą dzwonową. <ref>Oczywiście
 
zwanemu też rozkładem normalnym lub krzywą dzwonową. <ref>Oczywiście
 
założenie to przyjmujemy, jeśli nie znamy rozkładu badanej
 
założenie to przyjmujemy, jeśli nie znamy rozkładu badanej
Linia 21: Linia 21:
 
Już na długo przed pojawieniem się współczesnych metod opartych na
 
Już na długo przed pojawieniem się współczesnych metod opartych na
 
komputerach, podstawy teorii statystyki były przedmiotem gorących
 
komputerach, podstawy teorii statystyki były przedmiotem gorących
dyskusji &mdash; poczynając od samej [[WnioskowanieStatystyczne/Prawdopodobieństwo|definicji
+
dyskusji &mdash; poczynając od samej [[WnioskowanieStatystyczne/Prawdopodobienstwo|definicji
 
prawdopodobieństwa]]. Główną alternatywą dla najbardziej
 
prawdopodobieństwa]]. Główną alternatywą dla najbardziej
 
rozpowszechnionej statystyki klasycznej (zwanej również częstościową,
 
rozpowszechnionej statystyki klasycznej (zwanej również częstościową,

Aktualna wersja na dzień 15:48, 6 mar 2026

Wnioskowanie_Statystyczne_-_wykład


Założenia i ograniczenia teorii klasycznej

Klasyczna statystyka powstawała w czasach, gdy obliczenia wykonywano wyłącznie na papierze — albo za pomocą suwaków logarytmicznych itp., ale bez komputerów. Analityczny opis prawdopodobieństw prowadzi, z wyjątkiem najprostszych przykładów, do skomplikowanych wzorów. W dodatku opiera się zwykle na silnie upraszczających założeniach — najczęściej punktem wyjścia jest przyjęcie, że dane podlegają rozkładowi Gaussa zwanemu też rozkładem normalnym lub krzywą dzwonową. [1]

Jednak "długie wzory" to nie jedyny problem statystyki klasycznej. Już na długo przed pojawieniem się współczesnych metod opartych na komputerach, podstawy teorii statystyki były przedmiotem gorących dyskusji — poczynając od samej definicji prawdopodobieństwa. Główną alternatywą dla najbardziej rozpowszechnionej statystyki klasycznej (zwanej również częstościową, od sposobu definiowania prawdopodobieństwa) jest podejście Bayesowskie. Jest ono bardziej eleganckie z filozoficznego punktu widzenia (choć dla niektórych immanentnie obecny element subiektywności jest trudny do zaakceptowania), jednak nie w każdym przypadku podaje konkretne recepty na obliczanie prawdopodobieństwa.

Wreszcie są również sytuacje, w których stopień skomplikowania uniemożliwia wyprowadzenie jakichkolwiek wzorów analitycznych, przez co powyższe podejścia stają się bezsilne i jako jedyna recepta pozostaje "brutalna siła" obliczeniowa.

Z drugiej strony, jeśli dla danego problemu znane jest poprawne rozwiązanie klasyczne, bywa ono nie tylko szybsze, ale i dokładniejsze niż symulacje czy repróbkowanie. Jeśli wynik wyraża się nawet bardzo skomplikowanym wzorem, można go obliczyć bez porównania szybciej,[2] niż setki czy tysiące powtórzeń znacznie prostszego wzoru, będące podstawą metod repróbkowania opisywanych w poprzedniej części.

Ponadto metody klasyczne są wciąż podstawowym językiem wyrażania istotności wyników i weryfikacji hipotez w większości zastosowań statystyki. Dlatego też współczesny kurs powinien zawierać zarówno elementy repróbkowania, jak i statystyki klasycznej. Ich znajomość pozwoli na wybranie metody odpowiedniej (lub najprostszej) dla konkretnego problemu.



  1. Oczywiście założenie to przyjmujemy, jeśli nie znamy rozkładu badanej populacji. Jego znajomość jest jednak w praktyce dość rzadka i dlatego pozostaje przyjąć wybór uzasadniony dla przypadków, w których mamy do czynienia z sumowaniem dużej liczby małych błędów, czyli rozkład Gaussa.
  2. Nawet jeśli we wzorach występują trudne do obliczenia całki, gdyż wartości częściej używanych całek zapisywano w tablicach. Jeszcze do niedawna większość podręczników statystyki zawierała tablice całek funkcji Gaussa, funkcji [math]\Gamma[/math], [math]\chi^2[/math] itp. Dziś wszystkimi obliczeniami zajmuje się komputer, my możemy skupić się na sednie problemu i poprawnym wyborze metody.