Wnioskowanie Statystyczne - wykład: Różnice pomiędzy wersjami
Z Brain-wiki
(Nie pokazano 37 wersji utworzonych przez 2 użytkowników) | |||
Linia 8: | Linia 8: | ||
'''UWAGA: wymagane zaliczenie Technologii Informacyjnych i Komunikacyjnych z ćwiczeniami z programowania w Pythonie w wymiarze 45 godzin ćwiczeń''' | '''UWAGA: wymagane zaliczenie Technologii Informacyjnych i Komunikacyjnych z ćwiczeniami z programowania w Pythonie w wymiarze 45 godzin ćwiczeń''' | ||
+ | |||
+ | <!-- Zajęcia zdalne w roku 2021 odbywają się pod adresem https://kampus.come.uw.edu.pl/course/view.php?id=5295 | ||
+ | --> | ||
# | # | ||
Linia 18: | Linia 21: | ||
## [[WnioskowanieStatystyczne/wstep|Wstęp]] | ## [[WnioskowanieStatystyczne/wstep|Wstęp]] | ||
## [[WnioskowanieStatystyczne/Klasyczna_teoria|Teoria klasyczna]] | ## [[WnioskowanieStatystyczne/Klasyczna_teoria|Teoria klasyczna]] | ||
− | ## | + | ## [[WnioskowanieStatystyczne/Statystyki_i_estymatory|Statystyki i estymatory]] |
# | # | ||
## [[WnioskowanieStatystyczne/Weryfikacja_hipotez|Weryfikacja hipotez statystycznych]] | ## [[WnioskowanieStatystyczne/Weryfikacja_hipotez|Weryfikacja hipotez statystycznych]] | ||
− | |||
## [[WnioskowanieStatystyczne/Test_t|Test ''t'' Studenta]] | ## [[WnioskowanieStatystyczne/Test_t|Test ''t'' Studenta]] | ||
# | # | ||
## [[WnioskowanieStatystyczne/Test_chi2|Test <math>\chi^2</math>]] | ## [[WnioskowanieStatystyczne/Test_chi2|Test <math>\chi^2</math>]] | ||
+ | # | ||
+ | ## | ||
+ | # | ||
## [[WnioskowanieStatystyczne/Z_komputerem|Monte Carlo]] | ## [[WnioskowanieStatystyczne/Z_komputerem|Monte Carlo]] | ||
+ | ## [[WnioskowanieStatystyczne/Testy_permutacyjne|Testy permutacyjne]] | ||
+ | ## [[WnioskowanieStatystyczne/Bootstrap|Bootstrap]] | ||
+ | # | ||
# | # | ||
## [[WnioskowanieStatystyczne/Testy_nieprametryczne|Testy nieparametryczne]] | ## [[WnioskowanieStatystyczne/Testy_nieprametryczne|Testy nieparametryczne]] | ||
## [[WnioskowanieStatystyczne/Test_serii|Test serii]] | ## [[WnioskowanieStatystyczne/Test_serii|Test serii]] | ||
## [[WnioskowanieStatystyczne/Test_Wilcoxona|Test Wilcoxona-Manna-Whitneya]] | ## [[WnioskowanieStatystyczne/Test_Wilcoxona|Test Wilcoxona-Manna-Whitneya]] | ||
− | |||
− | |||
− | |||
# | # | ||
## [[WnioskowanieStatystyczne/MLF|Metoda największej wiarygodności]] | ## [[WnioskowanieStatystyczne/MLF|Metoda największej wiarygodności]] | ||
## [[WnioskowanieStatystyczne/Regresja_liniowa|Regresja liniowa]] | ## [[WnioskowanieStatystyczne/Regresja_liniowa|Regresja liniowa]] | ||
+ | # | ||
## [[WnioskowanieStatystyczne/Interpretacja współczynnika korelacji|Interpretacja współczynnika korelacji]] | ## [[WnioskowanieStatystyczne/Interpretacja współczynnika korelacji|Interpretacja współczynnika korelacji]] | ||
+ | ## [[WnioskowanieStatystyczne/Analiza_wariancji|Analiza wariancji]] | ||
# | # | ||
− | ## [[WnioskowanieStatystyczne/Bonferroni|Problem porównań wielokrotnych | + | ## [[WnioskowanieStatystyczne/Bonferroni|TP/FP, ROC. Problem porównań wielokrotnych — miejskie legendy i przepowiednie]] |
− | |||
− | |||
# | # | ||
+ | ## [[WnioskowanieStatystyczne/Prawdopodobienstwo|Prawdopodobieństwo]] | ||
## [[WnioskowanieStatystyczne/Twierdzenie_Bayesa|Twierdzenie Bayesa]] | ## [[WnioskowanieStatystyczne/Twierdzenie_Bayesa|Twierdzenie Bayesa]] | ||
− | |||
# | # | ||
## [[WnioskowanieStatystyczne/Elementy_statystyki_wielowymiarowej|Elementy statystyki wielowymiarowej]] | ## [[WnioskowanieStatystyczne/Elementy_statystyki_wielowymiarowej|Elementy statystyki wielowymiarowej]] | ||
Linia 60: | Linia 65: | ||
Punktacja [[Wnioskowanie_Statystyczne_-_ćwiczenia | ćwiczeń]]: | Punktacja [[Wnioskowanie_Statystyczne_-_ćwiczenia | ćwiczeń]]: | ||
+ | *'''Kartkówki (16 pkt)''': 4 kartkówki po 4 pkt w trakcie semestru | ||
+ | **zakres: zmienne losowe, przedziały ufności, testowanie hipotez | ||
+ | *'''Prace domowe/Aktywność (4 pkt)''' | ||
*'''Kolokwium (20 pkt)''' | *'''Kolokwium (20 pkt)''' | ||
− | **30.05. | + | **data: '''30.05.2022''', w godz. 9:00 - 12:00 |
− | |||
**zakres: zmienne losowe, przedziały ufności, testowanie hipotez | **zakres: zmienne losowe, przedziały ufności, testowanie hipotez | ||
− | |||
− | |||
− | |||
− | |||
− | |||
*'''Projekt (10 pkt)''' | *'''Projekt (10 pkt)''' | ||
− | **kod do napisania i indywidualnej obrony u prowadzącego do | + | **kod do napisania i indywidualnej obrony u prowadzącego (kod należy wysłać, a następnie umówić się indywidualnie na obronę do '''22.06.2022''') |
**zakres: chi2 | **zakres: chi2 | ||
**propozycje zadań zostaną podane w trakcie semestru | **propozycje zadań zostaną podane w trakcie semestru | ||
− | * | + | *'''Obecność''' |
− | **Obecność na ćwiczeniach jest obowiązkowa. Dopuszczalne są dwie nieusprawiedliwione nieobecności | + | **Obecność na ćwiczeniach jest obowiązkowa. Dopuszczalne są dwie nieusprawiedliwione nieobecności. |
Zaliczenie ćwiczeń: | Zaliczenie ćwiczeń: | ||
− | * | + | * > 50% z 50 pkt łącznie |
− | Zaliczenie ćwiczeń jest warunkiem koniecznym dopuszczenia do egzaminu | + | * Zaliczenie ćwiczeń jest warunkiem koniecznym dopuszczenia do egzaminu z wykładu. |
+ | * W przypadku braku uzyskania zaliczenia z ćwiczeń: '''kolokwium poprawkowe''' w czerwcu ('''24.06.2022''') lub w sesji jesiennej ('''x'''). | ||
+ | * Do kolokwium można podejść również w sytuacji chęci poprawienia oceny z ćwiczeń. Podejście do kolokwium poprawkowego jest równoznaczne z '''wyzerowaniem punktów z całego semestru'''. | ||
Zaliczenie wykładu: | Zaliczenie wykładu: | ||
− | * Egzamin pisemny | + | * Egzamin pisemny w sali. Tematy do przemyślenia przed egzaminem == przerobiony na wykładzie program. Dla ustalenia uwagi, na przykład: |
− | |||
** Sformułuj Centralne Twierdzenie Graniczne. | ** Sformułuj Centralne Twierdzenie Graniczne. | ||
** Wypisz i przedyskutuj definicje prawdopodobieństwa. | ** Wypisz i przedyskutuj definicje prawdopodobieństwa. | ||
Linia 97: | Linia 100: | ||
** Wyprowadź wzór na średnią ''N'' pomiarów <math>x_i</math> o różnych wariancjach <math>\sigma_{i}^2</math> z metody największej wiarygodności. | ** Wyprowadź wzór na średnią ''N'' pomiarów <math>x_i</math> o różnych wariancjach <math>\sigma_{i}^2</math> z metody największej wiarygodności. | ||
** Dany jest zbiór rozłącznych hipotez <math>H_{i}</math> pokrywających całą przestrzeń zdarzeń <math>\Omega</math>: <math>\sum_{i}H_{i}=\Omega</math> oraz prawdopodobieństwa wyniku eksperymentu W w świetle każdej z hipotez <math>H_{i}</math>, czyli <math>P(W\mid H_{i})</math>. Korzystając z tych oznaczeń, wypisz i wyprowadź twierdzenie Bayesa, czyli wzór na prawdopodobieństwo prawdziwości hipotezy <math>H_{j}</math> w świetle wyników eksperymentu W. | ** Dany jest zbiór rozłącznych hipotez <math>H_{i}</math> pokrywających całą przestrzeń zdarzeń <math>\Omega</math>: <math>\sum_{i}H_{i}=\Omega</math> oraz prawdopodobieństwa wyniku eksperymentu W w świetle każdej z hipotez <math>H_{i}</math>, czyli <math>P(W\mid H_{i})</math>. Korzystając z tych oznaczeń, wypisz i wyprowadź twierdzenie Bayesa, czyli wzór na prawdopodobieństwo prawdziwości hipotezy <math>H_{j}</math> w świetle wyników eksperymentu W. | ||
− | + | <!-- * Jeśli będzie egzamin ustny, to będzie obejmował tematy omawiane na wykładzie, jak np. powyższe. | |
+ | * W obu przypadkach na ocenę końcową mogą wpływać również punkty za aktywność na zajęciach.--> | ||
Ocena końcowa z przedmiotu = średnia ocen z ćwiczeń i z wykładu, pod warunkiem zaliczenia ćwiczeń '''i''' wykładu. | Ocena końcowa z przedmiotu = średnia ocen z ćwiczeń i z wykładu, pod warunkiem zaliczenia ćwiczeń '''i''' wykładu. |
Wersja z 22:17, 18 cze 2022
Wnioskowanie statystyczne (wykład)
UWAGA: wymagane zaliczenie Technologii Informacyjnych i Komunikacyjnych z ćwiczeniami z programowania w Pythonie w wymiarze 45 godzin ćwiczeń
Całość podręcznika jest udostępniona na licencji Creative Commons Uznanie autorstwa-Na tych samych zasadach 3.0 Polska.
Autor: Piotr Durka.
zasady zaliczenia przedmiotu
Punktacja ćwiczeń:
- Kartkówki (16 pkt): 4 kartkówki po 4 pkt w trakcie semestru
- zakres: zmienne losowe, przedziały ufności, testowanie hipotez
- Prace domowe/Aktywność (4 pkt)
- Kolokwium (20 pkt)
- data: 30.05.2022, w godz. 9:00 - 12:00
- zakres: zmienne losowe, przedziały ufności, testowanie hipotez
- Projekt (10 pkt)
- kod do napisania i indywidualnej obrony u prowadzącego (kod należy wysłać, a następnie umówić się indywidualnie na obronę do 22.06.2022)
- zakres: chi2
- propozycje zadań zostaną podane w trakcie semestru
- Obecność
- Obecność na ćwiczeniach jest obowiązkowa. Dopuszczalne są dwie nieusprawiedliwione nieobecności.
Zaliczenie ćwiczeń:
- > 50% z 50 pkt łącznie
- Zaliczenie ćwiczeń jest warunkiem koniecznym dopuszczenia do egzaminu z wykładu.
- W przypadku braku uzyskania zaliczenia z ćwiczeń: kolokwium poprawkowe w czerwcu (24.06.2022) lub w sesji jesiennej (x).
- Do kolokwium można podejść również w sytuacji chęci poprawienia oceny z ćwiczeń. Podejście do kolokwium poprawkowego jest równoznaczne z wyzerowaniem punktów z całego semestru.
Zaliczenie wykładu:
- Egzamin pisemny w sali. Tematy do przemyślenia przed egzaminem == przerobiony na wykładzie program. Dla ustalenia uwagi, na przykład:
- Sformułuj Centralne Twierdzenie Graniczne.
- Wypisz i przedyskutuj definicje prawdopodobieństwa.
- Wypisz założenia wersji Centralnego Twierdzenia Granicznego, którą można stosunkowo prosto udowodnić (twierdzenie Lindeberga-Levy'ego). Udowodnij lub spróbuj nakreślić szkic dowodu.
- Oblicz wartość oczekiwaną rozkładu równomiernego, określonego na odcinku [0, 2], danego wzorami p(x) = 0,5 dla [math]0\leq x\leq 2[/math] i p(x) = 0 dla x>2 lub x<0.
- Oblicz wariancję rozkładu równomiernego określonego na odcinku [0, 2], danego wzorami p(x) = 0,5 dla [math]0\leq x\leq 2[/math] i p(x) = 0 dla x>2 lub x<0
- Co to jest [math]\chi^2[/math]?
- Wypisz / wyprowadź wzory na wartość oczekiwaną i wariancję rozkładu Poissona.
- Z rozkładu dwumianowego wylicz prawdopodobieństwo, że wśród czworga dzieci będą co najmniej trzy dziewczynki — zakładając, że prawdopodobieństwa urodzenia dziecka każdej płci są równe.
- Testy parametryczne i nieparametryczne: wady, zalety, przykłady.
- Co ma wspólnego poziom istotności testu z poprawką Bonferroniego?
- Co to jest i jak obliczamy moc testu?
- Opisz w punktach (zwięźle i konkretnie) procedurę weryfikacji hipotezy o różnicy średnich dwóch grup wyników [math]\{x_{i}, i=1\dots N$\}[/math] i [math]\{y_{j}, j=1\dots M\}[/math] metodą repróbkowania (resampling).
- Wyprowadź wzór na średnią N pomiarów [math]x_i[/math] o różnych wariancjach [math]\sigma_{i}^2[/math] z metody największej wiarygodności.
- Dany jest zbiór rozłącznych hipotez [math]H_{i}[/math] pokrywających całą przestrzeń zdarzeń [math]\Omega[/math]: [math]\sum_{i}H_{i}=\Omega[/math] oraz prawdopodobieństwa wyniku eksperymentu W w świetle każdej z hipotez [math]H_{i}[/math], czyli [math]P(W\mid H_{i})[/math]. Korzystając z tych oznaczeń, wypisz i wyprowadź twierdzenie Bayesa, czyli wzór na prawdopodobieństwo prawdziwości hipotezy [math]H_{j}[/math] w świetle wyników eksperymentu W.
Ocena końcowa z przedmiotu = średnia ocen z ćwiczeń i z wykładu, pod warunkiem zaliczenia ćwiczeń i wykładu.