Wnioskowanie Statystyczne - wykład: Różnice pomiędzy wersjami

Z Brain-wiki
(Nie pokazano 8 wersji utworzonych przez 2 użytkowników)
Linia 9: Linia 9:
 
'''UWAGA: wymagane zaliczenie Technologii Informacyjnych i Komunikacyjnych z ćwiczeniami z programowania w Pythonie w wymiarze 45 godzin ćwiczeń'''
 
'''UWAGA: wymagane zaliczenie Technologii Informacyjnych i Komunikacyjnych z ćwiczeniami z programowania w Pythonie w wymiarze 45 godzin ćwiczeń'''
  
Zajęcia zdalne w roku 2021 odbywają się pod adresem https://kampus.come.uw.edu.pl/course/view.php?id=5295
+
<!-- Zajęcia zdalne w roku 2021 odbywają się pod adresem https://kampus.come.uw.edu.pl/course/view.php?id=5295
 +
-->
  
 
#  
 
#  
Linia 44: Linia 45:
 
## [[WnioskowanieStatystyczne/Analiza_wariancji|Analiza wariancji]]
 
## [[WnioskowanieStatystyczne/Analiza_wariancji|Analiza wariancji]]
 
#
 
#
## [[WnioskowanieStatystyczne/Bonferroni|Problem porównań wielokrotnych -- miejskie legendy i przepowiednie]]
+
## [[WnioskowanieStatystyczne/Bonferroni|TP/FP, ROC. Problem porównań wielokrotnych miejskie legendy i przepowiednie]]
 
#
 
#
 +
## [[WnioskowanieStatystyczne/Prawdopodobienstwo|Prawdopodobieństwo]]
 
## [[WnioskowanieStatystyczne/Twierdzenie_Bayesa|Twierdzenie Bayesa]]
 
## [[WnioskowanieStatystyczne/Twierdzenie_Bayesa|Twierdzenie Bayesa]]
## [[WnioskowanieStatystyczne/Prawdopodobienstwo|Prawdopodobieństwo]]
 
 
#
 
#
 
## [[WnioskowanieStatystyczne/Elementy_statystyki_wielowymiarowej|Elementy statystyki wielowymiarowej]]
 
## [[WnioskowanieStatystyczne/Elementy_statystyki_wielowymiarowej|Elementy statystyki wielowymiarowej]]
Linia 64: Linia 65:
  
 
Punktacja [[Wnioskowanie_Statystyczne_-_ćwiczenia | ćwiczeń]]:
 
Punktacja [[Wnioskowanie_Statystyczne_-_ćwiczenia | ćwiczeń]]:
*'''Kartkówki (20 pkt)''': 4 kartkówki po 5 pkt w trakcie semestru
+
*'''Kartkówki (16 pkt)''': 4 kartkówki po 4 pkt w trakcie semestru
 
**zakres: zmienne losowe, przedziały ufności, testowanie hipotez
 
**zakres: zmienne losowe, przedziały ufności, testowanie hipotez
 +
*'''Prace domowe/Aktywność (4 pkt)'''
 
*'''Kolokwium (20 pkt)'''
 
*'''Kolokwium (20 pkt)'''
**data: '''17.05.2021''', w godz. 9:00 - 12:00
+
**data: '''30.05.2022''', w godz. 9:00 - 12:00
 
**zakres: zmienne losowe, przedziały ufności, testowanie hipotez
 
**zakres: zmienne losowe, przedziały ufności, testowanie hipotez
 
*'''Projekt (10 pkt)'''
 
*'''Projekt (10 pkt)'''
**kod do napisania i indywidualnej obrony u prowadzącego (kod należy wysłać, a następnie umówić się indywidualnie na obronę do '''22.06.2021''')
+
**kod do napisania i indywidualnej obrony u prowadzącego (kod należy wysłać, a następnie umówić się indywidualnie na obronę do '''22.06.2022''')
 
**zakres: chi2
 
**zakres: chi2
 
**propozycje zadań zostaną podane w trakcie semestru
 
**propozycje zadań zostaną podane w trakcie semestru
Linia 77: Linia 79:
  
 
Zaliczenie ćwiczeń:
 
Zaliczenie ćwiczeń:
* Minimum 25 pkt łącznie
+
* > 50% z 50 pkt łącznie
 
* Zaliczenie ćwiczeń jest warunkiem koniecznym dopuszczenia do egzaminu z wykładu.
 
* Zaliczenie ćwiczeń jest warunkiem koniecznym dopuszczenia do egzaminu z wykładu.
* W przypadku braku uzyskania zaliczenia z ćwiczeń: '''kolokwium poprawkowe''' w czerwcu ('''23.06.2021''') lub w sesji jesiennej ('''07.09.2021''').
+
* W przypadku braku uzyskania zaliczenia z ćwiczeń: '''kolokwium poprawkowe''' w czerwcu ('''24.06.2022''') lub w sesji jesiennej ('''x''').
* Do kolokwium można podejść również w sytuacji chęci poprawienia oceny z ćwiczeń. Podejście do kolokwium poprawkowego jest równoznaczne z wyzerowaniem punktów z całego semestru.
+
* Do kolokwium można podejść również w sytuacji chęci poprawienia oceny z ćwiczeń. Podejście do kolokwium poprawkowego jest równoznaczne z '''wyzerowaniem punktów z całego semestru'''.
  
 
Zaliczenie wykładu:
 
Zaliczenie wykładu:
Egzamin pisemny i ustny — szczegóły w zależności od stanu pandemii. Tematy do przemyślenia przed egzaminem == przerobony program. Dla ustalenia uwagi, na przykład:
+
* Egzamin pisemny w sali. Tematy do przemyślenia przed egzaminem == przerobiony na wykładzie program. Dla ustalenia uwagi, na przykład:
 
** Sformułuj Centralne Twierdzenie Graniczne.  
 
** Sformułuj Centralne Twierdzenie Graniczne.  
 
** Wypisz i przedyskutuj definicje prawdopodobieństwa.
 
** Wypisz i przedyskutuj definicje prawdopodobieństwa.
Linia 98: Linia 100:
 
** Wyprowadź wzór na średnią ''N'' pomiarów <math>x_i</math> o różnych wariancjach <math>\sigma_{i}^2</math> z metody największej wiarygodności.
 
** Wyprowadź wzór na średnią ''N'' pomiarów <math>x_i</math> o różnych wariancjach <math>\sigma_{i}^2</math> z metody największej wiarygodności.
 
** Dany jest zbiór rozłącznych hipotez <math>H_{i}</math> pokrywających całą przestrzeń zdarzeń <math>\Omega</math>: <math>\sum_{i}H_{i}=\Omega</math> oraz prawdopodobieństwa wyniku eksperymentu W w świetle każdej z hipotez <math>H_{i}</math>, czyli <math>P(W\mid H_{i})</math>. Korzystając z tych oznaczeń, wypisz i wyprowadź twierdzenie Bayesa, czyli wzór na prawdopodobieństwo prawdziwości hipotezy <math>H_{j}</math> w świetle wyników eksperymentu W.
 
** Dany jest zbiór rozłącznych hipotez <math>H_{i}</math> pokrywających całą przestrzeń zdarzeń <math>\Omega</math>: <math>\sum_{i}H_{i}=\Omega</math> oraz prawdopodobieństwa wyniku eksperymentu W w świetle każdej z hipotez <math>H_{i}</math>, czyli <math>P(W\mid H_{i})</math>. Korzystając z tych oznaczeń, wypisz i wyprowadź twierdzenie Bayesa, czyli wzór na prawdopodobieństwo prawdziwości hipotezy <math>H_{j}</math> w świetle wyników eksperymentu W.
* Jeśli będzie egzamin ustny, to będzie obejmował tematy omawiane na wykładzie, jak np. powyższe.
+
<!-- * Jeśli będzie egzamin ustny, to będzie obejmował tematy omawiane na wykładzie, jak np. powyższe.
* W obu przypadkach na ocenę końcową mogą wpływać również punkty za aktywność na zajęciach.
+
* W obu przypadkach na ocenę końcową mogą wpływać również punkty za aktywność na zajęciach.-->
 
 
W ocenie końcowej będą brane pod uwagę aktywność na zajęciach oraz prace domowe, dostępne na platformie Kampus.
 
  
 
Ocena końcowa z przedmiotu = średnia ocen z ćwiczeń i z wykładu, pod warunkiem zaliczenia ćwiczeń '''i''' wykładu.
 
Ocena końcowa z przedmiotu = średnia ocen z ćwiczeń i z wykładu, pod warunkiem zaliczenia ćwiczeń '''i''' wykładu.

Wersja z 22:17, 18 cze 2022


Wnioskowanie statystyczne (wykład)

UWAGA: wymagane zaliczenie Technologii Informacyjnych i Komunikacyjnych z ćwiczeniami z programowania w Pythonie w wymiarze 45 godzin ćwiczeń


    1. Rozkłady gęstości prawdopodobieństwa
    2. Wariancja, mediana...
    3. Przykładowe rozkłady
    1. Centralne Twierdzenie Graniczne
    1. Wstęp
    2. Teoria klasyczna
    3. Statystyki i estymatory
    1. Weryfikacja hipotez statystycznych
    2. Test t Studenta
    1. Test [math]\chi^2[/math]
    1. Monte Carlo
    2. Testy permutacyjne
    3. Bootstrap
    1. Testy nieparametryczne
    2. Test serii
    3. Test Wilcoxona-Manna-Whitneya
    1. Metoda największej wiarygodności
    2. Regresja liniowa
    1. Interpretacja współczynnika korelacji
    2. Analiza wariancji
    1. TP/FP, ROC. Problem porównań wielokrotnych — miejskie legendy i przepowiednie
    1. Prawdopodobieństwo
    2. Twierdzenie Bayesa
    1. Elementy statystyki wielowymiarowej
    1. Sztuczne sieci neuronowe
    2. Algorytmy Genetyczne


Całość podręcznika jest udostępniona na licencji Creative Commons Uznanie autorstwa-Na tych samych zasadach 3.0 Polska. CC-88x31.png Autor: Piotr Durka.


slajdy z wykładów

zasady zaliczenia przedmiotu

Punktacja ćwiczeń:

  • Kartkówki (16 pkt): 4 kartkówki po 4 pkt w trakcie semestru
    • zakres: zmienne losowe, przedziały ufności, testowanie hipotez
  • Prace domowe/Aktywność (4 pkt)
  • Kolokwium (20 pkt)
    • data: 30.05.2022, w godz. 9:00 - 12:00
    • zakres: zmienne losowe, przedziały ufności, testowanie hipotez
  • Projekt (10 pkt)
    • kod do napisania i indywidualnej obrony u prowadzącego (kod należy wysłać, a następnie umówić się indywidualnie na obronę do 22.06.2022)
    • zakres: chi2
    • propozycje zadań zostaną podane w trakcie semestru
  • Obecność
    • Obecność na ćwiczeniach jest obowiązkowa. Dopuszczalne są dwie nieusprawiedliwione nieobecności.

Zaliczenie ćwiczeń:

  • > 50% z 50 pkt łącznie
  • Zaliczenie ćwiczeń jest warunkiem koniecznym dopuszczenia do egzaminu z wykładu.
  • W przypadku braku uzyskania zaliczenia z ćwiczeń: kolokwium poprawkowe w czerwcu (24.06.2022) lub w sesji jesiennej (x).
  • Do kolokwium można podejść również w sytuacji chęci poprawienia oceny z ćwiczeń. Podejście do kolokwium poprawkowego jest równoznaczne z wyzerowaniem punktów z całego semestru.

Zaliczenie wykładu:

  • Egzamin pisemny w sali. Tematy do przemyślenia przed egzaminem == przerobiony na wykładzie program. Dla ustalenia uwagi, na przykład:
    • Sformułuj Centralne Twierdzenie Graniczne.
    • Wypisz i przedyskutuj definicje prawdopodobieństwa.
    • Wypisz założenia wersji Centralnego Twierdzenia Granicznego, którą można stosunkowo prosto udowodnić (twierdzenie Lindeberga-Levy'ego). Udowodnij lub spróbuj nakreślić szkic dowodu.
    • Oblicz wartość oczekiwaną rozkładu równomiernego, określonego na odcinku [0, 2], danego wzorami p(x) = 0,5 dla [math]0\leq x\leq 2[/math] i p(x) = 0 dla x>2 lub x<0.
    • Oblicz wariancję rozkładu równomiernego określonego na odcinku [0, 2], danego wzorami p(x) = 0,5 dla [math]0\leq x\leq 2[/math] i p(x) = 0 dla x>2 lub x<0
    • Co to jest [math]\chi^2[/math]?
    • Wypisz / wyprowadź wzory na wartość oczekiwaną i wariancję rozkładu Poissona.
    • Z rozkładu dwumianowego wylicz prawdopodobieństwo, że wśród czworga dzieci będą co najmniej trzy dziewczynki — zakładając, że prawdopodobieństwa urodzenia dziecka każdej płci są równe.
    • Testy parametryczne i nieparametryczne: wady, zalety, przykłady.
    • Co ma wspólnego poziom istotności testu z poprawką Bonferroniego?
    • Co to jest i jak obliczamy moc testu?
    • Opisz w punktach (zwięźle i konkretnie) procedurę weryfikacji hipotezy o różnicy średnich dwóch grup wyników [math]\{x_{i}, i=1\dots N$\}[/math] i [math]\{y_{j}, j=1\dots M\}[/math] metodą repróbkowania (resampling).
    • Wyprowadź wzór na średnią N pomiarów [math]x_i[/math] o różnych wariancjach [math]\sigma_{i}^2[/math] z metody największej wiarygodności.
    • Dany jest zbiór rozłącznych hipotez [math]H_{i}[/math] pokrywających całą przestrzeń zdarzeń [math]\Omega[/math]: [math]\sum_{i}H_{i}=\Omega[/math] oraz prawdopodobieństwa wyniku eksperymentu W w świetle każdej z hipotez [math]H_{i}[/math], czyli [math]P(W\mid H_{i})[/math]. Korzystając z tych oznaczeń, wypisz i wyprowadź twierdzenie Bayesa, czyli wzór na prawdopodobieństwo prawdziwości hipotezy [math]H_{j}[/math] w świetle wyników eksperymentu W.

Ocena końcowa z przedmiotu = średnia ocen z ćwiczeń i z wykładu, pod warunkiem zaliczenia ćwiczeń i wykładu.