Wnioskowanie Statystyczne - wykład: Różnice pomiędzy wersjami

Z Brain-wiki
(Nie pokazano 95 wersji utworzonych przez 4 użytkowników)
Linia 1: Linia 1:
 
[[Category:Przedmioty specjalizacyjne]]
 
[[Category:Przedmioty specjalizacyjne]]
 +
<!--
 +
https://docs.google.com/document/d/1PHoVNlKhBkOVmkJzgvm7Tu7nF-aXlhWAEXTJbv5qqQY/edit
 +
-->
 +
 +
 
=Wnioskowanie statystyczne (wykład)=
 
=Wnioskowanie statystyczne (wykład)=
  
#  [[WnioskowanieStatystyczne/wstep|Wstęp]]
+
'''UWAGA: wymagane zaliczenie Technologii Informacyjnych i Komunikacyjnych z ćwiczeniami z programowania w Pythonie w wymiarze 45 godzin ćwiczeń'''
#  [[WnioskowanieStatystyczne/Klasyczna_teoria|Teoria klasyczna]]
+
 
## [[WnioskowanieStatystyczne/Prawdopodobienstwo|Prawdopodobieństwo]]
+
<!-- Zajęcia zdalne w roku 2021 odbywają się pod adresem https://kampus.come.uw.edu.pl/course/view.php?id=5295
 +
-->
 +
 
 +
#  
 
## [[WnioskowanieStatystyczne/Rozklady|Rozkłady gęstości prawdopodobieństwa]]
 
## [[WnioskowanieStatystyczne/Rozklady|Rozkłady gęstości prawdopodobieństwa]]
 
## [[WnioskowanieStatystyczne/Momenty|Wariancja, mediana...]]
 
## [[WnioskowanieStatystyczne/Momenty|Wariancja, mediana...]]
##  [[WnioskowanieStatystyczne/Statystyki_i_estymatory|Statystyki i estymatory]]
 
 
## [[WnioskowanieStatystyczne/Rozklady-przyklady|Przykładowe rozkłady]]
 
## [[WnioskowanieStatystyczne/Rozklady-przyklady|Przykładowe rozkłady]]
 +
#
 
## [[WnioskowanieStatystyczne/CLT|Centralne Twierdzenie Graniczne]]
 
## [[WnioskowanieStatystyczne/CLT|Centralne Twierdzenie Graniczne]]
#  [[WnioskowanieStatystyczne/Weryfikacja_hipotez|Weryfikacja hipotez statystycznych]]
+
 +
## [[WnioskowanieStatystyczne/wstep|Wstęp]]
 +
## [[WnioskowanieStatystyczne/Klasyczna_teoria|Teoria klasyczna]]
 +
## [[WnioskowanieStatystyczne/Statystyki_i_estymatory|Statystyki i estymatory]]
 +
#
 +
##  [[WnioskowanieStatystyczne/Weryfikacja_hipotez|Weryfikacja hipotez statystycznych]]  
 
## [[WnioskowanieStatystyczne/Test_t|Test ''t'' Studenta]]
 
## [[WnioskowanieStatystyczne/Test_t|Test ''t'' Studenta]]
 +
#
 
## [[WnioskowanieStatystyczne/Test_chi2|Test <math>\chi^2</math>]]
 
## [[WnioskowanieStatystyczne/Test_chi2|Test <math>\chi^2</math>]]
#  [[WnioskowanieStatystyczne/Z_komputerem|Statystyka z komputerem]]
+
#
 +
##
 +
#
 +
##  [[WnioskowanieStatystyczne/Z_komputerem|Monte Carlo]]
 +
## [[WnioskowanieStatystyczne/Testy_permutacyjne|Testy permutacyjne]]
 
## [[WnioskowanieStatystyczne/Bootstrap|Bootstrap]]
 
## [[WnioskowanieStatystyczne/Bootstrap|Bootstrap]]
## [[WnioskowanieStatystyczne/Testy_permutacyjne|Testy permutacyjne]]
+
#
#  [[WnioskowanieStatystyczne/Testy_nieprametryczne|Testy nieparametryczne]]
+
#
 +
##  [[WnioskowanieStatystyczne/Testy_nieprametryczne|Testy nieparametryczne]]
 
## [[WnioskowanieStatystyczne/Test_serii|Test serii]]
 
## [[WnioskowanieStatystyczne/Test_serii|Test serii]]
 
## [[WnioskowanieStatystyczne/Test_Wilcoxona|Test Wilcoxona-Manna-Whitneya]]
 
## [[WnioskowanieStatystyczne/Test_Wilcoxona|Test Wilcoxona-Manna-Whitneya]]
#  [[WnioskowanieStatystyczne/MLF|Metoda największej wiarygodności]]
+
#
#  [[WnioskowanieStatystyczne/Regresja_liniowa|Regresja liniowa]]
+
##  [[WnioskowanieStatystyczne/MLF|Metoda największej wiarygodności]]
#  [[WnioskowanieStatystyczne/Twierdzenie_Bayesa|Twierdzenie Bayesa]]
+
##  [[WnioskowanieStatystyczne/Regresja_liniowa|Regresja liniowa]]
# [[WnioskowanieStatystyczne/Analiza_wariancji|Analiza wariancji]]
+
#
# [[WnioskowanieStatystyczne/Elementy_statystyki_wielowymiarowej|Elementy statystyki wielowymiarowej]]
+
##  [[WnioskowanieStatystyczne/Interpretacja współczynnika korelacji|Interpretacja współczynnika korelacji]]
 +
## [[WnioskowanieStatystyczne/Analiza_wariancji|Analiza wariancji]]
 +
#
 +
## [[WnioskowanieStatystyczne/Bonferroni|TP/FP, ROC. Problem porównań wielokrotnych — miejskie legendy i przepowiednie]]
 +
#
 +
## [[WnioskowanieStatystyczne/Prawdopodobienstwo|Prawdopodobieństwo]]
 +
## [[WnioskowanieStatystyczne/Twierdzenie_Bayesa|Twierdzenie Bayesa]]
 +
#
 +
## [[WnioskowanieStatystyczne/Elementy_statystyki_wielowymiarowej|Elementy statystyki wielowymiarowej]]
 +
#
 +
## [[Sztuczne sieci neuronowe (ANN )|Sztuczne sieci neuronowe]]
 +
## [[Algorytmy Genetyczne|Algorytmy Genetyczne]]
 +
 
  
 
{{color|green|'''Całość podręcznika jest udostępniona na licencji [http://creativecommons.org/licenses/by-sa/3.0/pl Creative Commons Uznanie autorstwa-Na tych samych zasadach 3.0 Polska].'''}} [[Grafika:CC-88x31.png]]
 
{{color|green|'''Całość podręcznika jest udostępniona na licencji [http://creativecommons.org/licenses/by-sa/3.0/pl Creative Commons Uznanie autorstwa-Na tych samych zasadach 3.0 Polska].'''}} [[Grafika:CC-88x31.png]]
 
Autor: [http://durka.name Piotr Durka].
 
Autor: [http://durka.name Piotr Durka].
 +
 +
 +
[https://drive.google.com/drive/folders/1yPKnOfmO3dEp0SeslNXwSfOoPzQFSanc?usp=sharing slajdy z wykładów]
 +
 +
===zasady zaliczenia przedmiotu===
 +
 +
Punktacja [[Wnioskowanie_Statystyczne_-_ćwiczenia | ćwiczeń]]:
 +
*'''Kartkówki (16 pkt)''': 4 kartkówki po 4 pkt w trakcie semestru
 +
**zakres: zmienne losowe, przedziały ufności, testowanie hipotez
 +
*'''Prace domowe/Aktywność (4 pkt)'''
 +
*'''Kolokwium (20 pkt)'''
 +
**data: '''30.05.2022''', w godz. 9:00 - 12:00
 +
**zakres: zmienne losowe, przedziały ufności, testowanie hipotez
 +
*'''Projekt (10 pkt)'''
 +
**kod do napisania i indywidualnej obrony u prowadzącego (kod należy wysłać, a następnie umówić się indywidualnie na obronę do '''22.06.2022''')
 +
**zakres: chi2
 +
**propozycje zadań zostaną podane w trakcie semestru
 +
*'''Obecność'''
 +
**Obecność na ćwiczeniach jest obowiązkowa. Dopuszczalne są dwie nieusprawiedliwione nieobecności.
 +
 +
Zaliczenie ćwiczeń:
 +
* > 50% z 50 pkt łącznie
 +
* Zaliczenie ćwiczeń jest warunkiem koniecznym dopuszczenia do egzaminu z wykładu.
 +
* W przypadku braku uzyskania zaliczenia z ćwiczeń: '''kolokwium poprawkowe''' w czerwcu ('''24.06.2022''') lub w sesji jesiennej ('''x''').
 +
* Do kolokwium można podejść również w sytuacji chęci poprawienia oceny z ćwiczeń. Podejście do kolokwium poprawkowego jest równoznaczne z '''wyzerowaniem punktów z całego semestru'''.
 +
 +
Zaliczenie wykładu:
 +
* Egzamin pisemny w sali. Tematy do przemyślenia przed egzaminem == przerobiony na wykładzie program. Dla ustalenia uwagi, na przykład:
 +
** Sformułuj Centralne Twierdzenie Graniczne.
 +
** Wypisz i przedyskutuj definicje prawdopodobieństwa.
 +
** Wypisz założenia wersji Centralnego Twierdzenia Granicznego, którą można stosunkowo prosto udowodnić (twierdzenie Lindeberga-Levy'ego). Udowodnij lub spróbuj nakreślić szkic dowodu.
 +
** Oblicz wartość oczekiwaną rozkładu równomiernego, określonego na odcinku [0, 2], danego wzorami  p(''x'') =  0,5 dla <math>0\leq x\leq 2</math> i p(''x'') =  0 dla ''x''>2  lub  ''x''<0.
 +
** Oblicz wariancję rozkładu równomiernego określonego na odcinku [0, 2], danego wzorami  p(''x'') =  0,5 dla <math>0\leq x\leq 2</math> i p(''x'') =  0 dla ''x''>2 lub  ''x''<0
 +
** Co to jest <math>\chi^2</math>?
 +
** Wypisz / wyprowadź wzory na wartość oczekiwaną i wariancję rozkładu Poissona.
 +
** Z rozkładu dwumianowego wylicz prawdopodobieństwo, że wśród czworga dzieci będą co najmniej trzy dziewczynki — zakładając, że prawdopodobieństwa urodzenia dziecka każdej płci są równe.
 +
** Testy parametryczne i nieparametryczne: wady, zalety, przykłady.
 +
** Co ma wspólnego poziom istotności testu z poprawką Bonferroniego?
 +
** Co to jest i jak obliczamy moc testu?
 +
** Opisz w punktach (zwięźle i konkretnie) procedurę weryfikacji hipotezy o różnicy średnich dwóch grup wyników <math>\{x_{i}, i=1\dots N$\}</math> i <math>\{y_{j}, j=1\dots M\}</math> metodą repróbkowania (resampling).
 +
** Wyprowadź wzór na średnią ''N'' pomiarów <math>x_i</math> o różnych wariancjach <math>\sigma_{i}^2</math> z metody największej wiarygodności.
 +
** Dany jest zbiór rozłącznych hipotez <math>H_{i}</math> pokrywających całą przestrzeń zdarzeń <math>\Omega</math>: <math>\sum_{i}H_{i}=\Omega</math> oraz prawdopodobieństwa wyniku eksperymentu W w świetle każdej z hipotez <math>H_{i}</math>, czyli <math>P(W\mid H_{i})</math>. Korzystając z tych oznaczeń, wypisz i wyprowadź twierdzenie Bayesa, czyli wzór na prawdopodobieństwo prawdziwości hipotezy <math>H_{j}</math> w świetle wyników eksperymentu W.
 +
<!-- * Jeśli będzie egzamin ustny, to będzie obejmował tematy omawiane na wykładzie, jak np. powyższe.
 +
* W obu przypadkach na ocenę końcową mogą wpływać również punkty za aktywność na zajęciach.-->
 +
 +
Ocena końcowa z przedmiotu = średnia ocen z ćwiczeń i z wykładu, pod warunkiem zaliczenia ćwiczeń '''i''' wykładu.

Wersja z 22:17, 18 cze 2022


Wnioskowanie statystyczne (wykład)

UWAGA: wymagane zaliczenie Technologii Informacyjnych i Komunikacyjnych z ćwiczeniami z programowania w Pythonie w wymiarze 45 godzin ćwiczeń


    1. Rozkłady gęstości prawdopodobieństwa
    2. Wariancja, mediana...
    3. Przykładowe rozkłady
    1. Centralne Twierdzenie Graniczne
    1. Wstęp
    2. Teoria klasyczna
    3. Statystyki i estymatory
    1. Weryfikacja hipotez statystycznych
    2. Test t Studenta
    1. Test [math]\chi^2[/math]
    1. Monte Carlo
    2. Testy permutacyjne
    3. Bootstrap
    1. Testy nieparametryczne
    2. Test serii
    3. Test Wilcoxona-Manna-Whitneya
    1. Metoda największej wiarygodności
    2. Regresja liniowa
    1. Interpretacja współczynnika korelacji
    2. Analiza wariancji
    1. TP/FP, ROC. Problem porównań wielokrotnych — miejskie legendy i przepowiednie
    1. Prawdopodobieństwo
    2. Twierdzenie Bayesa
    1. Elementy statystyki wielowymiarowej
    1. Sztuczne sieci neuronowe
    2. Algorytmy Genetyczne


Całość podręcznika jest udostępniona na licencji Creative Commons Uznanie autorstwa-Na tych samych zasadach 3.0 Polska. CC-88x31.png Autor: Piotr Durka.


slajdy z wykładów

zasady zaliczenia przedmiotu

Punktacja ćwiczeń:

  • Kartkówki (16 pkt): 4 kartkówki po 4 pkt w trakcie semestru
    • zakres: zmienne losowe, przedziały ufności, testowanie hipotez
  • Prace domowe/Aktywność (4 pkt)
  • Kolokwium (20 pkt)
    • data: 30.05.2022, w godz. 9:00 - 12:00
    • zakres: zmienne losowe, przedziały ufności, testowanie hipotez
  • Projekt (10 pkt)
    • kod do napisania i indywidualnej obrony u prowadzącego (kod należy wysłać, a następnie umówić się indywidualnie na obronę do 22.06.2022)
    • zakres: chi2
    • propozycje zadań zostaną podane w trakcie semestru
  • Obecność
    • Obecność na ćwiczeniach jest obowiązkowa. Dopuszczalne są dwie nieusprawiedliwione nieobecności.

Zaliczenie ćwiczeń:

  • > 50% z 50 pkt łącznie
  • Zaliczenie ćwiczeń jest warunkiem koniecznym dopuszczenia do egzaminu z wykładu.
  • W przypadku braku uzyskania zaliczenia z ćwiczeń: kolokwium poprawkowe w czerwcu (24.06.2022) lub w sesji jesiennej (x).
  • Do kolokwium można podejść również w sytuacji chęci poprawienia oceny z ćwiczeń. Podejście do kolokwium poprawkowego jest równoznaczne z wyzerowaniem punktów z całego semestru.

Zaliczenie wykładu:

  • Egzamin pisemny w sali. Tematy do przemyślenia przed egzaminem == przerobiony na wykładzie program. Dla ustalenia uwagi, na przykład:
    • Sformułuj Centralne Twierdzenie Graniczne.
    • Wypisz i przedyskutuj definicje prawdopodobieństwa.
    • Wypisz założenia wersji Centralnego Twierdzenia Granicznego, którą można stosunkowo prosto udowodnić (twierdzenie Lindeberga-Levy'ego). Udowodnij lub spróbuj nakreślić szkic dowodu.
    • Oblicz wartość oczekiwaną rozkładu równomiernego, określonego na odcinku [0, 2], danego wzorami p(x) = 0,5 dla [math]0\leq x\leq 2[/math] i p(x) = 0 dla x>2 lub x<0.
    • Oblicz wariancję rozkładu równomiernego określonego na odcinku [0, 2], danego wzorami p(x) = 0,5 dla [math]0\leq x\leq 2[/math] i p(x) = 0 dla x>2 lub x<0
    • Co to jest [math]\chi^2[/math]?
    • Wypisz / wyprowadź wzory na wartość oczekiwaną i wariancję rozkładu Poissona.
    • Z rozkładu dwumianowego wylicz prawdopodobieństwo, że wśród czworga dzieci będą co najmniej trzy dziewczynki — zakładając, że prawdopodobieństwa urodzenia dziecka każdej płci są równe.
    • Testy parametryczne i nieparametryczne: wady, zalety, przykłady.
    • Co ma wspólnego poziom istotności testu z poprawką Bonferroniego?
    • Co to jest i jak obliczamy moc testu?
    • Opisz w punktach (zwięźle i konkretnie) procedurę weryfikacji hipotezy o różnicy średnich dwóch grup wyników [math]\{x_{i}, i=1\dots N$\}[/math] i [math]\{y_{j}, j=1\dots M\}[/math] metodą repróbkowania (resampling).
    • Wyprowadź wzór na średnią N pomiarów [math]x_i[/math] o różnych wariancjach [math]\sigma_{i}^2[/math] z metody największej wiarygodności.
    • Dany jest zbiór rozłącznych hipotez [math]H_{i}[/math] pokrywających całą przestrzeń zdarzeń [math]\Omega[/math]: [math]\sum_{i}H_{i}=\Omega[/math] oraz prawdopodobieństwa wyniku eksperymentu W w świetle każdej z hipotez [math]H_{i}[/math], czyli [math]P(W\mid H_{i})[/math]. Korzystając z tych oznaczeń, wypisz i wyprowadź twierdzenie Bayesa, czyli wzór na prawdopodobieństwo prawdziwości hipotezy [math]H_{j}[/math] w świetle wyników eksperymentu W.

Ocena końcowa z przedmiotu = średnia ocen z ćwiczeń i z wykładu, pod warunkiem zaliczenia ćwiczeń i wykładu.