Wnioskowanie Statystyczne - wykład: Różnice pomiędzy wersjami

Z Brain-wiki
(egz)
(Nie pokazano 92 wersji utworzonych przez 4 użytkowników)
Linia 1: Linia 1:
 
[[Category:Przedmioty specjalizacyjne]]
 
[[Category:Przedmioty specjalizacyjne]]
 +
<!--
 +
https://docs.google.com/document/d/1PHoVNlKhBkOVmkJzgvm7Tu7nF-aXlhWAEXTJbv5qqQY/edit
 +
-->
 +
 +
 
=Wnioskowanie statystyczne (wykład)=
 
=Wnioskowanie statystyczne (wykład)=
  
#  [[WnioskowanieStatystyczne/wstep|Wstęp]]
+
'''UWAGA: wymagane zaliczenie Technologii Informacyjnych i Komunikacyjnych z ćwiczeniami z programowania w Pythonie w wymiarze 45 godzin ćwiczeń'''
#  [[WnioskowanieStatystyczne/Klasyczna_teoria|Teoria klasyczna]]
+
 
## [[WnioskowanieStatystyczne/Prawdopodobienstwo|Prawdopodobieństwo]]
+
<!-- Zajęcia zdalne w roku 2021 odbywają się pod adresem https://kampus.come.uw.edu.pl/course/view.php?id=5295
 +
-->
 +
 
 +
#  
 
## [[WnioskowanieStatystyczne/Rozklady|Rozkłady gęstości prawdopodobieństwa]]
 
## [[WnioskowanieStatystyczne/Rozklady|Rozkłady gęstości prawdopodobieństwa]]
 
## [[WnioskowanieStatystyczne/Momenty|Wariancja, mediana...]]
 
## [[WnioskowanieStatystyczne/Momenty|Wariancja, mediana...]]
##  [[WnioskowanieStatystyczne/Statystyki_i_estymatory|Statystyki i estymatory]]
 
 
## [[WnioskowanieStatystyczne/Rozklady-przyklady|Przykładowe rozkłady]]
 
## [[WnioskowanieStatystyczne/Rozklady-przyklady|Przykładowe rozkłady]]
 +
#
 
## [[WnioskowanieStatystyczne/CLT|Centralne Twierdzenie Graniczne]]
 
## [[WnioskowanieStatystyczne/CLT|Centralne Twierdzenie Graniczne]]
#  [[WnioskowanieStatystyczne/Weryfikacja_hipotez|Weryfikacja hipotez statystycznych]]
+
 +
## [[WnioskowanieStatystyczne/wstep|Wstęp]]
 +
## [[WnioskowanieStatystyczne/Klasyczna_teoria|Teoria klasyczna]]
 +
## [[WnioskowanieStatystyczne/Statystyki_i_estymatory|Statystyki i estymatory]]
 +
#
 +
##  [[WnioskowanieStatystyczne/Weryfikacja_hipotez|Weryfikacja hipotez statystycznych]]  
 
## [[WnioskowanieStatystyczne/Test_t|Test ''t'' Studenta]]
 
## [[WnioskowanieStatystyczne/Test_t|Test ''t'' Studenta]]
 +
#
 
## [[WnioskowanieStatystyczne/Test_chi2|Test <math>\chi^2</math>]]
 
## [[WnioskowanieStatystyczne/Test_chi2|Test <math>\chi^2</math>]]
#  [[WnioskowanieStatystyczne/Z_komputerem|Statystyka z komputerem]]
+
#
 +
##
 +
#
 +
##  [[WnioskowanieStatystyczne/Z_komputerem|Monte Carlo]]
 +
## [[WnioskowanieStatystyczne/Testy_permutacyjne|Testy permutacyjne]]
 
## [[WnioskowanieStatystyczne/Bootstrap|Bootstrap]]
 
## [[WnioskowanieStatystyczne/Bootstrap|Bootstrap]]
## [[WnioskowanieStatystyczne/Testy_permutacyjne|Testy permutacyjne]]
+
#
#  [[WnioskowanieStatystyczne/Testy_nieprametryczne|Testy nieparametryczne]]
+
#
 +
##  [[WnioskowanieStatystyczne/Testy_nieprametryczne|Testy nieparametryczne]]
 
## [[WnioskowanieStatystyczne/Test_serii|Test serii]]
 
## [[WnioskowanieStatystyczne/Test_serii|Test serii]]
 
## [[WnioskowanieStatystyczne/Test_Wilcoxona|Test Wilcoxona-Manna-Whitneya]]
 
## [[WnioskowanieStatystyczne/Test_Wilcoxona|Test Wilcoxona-Manna-Whitneya]]
#  [[WnioskowanieStatystyczne/MLF|Metoda największej wiarygodności]]
+
#
 +
##  [[WnioskowanieStatystyczne/MLF|Metoda największej wiarygodności]]
 
##  [[WnioskowanieStatystyczne/Regresja_liniowa|Regresja liniowa]]
 
##  [[WnioskowanieStatystyczne/Regresja_liniowa|Regresja liniowa]]
#  [[WnioskowanieStatystyczne/Analiza_wariancji|Analiza wariancji]]
+
#
# [[WnioskowanieStatystyczne/Twierdzenie_Bayesa|Twierdzenie Bayesa]]
+
#[[WnioskowanieStatystyczne/Interpretacja współczynnika korelacji|Interpretacja współczynnika korelacji]]
# [[WnioskowanieStatystyczne/Elementy_statystyki_wielowymiarowej|Elementy statystyki wielowymiarowej]]
+
## [[WnioskowanieStatystyczne/Analiza_wariancji|Analiza wariancji]]
 +
#
 +
## [[WnioskowanieStatystyczne/Bonferroni|TP/FP, ROC. Problem porównań wielokrotnych — miejskie legendy i przepowiednie]]
 +
#
 +
## [[WnioskowanieStatystyczne/Prawdopodobienstwo|Prawdopodobieństwo]]
 +
## [[WnioskowanieStatystyczne/Twierdzenie_Bayesa|Twierdzenie Bayesa]]
 +
#
 +
## [[WnioskowanieStatystyczne/Elementy_statystyki_wielowymiarowej|Elementy statystyki wielowymiarowej]]
 +
#
 +
## [[Sztuczne sieci neuronowe (ANN )|Sztuczne sieci neuronowe]]
 +
## [[Algorytmy Genetyczne|Algorytmy Genetyczne]]
 +
 
  
 
{{color|green|'''Całość podręcznika jest udostępniona na licencji [http://creativecommons.org/licenses/by-sa/3.0/pl Creative Commons Uznanie autorstwa-Na tych samych zasadach 3.0 Polska].'''}} [[Grafika:CC-88x31.png]]
 
{{color|green|'''Całość podręcznika jest udostępniona na licencji [http://creativecommons.org/licenses/by-sa/3.0/pl Creative Commons Uznanie autorstwa-Na tych samych zasadach 3.0 Polska].'''}} [[Grafika:CC-88x31.png]]
 
Autor: [http://durka.name Piotr Durka].
 
Autor: [http://durka.name Piotr Durka].
  
==wyniki egzaminu w terminie zerowym 2016.06.10 i niekóre punkty z ćwiczeń==
+
 
legenda:
+
[https://drive.google.com/drive/folders/1yPKnOfmO3dEp0SeslNXwSfOoPzQFSanc?usp=sharing slajdy z wykładów]
#kart/10 -- suma punktów z kartkówek (max 10)
+
 
# kol1/10 -- suma punktów z pierwszego kolokwium (max 10)
+
===zasady zaliczenia przedmiotu===
# ust.ćw. -- ustne zal. ćwiczeń (jeśli kartk. < 7/10)
+
 
# test/21 -- wynik części testowej egzaminu (max 21)
+
Punktacja [[Wnioskowanie_Statystyczne_-_ćwiczenia | ćwiczeń]]:
# otw12/4 -- punktacja pytań otwartych I i II (max. 4)
+
*'''Kartkówki (16 pkt)''': 4 kartkówki po 4 pkt w trakcie semestru
+
**zakres: zmienne losowe, przedziały ufności, testowanie hipotez
<pre>indeks kart/10 kol1/10 kol2/10 proj/10 ust.ćw. test/21 otw12/4 otw34/4 %egz0
+
*'''Prace domowe/Aktywność (4 pkt)'''
370517
+
*'''Kolokwium (20 pkt)'''
357725 7 15 -
+
**data: '''30.05.2022''', w godz. 9:00 - 12:00
370469 6 12
+
**zakres: zmienne losowe, przedziały ufności, testowanie hipotez
374722 3 11
+
*'''Projekt (10 pkt)'''
370466
+
**kod do napisania i indywidualnej obrony u prowadzącego (kod należy wysłać, a następnie umówić się indywidualnie na obronę do '''22.06.2022''')
374702
+
**zakres: chi2
372772
+
**propozycje zadań zostaną podane w trakcie semestru
374715 11 4 1.5 57%
+
*'''Obecność'''
370527 14 4 1.5 67%
+
**Obecność na ćwiczeniach jest obowiązkowa. Dopuszczalne są dwie nieusprawiedliwione nieobecności.
370471
+
 
345752 8 15 -
+
Zaliczenie ćwiczeń:
374723 1 nb
+
* > 50% z 50 pkt łącznie
370530 14 4 4 76%
+
* Zaliczenie ćwiczeń jest warunkiem koniecznym dopuszczenia do egzaminu z wykładu.
360731
+
* W przypadku braku uzyskania zaliczenia z ćwiczeń: '''kolokwium poprawkowe''' w czerwcu ('''24.06.2022''') lub w sesji jesiennej ('''x''').
374758
+
* Do kolokwium można podejść również w sytuacji chęci poprawienia oceny z ćwiczeń. Podejście do kolokwium poprawkowego jest równoznaczne z '''wyzerowaniem punktów z całego semestru'''.
374226
+
 
370449 18 4 3 86%
+
Zaliczenie wykładu:
380926
+
* Egzamin pisemny w sali. Tematy do przemyślenia przed egzaminem == przerobiony na wykładzie program. Dla ustalenia uwagi, na przykład:
374764
+
** Sformułuj Centralne Twierdzenie Graniczne.
374714
+
** Wypisz i przedyskutuj definicje prawdopodobieństwa.
380966 6 8
+
** Wypisz założenia wersji Centralnego Twierdzenia Granicznego, którą można stosunkowo prosto udowodnić (twierdzenie Lindeberga-Levy'ego). Udowodnij lub spróbuj nakreślić szkic dowodu.
359079 3 12 tak
+
** Oblicz wartość oczekiwaną rozkładu równomiernego, określonego na odcinku [0, 2], danego wzorami  p(''x'') =  0,5 dla <math>0\leq x\leq 2</math> i p(''x'') =  0 dla ''x''>2  lub  ''x''<0.
315748
+
** Oblicz wariancję rozkładu równomiernego określonego na odcinku [0, 2], danego wzorami  p(''x'') =  0,5 dla <math>0\leq x\leq 2</math> i p(''x'') =  0 dla ''x''>2 lub  ''x''<0
374761 4 12
+
** Co to jest <math>\chi^2</math>?
378738 6 8
+
** Wypisz / wyprowadź wzory na wartość oczekiwaną i wariancję rozkładu Poissona.
370486 16 4 5 86%
+
** Z rozkładu dwumianowego wylicz prawdopodobieństwo, że wśród czworga dzieci będą co najmniej trzy dziewczynki — zakładając, że prawdopodobieństwa urodzenia dziecka każdej płci są równe.
380972
+
** Testy parametryczne i nieparametryczne: wady, zalety, przykłady.
372777
+
** Co ma wspólnego poziom istotności testu z poprawką Bonferroniego?
370539
+
** Co to jest i jak obliczamy moc testu?
306921
+
** Opisz w punktach (zwięźle i konkretnie) procedurę weryfikacji hipotezy o różnicy średnich dwóch grup wyników <math>\{x_{i}, i=1\dots N$\}</math> i <math>\{y_{j}, j=1\dots M\}</math> metodą repróbkowania (resampling).
370543 2 14 14 4 0 62%
+
** Wyprowadź wzór na średnią ''N'' pomiarów <math>x_i</math> o różnych wariancjach <math>\sigma_{i}^2</math> z metody największej wiarygodności.
374710
+
** Dany jest zbiór rozłącznych hipotez <math>H_{i}</math> pokrywających całą przestrzeń zdarzeń <math>\Omega</math>: <math>\sum_{i}H_{i}=\Omega</math> oraz prawdopodobieństwa wyniku eksperymentu W w świetle każdej z hipotez <math>H_{i}</math>, czyli <math>P(W\mid H_{i})</math>. Korzystając z tych oznaczeń, wypisz i wyprowadź twierdzenie Bayesa, czyli wzór na prawdopodobieństwo prawdziwości hipotezy <math>H_{j}</math> w świetle wyników eksperymentu W.
374762 nb nb
+
<!-- * Jeśli będzie egzamin ustny, to będzie obejmował tematy omawiane na wykładzie, jak np. powyższe.
372776
+
* W obu przypadkach na ocenę końcową mogą wpływać również punkty za aktywność na zajęciach.-->
372860 5 12
+
 
370618 8 14 -
+
Ocena końcowa z przedmiotu = średnia ocen z ćwiczeń i z wykładu, pod warunkiem zaliczenia ćwiczeń '''i''' wykładu.
372771 6 8
 
372768 5 8
 
335315 4 14
 
380959
 
370490 8 12 - 19 4 3 90%
 
373218 6 12 17 4 5 90%
 
305957
 
370420
 
335598
 
370493 7 15 - 19 4 4.5 95%
 
370467 9 14 - 20 4 4.5 98%
 
380960 5 12
 
374763 3 6
 
370496
 
374711 5 13 16 4 4 83%
 
372766 6 10
 
</pre>
 

Wersja z 22:17, 18 cze 2022


Wnioskowanie statystyczne (wykład)

UWAGA: wymagane zaliczenie Technologii Informacyjnych i Komunikacyjnych z ćwiczeniami z programowania w Pythonie w wymiarze 45 godzin ćwiczeń


    1. Rozkłady gęstości prawdopodobieństwa
    2. Wariancja, mediana...
    3. Przykładowe rozkłady
    1. Centralne Twierdzenie Graniczne
    1. Wstęp
    2. Teoria klasyczna
    3. Statystyki i estymatory
    1. Weryfikacja hipotez statystycznych
    2. Test t Studenta
    1. Test [math]\chi^2[/math]
    1. Monte Carlo
    2. Testy permutacyjne
    3. Bootstrap
    1. Testy nieparametryczne
    2. Test serii
    3. Test Wilcoxona-Manna-Whitneya
    1. Metoda największej wiarygodności
    2. Regresja liniowa
    1. Interpretacja współczynnika korelacji
    2. Analiza wariancji
    1. TP/FP, ROC. Problem porównań wielokrotnych — miejskie legendy i przepowiednie
    1. Prawdopodobieństwo
    2. Twierdzenie Bayesa
    1. Elementy statystyki wielowymiarowej
    1. Sztuczne sieci neuronowe
    2. Algorytmy Genetyczne


Całość podręcznika jest udostępniona na licencji Creative Commons Uznanie autorstwa-Na tych samych zasadach 3.0 Polska. CC-88x31.png Autor: Piotr Durka.


slajdy z wykładów

zasady zaliczenia przedmiotu

Punktacja ćwiczeń:

  • Kartkówki (16 pkt): 4 kartkówki po 4 pkt w trakcie semestru
    • zakres: zmienne losowe, przedziały ufności, testowanie hipotez
  • Prace domowe/Aktywność (4 pkt)
  • Kolokwium (20 pkt)
    • data: 30.05.2022, w godz. 9:00 - 12:00
    • zakres: zmienne losowe, przedziały ufności, testowanie hipotez
  • Projekt (10 pkt)
    • kod do napisania i indywidualnej obrony u prowadzącego (kod należy wysłać, a następnie umówić się indywidualnie na obronę do 22.06.2022)
    • zakres: chi2
    • propozycje zadań zostaną podane w trakcie semestru
  • Obecność
    • Obecność na ćwiczeniach jest obowiązkowa. Dopuszczalne są dwie nieusprawiedliwione nieobecności.

Zaliczenie ćwiczeń:

  • > 50% z 50 pkt łącznie
  • Zaliczenie ćwiczeń jest warunkiem koniecznym dopuszczenia do egzaminu z wykładu.
  • W przypadku braku uzyskania zaliczenia z ćwiczeń: kolokwium poprawkowe w czerwcu (24.06.2022) lub w sesji jesiennej (x).
  • Do kolokwium można podejść również w sytuacji chęci poprawienia oceny z ćwiczeń. Podejście do kolokwium poprawkowego jest równoznaczne z wyzerowaniem punktów z całego semestru.

Zaliczenie wykładu:

  • Egzamin pisemny w sali. Tematy do przemyślenia przed egzaminem == przerobiony na wykładzie program. Dla ustalenia uwagi, na przykład:
    • Sformułuj Centralne Twierdzenie Graniczne.
    • Wypisz i przedyskutuj definicje prawdopodobieństwa.
    • Wypisz założenia wersji Centralnego Twierdzenia Granicznego, którą można stosunkowo prosto udowodnić (twierdzenie Lindeberga-Levy'ego). Udowodnij lub spróbuj nakreślić szkic dowodu.
    • Oblicz wartość oczekiwaną rozkładu równomiernego, określonego na odcinku [0, 2], danego wzorami p(x) = 0,5 dla [math]0\leq x\leq 2[/math] i p(x) = 0 dla x>2 lub x<0.
    • Oblicz wariancję rozkładu równomiernego określonego na odcinku [0, 2], danego wzorami p(x) = 0,5 dla [math]0\leq x\leq 2[/math] i p(x) = 0 dla x>2 lub x<0
    • Co to jest [math]\chi^2[/math]?
    • Wypisz / wyprowadź wzory na wartość oczekiwaną i wariancję rozkładu Poissona.
    • Z rozkładu dwumianowego wylicz prawdopodobieństwo, że wśród czworga dzieci będą co najmniej trzy dziewczynki — zakładając, że prawdopodobieństwa urodzenia dziecka każdej płci są równe.
    • Testy parametryczne i nieparametryczne: wady, zalety, przykłady.
    • Co ma wspólnego poziom istotności testu z poprawką Bonferroniego?
    • Co to jest i jak obliczamy moc testu?
    • Opisz w punktach (zwięźle i konkretnie) procedurę weryfikacji hipotezy o różnicy średnich dwóch grup wyników [math]\{x_{i}, i=1\dots N$\}[/math] i [math]\{y_{j}, j=1\dots M\}[/math] metodą repróbkowania (resampling).
    • Wyprowadź wzór na średnią N pomiarów [math]x_i[/math] o różnych wariancjach [math]\sigma_{i}^2[/math] z metody największej wiarygodności.
    • Dany jest zbiór rozłącznych hipotez [math]H_{i}[/math] pokrywających całą przestrzeń zdarzeń [math]\Omega[/math]: [math]\sum_{i}H_{i}=\Omega[/math] oraz prawdopodobieństwa wyniku eksperymentu W w świetle każdej z hipotez [math]H_{i}[/math], czyli [math]P(W\mid H_{i})[/math]. Korzystając z tych oznaczeń, wypisz i wyprowadź twierdzenie Bayesa, czyli wzór na prawdopodobieństwo prawdziwości hipotezy [math]H_{j}[/math] w świetle wyników eksperymentu W.

Ocena końcowa z przedmiotu = średnia ocen z ćwiczeń i z wykładu, pod warunkiem zaliczenia ćwiczeń i wykładu.