Wnioskowanie Statystyczne - wykład: Różnice pomiędzy wersjami

Z Brain-wiki
 
(Nie pokazano 76 wersji utworzonych przez 3 użytkowników)
Linia 1: Linia 1:
 
[[Category:Przedmioty specjalizacyjne]]
 
[[Category:Przedmioty specjalizacyjne]]
<!--
+
<!-- program ćwiczeń:
https://docs.google.com/document/d/1PHoVNlKhBkOVmkJzgvm7Tu7nF-aXlhWAEXTJbv5qqQY/edit
+
https://docs.google.com/document/d/1PHoVNlKhBkOVmkJzgvm7Tu7nF-aXlhWAEXTJbv5qqQY/edit -->
-->
 
 
 
 
 
 
=Wnioskowanie statystyczne (wykład)=
 
=Wnioskowanie statystyczne (wykład)=
 
+
'''UWAGA: wymagane zaliczenie Technologii Informacyjnych i Komunikacyjnych z ćwiczeniami z programowania w Pythonie w wymiarze 45 godzin ćwiczeń'''
 
#  
 
#  
 
## [[WnioskowanieStatystyczne/Rozklady|Rozkłady gęstości prawdopodobieństwa]]
 
## [[WnioskowanieStatystyczne/Rozklady|Rozkłady gęstości prawdopodobieństwa]]
Linia 16: Linia 13:
 
## [[WnioskowanieStatystyczne/wstep|Wstęp]]
 
## [[WnioskowanieStatystyczne/wstep|Wstęp]]
 
## [[WnioskowanieStatystyczne/Klasyczna_teoria|Teoria klasyczna]]
 
## [[WnioskowanieStatystyczne/Klasyczna_teoria|Teoria klasyczna]]
## [[WnioskowanieStatystyczne/Statystyki_i_estymatory|Statystyki i estymatory]]
+
## [[WnioskowanieStatystyczne/Statystyki_i_estymatory|Statystyki i estymatory]]
 
#
 
#
 
##  [[WnioskowanieStatystyczne/Weryfikacja_hipotez|Weryfikacja hipotez statystycznych]]  
 
##  [[WnioskowanieStatystyczne/Weryfikacja_hipotez|Weryfikacja hipotez statystycznych]]  
#
 
 
## [[WnioskowanieStatystyczne/Test_t|Test ''t'' Studenta]]
 
## [[WnioskowanieStatystyczne/Test_t|Test ''t'' Studenta]]
 
#
 
#
 
## [[WnioskowanieStatystyczne/Test_chi2|Test <math>\chi^2</math>]]
 
## [[WnioskowanieStatystyczne/Test_chi2|Test <math>\chi^2</math>]]
 +
#
 
##  [[WnioskowanieStatystyczne/Z_komputerem|Monte Carlo]]
 
##  [[WnioskowanieStatystyczne/Z_komputerem|Monte Carlo]]
 +
## [[WnioskowanieStatystyczne/Testy_permutacyjne|Testy permutacyjne]]
 +
## [[WnioskowanieStatystyczne/Bootstrap|Bootstrap]]
 +
#
 
#
 
#
 
##  [[WnioskowanieStatystyczne/Testy_nieprametryczne|Testy nieparametryczne]]
 
##  [[WnioskowanieStatystyczne/Testy_nieprametryczne|Testy nieparametryczne]]
 
## [[WnioskowanieStatystyczne/Test_serii|Test serii]]
 
## [[WnioskowanieStatystyczne/Test_serii|Test serii]]
 
## [[WnioskowanieStatystyczne/Test_Wilcoxona|Test Wilcoxona-Manna-Whitneya]]
 
## [[WnioskowanieStatystyczne/Test_Wilcoxona|Test Wilcoxona-Manna-Whitneya]]
#
 
## [[WnioskowanieStatystyczne/Testy_permutacyjne|Testy permutacyjne]]
 
## [[WnioskowanieStatystyczne/Bootstrap|Bootstrap]]
 
 
#
 
#
 
##  [[WnioskowanieStatystyczne/MLF|Metoda największej wiarygodności]]
 
##  [[WnioskowanieStatystyczne/MLF|Metoda największej wiarygodności]]
 
##  [[WnioskowanieStatystyczne/Regresja_liniowa|Regresja liniowa]]
 
##  [[WnioskowanieStatystyczne/Regresja_liniowa|Regresja liniowa]]
 
#
 
#
## [[WnioskowanieStatystyczne/Bonferroni|Problem porównań wielokrotnych  -- miejskie legendy i przepowiednie]]
+
## [[WnioskowanieStatystyczne/Interpretacja współczynnika korelacji|Interpretacja współczynnika korelacji]]
#
 
 
## [[WnioskowanieStatystyczne/Analiza_wariancji|Analiza wariancji]]
 
## [[WnioskowanieStatystyczne/Analiza_wariancji|Analiza wariancji]]
 
#
 
#
## [[WnioskowanieStatystyczne/Twierdzenie_Bayesa|Twierdzenie Bayesa]]
+
## [[WnioskowanieStatystyczne/ROC|TP, FP, ROC]]
## [[WnioskowanieStatystyczne/Prawdopodobienstwo|Prawdopodobieństwo]]
 
 
#
 
#
## [[WnioskowanieStatystyczne/Elementy_statystyki_wielowymiarowej|Elementy statystyki wielowymiarowej]]
+
## [[WnioskowanieStatystyczne/Bonferroni|Problem porównań wielokrotnych — miejskie legendy i przepowiednie]]
 
#
 
#
## [[Sztuczne sieci neuronowe (ANN )|Sztuczne sieci neuronowe]]
+
## [[WnioskowanieStatystyczne/Prawdopodobienstwo|Prawdopodobieństwo]]
 +
## [[WnioskowanieStatystyczne/Twierdzenie_Bayesa|Twierdzenie Bayesa]]
 +
## [[WnioskowanieStatystyczne/Effect_size|Wielkość efektu]]
 +
#
 +
## [[WnioskowanieStatystyczne/Elementy_statystyki_wielowymiarowej|PCA, MANOVA, analiza skupień]]
 +
## [[Sztuczne sieci neuronowe (ANN )|LDA, LR, ANN]]
 
## [[Algorytmy Genetyczne|Algorytmy Genetyczne]]
 
## [[Algorytmy Genetyczne|Algorytmy Genetyczne]]
 +
# Maris, E., Oostenveld, R. (2007). [https://www.researchgate.net/publication/6316066_Nonparametric_statistical_testing_of_EEG-_and_MEG-data Nonparametric statistical testing of EEG- and MEG-data]. Journal of Neuroscience Methods, 164(1), 177–190.
  
  
{{color|green|'''Całość podręcznika jest udostępniona na licencji [http://creativecommons.org/licenses/by-sa/3.0/pl Creative Commons Uznanie autorstwa-Na tych samych zasadach 3.0 Polska].'''}} [[Grafika:CC-88x31.png]]
+
----
Autor: [http://durka.name Piotr Durka].
 
  
===zasady zaliczenia przedmiotu===
+
{{color|green|'''Całość podręcznika jest udostępniona na licencji [http://creativecommons.org/licenses/by-sa/3.0/pl Creative Commons Uznanie autorstwa-Na tych samych zasadach 3.0 Polska].'''}} [[Grafika:CC-88x31.png]]
 +
Na podstawie książki [https://www.fuw.edu.pl/~durka/ksiazki/statystyka/index.html Wstęp do współczesnej statystyki]. Autor: [http://durka.name Piotr Durka].
  
Punktacja [[Wnioskowanie_Statystyczne_-_ćwiczenia | ćwiczeń]]:
+
----
* 10 wejściówek (po 1 pkt) na początku zajęć
 
** materiał obejmuje zagadnienia z poprzednich wykładów i ćwiczeń, wybrane pod kątem najbliższych ćwiczeń
 
** polecenia będą obejmować przykładowo naszkicowanie zadanego rozkładu, podania definicji, przeprowadzenia prostego rachunku czy zaproponowania fragmentu kodu
 
* 2 kolokwia (po 14 pkt), poniedziałki rano
 
** 24.04.17 - zmienne losowe i przedziały ufności
 
** 05.06.17 - testowanie hipotez i regresja liniowa
 
** możliwość korzystania z własnych notatek i programów
 
* 2 projekty (po 6 pkt)
 
** do oddania odpowiednio do 10.04.17 i 29.05.17
 
** propozycje projektów zostaną podane w trakcie semestru:
 
*** [http://fuw.edu.pl/~mpietrzak/wnioskowanie/e3rdtf5guimo2017/projekt_WS_1-2017.pdf Projekt nr 1-2017]
 
*** [http://fuw.edu.pl/~mpietrzak/wnioskowanie/e3rdtf5guimo2017/projekt_WS_2-2017.pdf Projekt nr 2-2017]
 
  
Zaliczenie ćwiczeń:
+
*[https://drive.google.com/drive/folders/1yPKnOfmO3dEp0SeslNXwSfOoPzQFSanc?usp=sharing slajdy z wykładów]
* Minimum 25 pkt łącznie
+
* [https://drive.google.com/drive/folders/17gUnDAzVKY1CRQ4ExTqsjwYgXTJ-eWnq zapisy wideo zajęć zdalnych w 2021]
* W tym min. 7 pkt z wejściówek
+
* książka [https://www.deeplearningbook.org "Deep Learning"] Ian Goodfellow, Yoshua Bengio and Aaron Courville
Zaliczenie ćwiczeń jest warunkiem koniecznym dopuszczenia do egzaminu pisemnego (z wykładu). Możliwe, że dla studentów, którzy uzyskali co najmniej 25 pkt łącznie i co najmniej 4 pkt z wejściówek, konieczna będzie kartkówka poprawkowa (przed egzaminem końcowym) pozwalająca zaliczyć ćwiczenia.
 
  
Zaliczenie wykładu:
+
=Egzamin i zaliczenie=
* Egzamin pisemny
+
Do egzaminu podchodzą osoby, które zaliczą [[Wnioskowanie_Statystyczne_-_ćwiczenia | ćwiczenia]] — w braku zaliczonych ćwiczeń wynik egzaminu z wykładu nie "przenosi się" na przyszły rok. Egzamin składał się będzie z testu jednokrotnego wyboru (<math>N</math> pytań, każde z czterema odpowiedziami do wyboru, bez punktów ujemnych za błędne odpowiedzi, ale z korektą dla <math>p</math> poprawnych odpowiedzi
 +
<math>
 +
p_{\% kor} = \frac{p - N/4}{N - N/4}
 +
</math>
 +
po jednym punkcie za poprawną) i kilku pytań otwartych (po 2—4 punkty). Ostateczne przeliczenie punktów na oceny, jednakowe dla wszystkich, będzie ustalone a posteriori na podstawie statystyki i zdrowego rozsądku — w każdym razie próg zaliczenia powinien wyraźnie przekraczać 50% (po korekcie na odpowiedzi przypadkowe w części testowej).
  
Ocena końcowa z przedmiotu = średnia ocen z [[Wnioskowanie_Statystyczne_-_ćwiczenia | ćwiczeń]] i z wykładu.
+
Ocena końcowa z przedmiotu = średnia ocen z ćwiczeń i z wykładu, pod warunkiem zaliczenia ćwiczeń '''i''' wykładu (koniunkcja warunków).
  
 +
==Organizacja egzaminu==
  
 +
Egzamin rozpocznie się w piątek 30 czerwca 2023 roku o godzinie 10 rano w sali 1.40 (Pasteura 5).
 +
 +
* nie wychodzimy z sali w trakcie egzaminu — bardzo proszę o przygotowanie się pod tym kątem :)
 +
* nie ściągamy. To niemodne i passé, a przeprowadzenie egzaminu w przyjaznej atmosferze leży w Waszym interesie
 
<!--
 
<!--
==wyniki I termin 2017.06==
+
* osoby, które uczestniczyły intelektualnie w wykładzie (popartym obszernymi materiałami dostępnymi w Internecie) powinny napisać test w ok. godziny, ale "na zapas" gwarantujemy w sumie 90 minut od momentu rozdania testów.  
Wynik egzaminu pisemnego 2,5 == 3- oznacza, że końcowa nie może być wyższa niż 3. Ocena końcowa w niektórych przypadkach uwzględnia dodatkowe punkty za aktywność na wykładzie lub ujemne punkty za wyjątkowo bzdurne formulacje CTG na egzaminie pisemnym.
+
-->
 
+
* dla zachowania przyjaznej atmosfery i oddalenia pokus nieetycznych zachowań, torby/teczki/ubrania nie pozostawione w szatni zostawiamy na podłodze na froncie sali. Do ławki zabieramy ze sobą tylko długopis (lub dwa) oraz dowolne ID ze zdjęciem, które okazujemy na ew. prośbę Prowadzących (elegancko jest od razu położyć ID na brzegu ławki po podpisaniu testu)
 
+
* w ławkach siadamy, zajmując dostępną przestrzeń możliwie równomiernie według wskazań Prowadzących, poczynając od pierwszych ławek
<pre>
+
* nie jest dopuszczalny kontakt z urządzeniami komunikacyjnymi i/lub elektronicznymi. Jeśli ktoś oczekuje pilnego telefonu w czasie egzaminu, powinien ten fakt zgłosić Prowadzącym _przed_ rozpoczęciem egzaminu. W pozostałych wypadkach telefony (po wyciszeniu a najlepiej wyłączeniu) itp. urządzenia potencjalnie komunikacyjne i elektroniczne pozostawiamy w torbach lub ew. w kieszeniach i nie wyjmujemy w czasie egzaminu. Do wykonania nielicznych wyliczeń wystarczy głowa, ew. długopis
indeks ocena ćw egz: test/22 otw/18
+
* odpowiedzi na pytania testowe będziemy wpisywać "na czysto" w tabelce przed samym oddaniem testu, strony z pytaniami testowymi można dowolnie pomazać, oznaczenia na pytaniach nie będą brane pod uwagę przy sprawdzaniu
383301
+
* odpowiedzi do pytań otwartych wpisujemy maksymalnie czytelnie i "na czysto". Nieczytelne i niewyraźne wywody nie będą sprawdzane. Kartki użyte jako brudnopis przed oddaniem przekreślamy.
358252 - 4 0 13 5
+
* oddajemy kompletne arkusze wraz z notatkami i brudnopisami, nie jest dozwolone robienie kopii "na pamiątkę".
385532 3 0
 
383249 3,5 4 3 10 12
 
374702 0
 
383882 0
 
382358 5 4,5 5 19 16
 
383336 4 4,5 3 15 9
 
383898 3 4 2,5 11 9
 
360731 0
 
383381 4 4 3,5 16 10
 
358323 3 3,5 3 15 7
 
374226 0
 
383331 3,5 3 3,5 17 7,5
 
332269 0
 
374714 3 3,5 3
 
372393 4 4 4 11,5 17
 
382395 3,5 4 3 16 9
 
374760 - 4 0 14 5,5
 
382443 5 4,5 5 21 16
 
359079 - 3,5 0 13 4
 
315748 0
 
372202 5! 4,5 5 22 18
 
383365 3,5 3,5 3 16 8
 
383251 4,5 4 5 16 18,5
 
325637 4 4 4 16 10
 
383253 3,5 3,5 3 18 7
 
374888 3,5 3,5 3 12 10,5
 
383288 0
 
382440 4,5 4 5 21 12,5
 
362873 4 4 3,5 16 10,5
 
384416 0
 
322230 0
 
332819 0
 
293258 0
 
308698 0
 
335737 4 4 4 15 16
 
383902 4 4 4 15 16
 
372768 3 3 3 16 7,5
 
383887 0
 
383375 4,5 4 4,5 14 18
 
370617 4,5 4,5 4 19 8
 
382275 0
 
370420 - 3,5 0 14 0,5
 
</pre>
 
 
 
  
 
+
==Tematy do przemyślenia przed egzaminem ==  
==wyniki egzaminu w terminie zerowym 2016.06.10 i niekóre punkty z ćwiczeń==
+
Dla ustalenia uwagi, na przykład:
legenda:
+
* Sformułuj Centralne Twierdzenie Graniczne.
* kart/10 -- suma punktów z kartkówek (max 10)
+
* Wypisz i przedyskutuj definicje prawdopodobieństwa.
* kol1/10 -- suma punktów z pierwszego kolokwium (max 10)
+
* Wypisz założenia wersji Centralnego Twierdzenia Granicznego, którą można stosunkowo prosto udowodnić (twierdzenie Lindeberga-Levy'ego). Udowodnij lub spróbuj nakreślić szkic dowodu.
* ust.ćw. -- ustne zal. ćwiczeń (jeśli kartk. < 7/10)
+
* Oblicz wartość oczekiwaną rozkładu równomiernego, określonego na odcinku [0, 2], danego wzorami  p(''x'') =  0,5 dla <math>0\leq x\leq 2</math> i p(''x'') =  0 dla ''x''>2 lub  ''x''<0.
* test/21 -- wynik części testowej egzaminu (max 21)
+
* Oblicz wariancję rozkładu równomiernego określonego na odcinku [0, 2], danego wzorami  p(''x'') =  0,5 dla <math>0\leq x\leq 2</math> i p(''x'') =  0 dla ''x''>2 lub  ''x''<0
* otw12/4 -- punktacja pytań otwartych I i II (max. 4)
+
* Co to jest <math>\chi^2</math>?
 
+
* Wypisz / wyprowadź wzory na wartość oczekiwaną i wariancję rozkładu Poissona.
+
* Z rozkładu dwumianowego wylicz prawdopodobieństwo, że wśród czworga dzieci będą co najmniej trzy dziewczynki — zakładając, że prawdopodobieństwa urodzenia dziecka każdej płci są równe.
<pre>indeks kart/10 kol1/15 kol2/15 proj/10 zal.ust cw/50 oc.cw test/21 otw12/4 otw34/4 %egz0 egz0oc test/22 otw/18 egz% egz_oc OCENA KOŃCOWA
+
* Testy parametryczne i nieparametryczne: wady, zalety, przykłady.
357725 7 15 14 7 - 43 4,5 20 17 92.50% 5 5
+
* Co ma wspólnego poziom istotności testu z poprawką Bonferroniego?
370469 6 12 12 10 tak 40 4 20 10 75.00% 4.5 4.5
+
* Co to jest i jak obliczamy moc testu?
374722 3 11 11 10 tak 35 3,5 14 11 62.50% 3.5 3.5
+
* Opisz w punktach (zwięźle i konkretnie) procedurę weryfikacji hipotezy o różnicy średnich dwóch grup wyników <math>\{x_{i}, i=1\dots N\}</math> i <math>\{y_{j}, j=1\dots M\}</math> metodą repróbkowania (resampling).
372772 5 3 9 8 tak 25 3 18 7 62.50% 3.5 3.5
+
* Wyprowadź wzór na średnią ''N'' pomiarów <math>x_i</math> o różnych wariancjach <math>\sigma_{i}^2</math> z metody największej wiarygodności.
374715 7 11 7 nb - 25 3 11 4 1.5 57% 3 0.00% 3 3
+
* Dany jest zbiór rozłącznych hipotez <math>H_{i}</math> pokrywających całą przestrzeń zdarzeń <math>\Omega</math>: <math>\sum_{i}H_{i}=\Omega</math> oraz prawdopodobieństwa wyniku eksperymentu W w świetle każdej z hipotez <math>H_{i}</math>, czyli <math>P(W\mid H_{i})</math>. Korzystając z tych oznaczeń, wypisz i wyprowadź twierdzenie Bayesa, czyli wzór na prawdopodobieństwo prawdziwości hipotezy <math>H_{j}</math> w świetle wyników eksperymentu W.
370527 9 14 11 10 - 44 5 14 4 1.5 67% 3.5 0.00% 3.5 4.5
+
* Wyjaśnij różnicę między poziomem istotności hipotezy o różnicy średnich a rozmiarem efektu, wyliczonymi dla tych samych danych.
370471 4 9 14 nb nb 0 2! 0.00% --
+
* Opisz w kategoriach wejścia i wyjścia algorytmy realizujące: regresję liniową, regresję logistyczną, liniową analizę dyskryminacyjną, analizę skupień, analizę wariancji i analizę składowych głównych.
345752 8 15 14 8 - 45 5 18 16 85.00% 5 5!
 
374723 1 nb nb nb 0 2 0.00% --
 
370530 6 13 9 9 tak 37 4 14 4 4 76% 4.5 0.00% 4.5 4.5
 
360731 nb nb nb 0 2! 0.00% --
 
374758 2 nb nb 0 2! 0.00% --
 
370449 8 13 11 8 - 40 4,5 18 4 3 86% 5 0.00% 5 5
 
380926 0 0.00% --
 
374764 3 nb 2 nb nb 0 2 0.00% --
 
374714 5 11 4 nb nb 0 2 14 7 52.50% 3
 
380966 6 8 11 10 tak 35 4 18 13.5 78.75% 4.5 4.5
 
359079 3 10 11 nb tak 0 2 14 2 40.00% --
 
315748 2 nb nb 0 2! 0.00% --
 
374761 4 12 8 10 tak 34 3,5 16 10.5 66.25% 3.5 3.5
 
378738 6 8 7 10 tak 31 3,5 14 12 65.00% 3.5 3.5
 
370486 8 10 10 7 - 35 4 16 4 5 86% 5 0.00% 5 4.5
 
372777 4 9 5 8 tak 26 3 12 8 50.00% --
 
306921 0 0.00% --
 
370543 2 14 3 8 tak 27 3 14 4 0 62% 3.5 0.00% 3.5 3.5
 
374762 3 nb nb nb 0 2! 0.00% --
 
372860 5 12 5 10 tak 32 3,5 17 7 60.00% 3 3.5
 
370618 8 14 14 10 - 46 5 18 4.5 56.25% 3 4
 
372771 6 8 7 10 tak 31 3,5 14 6.5 51.25% 3 3.5
 
372768 5 8 5 10 tak 28 3 12 2 35.00% --
 
335315 4 14 11 10 tak 39 4 0.00% --
 
370490 8 12 12 6 - 38 4 19 4 3 90% 5 0.00% 5 4.5
 
373218 6 12 11 10 tak 39 4 17 4 5 90% 5 0.00% 5 4.5
 
305957 9 13 15 10 - 47 5 18 16 85.00% 5 5!
 
370420 0 nb nb 0 2! 0.00% --
 
335598 nb nb nb 0 2! 0.00% --
 
370493 7 15 13 10 - 45 5 19 4 4.5 95% 5 0.00% 5 5
 
370467 9 14 15 10 - 48 5 20 4 4.5 98% 5 0.00% 5 5!
 
380960 5 12 7 10 tak 34 3,5 12 8 50.00% --
 
374763 3 6 nb nb nb 0 2! 0.00% --
 
370496 3 11 15 8 tak 37 4 14 7 52.50% 3 3.5
 
374711 5 13 13 9 tak 40 4 16 4 4 83% 4.5 0.00% 4.5 4.5
 
372766 6 10 6 6 tak 28 3 11 7.5 46.25% --
 
</pre>
 
 
 
-->
 

Aktualna wersja na dzień 11:28, 8 cze 2023

Wnioskowanie statystyczne (wykład)

UWAGA: wymagane zaliczenie Technologii Informacyjnych i Komunikacyjnych z ćwiczeniami z programowania w Pythonie w wymiarze 45 godzin ćwiczeń

    1. Rozkłady gęstości prawdopodobieństwa
    2. Wariancja, mediana...
    3. Przykładowe rozkłady
    1. Centralne Twierdzenie Graniczne
    1. Wstęp
    2. Teoria klasyczna
    3. Statystyki i estymatory
    1. Weryfikacja hipotez statystycznych
    2. Test t Studenta
    1. Test [math]\chi^2[/math]
    1. Monte Carlo
    2. Testy permutacyjne
    3. Bootstrap
    1. Testy nieparametryczne
    2. Test serii
    3. Test Wilcoxona-Manna-Whitneya
    1. Metoda największej wiarygodności
    2. Regresja liniowa
    1. Interpretacja współczynnika korelacji
    2. Analiza wariancji
    1. TP, FP, ROC
    1. Problem porównań wielokrotnych — miejskie legendy i przepowiednie
    1. Prawdopodobieństwo
    2. Twierdzenie Bayesa
    3. Wielkość efektu
    1. PCA, MANOVA, analiza skupień
    2. LDA, LR, ANN
    3. Algorytmy Genetyczne
  1. Maris, E., Oostenveld, R. (2007). Nonparametric statistical testing of EEG- and MEG-data. Journal of Neuroscience Methods, 164(1), 177–190.



Całość podręcznika jest udostępniona na licencji Creative Commons Uznanie autorstwa-Na tych samych zasadach 3.0 Polska. CC-88x31.png Na podstawie książki Wstęp do współczesnej statystyki. Autor: Piotr Durka.


Egzamin i zaliczenie

Do egzaminu podchodzą osoby, które zaliczą ćwiczenia — w braku zaliczonych ćwiczeń wynik egzaminu z wykładu nie "przenosi się" na przyszły rok. Egzamin składał się będzie z testu jednokrotnego wyboru ([math]N[/math] pytań, każde z czterema odpowiedziami do wyboru, bez punktów ujemnych za błędne odpowiedzi, ale z korektą dla [math]p[/math] poprawnych odpowiedzi [math] p_{\% kor} = \frac{p - N/4}{N - N/4} [/math] po jednym punkcie za poprawną) i kilku pytań otwartych (po 2—4 punkty). Ostateczne przeliczenie punktów na oceny, jednakowe dla wszystkich, będzie ustalone a posteriori na podstawie statystyki i zdrowego rozsądku — w każdym razie próg zaliczenia powinien wyraźnie przekraczać 50% (po korekcie na odpowiedzi przypadkowe w części testowej).

Ocena końcowa z przedmiotu = średnia ocen z ćwiczeń i z wykładu, pod warunkiem zaliczenia ćwiczeń i wykładu (koniunkcja warunków).

Organizacja egzaminu

Egzamin rozpocznie się w piątek 30 czerwca 2023 roku o godzinie 10 rano w sali 1.40 (Pasteura 5).

  • nie wychodzimy z sali w trakcie egzaminu — bardzo proszę o przygotowanie się pod tym kątem :)
  • nie ściągamy. To niemodne i passé, a przeprowadzenie egzaminu w przyjaznej atmosferze leży w Waszym interesie
  • dla zachowania przyjaznej atmosfery i oddalenia pokus nieetycznych zachowań, torby/teczki/ubrania nie pozostawione w szatni zostawiamy na podłodze na froncie sali. Do ławki zabieramy ze sobą tylko długopis (lub dwa) oraz dowolne ID ze zdjęciem, które okazujemy na ew. prośbę Prowadzących (elegancko jest od razu położyć ID na brzegu ławki po podpisaniu testu)
  • w ławkach siadamy, zajmując dostępną przestrzeń możliwie równomiernie według wskazań Prowadzących, poczynając od pierwszych ławek
  • nie jest dopuszczalny kontakt z urządzeniami komunikacyjnymi i/lub elektronicznymi. Jeśli ktoś oczekuje pilnego telefonu w czasie egzaminu, powinien ten fakt zgłosić Prowadzącym _przed_ rozpoczęciem egzaminu. W pozostałych wypadkach telefony (po wyciszeniu a najlepiej wyłączeniu) itp. urządzenia potencjalnie komunikacyjne i elektroniczne pozostawiamy w torbach lub ew. w kieszeniach i nie wyjmujemy w czasie egzaminu. Do wykonania nielicznych wyliczeń wystarczy głowa, ew. długopis
  • odpowiedzi na pytania testowe będziemy wpisywać "na czysto" w tabelce przed samym oddaniem testu, strony z pytaniami testowymi można dowolnie pomazać, oznaczenia na pytaniach nie będą brane pod uwagę przy sprawdzaniu
  • odpowiedzi do pytań otwartych wpisujemy maksymalnie czytelnie i "na czysto". Nieczytelne i niewyraźne wywody nie będą sprawdzane. Kartki użyte jako brudnopis przed oddaniem przekreślamy.
  • oddajemy kompletne arkusze wraz z notatkami i brudnopisami, nie jest dozwolone robienie kopii "na pamiątkę".

Tematy do przemyślenia przed egzaminem

Dla ustalenia uwagi, na przykład:

  • Sformułuj Centralne Twierdzenie Graniczne.
  • Wypisz i przedyskutuj definicje prawdopodobieństwa.
  • Wypisz założenia wersji Centralnego Twierdzenia Granicznego, którą można stosunkowo prosto udowodnić (twierdzenie Lindeberga-Levy'ego). Udowodnij lub spróbuj nakreślić szkic dowodu.
  • Oblicz wartość oczekiwaną rozkładu równomiernego, określonego na odcinku [0, 2], danego wzorami p(x) = 0,5 dla [math]0\leq x\leq 2[/math] i p(x) = 0 dla x>2 lub x<0.
  • Oblicz wariancję rozkładu równomiernego określonego na odcinku [0, 2], danego wzorami p(x) = 0,5 dla [math]0\leq x\leq 2[/math] i p(x) = 0 dla x>2 lub x<0
  • Co to jest [math]\chi^2[/math]?
  • Wypisz / wyprowadź wzory na wartość oczekiwaną i wariancję rozkładu Poissona.
  • Z rozkładu dwumianowego wylicz prawdopodobieństwo, że wśród czworga dzieci będą co najmniej trzy dziewczynki — zakładając, że prawdopodobieństwa urodzenia dziecka każdej płci są równe.
  • Testy parametryczne i nieparametryczne: wady, zalety, przykłady.
  • Co ma wspólnego poziom istotności testu z poprawką Bonferroniego?
  • Co to jest i jak obliczamy moc testu?
  • Opisz w punktach (zwięźle i konkretnie) procedurę weryfikacji hipotezy o różnicy średnich dwóch grup wyników [math]\{x_{i}, i=1\dots N\}[/math] i [math]\{y_{j}, j=1\dots M\}[/math] metodą repróbkowania (resampling).
  • Wyprowadź wzór na średnią N pomiarów [math]x_i[/math] o różnych wariancjach [math]\sigma_{i}^2[/math] z metody największej wiarygodności.
  • Dany jest zbiór rozłącznych hipotez [math]H_{i}[/math] pokrywających całą przestrzeń zdarzeń [math]\Omega[/math]: [math]\sum_{i}H_{i}=\Omega[/math] oraz prawdopodobieństwa wyniku eksperymentu W w świetle każdej z hipotez [math]H_{i}[/math], czyli [math]P(W\mid H_{i})[/math]. Korzystając z tych oznaczeń, wypisz i wyprowadź twierdzenie Bayesa, czyli wzór na prawdopodobieństwo prawdziwości hipotezy [math]H_{j}[/math] w świetle wyników eksperymentu W.
  • Wyjaśnij różnicę między poziomem istotności hipotezy o różnicy średnich a rozmiarem efektu, wyliczonymi dla tych samych danych.
  • Opisz w kategoriach wejścia i wyjścia algorytmy realizujące: regresję liniową, regresję logistyczną, liniową analizę dyskryminacyjną, analizę skupień, analizę wariancji i analizę składowych głównych.