Teorie Testovani hypotez
Úvod do Testování Hypotéz¶
Testování hypotéz je statistický nástroj používaný k rozhodování na základě dat. Hlavní myšlenka spočívá v testování nulové hypotézy H_0 proti alternativní hypotéze H_A. Toto se provádí na určité hladině významnosti \alpha, což je pravděpodobnost, že zamítneme H_0, když je pravdivá.
Testovací Statistika¶
K měření vzdálenosti mezi daty a nulovou hypotézou se používá testovací statistika T(X) = T(X_1, \dots, X_n). Předpokládáme, že při platnosti H_0 známe rozdělení statistiky T(X).
Kritický Obor Testovací Statistiky¶
Kritický obor testovací statistiky S_\alpha \subseteq \mathbb{R} je množina hodnot, při jejichž dosažení zamítáme H_0. Je definován jako:
Kritickou oblast S_\alpha volíme tak, aby:
- chyba 1. druhu P(T(X) \in S_\alpha | H_0) byla \leq \alpha,
- chyba 2. druhu P(T(X) \notin S_\alpha | H_A) byla co nejmenší.
P-hodnota¶
P-hodnota je nejnižší hladina významnosti \alpha, při které zamítneme H_0. Je definována jako:
Testová statistika a kritické obory při známém rozptylu \sigma^2¶
Testová statistika¶
| H_0 | H_A | kritický obor |
|---|---|---|
| \mu = \mu_0 | \mu \neq \mu_0 | \vert T\vert \geq z_{\alpha/2} |
| \mu \leq \mu_0 | \mu > \mu_0 | T \geq z_{\alpha} |
| \mu \geq \mu_0 | \mu < \mu_0 | T \leq -z_{\alpha} |
Testová statistika a kritické obory při neznámém rozptylu \sigma^2¶
Testová statistika¶
| H_0 | H_A | kritický obor |
|---|---|---|
| \mu = \mu_0 | \mu \neq \mu_0 | \vert T \vert \geq t_{\alpha/2, n-1} |
| \mu \leq \mu_0 | \mu > \mu_0 | T \geq t_{\alpha, n-1} |
| \mu \geq \mu_0 | \mu < \mu_0 | T \leq -t_{\alpha, n-1} |
Opakování teorie – Dvouvýběrové testy¶
Testy o shodě středních hodnot pro \sigma_1^2 = \sigma_2^2¶
Testová statistika¶
| H_0 | H_A | kritický obor |
|---|---|---|
| \mu_1 = \mu_2 | \mu_1 \neq \mu_2 | \vert T\vert \geq t_{\alpha/2, n+m-2} |
| \mu_1 \leq \mu_2 | \mu_1 > \mu_2 | T \geq t_{\alpha, n+m-2} |
| \mu_1 \geq \mu_2 | \mu_1 < \mu_2 | T \leq -t_{\alpha, n+m-2} |
Testy o shodě středních hodnot pro \sigma_1^2 \neq \sigma_2^2¶
Testová statistika¶
| H_0 | H_A | kritický obor |
|---|---|---|
| \mu_1 = \mu_2 | \mu_1 \neq \mu_2 | \vert T \vert \geq t_{\alpha/2, n_d} |
| \mu_1 \leq \mu_2 | \mu_1 > \mu_2 | T \geq t_{\alpha, n_d} |
| \mu_1 \geq \mu_2 | \mu_1 < \mu_2 | T \leq -t_{\alpha, n_d} |
Opakování teorie – testy dobré shody¶
Testujeme, zda výběr X_1, \dots, X_n \, \text{i.i.d} \sim F (neznámé) pochází z daného F_0, tj.
"Binování"
k "binů" A_1, \dots, A_k, tak aby \mathbb{R} = \bigcup A_j, A_j \cap A_i = \emptyset pro i \neq j,
N_i = \sum_{j=1}^{n} 1_{X_j \in A_i} (počet hodnot, které spadly do A_i),
p_i = P_{F_0}(X_j \in A_i) (teoretické relativní četnosti při platnosti H_0).
Testová statistika (rozdělení za platnosti H_0 při n \approx +\infty)
kde p je počet odhadnutých parametrů rozdělení F_0.
Zamítneme H_0, pokud \chi^2(X) \geq \chi^2_{\alpha,k-1-p}.
Opakování teorie – test nezávislosti v kontingencní tabulce¶
Kontingencní tabulka a matice pravděpodobností Provedení testu nezávislosti Y a Z
Odhady marginálních pravděpodobností: \hat{p}_{i\cdot} = \frac{N_{i\cdot}}{n} a \hat{p}_{\cdot j} = \frac{N_{\cdot j}}{n}. Počet stupňů volnosti je tedy: (\#\text{řádků} - 1) \times (\#\text{sloupců} - 1).
Opakování teorie - NIST testy nezávislosti¶
Bloky nad/pod stř. hodnotou (runs above/below the mean)
Nechť X_1, \dots, X_n je posloupnost náhodných veličin se stejným rozdělením, které má konečnou střední hodnotu \mu = E[X_i], dále P(X_i = \mu) = 0 a je symetrické kolem \mu: P(X_i < \mu) = P(X_i > \mu) = \frac{1}{2}.
Chceme testovat hypotézu
H_0 : "X_i$ jsou nezávislé" proti alternativě H_A : "X_i nejsou nezávislé".
Jako blok uvažujme úsek hodnot, které jsou všechny větší (nebo menší) než střední hodnota \mu. Položme
N_n = \#\{\text{bloků hodnot nepřekračujících } \mu\}.
Při H_0 platí N_n \sim N\left(\frac{n+1}{2}, \frac{n-1}{4}\right) pro velká n (v notaci N(\mu, \sigma^2)).
Testovací statistika: T = \frac{2N - n - 1}{\sqrt{n-1}} \sim N(0, 1) pro velká n při H_0.
Opakování teorie - NIST testy nezávislosti¶
Bloky nahoru/dolů (runs up/down)
Nechť X_1, \dots, X_n je posloupnost náhodných veličin se stejným rozdělením a P(X_i = X_{i+1}) = 0 pro všechna i.
Chceme testovat hypotézu
Jako blok uvažujme úsek monotónně se měnících hodnot. Položme
Při H_0 platí N_n \sim N\left(\frac{2n-1}{3}, \frac{16n-29}{90}\right) pro velká n.
Testovací statistika: pro velká n při H_0.