Skip to content

Teorie Testovani hypotez

Úvod do Testování Hypotéz

Testování hypotéz je statistický nástroj používaný k rozhodování na základě dat. Hlavní myšlenka spočívá v testování nulové hypotézy H_0 proti alternativní hypotéze H_A. Toto se provádí na určité hladině významnosti \alpha, což je pravděpodobnost, že zamítneme H_0, když je pravdivá.

Testovací Statistika

K měření vzdálenosti mezi daty a nulovou hypotézou se používá testovací statistika T(X) = T(X_1, \dots, X_n). Předpokládáme, že při platnosti H_0 známe rozdělení statistiky T(X).

Kritický Obor Testovací Statistiky

Kritický obor testovací statistiky S_\alpha \subseteq \mathbb{R} je množina hodnot, při jejichž dosažení zamítáme H_0. Je definován jako:

T(X) \in S_\alpha \Rightarrow \text{zamítám } H_0,
T(X) \notin S_\alpha \Rightarrow \text{nezamítám } H_0.

Kritickou oblast S_\alpha volíme tak, aby:

  • chyba 1. druhu P(T(X) \in S_\alpha | H_0) byla \leq \alpha,
  • chyba 2. druhu P(T(X) \notin S_\alpha | H_A) byla co nejmenší.

P-hodnota

P-hodnota je nejnižší hladina významnosti \alpha, při které zamítneme H_0. Je definována jako:

\hat{p} \equiv \hat{p}(X) = \inf\{\alpha | T(X) \in S_\alpha\}.

Testová statistika a kritické obory při známém rozptylu \sigma^2

Testová statistika

T = \frac{\bar{X}_n - \mu_0}{\sigma}\sqrt{n}
H_0 H_A kritický obor
\mu = \mu_0 \mu \neq \mu_0 \vert T\vert \geq z_{\alpha/2}
\mu \leq \mu_0 \mu > \mu_0 T \geq z_{\alpha}
\mu \geq \mu_0 \mu < \mu_0 T \leq -z_{\alpha}

Testová statistika a kritické obory při neznámém rozptylu \sigma^2

Testová statistika

T = \frac{\bar{X}_n - \mu_0}{s_n} \sqrt{n}
H_0 H_A kritický obor
\mu = \mu_0 \mu \neq \mu_0 \vert T \vert \geq t_{\alpha/2, n-1}
\mu \leq \mu_0 \mu > \mu_0 T \geq t_{\alpha, n-1}
\mu \geq \mu_0 \mu < \mu_0 T \leq -t_{\alpha, n-1}

Opakování teorie – Dvouvýběrové testy

Testy o shodě středních hodnot pro \sigma_1^2 = \sigma_2^2

Testová statistika

T = \frac{\bar{X}_n - \bar{Y}_m}{s_{12} \sqrt{\frac{1}{m}+\frac{1 }{n}}}
s_{12} = \sqrt{\frac{(n - 1)s_X^2 + (m - 1)s_Y^2}{n + m - 2}}
H_0 H_A kritický obor
\mu_1 = \mu_2 \mu_1 \neq \mu_2 \vert T\vert \geq t_{\alpha/2, n+m-2}
\mu_1 \leq \mu_2 \mu_1 > \mu_2 T \geq t_{\alpha, n+m-2}
\mu_1 \geq \mu_2 \mu_1 < \mu_2 T \leq -t_{\alpha, n+m-2}

Testy o shodě středních hodnot pro \sigma_1^2 \neq \sigma_2^2

Testová statistika

T = \frac{\bar{X}_n - \bar{Y}_m}{s_d}
s_d = \sqrt{\frac{s_X^2}{n} + \frac{s_Y^2}{m}}, \quad n_d = \frac{s_d^4}{\frac{1}{n-1}\left(\frac{s_X^2}{n}\right)^2 + \frac{1}{m-1}\left(\frac{s_Y^2}{m}\right)^2}
H_0 H_A kritický obor
\mu_1 = \mu_2 \mu_1 \neq \mu_2 \vert T \vert \geq t_{\alpha/2, n_d}
\mu_1 \leq \mu_2 \mu_1 > \mu_2 T \geq t_{\alpha, n_d}
\mu_1 \geq \mu_2 \mu_1 < \mu_2 T \leq -t_{\alpha, n_d}

Opakování teorie – testy dobré shody

Testujeme, zda výběr X_1, \dots, X_n \, \text{i.i.d} \sim F (neznámé) pochází z daného F_0, tj.

H_0 : F = F_0 \quad \text{vs.} \quad H_A : F \neq F_0.

"Binování"

k "binů" A_1, \dots, A_k, tak aby \mathbb{R} = \bigcup A_j, A_j \cap A_i = \emptyset pro i \neq j,

N_i = \sum_{j=1}^{n} 1_{X_j \in A_i} (počet hodnot, které spadly do A_i),

p_i = P_{F_0}(X_j \in A_i) (teoretické relativní četnosti při platnosti H_0).

Testová statistika (rozdělení za platnosti H_0 při n \approx +\infty)

\chi^2(X) := \sum_{i=1}^{k} \frac{(N_i - n p_i)^2}{n p_i} \sim \chi^2(k - 1 - p),

kde p je počet odhadnutých parametrů rozdělení F_0.

Zamítneme H_0, pokud \chi^2(X) \geq \chi^2_{\alpha,k-1-p}.

Opakování teorie – test nezávislosti v kontingencní tabulce

Kontingencní tabulka a matice pravděpodobností Provedení testu nezávislosti Y a Z

Odhady marginálních pravděpodobností: \hat{p}_{i\cdot} = \frac{N_{i\cdot}}{n} a \hat{p}_{\cdot j} = \frac{N_{\cdot j}}{n}. Počet stupňů volnosti je tedy: (\#\text{řádků} - 1) \times (\#\text{sloupců} - 1).

Opakování teorie - NIST testy nezávislosti

Bloky nad/pod stř. hodnotou (runs above/below the mean)

Nechť X_1, \dots, X_n je posloupnost náhodných veličin se stejným rozdělením, které má konečnou střední hodnotu \mu = E[X_i], dále P(X_i = \mu) = 0 a je symetrické kolem \mu: P(X_i < \mu) = P(X_i > \mu) = \frac{1}{2}.

Chceme testovat hypotézu

H_0 : "X_i$ jsou nezávislé" proti alternativě H_A : "X_i nejsou nezávislé".

Jako blok uvažujme úsek hodnot, které jsou všechny větší (nebo menší) než střední hodnota \mu. Položme

N_n = \#\{\text{bloků hodnot nepřekračujících } \mu\}.

Při H_0 platí N_n \sim N\left(\frac{n+1}{2}, \frac{n-1}{4}\right) pro velká n (v notaci N(\mu, \sigma^2)).

Testovací statistika: T = \frac{2N - n - 1}{\sqrt{n-1}} \sim N(0, 1) pro velká n při H_0.

Opakování teorie - NIST testy nezávislosti

Bloky nahoru/dolů (runs up/down)

Nechť X_1, \dots, X_n je posloupnost náhodných veličin se stejným rozdělením a P(X_i = X_{i+1}) = 0 pro všechna i.

Chceme testovat hypotézu

H_0 : \text{"$X_i$ jsou nezávislé"} \quad \text{proti alternativě} \quad H_A : \text{"$X_i$ nejsou nezávislé"}.

Jako blok uvažujme úsek monotónně se měnících hodnot. Položme

N_n = \#\{\text{bloků monotónních hodnot}\}.

Při H_0 platí N_n \sim N\left(\frac{2n-1}{3}, \frac{16n-29}{90}\right) pro velká n.

Testovací statistika: pro velká n při H_0.