21. Autoregresní modely (AR) a modely klouzavých průměrů (MA): základní vlastnosti modelů/procesů, jejich stacionarita. Zápis AR a MA, včetně zápisu pomocí operátoru zpoždění. Identifikace řádů AR a MA z autokorelačních funkcí a pomocí informačních kritérií. (NI-SCR)¶
Úvodní matematické předpoklady¶
Autokorelační funkce (ACF):
- Definuje míru lineární závislosti mezi hodnotou časové řady a jejími zpožděnými hodnotami.
- Pro danou časovou řadu \{X_t\} je ACF pro lag k definována jako kde předpokládáme konstantní střední hodnotu a rozptyl (tj. slabou stacionaritu).
Parciální autokorelační funkce (PACF):
- Měří vzájemnou závislost mezi X_t a X_{t-k} po odstranění vlivu všech hodnot mezi nimi (tj. X_{t-1},X_{t-2},\dots,X_{t-k+1}).
- PACF je užitečná při identifikaci řádu autoregresního procesu, neboť u AR(p) má hodnoty pro lags větší než p tendenci vypadat jako nulové.
Informační kritéria:
- Slouží k výběru optimálního modelu (zejména při volbě řádu parametrů) kombinací míry dobrého přizpůsobení modelu a penalizace za složitost.
- Akaikeho informační kritérium (AIC): kde L je maximální hodnota funkce věrohodnosti (likelihood) modelu a k počet volně odhadnutých parametrů. Nižší hodnota AIC preferuje lepší model.
- Bayesovské informační kritérium (BIC): kde n je počet pozorování. BIC penalizuje složitost modelu silněji než AIC, a proto vybírá jednodušší modely, pokud počet dat roste.
Operátor zpoždění¶
Operátor zpoždění, známý také jako lag (backshift) operátor, značíme B nebo L a používáme jej pro zjednodušení zápisu časových řad. Definujeme jej následovně:
Tímto způsobem můžeme formulovat modely kompaktně, což napomáhá při analýze stacionarity a dalších vlastností.
Autoregresní modely (AR)¶
Autoregresní modely (AR) vyjadřují aktuální hodnotu časové řady jako lineární kombinaci předchozích hodnot a náhodné složky. Tyto předchozí hodnoty zachycují "paměť" časové řady.
Obecný tvar AR(p):
kde:
- X_t je aktuální hodnota časové řady.
- c je konstanta – často reprezentuje střední hodnotu procesu.
- \phi_1, \phi_2, \ldots, \phi_p jsou autoregresní koeficienty; vysvětlují, kolik váhy má každá z předchozích hodnot při tvorbě aktuální hodnoty.
- \varepsilon_t je reziduální složka, neboli bílý šum s vlastnostmi E[\varepsilon_t]=0 a Var(\varepsilon_t)=\sigma^2.
Zápis pomocí operátoru zpoždění (L):
Pomocí lag operátoru lze model zapsat kompaktně. Použijeme definici B X_t = X_{t-1} a zapisujeme:
Stacionarita¶
- AR proces je stacionární, pokud kořeny rovnice \phi(L)=0 (tj. hodnoty \lambda, pro které \phi(\lambda)=0) leží mimo jednotkový kruh, tedy |\lambda_i|>1.
- Splnění této podmínky znamená, že střední hodnota, rozptyl a autokovariance jsou konstantní v čase a závisí pouze na vzdálenosti (lagu).
Modely klouzavých průměrů (MA)¶
Základní vlastnosti¶
Modely klouzavých průměrů (MA) popisují aktuální hodnotu časové řady jako lineární kombinaci současných i minulých náhodných šoků (reziduí). U těchto modelů není přímo zahrnuta informace z předchozích hodnot řady, nýbrž z předchozích chyb.
Obecný tvar MA(q):
kde:
- c představuje konstantní střední hodnotu.
- \theta_1, \theta_2, \ldots, \theta_q jsou koeficienty MA, které váží vliv minulých náhodných šoků na aktuální hodnotu.
- \varepsilon_t jsou hodnoty bílého šumu (reziduí) s vlastnostmi E[\varepsilon_t]=0 a Var(\varepsilon_t)=\sigma^2.
Zápis pomocí operátoru zpoždění (L):
Podobně jako u AR modelů využijeme lag operátor k zápisu MA modelu:
Tento zápis vyjadřuje, že aktuální hodnota X_t je váženým součtem aktuálního náhodného šoku a předchozích chyb, přičemž koeficient 1 před \varepsilon_t reprezentuje přímý (aktuální) vliv.
Stacionarita¶
- Každý konečný MA proces (s konečným q) je stacionární, protože střední hodnota a rozptyl a autokovariance (které jsou nenulové pouze pro lags k \leq q) jsou konstantní v čase.
Identifikace řádů AR a MA pomocí autokorelačních funkcí a informačních kritérií¶
| Typ modelu | ACF chování | PACF chování |
|---|---|---|
| AR(p) | Exponenciální pokles nebo oscilace bez ostrého řezu | Ostrý řez po lag p (významné korelace do řádu p) |
| MA(q) | Ostrý řez po lag q (významné pouze do lag q) | Exponenciální pokles nebo oscilace |
Informační kritéria:
-
Akaikeho informační kritérium (AIC):
- Vyjadřuje kvalitu modelu s ohledem na maximální pravděpodobnost, ale penalizuje také složitost modelu (počet parametrů).
- Model s nižší hodnotou AIC je preferován, jelikož dosahuje dobré rovnováhy mezi přesností přizpůsobení a parsimonií.
-
Bayesovské informační kritérium (BIC):
- Podobné AIC, nicméně penalizace složitosti je silnější díky členům zahrnujícím logaritmus počtu dat, což znamená, že při velkém vzorku preferuje ještě jednodušší modely.
- Opět se vybírá model s nejnižší hodnotou BIC.
Tyto informace slouží jako kvantitativní pomoc při výběru řádu modelů AR a MA. V praxi se často testují několik kandidátních modelů, u kterých se následně spočítají AIC a BIC, a nakonec se vybírá ten s nejnižší hodnotou.