Skip to content

22. Smíšené modely ARIMA: základní vlastnosti modelů/procesů, integrování a diferencování. Zápis ARIMA, včetně zápisu pomocí operátorů zpoždění a diference, speciální případy podle hodnot p, d, q. Problém redundance parametrů. (NI-SCR)


ARMA

ARMA(p,q) model je kombinací autoregresního procesu řádu p a procesu klouzavých průměrů řádu q. Standardní zápis bez konstanty:

X_t = c + \varepsilon_t + \sum_{i=1}^p \phi_i X_{t-i} + \sum_{i=1}^q \theta_i \varepsilon_{t-i}

Pomocí operátoru zpoždění B:

\Phi X_t = \Theta \varepsilon_t

kde \Phi=1-\sum_{i=1}^p \phi_i B^i a \Theta=1+\sum_{i=1}^q \theta_i B^i

Diferencování / Integrace

Operátor diference \Delta je definován jako:

\begin{aligned} \Delta X_t &= X_t - X_{t-1} = (1-B) X_t \\ \Delta^d X_t &= (1-B)^d X_t \end{aligned}

Integrace je pak inverzní operace k diferencování - proces "sčítání" diferencí zpět na původní řadu.

Intuice

  • Diferencování odstraňuje nestacionární trendy v datech
  • První diference odstraňuje lineární trend
  • Druhá diference odstraňuje kvadratický trend
  • d-tá diference odstraňuje polynomiální trend stupně d

Vlastnosti

  • Snižuje řád integrace časové řady
  • Transformuje nestacionární řadu na stacionární
  • Může vést ke ztrátě informací při přediferencování

ARIMA

Standardní zápis

ARIMA(p,d,q) model s konstantou c:

kde \Phi=1-\sum_{i=1}^p \phi_i B^i a \Theta=1+\sum_{i=1}^q \theta_i B^i

Zápis pomocí zpoždění a diference

Pomocí operátorů B a \Delta:

\Phi\Delta^d X_t = c + \Theta \varepsilon_t

Vlastnosti modelu a procesu

  • Kombinuje autoregresní část, integraci a klouzavé průměry
  • Umožňuje modelovat nestacionární procesy
  • Flexibilní framework pro analýzu časových řad
  • Zachycuje krátkodobou i dlouhodobou dynamiku

Speciální případy hodnot

Model Popis
ARIMA(0,0,0)+c Konstantní model
ARIMA(0,1,0) Model náhodné procházky
ARIMA(0,1,0)+c Náhodná procházka s driftem
ARIMA(1,0,0)+c AR(1) model
ARIMA(2,0,0)+c AR(2) model
ARIMA(1,1,0)+c AR(1) na diferencovaných datech
ARIMA(2,1,0)+c AR(2) na diferencovaných datech
ARIMA(0,1,1) Exponenciální vyhlazování - MA(1) na diferencovaných datech
ARIMA(0,1,1)+c Exponenciální vyhlazování s lineárním trendem
ARIMA(1,1,2) Exponenciální vyhlazování s tlumeným trendem
ARIMA(p,0,q) ARMA model
ARIMA(0,d,0) d-krát integrovaný bílý šum
ARIMA(p,1,0) AR model na diferencovaných datech
ARIMA(0,0,q) MA model
ARIMA(p,d,q) Obecný ARIMA model

Problém redundance parametrů

Princip

Některé kombinace parametrů AR a MA části mohou vést ke stejnému nebo velmi podobnému chování modelu.

Vysvětlení

Dochází k tomu, když:

  • AR a MA polynomy mají společné kořeny
  • Parametry se vzájemně ruší nebo kompenzují
  • Model je "přeparametrizovaný"

Matematicky

Když \Phi(B) a \Theta(B) mají společné faktory, lze model zjednodušit na model nižšího řádu. Například:

(1-\phi B)(1-\alpha B)X_t = (1-\alpha B)\varepsilon_t

se zjednoduší na:

(1-\phi B)X_t = \varepsilon_t

Obecná pravidla pro volbu řádů ARIMA modelů

  • Základní pravidla pro volbu řádů p a q:

    • Obvykle p = 0 nebo q = 0 (často stačí jen AR nebo jen MA část)
    • p + q ≤ 3 (složitější modely jsou v praxi vzácné)
    • Volit co nejjednodušší model, který adekvátně popisuje data
    • Při výběru modelu využívat informační kritéria (AIC, BIC)
  • Problémy složitějších modelů:

    • Koeficienty Φᵢ a θᵢ mohou pracovat proti sobě
    • Zvyšování řádů u obou částí může vést k vzájemnému rušení efektů
    • Redundance parametrů - AR a MA části modelu se mohou navzájem kompenzovat
    • Složitější modely jsou náchylnější k přeučení (overfitting)
  • Výjimky a poznámky:

    • Mohou existovat i složitější modely porušující tato pravidla
    • I v těchto případech by měly být řády p, q relativně malé
    • Vždy je třeba ověřit stabilitu a invertibilitu modelu
    • Konečné rozhodnutí by mělo být podpořeno diagnostikou reziduí