Skip to content

1. Úvod, Náhodných process

Cíle analýzy časových řad

  1. Popisování pozorovaného jevu: Hlavním cílem je často pochopení charakteristik pozorovaného systému nebo procesu. To zahrnuje určení rozsahu hodnot, zjištění periodicity a sezónnosti, sledování krátkodobých i dlouhodobých trendů, identifikaci výjimečných a extrémních hodnot, a zkoumání vztahů mezi různými časovými řadami nebo měřenými proměnnými. Analýza obvykle začíná vytvořením grafu, který zobrazuje vývoj časové řady, a následnou subjektivní vizuální analýzou.

  2. Predikce budoucího vývoje nebo interpolace minulého vývoje: Tento cíl je často spojen s plánováním a rozhodováním na základě předpovědí.

  3. Řízení procesů: V případech, kdy je třeba řídit nějaký proces, jako je výroba nebo epidemiologie, je klíčové využít měřená data, která tento proces ovlivňují.

Charakteristiky časových řad

Dynamika vývoje

  1. Trend: Tento pojem se vztahuje k dlouhodobému směřování střední hodnoty časové řady. Přestože je tento koncept obecný, v praxi může být komplikovaný, zejména kvůli možnosti cyklických změn. Tyto cykly mohou v krátkodobějším, ale stále relativně dlouhém období, maskovat nebo ovlivňovat trend. Typickým příkladem jsou klimatické změny.

  2. Sezónnost: Tato vlastnost odkazuje na periodicky se opakující vzorce v časové řadě, které jsou relativně pravidelné a předvídatelné. Běžné příklady sezónnosti zahrnují roční teplotní trendy, sezónní nárůst zákazníků v pneuservisech, sezónní zaměstnanost v zemědělství, nebo návštěvnost horských středisek v zimních měsících.

  3. Cyklické změny: Toto jsou fluktuace, které nemají pevnou periodicitu a mohou se vyskytovat v nepravidelných intervalech. Typickým příkladem jsou ekonomické cykly.

  4. Další nepravidelné fluktuace: Tato kategorie zahrnuje všechny ostatní typy variací v časové řadě, které nejsou klasifikovány jako trend, sezónnost nebo cyklické změny. Tyto fluktuace mohou být způsobeny nepravidelnými událostmi nebo mimořádnými situacemi.

Časová řada se často dělí na základní komponenty, přičemž cyklické změny a nepravidelné fluktuace jsou obvykle kombinovány do jediné složky. Existují dva základní modely pro tuto dekompozici:

  • aditivní: Y_t = T_t + S_t + E_t,
  • multiplikativní: Y_t = T_t \cdot S_t \cdot E_t,

kde: - Y_t je pozorovaná veličina v čase t, - T_t je hodnota trendu - S_t je sezónní složka - E_t nevysvětlená složka

Rozdíl mezi těmito modely spočívá v předpokladech o sezónních složkách:

  • V aditivních modelech se obvykle předpokládá, že amplituda sezónních složek je konstantní bez ohledu na hodnotu trendu.
  • V multiplikativních modelech se očekává, že s rostoucím trendem se zvyšuje i amplituda sezónní složky (a naopak).

Při výběru vhodného modelu je jedním z klíčových kritérií minimalizace součtu čtverců hodnot autokorelační funkce reziduí (E_t). Autokorelační funkce (ACF) naznačuje míru korelace, která zůstává v nevysvětlené složce. Cílem je tedy najít model, který nejlépe redukuje zbývající korelace v reziduích.

Momenty

Statistické momenty jsou měřítka, která poskytují ucelený pohled na charakteristiky rozdělení pravděpodobnosti sady dat. Tyto momenty nám umožňují analyzovat a popsat rozmanité aspekty dat, jako jsou například jejich střední hodnota, variabilita, asymetrie (zkosení) a špičatost (kurtóza).

Základní momenty

  • Střední hodnota (První moment): \mu_t = \mathbb{E}[X_t]
  • Variance (Druhý moment): \sigma_t^2 = \operatorname{var} X_t
  • Autokovariance: \gamma(t_1, t_2) = \operatorname{cov}(X_{t_1}, X_{t_2}) = \mathbb{E}[(X_{t_1} - \mu_{t_1})(X_{t_2} - \mu_{t_2})].
    • Pro zjednodušení lze použít vztah \gamma(\tau) = \operatorname{cov}(X_t, X_{t+\tau}). kde \tau je časový posun.

Stacionarita

Stacionarita v časových řadách je vlastnost, kdy statistické charakteristiky časové řady, jako jsou střední hodnota, rozptyl a autokorelace, zůstávají konstantní v čase. Stacionární časová řada nevykazuje trendy, sezónní variace ani měnící se rozptyl a její chování je v čase předvídatelné. Existují dva hlavní typy stacionarity:

  1. Silně stacionarita

    1. Říkáme, že časová řada je striktně (silně) stacionární, pokud sdružená distribuce X_{t_1},\ldots, X_{t_n} je stejná, jako sdružená distribuce X_{t_1+\tau},\ldots, X_{t_n+\tau} pro všechna t_1, \ldots, t_n, \tau.
    2. Definice tedy říká, že posun o libovolný čas \tau nemá vliv na sdruženou distribuci, tj. sdružená distribuční funkce F_X(\cdot) není funkcí času. To znamená, že je stejná pro všechna t a rovněž momenty, např. \mu = \mu_t a \sigma^2 = \sigma_t^2 jsou v čase konstantní.
  2. Slabá nebo široká stacionarita:

    1. Časová řada je slabě stacionární, pokud je invariantní vůči posunům v čase pouze v rámci momentů do druhého řádu, tedy střední hodnota a variance.
    2. Tento typ stacionarity vyžaduje konstantnost pouze některých statistických charakteristik, jako je střední hodnota a kovarianční struktura.
    3. Slabá stacionarita je méně restriktivní a běžnější v praktických aplikacích.

Příklady náhodných procesů

Bílý šum

Bílý šum je náhodný proces, kde každá hodnota je generována nezávisle s nulovou střední hodnotou a konstantním rozptylem, bez vzájemné korelace mezi hodnotami.

Definice

Bílý šum je náhodný proces \{X_t\}, kde

\begin{aligned} \mathbb{E}[X_t] &= 0, \\ \operatorname{var}(X_t) &= \sigma^2 < \infty,\\ \operatorname{cov}(X_t, X_{t+\tau}) = \gamma(\tau) &= 0. \end{aligned}

Vlastnosti

  • Jedná se tedy o slabě stacionární process

2025-02-11T23:37:46.196126 image/svg+xml Matplotlib v3.10.0, https://matplotlib.org/

import scipy.stats as ss
import matplotlib.pylab as plt
from io import StringIO

Y = ss.norm.rvs(size=500) 

fig = plt.figure(figsize=(14, 6))
plt.plot(Y)

buffer = StringIO()
plt.savefig(buffer, format="svg")
print(buffer.getvalue())

Náhodná procházka

Náhodná procházka je proces, kde každá nová hodnota je vytvořena přičtením náhodného šumu k předchozí hodnotě, což vede k sérii hodnot, kde každá následuje náhodně z té předchozí.

Definice

Uvažujme diskrétní bílý šum Z_t \sim \mathcal{L}(0, \sigma^2). Proces \{X_t\} nazýváme náhodnou procházkou pokud

a tedy X_t = \sum_{i=1}^t Z_t.

Vidíme, že \mathbb{E}[X_t] = 0 a \operatorname{var}(X_t) = t\sigma^2.

Vlastnosti

  • Nejedná se o stacionární process
  • Přírůstky náhodné procházky jsou slabě stacionární.

2025-02-11T23:37:46.327899 image/svg+xml Matplotlib v3.10.0, https://matplotlib.org/

import scipy.stats as ss
import matplotlib.pylab as plt
import numpy as np
from io import StringIO

X = np.zeros(500)  
for t in range(1, 500):  
    X[t] = X[t-1] + ss.norm.rvs()

fig = plt.figure(figsize=(14, 6))
plt.plot(X)

buffer = StringIO()
plt.savefig(buffer, format="svg")
print(buffer.getvalue())