Skip to content

15. Stavové modely: rovnice pro vývoj stavu a rovnice měření, rozdíly mezi nimi. Bayesovský sekvenční odhad stavových modelů a jejich vliv na apriorní distribuci (znalost). Možnosti odhadu stavů v případě nelinearity (pouze vyjmenovat). (NI-BML)


Stavové modely

Stavový model představuje matematický nástroj pro popis dynamických systémů. Jeho klíčovou vlastností je schopnost zachytit vnitřní stav systému a jeho interakci s okolím. Pod pojmem "stav systému" rozumíme soubor všech informací, které potřebujeme znát pro předpověď budoucího chování systému, známe-li budoucí vstupy. Přeci každá otázka je o znalosti ne?

Základní komponenty

Stavový model se skládá z několika klíčových komponent:

  1. Stav systému (x) reprezentuje vnitřní charakteristiky systému. Stav nemusí být přímo pozorovatelný (může být latentní), ale přesto plně určuje chování systému. Například u letadla je stavem jeho poloha a rychlost, které společně určují jeho budoucí trajektorii.

  2. Měření/pozorování (y) představuje to, co můžeme skutečně změřit nebo pozorovat. Tato měření jsou typicky zatížena šumem a poskytují pouze částečnou informaci o stavu. V případě letadla mohou být měřením například GPS souřadnice.

  3. Vstupy (u) jsou známé vnější vlivy, kterými můžeme systém ovlivňovat nebo které na něj působí. U letadla by to byl například tah motorů nebo poloha řídicích ploch.

Fundamentální rovnice

Stavový model je definován dvěma základními rovnicemi. Stavová rovnice popisuje vnitřní dynamiku systému, měřící rovnice se zabývá tím, jak tento stav pozorujeme.

Stavová rovnice: x_t = f_k(x_{t-1}, u_t)

  • Jedna se tedy o předchozí stav a aktuální měření
  • Zachycuje dynamiku systému

Měřící rovnice: y_t = g_k(x_t)

  • Definuje vztah mezi stavem a měřením

Lineární případ

V mnoha praktických aplikacích můžeme systém aproximovat lineárním modelem, který je jednodušší na analýzu a implementaci. Lineární stavový model má následující tvar:

  1. Model Dynamiky Stavů

    • x_t: Stav systému v čase t.
    • A_t: Matice dynamiky systému.
    • B_t: Matice řídícího vstupu.
    • u_t: Vektor externích vstupů v čase t.
    • w_t: Náhodný šum procesu s kovariancí Q_t.
  2. Model Pozorování

    • y_t: Pozorované hodnoty v čase t.
    • H_t: Matice pozorování.
    • \varepsilon_t: Náhodný měřicí šum s kovariancí R.

Bayesovský sekvenční odhad stavových modelů

Bayesovský sekvenční odhad je metoda, která umožňuje postupně aktualizovat naše znalosti o stavu systému na základě nových měření. Tento přístup je založen na Bayesově větě a využívá dva hlavní kroky: predikci a aktualizaci. Tyto kroky se opakují v každém časovém okamžiku.

Princip fungování

Bayesovský sekvenční odhad vychází z předpokladu, že stav systému je reprezentován pravděpodobnostním rozdělením. V každém časovém kroku máme k dispozici:

  1. Apriorní informaci o stavu systému (z predikce),
  2. Nová měření, která tuto informaci zpřesňují.

Predikční krok

Predikce slouží k předpovědi budoucího stavu systému na základě jeho dynamického modelu. Tento krok využívá stavovou rovnici a předchozí odhad stavu k výpočtu apriorní distribuce stavu:

\pi(x_t|y_{0:t-1}, u_{0:t}) = \int p(x_t|x_{t-1}, u_t) \pi(x_{t-1}|y_{0:t-1}, u_{0:t-1}) dx_{t-1}.

Interpretace:

  • x_t: Stav systému v čase t.
  • y_t: Měření získané v čase t.
  • u_t: Vstupy působící na systém.
  • \pi: Pravděpodobnostní rozdělení.

Predikce využívá:

  1. Model dynamiky systému (p(x_t|x_{t-1}, u_t)), který popisuje, jak se stav vyvíjí.
  2. Aposteriorní distribuci z předchozího kroku (\pi(x_{t-1}|y_{0:t-1}, u_{0:t-1})), která slouží jako prior.

Výsledkem predikce je apriorní distribuce \pi(x_t|y_{0:t-1}, u_{0:t}), která reprezentuje náš odhad stavu před zahrnutím nového měření.

Aktualizační krok

Aktualizace kombinuje apriorní informaci z predikce s novým měřením pomocí Bayesovy věty:

\pi(x_t|y_{0:t}, u_{0:t}) \propto f(y_t|x_t)\pi(x_t|y_{0:t-1}, u_{0:t}),

kde symbol \propto znamená "úměrný" – levá strana je rovna pravé straně až na normalizační konstantu.

Interpretace:

  • f(y_t|x_t): Věrohodnost měření – pravděpodobnost, že bychom naměřili hodnotu y_t, pokud by skutečný stav byl x_t.
  • \pi(x_t|y_{0:t}): Aposteriorní distribuce – aktualizovaný odhad stavu po zahrnutí nového měření.

Aktualizační krok:

  1. Zohledňuje nejistotu v měření (f(y_t|x_t)).
  2. Kombinuje ji s apriorním odhadem (\pi(x_t|y_{0:t-1}, u_{0:t})), aby vytvořil přesnější aposteriorní rozdělení.

Vztah mezi predikcí a aktualizací

Bayesovský přístup systematicky aktualizuje apriorní distribuci na základě nových měření:

  1. Predikční krok:

    • Rozšiřuje nejistotu (např. kvůli procesnímu šumu).
    • Výsledkem je širší distribuce, která zahrnuje možné hodnoty budoucího stavu.
  2. Aktualizační krok:

    • Zpřesňuje odhad na základě nového měření.
    • Výsledkem je užší distribuce (aposteriorní), která lépe odpovídá realitě.

Aplikace v Kalmanově filtru

Pro lineární systémy s gaussovským šumem se Bayesovský sekvenční odhad redukuje na Kalmanův filtr:

Predikce:

  1. Predikovaný stav: x_t^- = Ax_{t-1}^+ + Bu_t
  2. Predikovaná kovariance: P_t^- = AP_{t-1}^+A^T + Q

Aktualizace:

  1. Kalmanovo zesílení: K_t = P_t^-H^T(HP_t^-H^T + R)^{-1}
  2. Aktualizovaný stav: x_t^+ = x_t^- + K_t(y_t - Hx_t^-)
  3. Aktualizovaná kovariance: P_t^+ = (I - K_tH)P_t^-

Možnosti odhadu stavů v případě nelinearity

Nelineární stavové modely mají obecný tvar:

kde alespoň jedna z funkcí f_k nebo g_k je nelineární. Přístupy:

  1. Rozšířený Kalmanův filtr (EKF)

    • Při slabé nelinearitě lze funkce f_k a g_k lokálně linearizovat pomocí Taylorova rozvoje prvního řádu.
    • EKF není optimální a může divergovat, ale za "rozumných" podmínek funguje dobře.
    • Je široce používán, například v GPS navigaci.
  2. Unscented Kalmanův filtr (UKF)

    • Vhodný pro větší nelinearity, kde EKF selhává.
    • Nepoužívá derivace, ale místo toho pracuje se sadou tzv. sigma bodů, které reprezentují rozdělení stavu a umožňují přesnější propagaci nejistoty.
  3. Částicové filtry (Particle Filters)

    • Používají Monte Carlo vzorkování pro aproximaci rozdělení pravděpodobnosti stavů.
    • Generují množinu náhodných částic (vektorů), které se vyhodnocují podle pravděpodobnosti daného měření.
    • Nejpravděpodobnějším částicím jsou přiřazeny vysoké váhy a hledání se zaměřuje v jejich okolí.
    • Jsou výpočetně náročné, ale velmi flexibilní a vhodné pro silně nelineární systémy nebo negaussovská rozdělení.