Bajesovo informacijsko merilo

Bayesov informacijski kriterij ali Schwarzov kriterij je metoda, ki se osredotoča na vsoto kvadratov ostankov za iskanje števila zaostalih obdobij str ki minimizirajo ta model.

Z drugimi besedami, najti želimo najmanjše število zaostalih obdobij, ki jih vključimo v avtoregrezijo, da bi nam pomagali pri napovedovanju odvisne spremenljivke.

Na ta način bomo imeli nadzor nad številom zaostalih obdobij str da smo vključeni v regresijo. Ko bomo presegli to optimalno raven, se bo Schwarzov model nehal zmanjševati, zato smo dosegli minimum. To pomeni, da bomo dosegli število zaostalih obdobij str ki minimizirajo Schwarzov model.

Imenuje se tudi Bayesovo informacijsko merilo (BIC).

Priporočeni članki: avtoregresija, vsota kvadratov ostankov (SCE).

Formula Bayesovega informacijskega merila

Čeprav se na prvi pogled zdi zapletena formula, bomo razumeli nekaj delov. Najprej moramo na splošno:

  • Logaritmi obeh faktorjev formule predstavljajo obrobni učinek vključitve zaostalega obdobja str bolj v samoregresiji.
  • N je skupno število opazovanj.
  • Formulo lahko razdelimo na dva dela: levi in ​​desni del.

Del na levi:

Predstavlja vsoto kvadratov ostankov (SCE) avtoregresijestr zaostala obdobja, deljeno s skupnim številom opazovanj (N).

Za oceno koeficientov uporabljamo navadne najmanjše kvadrate (OLS). Ko torej vključimo nova zaostala obdobja, lahko SCE (p) samo vzdržujemo ali zmanjšujemo.

Nato povečanje zaostalega obdobja avtoregrezije povzroči:

  • SCE (p): zmanjša ali ostane konstanten.
  • Koeficient določitve: poveča se.
  • SKUPNI UČINEK: povečanje v zaostalem obdobju povzroči zmanjšanje levega dela formule.

Zdaj pravi del:

(p + 1) predstavlja skupno število koeficientov v avtoregresiji, to je regresorje z njihovimi zaostalimi obdobji (str) in prestrezanje (1).

Nato povečanje zaostalega obdobja avtoregrezije povzroči:

  • (p + 1): poveča se, ker vključimo zaostalo obdobje.
  • SKUPNI UČINEK: povečanje v zaostalem obdobju povzroči povečanje desnega dela formule.

Praktični primer

Predvidevamo, da želimo napovedati cene censmučarske vozovnice za naslednjo sezono 2020 s petletnim vzorcem, vendar ne vemo, koliko obdobij zaostanka uporabiti: AR (2) ali AR (3)?

  • Prenesemo podatke in izračunamo naravne logaritme cen smučarske vozovnice.

1. Koeficiente ocenimo z uporabo OLS in dobimo:

Vsota kvadratov ostankov (SCE) za AR (2) = 0,011753112

Koeficient določitve za AR (2) = 0,085

2. Dodamo še 1 zaostalo obdobje, da vidimo, kako se spreminja SCE:

Vsota kvadratov ostankov za AR (3) = 0,006805295

Koeficient določitve za AR (3) = 0,47

Vidimo lahko, da ko v autoregresiji dodamo zakasnjeno obdobje, se koeficient določitve poveča in SCE v tem primeru zmanjša.

  • Izračunamo Bayesov informacijski kriterij:

Manjši kot je model BIC, bolj prednostni je model. Potem bi bil AR (3) najprimernejši model glede na AR (2), saj je njegov koeficient določljivosti višji, SCE nižji in tudi Schwarzov model ali Bayesov informacijski kriterij nižji.

Vam bo pomagal razvoj spletnega mesta, ki si delijo stran s svojimi prijatelji

wave wave wave wave wave