Preprosta funkcija samodejne korelacije - primer v R

Kazalo:

Preprosta funkcija samodejne korelacije - primer v R
Preprosta funkcija samodejne korelacije - primer v R
Anonim

Z drugimi besedami, enostavna funkcija samodejne korelacije (FAS) ali iz angleščine, Funkcija samodejne korelacije, Gre za matematično funkcijo, ki nam pomaga vedeti, kako odvisni so podatki določenega obdobja od istih podatkov iz k prejšnjih obdobij.

Ustvarimo letno časovno vrsto X, ki sledi običajni porazdelitvi in ​​vztrajnosti. Uporabimo lahko tudi prave podatke.

Metodologija

Programi so bistveni za delo na analizi avtokorelacije. Lahko se uporabljajo programi, kot je Python, vendar za statistično analizo in upravljanje podatkov priporočamo R ali njegovo izboljšano različico R Studio. Tu bomo delali z R.

Izračun

In kako zapišemo formulo FAS v kodo R?

Tako R kot Python imata knjižnici, kjer so formule povezane z imenom. Potem je dovolj, da smo namestili knjižnico, ki vsebuje formulo, ki jo želimo uporabiti, in jo poklicati v skriptu.

V kion R moramo zapisati:

Funkcija prim v knjižnici je statistika.

X -> Časovne vrste, ki jih uporabimo kot vzorec za izračun FAS.

acf (X, ylim = c (-1,1)) -> Preprosta funkcija samodejne korelacije na X z omejitvami na navpični osi med -1 in 1, kar so vrednosti, ki jih lahko sprejme koeficient avtokorelacije.

Preverjanje

Ta korak ni potreben, če smo uporabili prejšnjo kodo, saj sama izračuna pasove zaupanja.

Da bi ugotovili, ali so izračunani koeficienti avtokorelacije statistično pomembni, bomo morali določiti pasove zaupanja s kritičnimi vrednostmi. Na ta način lahko glede na odstotek pomembnosti s statistično gotovostjo trdimo, ali je v podatkih prisotna avtokorelacija ali ne.

Enako kot korelacijski koeficient tudi avtokorelacijski koeficient predpostavlja normalno, zato bomo interval zaupanja izračunali na naslednji način:

Preizkušanje hipotez definiramo kot:

Pri 95-odstotni zanesljivosti s stopnjo pomembnosti 5% v običajnih tabelah najdemo slavnih 1,96. Kritično vrednost podaja:

Kadar je varianca koeficientov podana s približkom:

Čeprav podajamo formulo, za večjo natančnost in hitrost svetujemo uporabo statističnih programov.

Izid

Vse vrstice, ki se končajo zunaj pasu zaupanja, pomenijo, da ima časovna serija avtokorelacijo v navedenem obdobju.

Na podlagi grafa torej vidimo, da je v tej časovni vrsti prisotna avtokorelacija v obdobjih, ko črta štrli iz diskontinuiranega pasu.

Prvo vrstico, ki je na 0 in se sproži proti 1, lahko prezremo, ker mora biti t strogo večja od 0, v tem primeru pa ne. Ni smiselno, da bi morali narediti vse prejšnje korake, da bi poznali avtokorelacijo zdaj in zdaj, ker jo že poznamo: korelacija spremenljivke s seboj je 1, zato odgovor že imamo.