Linearni verjetnostni model je binarni model izbire. Pri tem je pogojno pričakovanje odvisne spremenljivke linearna funkcija, to je razmerje odvisne spremenljivke s pojasnjevalnimi spremenljivkami je konstantno.
Da bi to videli drugače, je linearni verjetnostni model model, kjer imamo odvisno spremenljivko in neodvisno spremenljivko (-e), pomnoženo s trajnimi koeficienti (-i).
Poudariti moramo, da je linearni verjetnostni model binarni model izbire, torej lahko odvisna spremenljivka ima dve vrednosti. Te vrednosti so 1 oziroma 0, kar pomeni uspeh oziroma neuspeh.
Linearni verjetnostni model je izražen na naslednji način:
E (Y | X = x) = Pr (Y = 1 | X = x) = p (x) = β0 + β1x
V prikazani enačbi se pogojno pričakovanje Y glede na X razlaga kot enako β0 + β1x.
V tem primeru vzamemo pogojno pričakovanje, saj nas zanima, kakšna je verjetnost, da se posameznik na primer odloči glede na njegove značilnosti (ali kot referenco lahko vzamemo drugo neodvisno spremenljivko).
Slabosti linearnega verjetnostnega modela
Nekatere slabosti linearnega verjetnostnega modela so naslednje:
- Linearni verjetnostni model lahko pokaže heteroskedastičnost. In sicer varianca napak pri vseh ugotovitvah ni enaka. V tem primeru se uporabljajo standardne napake.
- Ni mogoče domnevati, da so napake običajno porazdeljene.
- Odvisna spremenljivka ima lahko le dve vrednosti.
- Predpostavlja se, da imajo neodvisne in odvisne spremenljivke linearno razmerje, to pomeni, da je hitrost sprememb vedno enaka. Vendar bi bilo morda bolj natančno zgraditi model, pri katerem se hitrost sprememb poveča, ko Y doseže višjo vrednost, nasprotno pa se zgodi, ko se Y zmanjša.
Glede na te pomanjkljivosti obstajajo logit in probit modeli.
Primer linearnega verjetnostnega modela
Na primer, lahko je sestavljen linearni verjetnostni model, kjer je odvisna spremenljivka, ali ima oseba trenutno formalno službo, ki jo ima eno leto ali več. Neodvisne spremenljivke so lahko raven študija ali izobrazba, spol in starost.
V prikazanem primeru bo odvisna spremenljivka 1 ali 0, vendar jo je treba interpretirati kvalitativno, ne glede na njeno številčno vrednost. Tako 1 pomeni, da ima oseba formalno službo, ki se ohranja več kot eno leto, 0 pa bi bila situacija, v kateri se to ne bi zgodilo.