Dummy spremenljivka - kaj je to, opredelitev in koncept

Kazalo:

Dummy spremenljivka - kaj je to, opredelitev in koncept
Dummy spremenljivka - kaj je to, opredelitev in koncept
Anonim

Lažna spremenljivka je spremenljivka, ki se uporablja za razlago kvalitativnih vrednosti v regresijskem modelu.

Regresijski modeli poskušajo razložiti eno spremenljivko z vidika drugih. Na primer plača osebe glede na njeno starost, izobrazbo in izkušnje. Te spremenljivke je mogoče količinsko opredeliti. Starost, izobrazbo in izkušnje osebe je mogoče količinsko opredeliti v številu let. Toda kaj se zgodi, ko imamo spremenljivke, ki jih ni mogoče količinsko opredeliti? Na primer barva las, država, v kateri živite, ali spol. Rešitev tega problema je v navideznih spremenljivkah. So spremenljivke, ki običajno sprejmejo binarne vrednosti. To je vrednost nič ali ena.

Na primer, spremenljivi spol, kot smo rekli, je kvalitativna spremenljivka. Če ga želite vključiti v regresijski model, morate ustvariti navidezno spremenljivko. Spremenljivko "ženska" bomo poklicali tako, da:

Ženska = 1 (če je posameznik ženska)

Ženska = 0 (če posameznik ni ženska, torej je moški)

V tem primeru se "moški" šteje za referenčno kategorijo ali osnovno skupino.

Obstajata dve vrsti navideznih spremenljivk. Na eni strani so aditivne navidezne spremenljivke, na drugi strani pa multiplikativne navidezne spremenljivke.

Regresijska analiza

Aditivna navidezna spremenljivka

Aditivna navidezna spremenljivka zbira določeno spremembo. Ta sprememba vpliva samo na konstanten člen enačbe. Na primer model, katerega namen je pojasniti plače glede na spol in leta izobrazbe. Enačbo lahko postavimo kot sklic na moške (druga enačba) ali kot sklic na ženske (prva enačba):

Grafični prikaz enačb bi bil: V primeru, da imajo moški višje plače in imajo aditivno preskusno spremenljivko, bi bil model predstavljen kot prejšnja slika.

V vašem primeru, če bi imele ženske višje plače kot moški, če bi upoštevali aditivno preskusno spremenljivko, bi bil model grafično predstavljen kot prejšnja slika.

Kvantitativna razlika med modro črto (moški) in oranžno črto (ženske) bo enaka vrednosti spremenljivke «Ženske"ali"Moški»Glede na izbrani model. V tem primeru razlika med dodanimi navideznimi spremenljivkami razlika v plači ni odvisna od stopnje študija. Z drugimi besedami, razlika v plači je odvisna izključno in izključno od spola.

Multiplikativna navidezna spremenljivka

Multiplikativna navidezna spremenljivka zajema spremembo naklona enačb za moške in ženske. Nadaljujemo s prejšnjim primerom:

Grafično bi bila možna predstavitev:

V tem primeru bi nam model povedal dve stvari. Najprej so plače žensk nižje od moških. In drugič, da se dodatno leto izobraževanja bolj splača moškim kot ženskam. To vemo, ker je naklon modre črte (moški) večji od naklona oranžne črte (ženske).

Če bi bilo dodatno leto izobraževanja bolje plačano za ženske, bi bil naklon oranžne črte (ženske) večji. In modra črta (moški) bi bila spodaj.

Statistična spremenljivka