Kategorična spremenljivka - kaj je to, opredelitev in koncept

Kazalo:

Anonim

Kategorična spremenljivka je tista, ki omogoča razvrščanje niza podatkov s pomočjo stalnih vrednosti, povezanih z določeno kakovostjo ali kategorijo.

Kategorična spremenljivka za razliko od glavnih ali neprekinjenih spremenljivk (ki omogočajo numerične izračune) razvršča posameznike ali primere. Običajno imajo vrednosti, ki jih predstavljajo cela števila, na primer ena ali nič, toda to so samo predstavitve.

V primeru bomo videli podrobneje.

Razlike med kategorično in zvezno spremenljivko

Obstaja nekaj razlik med kategorično spremenljivko in zvezno ali glavno spremenljivko, ki bi jih bilo treba poznati. Poglejmo najpomembnejše.

  • Najprej se za razvrščanje v skupine uporablja kategorična spremenljivka, za štetje pa neprekinjena spremenljivka. Z drugimi besedami, prva omogoča oblikovanje kategorij z vrsto podatkov. Na primer spol ali število otrok. Drugi nam daje numerične informacije. Na primer starost.
  • Kardinalna spremenljivka omogoča numerične izračune, druge pa ne. Tako lahko pri prvem poznamo sredstva ali odstopanja, pri drugih pa le nekatere podatke, na primer način ali odstotek kategorij.
  • Kategorični so zelo koristni, če poznamo kvalitativne informacije, torej neko kakovost podatkov. Neprekinjene nam zagotavljajo kvantitativne podatke, torej količine in vrednosti, predstavljene s številkami.

Statistične tehnike za kategorične spremenljivke

Nato si oglejmo statistične tehnike, ki se najpogosteje uporabljajo v kategoričnih spremenljivkah, in jih primerjamo s kontinuiranimi ali kardinalnimi spremenljivkami.

  • Opisna statistika: Pri tej vrsti spremenljivk analize med drugim običajno temeljijo na stolpčnih in odstotnih diagramih. Kardinali omogočajo uporabo analitičnih tehnik za izračun statistike položaja, kot so kvantile, ali statistike razpršitve, kot so variance.
  • Hipotezni kontrast: V kategoričnem je mogoče rezultate ekstrapolirati s pomočjo neparametričnih testov hipotez. Po drugi strani pa kontinuirni uporabljajo parametrične kontraste, o katerih je mogoče tudi sklepati.
  • Regresijske tehnike: V tem primeru se za prve uporabljajo med drugim logistična regresija ali podobno. Za drugo vrsto spremenljivk je najpogosteje uporabljena tehnika linearna regresija.

Primer kategorične spremenljivke

Za konec si oglejmo zelo pogost primer v trženju. Predstavljajmo si, da želimo prodati izdelek in nas zanima podatek o zakonskem stanu.

Za to bomo 1 določili za samske, 2 za poročene, 3 za ločene, 4 za partnerja in 5 za druge.

Poglejmo sliko in jo nato komentirajte:

V njem lahko vidimo, da je največ odstotkov posameznikov samskih, poročenih in ločenih, drugi dve možnosti pa sta le 5%.

Kot vidimo, so kategorične spremenljivke uporabne za razvrščanje v skupine. Palični grafikon nam omogoča boljše opazovanje teh odstotkov, saj je lažje primerjati velikost palic.