Koeficient variacije - kaj je to, opredelitev in pomen

Kazalo:

Koeficient variacije - kaj je to, opredelitev in pomen
Koeficient variacije - kaj je to, opredelitev in pomen
Anonim

Koeficient variacije, znan tudi kot Pearsonov koeficient variacije, je statistično merilo, ki nas obvešča o relativni razpršenosti nabora podatkov.

To pomeni, da nas tako kot druge mere razpršitve obvešča o tem, ali se spremenljivka giblje veliko, malo, bolj ali manj kot druga.

Koeficient variacijske formule

Njegov izračun dobimo tako, da standardni odklon delimo z absolutno vrednostjo povprečja množice in je za boljše razumevanje običajno izražen v odstotkih.

  • X: spremenljivka, na podlagi katere je treba izračunati varianco
  • σx: Standardni odklon spremenljivke X.
  • | x̄ |: To je povprečje spremenljivke X v absolutni vrednosti z x̄ ̄ 0

Koeficient variacije je razviden s črkami CV ali r, odvisno od priročnika ali uporabljene pisave. Njegova formula je naslednja:

Koeficient variacije se uporablja za primerjavo naborov podatkov, ki pripadajo različnim populacijam. Če pogledamo njegovo formulo, vidimo, da upošteva vrednost srednje vrednosti. Zato nam koeficient variacije omogoča disperzijsko mero, ki odpravlja možna izkrivljanja povprečja dveh ali več populacij.

Uvrstitev

Primeri uporabe koeficienta variacije namesto standardnega odklona

Tu je nekaj primerov te mere razpršenosti:

Primerjava naborov podatkov različnih dimenzij

Želimo kupiti disperzijo med višino 50 učencev v razredu in njihovo težo. Za primerjavo višine bi lahko uporabili metre in centimetre kot mersko enoto in kilogram za težo. Primerjava teh dveh porazdelitev s standardnim odklonom ne bi bila smiselna, saj poskušamo izmeriti dve različni kvalitativni spremenljivki (merilo dolžine in eno maso).

Primerjajte sklope z veliko razliko med sredstvi

Predstavljajte si na primer, da želimo izmeriti težo hroščev in povodnih konjev. Teža hroščev se meri v gramih ali miligramih, teža povodnih konjev pa se običajno meri v tonah. Če za naše merjenje težo hroščev pretvorimo v tone, tako da imata obe populaciji enak obseg, uporaba standardnega odklona kot mere razpršenosti ne bi bila primerna. Povprečna teža hrošča, izmerjena v tonah, bi bila tako majhna, da če bi uporabili standardni odklon, v podatkih skorajda ne bi prišlo do razpršitve. To bi bila napaka, saj se teža med različnimi vrstami hroščev lahko zelo razlikuje.

Primer izračuna koeficienta variacije

Razmislimo o populaciji slonov in drugih miši. Populacija slonov ima povprečno težo 5000 kilogramov in standardni odklon 400 kilogramov. Populacija miši ima povprečno težo 15 gramov in standardni odklon 5 gramov. Če primerjamo razpršenost obeh populacij s standardnim odklonom, bomo morda mislili, da je razpršenost populacije slonov večja kot pri miših.

Pri izračunu koeficienta variacije za obe populaciji pa bi ugotovili, da je ravno obratno.

Sloni: 400/5000 = 0,08
Miši: 5/15 = 0,33

Če pomnožimo oba podatka s 100, imamo koeficient variacije za slone le 8%, miši pa 33%. Kot posledica razlike med populacijami in njihovo povprečno težo vidimo, da populacija z največjo razpršenostjo ni tista z največjim standardnim odklonom.

Interval zaupanjaLinearni korelacijski koeficient