Kvantil je tista točka, ki deli porazdelitveno funkcijo naključne spremenljivke na pravilne intervale.
Zato ločitev podatkov od distribucije ni nič drugega kot statistična tehnika. Seveda se mora izpolniti, da so skupine enake. Iz tega razloga obstajajo različne vrste kvantilov, kot bomo videli kasneje, odvisno od števila particij, ki jih naredijo.
Izjemno so uporabni v mnogih praktičnih aplikacijah, v primeru, ki ga bomo prikazali.
Obrazec za izračun količin
Kvantile lahko izračunamo s parametričnega in neparametričnega vidika. Oglejmo si podrobneje oboje in tudi tako imenovano "kvantilno funkcijo".
- Parametrično: Uporabljajo se v distribucijah, katerih obliko poznamo. To pomeni, da bo porazdelitev normalna, enakomerna, eksponentna itd. Na ta način se predpostavlja, da je znan in tudi njegovi glavni parametri (aritmetična sredina in varianca).
- Neparametrična: Primeren je za majhne vzorce, kjer je težko natančno poznati njegovo obliko in zato ne poznamo njegove porazdelitvene funkcije. Ta metoda daje podobne vrednosti kot prejšnja, ko se vzorec poveča, zato je uporaba obeh indiferentna.
- Kvantilna funkcija: Soočamo se z verjetnostno obliko izračuna. Cilj je izračunati vrednost, ki ima določeno verjetnost v funkciji porazdelitve. Ne bomo se spuščali v matematična vprašanja, ki otežujejo koncept.
Najpogostejši kvantili
Pokazali bomo, kateri so najpogosteje uporabljeni kvantili v statistiki. Večina se jih pogosto uporablja, da lahko podrobno analizirajo distribucijo podatkov. Poleg tega je še ena njegova uporaba ločevanje podatkov v skupine, pri čemer lahko izbere najvišjo ali najnižjo. V primeru bomo to videli podrobneje.
- Kvartil: Ločite vrednosti v štiri enake skupine in tri kvartile so. Je najpogostejša. Kvartil ena (Q1) je najnižji podatek, kvartil tri (Q3) pa najvišji. Po drugi strani pa kvartil dva (Q2) ustreza mediani (Me), ki je statistični položaj, ki deli porazdelitev podatkov na polovico. Vrednosti kvantilov bi bile 0,25 (Q1), 0,5 (Q2) in 0,75 (Q3).
- Kvintil: Podobno kot pri prejšnjem je manj pogost in podatke deli na pet enakih delov. Zato obstajajo štirje kvintili. V tem primeru bi bile vrednosti kvantilov 0,20, 0,40, 0,60, 0,80.
- Odločite se: V tem primeru so razdeljeni na deset delov, zato je devet decilov. Tudi to ni preveč pogosto. Njihove vrednosti bi bile od 0,1 do 0,9.
- Percentili: Soočamo se z različico, pri kateri je razdelitev razdeljena na sto enakih delov. Zanimiv je lahko za zelo velike vzorce. Njihove vrednosti se gibljejo od 0,01 do 0,99.
Primer količin
Poglejmo primer, v katerem imamo vrsto podatkov o dohodkih prebivalcev določene občine. Izračunali smo tri najbolj reprezentativne kvartile in tri decile. Vključimo uporabljene formule, pri čemer upoštevamo, da za decile uporabimo ekvivalent v percentilih. Ne pozabite, da so podatki v Q2 in D5 enakovredni mediani.
Opazimo lahko, da je dohodek posameznikov, ki predstavljajo 25% manj ugodnih prebivalcev (Q1), 2900. V primerjavi z decilom je dohodek 10% (D1) posameznikov, ki prejmejo najmanj 2.800. Enaka razlaga je z nadrejenimi, vendar obratno. 25% (Q3), ki zaslužijo največ, dobijo 4.100 dohodkov, 10% pa 4.800. Kvantil torej odraža ustrezne informacije, če želite izvedeti več o spremenljivki.