Box Plot - kaj je to, opredelitev in koncept

Kazalo:

Box Plot - kaj je to, opredelitev in koncept
Box Plot - kaj je to, opredelitev in koncept
Anonim

Boxplot, iz angleščine, boxplot, je predstavitev kvantitativne ali kategorične spremenljivke za hitro prepoznavanje kvartilov nabora podatkov.

Z drugimi besedami, boxplot je graf, ki predstavlja kvantitativno ali kvalitativno spremenljivko skozi kvartile.

V statistiki je koristno orodje za predstavitev diskretnih in neprekinjenih podatkovnih nizov.

Upoštevati je treba, da morajo biti spremenljivke kvalitativne spremenljivke ali ki so namenjene predstavljanju naročila ali kategorije vedno povezane s številskim indeksom, večjim od 0, da se lahko pojavijo na grafu in izračunajo ustrezni statistični podatki.

Škatla in histogram

Polje škatle ni nič drugega kot histogram, ki ga gledamo od zgoraj, in na enak način je histogram škatla, gledano s strani. Primer si lahko ogledate spodaj.

Prva značilnost, ki si jo delita tabela, je najmanjša in največja vrednost nabora podatkov. Končni stolpci za pomišljaji označujejo najmanjši (spodnji stolpec) in največji (zgornji stolpec). Izstopajoče vrednosti bi bile zastopane zunaj obsega največjega in najmanjšega. Se pravi onstran za vezaji. Najdemo lahko tudi vodoravne škatlaste parcele.

Že na prvi pogled lahko vidite, da je večina podatkov osredotočena na opažanja blizu minimuma v obeh grafih. To označuje ploskev, pri kateri je polje bližje minimumu od maksimuma. Če pogledamo histogram, bomo videli, da so najpogostejša opazovanja opazovanja, ki so blizu minimuma in daleč od maksimuma.

Informacije o parceli v polju

Podatki, ki jih vsebuje polje polja, so naslednji:

  1. Na dnu polja je prvi kvartil (Q1).
  2. Stolpec na sredini polja je mediana ali drugi kvartil (Q2).
  3. Na vrhu polja je tretji kvartil (Q3).
  4. Interkvartilni razpon ali IQR bi bila višina polja, to je razlika med Q3 in Q1.

Ključ ploskve polja

Ta grafični prikaz se imenuje ploskev polja, ker je videti kot polje. Da bi si zapomnili ta graf, bi si morali omisliti le kvadratni predmet ali polje.

Za bralce, ki poznajo ceno finančnega premoženja, bodo videli več podobnosti s svečo. Sveče, ki jih vidite v ponudbi, so škatle, prilagojene izbranemu časovnemu oknu.

Prednosti in slabosti škatle

Med prednostmi in slabostmi tega diagrama najdemo naslednje:

Prednost

  • Globalizirana vizija absolutne pogostosti kvantitativne ali kvalitativne spremenljivke.
  • Poznavanje minimuma, maksimuma in kvartilov nabora podatkov, ne da bi jih bilo treba izračunati.
  • Prepoznavanje ekstremnih vrednosti hitreje kot pri histogramu, ker so skrajne vrednosti označene s krogi zunaj največjega in najmanjšega.

Slabosti

  • Če je nabor podatkov majhen, bo težje razumevanje, če bo polje za izražanje teh podatkov oteženo.

Primer zabojne škatle

Predvidevamo, da želimo predstaviti število kolesarjev, ki tečejo mimo naše hiše v enem letu. Najprej preštejemo kolesarje in podatke zberemo v tabeli.

Skozi nekatere programe, kot sta R ali Excel, lahko ustvarimo spodnji graf.

Zahvaljujoč predstavitvi števila kolesarjev skozi zaboj, lahko hitro ugotovimo, kje je mediana, drugi kvartili, največja in najnižja. V tem primeru nimamo netipičnih podatkov, saj preko maksimuma in minimuma ni ničesar.

Uporaba te vrste grafov je zelo pogosta glede na njeno preprostost in uporabnost na številnih področjih, ki presegajo finance in ekonomijo.