Analiza grozdov - kaj je to, opredelitev in koncept

Analiza grozdov je sklop multivariatnih statističnih tehnik, katerih cilj je nabor primerov ali posameznikov združiti v grozde ali grozde.

Analiza grozdov je torej vrsta statističnega združevanja. Cilj je, da so podatki v vsaki grozdi čim bolj podobni in čim bolj različni glede na druge skupine. To je mogoče storiti tudi s spremenljivkami.

Preoblikovanje podatkov pri gručni analizi

Ena izmed težav, s katero se srečujemo pri združevanju podatkov, je ta, da so podatki včasih v različnih merskih enotah. Zato je treba izvesti korak analize pred gručami, ki omogoča združevanje v gruče.

Najpogostejša metoda je standardizacija. To se uporablja za preoblikovanje podatkov, tako da imajo podobne merske enote. Upoštevati je treba dve pravili, binarne spremenljivke niso standardizirane in, če so kategorične, postanejo binarne (prisotnost / odsotnost).

Metode v gručni analizi

Obstaja veliko metod za izvedbo analize grozdov, vendar bomo v Economy-Wiki.com po načelu enostavnosti, ki nas zaznamuje, videli shematsko najustreznejše.

Hierarhične metode

Prva klasifikacija bi bila hierarhična ali nehierarhična metoda. Nekdanji združujejo posameznike v hierarhične faze (od tod tudi njihovo ime). Na ta način samo en predmet hkrati spremeni skupino, ostali pa ostanejo na istem mestu.

Ti pa so razvrščeni v:

Aglomerativne metode

Sestavljen je iz združevanja posameznikov v manj grozdov vsakič. Izhaja iz številnih skupin, ki so enake številu primerov, in se zmanjšuje.

Najbolj znani so:

  • Metoda najbližjega soseda: V tem primeru za združevanje podatkov uporabite algoritem. Kar iščete, je minimalna razdalja med najbližjimi posamezniki. Je zelo občutljiv na podatke, ki lahko povzročijo tako imenovani "šum". Metoda najbolj oddaljenega soseda je podobna.
  • Povprečna metoda med skupinami: Izračuna povprečje razdalje med posamezniki v skupini in še posebej z enim od njih. Zelo koristno je zmanjšati tako imenovani "hrup".
  • Wardova metoda: Kar se naredi, je, da se izognemo izgubi informacij, dodamo kvadratke odstopanj med posameznikom in sredino njegove grozde. Je ena najbolj znanih in ima prednosti metode, ki temelji na srednji vrednosti, vendar večji moči diskriminacije.

Disociativne metode

V tem primeru je tisto, kar naredite, deliti. Začne se z enim samim grozdom, oddelki pa se predlagajo na podlagi vrste zahtev.

Najpogostejši so:

  • Metoda povprečja med najbližjimi sosedi in najbolj oddaljenimi sosedi med skupinami: Te tri metode so podobne prejšnjemu primeru, vendar z uporabo disociativne metode. To pomeni, da je tokrat to, kar počnemo, ločeno in ne skupinsko.
  • Metoda Centroid: Pogosto se uporablja pri problemih z optimizacijo lokacije objekta. S to vrsto analize poiščite najprimernejše.

Nehierarhične metode

V tem primeru začnejo z vnaprej določeno rešitvijo. To je izhodišče za analizo grozdov. Na ta način se skupine vzpostavijo vnaprej in vsak primer bo umeščen v eno od njih, odvisno od njegovih značilnosti. Po drugi strani jih lahko razdelimo v druge podskupine.

  • Metode prerazporeditve: Najbolj pomembne so metode centroidov, na primer k-pomeni. Medioidi, kot je PAM. Ali pa dinamičnih oblakov.
  • Neposredne metode: Najpomembnejše je združevanje v bloke, ki se pogosto uporablja pri podatkovnem rudarjenju.
  • Reduktivne metode: Temelji na faktorski analizi.
  • Metode iskanja po gostoti: Po eni strani bi obstajali tipološki pristopi, kot je modalna analiza. Po drugi strani imamo verjetnostne, kot je Wolf.

Primeri analize grozdov

Poglejmo na koncu še nekaj primerov aplikacij za analizo grozdov.

  • Predstavljajmo si, da imamo skupino držav, ki jo želimo združiti na podlagi nekaterih makroekonomskih spremenljivk, na primer inflacije ali brezposelnosti. S to vrsto analize lahko naredimo homogene skupine, na primer bolj ali manj razvite države.
  • Drug primer bi lahko bila vrsta potrošnikov z določenimi sociodemografskimi značilnostmi. Ideja je ustvariti skupine s podobnimi posamezniki, ki pa se med seboj zelo razlikujejo.
  • Toda grozdna analiza je poleg ekonomije koristna tudi pri drugih znanostih. Na primer v biologiji, za razvrščanje vrst ali v geologiji, da to storimo z minerali.

Vam bo pomagal razvoj spletnega mesta, ki si delijo stran s svojimi prijatelji

wave wave wave wave wave