Preprost naključni vzorec - kaj je to, opredelitev in koncept
Glede na naključno spremenljivko X je preprost naključni vzorec nabor naključnih spremenljivk, neodvisnih in enakomerno porazdeljenih, dobljenih iz naključne spremenljivke X, ki se porazdelijo enako.
Formalno je prejšnja definicija tista, ki opredeljuje preprost naključni vzorec. Zdaj lahko koncept definiramo bolj preprosto. Za pravilno razumevanje pojma preprostega naključnega vzorca je seveda pomembno, da ga natančno opredelimo.
Ker je formalna definicija zapletena, bomo vsak del definicije malo po malo razvili.
Preprost koncept naključnega vzorca korak za korakom
Tako moramo najprej upoštevati, da je preprost naključni vzorec vzorec. Kot vzorec je pridobljen iz naključne spremenljivke. To naključno spremenljivko smo poimenovali X. Primer naključne spremenljivke bi lahko bila ocena matematike srednješolcev. Zato je prvi del definicije jasen. Preprost naključni vzorec je vzorec, pridobljen iz katere koli naključne spremenljivke.
Drugi del definicije je bolj zapleten. Predvsem s koncepti "neodvisnega in enako porazdeljenega naključnega". Koncept naključnega pomeni naključje. Ker je bil vzorec pridobljen naključno, so spremenljivke posledično naključne. Pojem neodvisen se nanaša na dejstvo, da pridobljeni podatki niso med seboj povezani. Se pravi, da izbira določenih podatkov ni odvisna od predhodno izbranih podatkov ali pa bodo izbrani kasneje. Končno, enako porazdeljena se nanaša na statistično porazdelitev, ki je enaka.
Če povzamemo, imamo preprost naključni vzorec vzorec, ki smo ga dobili na povsem naključen način. Tako podatki, ki sestavljajo vzorec, niso med seboj povezani in podedujejo značilnosti naključne spremenljivke populacije X.
Zakaj je preprost koncept naključnega vzorca tako pomemben?
Kadar želimo izvesti raziskave nekaterih značilnosti nabora podatkov, je kakovost vzorca bistvenega pomena. Da bi bile izračunane metrike in zato zaključki raziskave zanesljivi, moramo imeti tako imenovani reprezentativni vzorec. Se pravi vzorec, ki ustrezno predstavlja značilnosti celotne populacije.
Ena glavnih značilnosti reprezentativnega vzorca je, da je naključen. Poznavanje koncepta preprostega naključnega vzorca je ključnega pomena, da naša študija velja v znanstveni skupnosti.
Primer preprostega naključnega vzorca
Recimo, da želimo izvesti študijo o mesečnih plačah državljanov države. Naša naključna spremenljivka bo mesečna plača državljanov.
Koncept vzorca nastane zaradi nezmožnosti spraševanja vseh državljanov države. To bi trajalo dolgo ali veliko finančnih virov. Namesto da bi vprašali 50 milijonov ljudi, smo se odločili, da jih bomo vprašali 50.000.
Ko smo definirali spremenljivko, na kateri bomo delali, in populacijo podatkov, moramo nadaljevati s pridobivanjem vzorca. Obstaja obsežna literatura o pridobivanju pravilnega vzorca. Ker pa je cilj te opredelitve pristop k temu konceptu na preprost način, se ne bomo spuščali v zadevo.
Če poenostavimo veliko, imamo na splošno dve možnosti. Ali vprašajte državljane povsem naključno ali izberite izbirni postopek. Da bi vzorec izpolnil merilo "naključnost", moramo to storiti povsem naključno. Ne moremo izbrati mest, območij, sosesk ali česar koli drugega.
Če se izbirnega postopka odločimo zavestno, bo naš vzorec verjetno pristranski. Pravilno bi bilo uporabiti orodje, ki naključno pridobiva imena državljanov.
Ko imamo preprost naključni vzorec, moramo delati s podatki. Se pravi statistično sklepati. To statistično sklepanje nam bo omogočilo, da bomo iz študije sklepali. Na primer izjave, kot so: "povprečna mesečna plača v Španiji znaša 1.200 evrov" ali, "le 5% državljanov z najvišjimi plačami zasluži protivrednost najrevnejših 30%."
Vse to z jasno mejo napak. Toda za to že skrbi statistično sklepanje.