- Pomembni premisleki
- Kaj je stratificirano vzorčenje?
- Postopek za izvajanje stratificiranega vzorčenja
- Vrste
- Proporcionalno stratificirano vzorčenje
- Enotno stratificirano vzorčenje
- Prednosti in slabosti
- - Prednost
- Zberite ključne lastnosti
- Večja statistična natančnost
- Manjša velikost vzorca
- - Slabosti
- Težave pri iskanju slojev
- Kompleksnost organizacije
- Primer
- Ustvarjanje slojev
- Reference
Stratificiran vzorčenje ali stratifikacija, je metoda vzorčenja, ki vključuje delitev prebivalcev v manjše podskupine, znane kot plasteh. Ti sloji se oblikujejo na podlagi skupnih lastnosti ali značilnosti članov, kot sta dohodek ali stopnja izobrazbe.
Uporablja se za poudarjanje razlik med skupinami v populaciji, v nasprotju s preprostim vzorčenjem, ki obravnava vse člane populacije kot enake, z enako verjetnostjo vzorčenja.
Vir: needpix.com
Cilj je izboljšati natančnost vzorca z zmanjšanjem napake vzorčenja. Lahko proizvede tehtano srednjo vrednost z manjšo variabilnostjo kot aritmetična sredina preprostega vzorca populacije.
Stratifikacija je postopek razdrobljenosti članov populacije na homogene podskupine pred vzorčenjem. Skozi sloje je določena porazdelitev prebivalstva.
To pomeni, da mora biti skupinsko izčrpen in medsebojno izključujoč, tako da je treba vsakemu elementu prebivalstva dodeliti en sam sloj. Nato se znotraj vsakega sloja uporabi sistematično ali preprosto vzorčenje.
Pomembni premisleki
Pomembno je upoštevati, da plasti ne smejo biti enakomerno izpostavljene. Če se prekrivajo podskupine, bodo nekateri imeli večjo možnost, da so izbrani kot predmeti. To popolnoma zamolči pojem stratificiranega vzorčenja kot prototipa vzorčenja.
Prav tako je pomembno, da mora raziskovalec uporabiti preprosto vzorčenje znotraj različnih slojev.
Najpogostejši sloji, ki se uporabljajo pri stratificiranem vzorčenju, so starost, spol, socialno-ekonomski status, vera, narodnost in stopnja izobrazbe.
Kaj je stratificirano vzorčenje?
Ob zaključku analize na skupini subjektov s podobnimi značilnostmi lahko preiskovalec ugotovi, da je velikost prebivalstva prevelika, da bi lahko zaključila preiskavo.
Da bi prihranili čas in denar, je mogoče izbrati večjo možno perspektivo z izbiro majhne skupine prebivalstva. Ta majhna skupina se imenuje velikost vzorca, ki je podskupina populacije, ki se uporablja za predstavljanje celotne populacije.
Vzorec iz populacije je mogoče izbrati na več načinov, od katerih je eden s stratificiranim vzorčenjem. To vključuje delitev celotne populacije na homogene skupine, imenovane strata. Nato se iz vsakega sloja izberejo naključni vzorci.
Postopek za izvajanje stratificiranega vzorčenja
- Razdelite populacijo na podskupine ali manjše sloje glede na atribute in značilnosti, ki jih imajo člani.
- Vzemite naključni vzorec iz vsakega sloja v številu, ki je sorazmerno z velikostjo stratuma.
- Združite podskupine slojev, da se oblikuje naključni vzorec.
- Izvedite analizo.
Na primer, razmislite o raziskovalcu, ki je želel vedeti število študentov podjetij, ki so v treh mesecih po diplomi leta 2018 prejeli ponudbo za zaposlitev. Kmalu bodo odkrili, da je bilo v tem letu skoraj 200.000 diplomantov podjetij.
Lahko bi se odločili, da preprosto vzamete naključni vzorec 5000 diplomantov in opravite anketo. Še bolje, razdelili bi lahko prebivalstvo v sloje in od teh plasti vzeli naključni vzorec.
Če želite to narediti, bi ustvarili skupine prebivalstva na podlagi starosti, rase, narodnosti ali poklicnega porekla.
Iz vsakega sloja se vzame naključni vzorec, sorazmerno z velikostjo sloja glede na celotno populacijo. Te podskupine bi bile razvrščene v vzorec.
Vrste
Proporcionalno stratificirano vzorčenje
Pri tej vrsti je velikost vzorca za vsak sloj sorazmerna z velikostjo populacije stratuma v primerjavi s celotno populacijo. To pomeni, da ima vsak sloj enako stopnjo vzorčenja.
Ko je za opredelitev slojev izbrana značilnost posameznikov, so dobljene podskupine pogosto različnih velikosti.
Na primer, želite preučiti odstotek mehiškega prebivalstva, ki kadi, in se odločite, da bi bila starost dobro merilo za razslojevanje, saj verjame, da se navade kajenja lahko glede na starost močno razlikujejo. Opredeljeni so trije sloji:
- mlajši od 20 let.
- Med 20 in 44.
- Nad 44.
Ko se prebivalstvo Mehike razdeli na te tri sloje, ne pričakujemo, da bodo te tri skupine enake. V resnici to potrjujejo dejanski podatki:
- Stratum 1: 42,4 milijona (41,0%).
- Stratum 2: 37,6 milijona (36,3%).
- Stratum 3: 23,5 milijona (22,7%).
Če se uporablja sorazmerno stratificirano vzorčenje, mora biti vzorec sestavljen iz slojev, ki ohranjajo enake deleže kot populacija. Če želite ustvariti vzorec 1.000 posameznikov, morajo biti vzorci naslednjih velikosti:
Zelo podobno je zbiranju manjše populacije, ki jo določajo relativni deleži slojev znotraj populacije.
Enotno stratificirano vzorčenje
Pri tej vrsti je enaka velikost vzorca dodeljena vsem definiranim slojem, ne glede na težo teh slojev v populaciji.
Enotno stratificirano vzorčenje iz prejšnjega primera ustvari naslednji vzorec za vsak sloj:
Ta metoda daje prednost slojem, ki imajo manjšo težo v prebivalstvu, saj jim daje enako raven pomena kot ustreznejšim slojem.
To zmanjšuje splošno učinkovitost vzorca, vendar omogoča, da se posamezne značilnosti vsakega sloja preučijo z večjo natančnostjo.
Na primer, če želite dati posebno izjavo o populaciji stratuma 3 (več kot 44), lahko zmanjšate napake pri vzorčenju z vzorcem 333 enot, namesto vzorca 227 enot, kot ga dobite iz sorazmerno stratificirano vzorčenje.
Prednosti in slabosti
Stratificirano vzorčenje deluje dobro za populacije, ki imajo različne atribute, vendar sicer ne bodo učinkovite, če ne bo mogoče oblikovati podskupin.
- Prednost
Zberite ključne lastnosti
Glavna prednost stratificiranega vzorčenja je, da zbira ključne značilnosti populacije v vzorcu.
Podobno kot tehtano povprečje tudi ta metoda vzorčenja v vzorcu daje lastnosti, ki so sorazmerne celotni populaciji.
Večja statistična natančnost
Stratifikacija daje manj napak pri oceni kot enostavna metoda vzorčenja. Večja kot je razlika med sloji, večji je natančnost.
V primerjavi s preprostim vzorčenjem je statistična natančnost večja. To je posledica dejstva, da je spremenljivost znotraj podskupin manjša, če jo primerjamo s celotnimi populacijami.
Manjša velikost vzorca
Ker ima ta tehnika visoko statistično natančnost, pomeni tudi, da zahteva manjšo velikost vzorca, kar lahko raziskovalcem prihrani veliko truda, denarja in časa.
- Slabosti
Na žalost te raziskovalne metode ni mogoče uporabiti v vseh raziskavah. Pomanjkljivost metode je, da mora biti za pravilno uporabo izpolnjenih več pogojev.
Težave pri iskanju slojev
Glavna pomanjkljivost je, da je težko določiti ustrezne sloje študije. Poleg tega je iskanje popolnega in dokončnega seznama celotne populacije lahko izziv.
Kompleksnost organizacije
Druga pomanjkljivost je, da je bolj zapleteno organizirati in analizirati rezultate v primerjavi s preprostim vzorčenjem.
Raziskovalci morajo identificirati vsakega člana študentske populacije in ga razvrstiti v samo eno podpopulacijo. Zato je stratificirano vzorčenje neugodno, če raziskovalci ne morejo zanesljivo razvrstiti vsakega člana populacije v podskupino.
Nasprotovanje je lahko težava, če obstajajo predmeti, ki spadajo v več podskupin. Če se izvaja preprosto vzorčenje, je večja verjetnost, da bodo izbrani tisti v več podskupinah. Rezultat bi lahko bil napačna predstavitev ali netočen odraz prebivalstva.
Primeri, kot so študentje, diplomanti, moški in ženske, olajšajo, saj gre za jasno definirane skupine.
Vendar bi bilo v drugih situacijah lahko veliko težje. Lahko si predstavljate, da vključuje značilnosti, kot so rasa, narodnost ali vera. Postopek razvrščanja bi postal težji, stratificirano vzorčenje pa bi postalo neučinkovita metoda.
Primer
Recimo, da želi raziskovalna skupina določiti povprečje točk študentov v ZDA.
Raziskovalna skupina ima očitne težave pri zbiranju teh podatkov od 21 milijonov študentov. Zato se odločite, da boste vzeli vzorec iz populacije, pri čemer uporabljate le 4000 študentov.
Skupina si ogleduje različne lastnosti udeležencev v vzorcu in se sprašuje, ali obstaja razlika med povprečjem točk in specializacijo študentov.
V vzorcu je razvidno, da je 560 študentov študentov angleščine, 1.135 naravoslovja, 800 računalništva, 1.090 tehnike in 415 matematike.
Skupina želi uporabiti sorazmerno stratificirano vzorčenje, kjer so vzorčni sloji sorazmerni s populacijskim vzorcem.
Ustvarjanje slojev
Da bi to naredili, skupina raziskuje statistiko univerzitetnih študentov v ZDA in ugotovi uradni odstotek študentov, ki so se specializirali: 12% angleščine, 28% znanosti, 24% računalništva, 21% tehnike in 15% iz matematike.
Zato je iz stratificiranega vzorčenja ustvarjenih pet slojev. Skupina mora potrditi, da je populacijski sloj sorazmeren z vzorčnim slojem. Vendar ugotovi, da razmerja niso enaka.
Posledično mora ekipa ponovno prešteti populacijo 4.000 študentov, tokrat pa so naključno izbrali 480 (12%) angleških učencev, 1.120 (28%) znanosti, 960 (24%) računalništvo, 840 ( 21%) iz inženirstva in 600 (15%) iz matematike.
S tem imamo sorazmerni stratificirani vzorec študentov, ki zagotavlja boljšo zastopanost študentov v ZDA.
Raziskovalci bodo lahko poudarili določen sloj, opazovali različne študije ameriških študentov in opazovali različna povprečna točk.
Reference
- Adam Hayes (2019). Stratificirano naključno vzorčenje. Izvedeno iz: investstopedia.com.
- Wikipedija, brezplačna enciklopedija (2019). Stratificirano vzorčenje. Izvedeno iz: en.wikipedia.org.
- Raziskovalno (2019). Metoda stratificiranega vzorčenja. Vzeto iz: explorable.com.
- Anketa Gizmo (2019). Kaj je stratificirano vzorčenje in kdaj se uporablja? Izvedeno iz: surveygizmo.com.
- Ashley Crossman (2019). Razumevanje stratificiranih vzorcev in kako jih narediti. Misel Co Izvedeno iz: thinkco.com.
- Carlos Ochoa (2017). Naključno vzorčenje: stratificirano vzorčenje. Vzeto iz: netquest.com.