- Velikost vzorca
- 1. primer: velikost prebivalstva ni znana
- Ravni zaupanja in ustrezne Z-vrednosti
- Primer 2: velikost prebivalstva je znana
- Primeri
- Ankete in vprašalniki
- QA
- Prednost
- Slabosti
- Vaja rešena
- Rešitev
- Reference
Naključno vzorčenje je, kako izbrati statistično reprezentativen vzorec iz določene populacije. Del načela, da mora biti vsak element v vzorcu enak verjetnosti, da bo izbran.
Žreb je primer naključnega vzorčenja, v katerem je vsakemu članu populacije udeležencev dodeljeno število. Za izbiro številk, ki ustrezajo nagradnim nagradam (vzorec), se uporablja neka naključna tehnika, na primer iz nabiralnika izvleči številke, ki so bile zapisane na identične kartice.
Slika 1. Pri naključnem vzorčenju se vzorec naključno vzame iz populacije s tehniko, ki zagotavlja, da imajo vsi elementi enako verjetnost, da so bili izbrani. Vir: netquest.com.
Pri naključnem vzorčenju je bistvenega pomena pravilno izbrati velikost vzorca, saj lahko reprezentativni vzorec populacije zaradi statističnih nihanj privede do napačnih zaključkov.
Velikost vzorca
Obstajajo formule za določitev ustrezne velikosti vzorca. Najpomembnejši dejavnik, ki ga je treba upoštevati, je, ali je znana velikost prebivalstva ali ne. Poglejmo formule za določitev velikosti vzorca:
1. primer: velikost prebivalstva ni znana
Kadar velikost populacije N ni znana, je mogoče izbrati vzorec ustrezne velikosti n, da ugotovimo, ali je določena hipoteza resnična ali napačna.
Za to se uporablja naslednja formula:
Kje:
-p je verjetnost, da je hipoteza resnična.
-q je verjetnost, da ni, zato je q = 1 - p.
-E je relativna meja napake, na primer napaka 5% ima mejo E = 0,05.
-Z je povezan s stopnjo zaupanja, ki jo zahteva študija.
V standardizirani (ali normalizirani) normalni porazdelitvi ima stopnja zaupanja 90% Z = 1.645, ker je verjetnost, da je rezultat med -1.645σ in + 1.645σ, 90%, kjer je σ standardni odklon .
Ravni zaupanja in ustrezne Z-vrednosti
1.- 50-odstotna stopnja zaupanja ustreza Z = 0,675.
2.- 68,3% stopnja zaupanja ustreza Z = 1.
3.- 90-odstotna stopnja zaupanja je enaka Z = 1.645.
4.- 95-odstotna stopnja zaupanja ustreza Z = 1,96
5.- 95,5% stopnja zaupanja ustreza Z = 2.
6.- 99.7% stopnja zaupanja je enaka Z = 3.
Primer, kjer bi lahko uporabili to formulo, bi bil v študiji za določitev povprečne teže kamenčkov na plaži.
Jasno je, da vseh kamenčkov na plaži ni mogoče preučiti in tehtati, zato je priporočljivo, da vzorec izvlečete čim bolj naključno in z ustreznim številom elementov.
Slika 2. Za preučevanje značilnosti kamenčkov na plaži je treba izbrati naključni vzorec z reprezentativnim številom njih. (Vir: pixabay)
Primer 2: velikost prebivalstva je znana
Ko je znano število N elementov, ki sestavljajo določeno populacijo (ali vesolje), če želimo s preprostim naključnim vzorčenjem izbrati statistično pomemben vzorec velikosti n, je to enačba:
Kje:
-Z je koeficient, povezan s stopnjo zaupanja.
-p je verjetnost uspeha hipoteze.
-q je verjetnost neuspeha v hipotezi, p + q = 1.
-N je velikost celotne populacije.
-E je relativna napaka rezultata študije.
Primeri
Metodologija za odvzem vzorcev je veliko odvisna od vrste študije, ki jo je treba opraviti. Zato ima naključno vzorčenje neskončno število aplikacij:
Ankete in vprašalniki
Na primer, v telefonskih anketah se osebe, s katerimi se posvetujemo, izberejo z uporabo generatorja naključnih števil, ki velja za preučeno regijo.
Če želite uporabiti vprašalnik za zaposlene v velikem podjetju, se lahko odločite za izbiro anketirancev prek njihove številke zaposlenega ali številke osebne izkaznice.
Omenjeno številko je treba izbrati tudi naključno, na primer s pomočjo generatorja naključnih števil.
Slika 3. Vprašalnik se lahko uporabi z naključnim izbiranjem udeležencev. Vir: Pixabay.
QA
V primeru, da je študija na delih, ki jih izdeluje stroj, je treba dele izbrati naključno, vendar iz serij, izdelanih v različnih obdobjih dneva ali v različnih dneh ali tednih.
Prednost
Enostavno naključno vzorčenje:
- Omogoča zmanjšanje stroškov statistične študije, saj ni treba preučevati celotne populacije, da bi dobili statistično zanesljive rezultate, z želenimi stopnjami zaupanja in stopnjo napake, ki jo zahteva študija.
- Izogibajte se pristranskosti: ker je izbira elementov, ki jih je treba preučiti, povsem naključna, študija zvesto odraža značilnosti prebivalstva, čeprav je bil proučen le del.
Slabosti
- Metoda ni primerna v primerih, ko želite vedeti o preferencah v različnih skupinah ali slojih prebivalstva.
V tem primeru je bolje predhodno določiti skupine ali segmente, na katerih naj bi se študija izvajala. Ko so določeni sloji ali skupine, potem, če je za vsako od njih primerno, uporabiti naključno vzorčenje.
- Zelo malo verjetno je, da bodo informacije pridobljene o manjšinskih sektorjih, za katere je včasih treba poznati njihove značilnosti.
Na primer, če gre za kampanjo za drag izdelek, je treba poznati preference najbogatejših manjšinskih sektorjev.
Vaja rešena
Želimo preučiti prednost prebivalstva za določeno pijačo s kola, vendar pri tej populaciji ni nobene prejšnje študije, katere velikost ni znana.
Po drugi strani mora biti vzorec reprezentativen z minimalno 90-odstotno stopnjo zaupanja, zaključki pa morajo imeti 2-odstotno odstotno napako.
-Kako določiti velikost n vzorca?
-Kakšna bi bila velikost vzorca, če bi bila mera napak bolj prilagodljiva na 5%?
Rešitev
Ker velikost populacije ni znana, se za določitev velikosti vzorca uporablja zgornja formula:
n = (Z 2 p q) / (E 2 )
Predvidevamo, da je za našo znamko brezalkoholnih pijač enaka verjetnost dajanja prednosti (p), tako da je p = q = 0,5.
Po drugi strani mora imeti rezultat študije odstotno napako manj kot 2%, potem bo relativna napaka E znašala 0,02.
Končno vrednost Z = 1.645 ustvari 90-odstotno stopnjo zaupanja.
Če povzamemo, imamo naslednje vrednosti:
Z = 1.645
p = 0,5
q = 0,5
E = 0,02
S temi podatki se izračuna najmanjša velikost vzorca:
n = (1.645 2 0.5 0.5) / (0.02 2 ) = 1691.3
To pomeni, da mora imeti študija z zahtevano mero napake in z izbrano stopnjo zaupanja vzorec anketirancev vsaj 1692 posameznikov, izbranih s preprostim naključnim vzorčenjem.
Če odstopate od 2 do 5%, je nova velikost vzorca:
n = (1.645 2 0.5 0.5) / (0,05 2 ) = 271
Kar je bistveno manjše število posameznikov. Za zaključek je velikost vzorca zelo občutljiva na želeno mero napake v študiji.
Reference
- Berenson, M. 1985. Statistika za management in ekonomijo, koncepte in aplikacije. Uredništvo Interamericana.
- Statistika. Naključno vzorčenje. Izvedeno iz: encyclopediaeconomica.com.
- Statistika. Vzorčenje. Pridobljeno: Estadistica.mat.uson.mx.
- Raziskovalno. Naključno vzorčenje. Pridobljeno od: explorable.com.
- Moore, D. 2005. Uporabljena osnovna statistika. 2. Izdaja.
- Netquest. Naključno vzorčenje. Pridobljeno: netquest.com.
- Wikipedija. Statistično vzorčenje. Pridobljeno: en.wikipedia.org