- Formule in enačbe
- Kako izračunati napako vzorčenja
- Za raven zaupanja
- Primeri
- - Primer 1
- Rešitev
- - Primer 2
- Rešitev
- - Primer 3
- Rešitev
- - Primer 4
- Rešitev
- - Vaja 5
- Rešitev
- Reference
Vzorčenje napaka ali vzorčenje napaka v statistiki je razlika med srednjo vrednostjo vzorca in srednje vrednosti celotnega prebivalstva. Za ponazoritev ideje si predstavljajmo, da je celotno prebivalstvo mesta milijon ljudi, od tega si želite njegovo povprečno velikost čevljev, za katero se vzame naključni vzorec tisoč ljudi.
Povprečna velikost vzorca ne bo nujno sovpadala z velikostjo celotne populacije, čeprav če vzorec ni pristranski, mora biti vrednost blizu. Ta razlika med srednjo vrednostjo vzorca in celotno populacijo je napaka vzorčenja.

Slika 1. Ker je vzorec podskupina celotne populacije, ima vrednost vzorca veliko napako. Vir: F. Zapata.
Na splošno je povprečna vrednost celotne populacije neznana, vendar obstajajo tehnike za zmanjšanje te napake in formule za oceno meje napake vzorčenja, ki bodo obravnavane v tem članku.
Formule in enačbe
Recimo, da želimo vedeti povprečno vrednost določene merljive značilnosti x pri populaciji velikosti N, ker pa je N veliko število, izvedbe študije o celotni populaciji ni izvedljivo, nato nadaljujemo z vzorčenjem naključnega vzorca velikost n <
Srednja vrednost vzorca je označena s
Predpostavimo, da se odvzame m vzorcev iz celotne populacije N, vsi enaki velikosti n s srednjimi vrednostmi
Te srednje vrednosti ne bodo enake med seboj in bodo vse okoli povprečne vrednosti μ. Meja napake vzorčenja E kaže na pričakovano ločitev srednjih vrednosti
Standardna meja napake ε vzorca velikosti n je:
ε = σ / √n
kjer je σ standardni odklon (kvadratni koren variance), ki se izračuna po naslednji formuli:
σ = √
Pomen standardne meje napake ε je naslednji:
Srednja vrednost
Kako izračunati napako vzorčenja
V prejšnjem razdelku je bila podana formula za iskanje standardne meje napake za vzorec velikosti n, kjer beseda standard kaže, da gre za napako s 68-odstotno zanesljivostjo.
To kaže, da če je bilo odvzetih več vzorcev iste velikosti n, jih bo 68% dalo povprečne vrednosti
Obstaja preprosto pravilo, imenovano pravilo 68-95-99.7, ki nam omogoča, da najdemo mejo napake vzorčenja E za stopnje zaupanja 68%, 95% in 99,7%, saj je ta meja 1⋅ ε, 2 ⋅ ε in 3⋅ ε.
Za raven zaupanja
Če stopnja zaupanja γ ni ena od zgornjih, je napaka vzorčenja standardni odklon σ, pomnožen s faktorjem Zγ, dobljen po naslednjem postopku:
1.- Najprej se določi stopnja pomembnosti α, ki se izračuna iz stopnje zaupanja γ po naslednjem razmerju: α = 1 - γ
2.- Nato moramo izračunati vrednost 1 - α / 2 = (1 + γ) / 2, ki ustreza nakopičeni normalni frekvenci med -∞ in Zγ, v normalni ali Gaussovi distribuciji, tipizirani F (z), katere definicija vidimo na sliki 2.
3.- Enačba F (Zγ) = 1 - α / 2 se reši s tabelami običajne porazdelitve (kumulativne) F ali s pomočjo računalniške aplikacije, ki ima obratno Gaussovo funkcijo F -1 .
V zadnjem primeru imamo:
Zγ = G -1 (1 - α / 2).
4.- Končno se ta formula uporablja za napako vzorčenja z stopnjo zanesljivosti γ:
E = Zγ ⋅ (σ / √n)

Slika 2. Tabela normalne porazdelitve. Vir: Wikimedia Commons.
Primeri
- Primer 1
Izračunajte standardno mejo napake v povprečni teži vzorca 100 novorojenčkov. Izračun povprečne teže je bil
Rešitev
Standardna meja napake je ε = σ / √n = (1500 kg) / √100 = 0,15 kg. To pomeni, da lahko s temi podatki sklepamo, da je teža 68% novorojenčkov med 2950 kg in 3,25 kg.
- Primer 2
Določite mejo napake vzorčenja E in razpon teže 100 novorojenčkov s 95-odstotno stopnjo zaupanja, če je povprečna teža 3.100 kg s standardnim odstopanjem σ = 1.500 kg.
Rešitev
Če velja pravilo 68; 95; 99,7 → 1⋅ ε; 2⋅ ε; 3⋅ ε, imamo:
E = 2⋅ε = 2⋅0,15 kg = 0,30 kg
Z drugimi besedami, 95% novorojenčkov bo imelo težo med 2800 in 3.400 kg.
- Primer 3
Določite obseg uteži novorojenčkov v primeru 1 z 99,7-odstotno stopnjo zaupanja.
Rešitev
Napaka vzorčenja z 99,7-odstotno zanesljivostjo znaša 3 σ / √n, kar je za naš primer E = 3 * 0,15 kg = 0,45 kg. Od tu izhaja, da bo 99,7% novorojenčkov tehtalo med 2.650 in 3.550 kg.
- Primer 4
Določite faktor Zγ za 75-odstotno stopnjo zaupanja. Za primer, prikazan v primeru 1, določite mejo napake vzorčenja s to stopnjo zanesljivosti.
Rešitev
Stopnja zaupanja je γ = 75% = 0,75, kar je povezano s stopnjo pomembnosti α skozi razmerje γ = (1 - α), tako da je stopnja pomembnosti α = 1 - 0,75 = 0 , 25.
To pomeni, da je kumulativna normalna verjetnost med -∞ in Zγ:
P (Z ≤ Zγ) = 1 - 0,125 = 0,875
Kar ustreza vrednosti Zγ 1.1503, kot je prikazano na sliki 3.

Slika 3. Določitev faktorja Zγ, ki ustreza 75-odstotni stopnji zaupanja. Vir: F. Zapata skozi Geogebra.
Z drugimi besedami, napaka vzorčenja je E = Zγ ⋅ (σ / √n) = 1,15 ⋅ (σ / √n).
Pri uporabi podatkov iz primera 1 poda napako:
E = 1,15 * 0,15 kg = 0,17 kg
S stopnjo zaupanja 75%.
- Vaja 5
Kakšna je stopnja zaupanja, če je Z α / 2 = 2,4?
Rešitev
P (Z ≤ Z α / 2 ) = 1 - α / 2
P (Z ≤ 2,4) = 1 - α / 2 = 0,9918 → α / 2 = 1 - 0,9918 = 0,0082 → α = 0,0164
Raven pomembnosti je:
α = 0,0164 = 1,64%
In končno, raven zaupanja ostaja:
1- α = 1 - 0,0164 = 100% - 1,64% = 98,36%
Reference
- Canavos, G. 1988. Verjetnost in statistika: Aplikacije in metode. McGraw Hill.
- Devore, J. 2012. Verjetnost in statistika za inženirstvo in znanost. 8. Izdaja. Zveži.
- Levin, R. 1988. Statistika za skrbnike. 2. Izdaja. Dvorana Prentice.
- Sudman, S. 1982. Zastavljanje vprašanj: Praktični vodnik za oblikovanje vprašalnika. San Francisco. Jossey Bass.
- Walpole, R. 2007. Verjetnost in statistika za inženiring in znanosti. Pearson.
- Wonnacott, TH in RJ Wonnacott. 1990. Uvodna statistika. 5. ed. Wiley
- Wikipedija. Napaka vzorčenja. Pridobljeno: en.wikipedia.com
- Wikipedija. Območje napake. Pridobljeno: en.wikipedia.com
