NAPAKA VZORČENJA: FORMULE IN ENAČBE, IZRAČUN, PRIMERI - DUDE

Vzorčenje napaka ali vzorčenje napaka v statistiki je razlika med srednjo vrednostjo vzorca in srednje vrednosti celotnega prebivalstva. Za ponazoritev ideje si predstavljajmo, da je celotno prebivalstvo mesta milijon ljudi, od tega si želite njegovo povprečno velikost čevljev, za katero se vzame naključni vzorec tisoč ljudi.

Povprečna velikost vzorca ne bo nujno sovpadala z velikostjo celotne populacije, čeprav če vzorec ni pristranski, mora biti vrednost blizu. Ta razlika med srednjo vrednostjo vzorca in celotno populacijo je napaka vzorčenja.

Slika 1. Ker je vzorec podskupina celotne populacije, ima vrednost vzorca veliko napako. Vir: F. Zapata.

Na splošno je povprečna vrednost celotne populacije neznana, vendar obstajajo tehnike za zmanjšanje te napake in formule za oceno meje napake vzorčenja, ki bodo obravnavane v tem članku.

Formule in enačbe

Recimo, da želimo vedeti povprečno vrednost določene merljive značilnosti x pri populaciji velikosti N, ker pa je N veliko število, izvedbe študije o celotni populaciji ni izvedljivo, nato nadaljujemo z vzorčenjem naključnega vzorca velikost n <

Srednja vrednost vzorca je označena s srednja vrednost celotnega prebivalstva pa je označena z grško črko μ (beri mu ali miu).

Predpostavimo, da se odvzame m vzorcev iz celotne populacije N, vsi enaki velikosti n s srednjimi vrednostmi 1>, 2>, 3>,….m>.

Te srednje vrednosti ne bodo enake med seboj in bodo vse okoli povprečne vrednosti μ. Meja napake vzorčenja E kaže na pričakovano ločitev srednjih vrednosti glede na povprečno vrednost populacije μ v določenem odstotku, ki se imenuje stopnja zaupanja γ (gama).

Standardna meja napake ε vzorca velikosti n je:

ε = σ / √n

kjer je σ standardni odklon (kvadratni koren variance), ki se izračuna po naslednji formuli:

σ = √

Pomen standardne meje napake ε je naslednji:

Srednja vrednost dobljen z vzorcem velikosti n, je vključen v interval ( - ε, + ε) s stopnjo zaupanja 68,3%.

Kako izračunati napako vzorčenja

V prejšnjem razdelku je bila podana formula za iskanje standardne meje napake za vzorec velikosti n, kjer beseda standard kaže, da gre za napako s 68-odstotno zanesljivostjo.

To kaže, da če je bilo odvzetih več vzorcev iste velikosti n, jih bo 68% dalo povprečne vrednosti v dosegu.

Obstaja preprosto pravilo, imenovano pravilo 68-95-99.7, ki nam omogoča, da najdemo mejo napake vzorčenja E za stopnje zaupanja 68%, 95% in 99,7%, saj je ta meja 1⋅ ε, 2 ⋅ ε in 3⋅ ε.

Za raven zaupanja

Če stopnja zaupanja γ ni ena od zgornjih, je napaka vzorčenja standardni odklon σ, pomnožen s faktorjem Zγ, dobljen po naslednjem postopku:

1.- Najprej se določi stopnja pomembnosti α, ki se izračuna iz stopnje zaupanja γ po naslednjem razmerju: α = 1 - γ

2.- Nato moramo izračunati vrednost 1 - α / 2 = (1 + γ) / 2, ki ustreza nakopičeni normalni frekvenci med -∞ in Zγ, v normalni ali Gaussovi distribuciji, tipizirani F (z), katere definicija vidimo na sliki 2.

3.- Enačba F (Zγ) = 1 - α / 2 se reši s tabelami običajne porazdelitve (kumulativne) F ali s pomočjo računalniške aplikacije, ki ima obratno Gaussovo funkcijo F ^-1 .

V zadnjem primeru imamo:

Zγ = G ^-1 (1 - α / 2).

4.- Končno se ta formula uporablja za napako vzorčenja z stopnjo zanesljivosti γ:

E = Zγ ⋅ (σ / √n)

Slika 2. Tabela normalne porazdelitve. Vir: Wikimedia Commons.

Primeri

- Primer 1

Izračunajte standardno mejo napake v povprečni teži vzorca 100 novorojenčkov. Izračun povprečne teže je bil= 3.100 kg s standardnim odklonom σ = 1.500 kg.

Rešitev

Standardna meja napake je ε = σ / √n = (1500 kg) / √100 = 0,15 kg. To pomeni, da lahko s temi podatki sklepamo, da je teža 68% novorojenčkov med 2950 kg in 3,25 kg.

- Primer 2

Določite mejo napake vzorčenja E in razpon teže 100 novorojenčkov s 95-odstotno stopnjo zaupanja, če je povprečna teža 3.100 kg s standardnim odstopanjem σ = 1.500 kg.

Rešitev

Če velja pravilo 68; 95; 99,7 → 1⋅ ε; 2⋅ ε; 3⋅ ε, imamo:

E = 2⋅ε = 2⋅0,15 kg = 0,30 kg

Z drugimi besedami, 95% novorojenčkov bo imelo težo med 2800 in 3.400 kg.

- Primer 3

Določite obseg uteži novorojenčkov v primeru 1 z 99,7-odstotno stopnjo zaupanja.

Rešitev

Napaka vzorčenja z 99,7-odstotno zanesljivostjo znaša 3 σ / √n, kar je za naš primer E = 3 * 0,15 kg = 0,45 kg. Od tu izhaja, da bo 99,7% novorojenčkov tehtalo med 2.650 in 3.550 kg.

- Primer 4

Določite faktor Zγ za 75-odstotno stopnjo zaupanja. Za primer, prikazan v primeru 1, določite mejo napake vzorčenja s to stopnjo zanesljivosti.

Rešitev

Stopnja zaupanja je γ = 75% = 0,75, kar je povezano s stopnjo pomembnosti α skozi razmerje γ = (1 - α), tako da je stopnja pomembnosti α = 1 - 0,75 = 0 , 25.

To pomeni, da je kumulativna normalna verjetnost med -∞ in Zγ:

P (Z ≤ Zγ) = 1 - 0,125 = 0,875

Kar ustreza vrednosti Zγ 1.1503, kot je prikazano na sliki 3.

Slika 3. Določitev faktorja Zγ, ki ustreza 75-odstotni stopnji zaupanja. Vir: F. Zapata skozi Geogebra.

Z drugimi besedami, napaka vzorčenja je E = Zγ ⋅ (σ / √n) = 1,15 ⋅ (σ / √n).

Pri uporabi podatkov iz primera 1 poda napako:

E = 1,15 * 0,15 kg = 0,17 kg

S stopnjo zaupanja 75%.

- Vaja 5

Kakšna je stopnja zaupanja, če je Z _{α / 2} = 2,4?

Rešitev

P (Z ≤ Z _{α / 2} ) = 1 - α / 2

P (Z ≤ 2,4) = 1 - α / 2 = 0,9918 → α / 2 = 1 - 0,9918 = 0,0082 → α = 0,0164

Raven pomembnosti je:

α = 0,0164 = 1,64%

In končno, raven zaupanja ostaja:

1- α = 1 - 0,0164 = 100% - 1,64% = 98,36%

Reference

Canavos, G. 1988. Verjetnost in statistika: Aplikacije in metode. McGraw Hill.
Devore, J. 2012. Verjetnost in statistika za inženirstvo in znanost. 8. Izdaja. Zveži.
Levin, R. 1988. Statistika za skrbnike. 2. Izdaja. Dvorana Prentice.
Sudman, S. 1982. Zastavljanje vprašanj: Praktični vodnik za oblikovanje vprašalnika. San Francisco. Jossey Bass.
Walpole, R. 2007. Verjetnost in statistika za inženiring in znanosti. Pearson.
Wonnacott, TH in RJ Wonnacott. 1990. Uvodna statistika. 5. ed. Wiley
Wikipedija. Napaka vzorčenja. Pridobljeno: en.wikipedia.com
Wikipedija. Območje napake. Pridobljeno: en.wikipedia.com

NAPAKA VZORČENJA: FORMULE IN ENAČBE, IZRAČUN, PRIMERI - DUDE - 2026

Formule in enačbe

Kako izračunati napako vzorčenja

Za raven zaupanja

Primeri

- Primer 1

Rešitev

- Primer 2

Rešitev

- Primer 3

Rešitev

- Primer 4

Rešitev

- Vaja 5

Rešitev

Reference

Izbira urednika