- Formule in enačbe
- Pomembne statistične spremenljivke
- Model in lastnosti
- Glavne lastnosti hipergeometrične porazdelitve
- Približevanje z binomno porazdelitvijo
- Primer 2
- Rešene vaje
- Vaja 1
- Rešitev
- Vaja 2
- Rešitev
- Vaja 3
- Rešitev za
- Rešitev c
- Reference
Hipergeometrična porazdelitev je diskretna statistična funkcija, ki je primerna za izračun verjetnosti v randomiziranih poskusih z dvema možnih izidov. Pogoj za njegovo uporabo je, da gre za majhne populacije, v katerih ekstrakcije niso nadomeščene in verjetnosti niso konstantne.
Zato, ko je izbran element populacije, da pozna rezultat (resničen ali napačen) določene značilnosti, tega istega elementa ni mogoče izbrati znova.

Slika 1. V tej populaciji boltov zagotovo obstajajo okvarjeni osebki. Vir: Pixabay.
Zagotovo je verjetno, da bo naslednji izbrani element resničen rezultat, če bi prejšnji element imel negativen rezultat. To pomeni, da se verjetnost spreminja, ko se elementi vzamejo iz vzorca.
Glavne aplikacije hipergeometrične porazdelitve so: kontrola kakovosti v procesih z malo populacije in izračun verjetnosti v igrah na srečo.
Kar zadeva matematično funkcijo, ki določa hipergeometrično porazdelitev, je sestavljena iz treh parametrov, ki so:
- Število elementov populacije (N)
- velikost vzorca (m)
- Število dogodkov v celotni populaciji z ugodnim (ali neugodnim) rezultatom preučene značilnosti (n).
Formule in enačbe
Formula hipergeometrične porazdelitve daje verjetnost P, da se pojavijo x ugodni primeri določene značilnosti. Način matematičnega pisanja na podlagi kombinatoričnih številk je:

V prejšnjem izrazu N, n in m so parametri in x je spremenljivka.
- Skupno prebivalstvo je N.
-Število pozitivnih rezultatov določene binarne značilnosti glede na celotno populacijo je n.
-Kvaliteta elementov v vzorcu je m.
V tem primeru je X naključna spremenljivka, ki prevzame vrednost x in P (x) kaže na verjetnost pojava x ugodnih primerov proučene značilnosti.
Pomembne statistične spremenljivke
Druge statistične spremenljivke za hipergeometrično porazdelitev so:
- Srednja μ = m * n / N
- varianta σ ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1)
- standardni odklon σ, ki je kvadratni koren variance.
Model in lastnosti
Da pridemo do modela hipergeometrične porazdelitve, izhajamo iz verjetnosti, da dobimo x ugodne primere v vzorcu velikosti m. Ta vzorec vsebuje elemente, ki ustrezajo preučevani lastnosti, in elemente, ki ne.
Spomnimo, da n predstavlja število ugodnih primerov v celotni populaciji N elementov. Potem bi se verjetnost izračunala tako:
Z navedenim v obliki kombinatoričnih številk dobimo naslednji model porazdelitve verjetnosti:

Glavne lastnosti hipergeometrične porazdelitve
To so:
- Vzorec mora biti vedno majhen, tudi če je populacija velika.
- Elemente vzorca izvlečemo enega za drugim, ne da bi jih ponovno vključili v populacijo.
- Lastnost, ki jo je treba preučevati, je binarna, torej lahko sprejme le dve vrednosti: 1 ali 0 ali resnično ali napačno.
V vsakem koraku ekstrakcije elementov se verjetnost spremeni glede na prejšnje rezultate.
Približevanje z binomno porazdelitvijo
Druga lastnost hipergeometrične porazdelitve je ta, da jo lahko približamo z binomno porazdelitvijo, označeno s Bi, dokler je populacija N velika in vsaj 10-krat večja od vzorca m. V tem primeru bi bilo videti tako:
Verjetnost okvare x = 3 v vzorcu je: P (500, 5, 60, 3) = 0,0129.
Verjetnost okvare x = 4 vijakov iz šestdeset vzorcev je: P (500, 5, 60; 4) = 0,0008.
Končno je verjetnost, da so v tem vzorcu okvarjeni x = 5 vijakov: P (500, 5, 60; 5) = 0.
Če pa želite vedeti, kakšna je verjetnost, da je v tem vzorcu več kot tri okvarjene vijake, morate pridobiti kumulativno verjetnost in dodati:
Ta primer je prikazan na sliki 2, pridobljeni z uporabo brezplačne programske opreme GeoGebra, ki se pogosto uporablja v šolah, zavodih in univerzah.

Slika 2. Primer hipergeometrične porazdelitve. Pripravil F. Zapata z GeoGebra.
Primer 2
Španska paluba ima 40 kart, od tega 10 zlata, preostalih 30 pa ne. Predpostavimo, da je iz te palube narisano 7 kart, ki niso ponovno združene v krov.
Če je X število zlatov, ki so prisotne v 7 narisanih kartah, je verjetnost, da boste imeli x zlata v risbi s 7 karticami, podana hipergeometrična porazdelitev P (40,10,7; x).
Poglejmo takole: za izračun verjetnosti 4 zlata v risbi s 7 kartic uporabimo formulo hipergeometrične porazdelitve z naslednjimi vrednostmi:

In rezultat je: 4,57% verjetnost.
Če pa želite vedeti verjetnost, da boste dobili več kot 4 kartice, morate dodati:
Rešene vaje
Naslednji sklop vaj je namenjen ponazoritvi in usvajanju konceptov, predstavljenih v tem članku. Pomembno je, da jih bralec poskuša rešiti sam, preden pogleda rešitev.
Vaja 1
Tovarna kondomov je ugotovila, da je od vsakih 1000 kondomov, ki jih proizvede določen stroj, 5 pokvarjenih. Za nadzor kakovosti se naključno vzame 100 kondomov in se partija zavrne, če je vsaj en ali več napak. Odgovor:
a) Kakšna je možnost, da bo veliko 100 zavrženih?
b) Ali je to merilo nadzora kakovosti učinkovito?
Rešitev
V tem primeru se bodo pojavile zelo velike kombinatorne številke. Izračun je težaven, razen če imate primeren programski paket.
Ker pa gre za veliko populacijo in je vzorec desetkrat manjši od celotne populacije, je mogoče uporabiti približek hipergeometrične porazdelitve z binomno porazdelitvijo:
V zgornjem izrazu C (100, x) je kombinatorična številka. Potem se bo verjetnost nastanka več kot enega napako izračunala tako:
Odličen približek je, če ga primerjamo z vrednostjo, pridobljeno z uporabo hipergeometrične porazdelitve: 0,4102
Lahko rečemo, da je treba s 40-odstotno verjetnostjo zavreči serijo 100 profilaktikov, kar ni zelo učinkovito.
Ker pa bi bili v postopku nadzora kakovosti nekoliko manj zahtevni in se lot 100 zavrže le, če obstajata dva ali več pomanjkljivosti, bi verjetnost zavrnitve serije padla na samo 8%.
Vaja 2
Stroj iz plastičnega bloka deluje tako, da na vsakih 10 kosov pride en deformiran. Kako velika je verjetnost, da je v enem vzorcu 5 kosov pokvarjen?
Rešitev
Prebivalstvo: N = 10
Število n napak za vsakega N: n = 1
Velikost vzorca: m = 5

Zato obstaja 50-odstotna verjetnost, da bo v vzorcu 5 blok deformiran.
Vaja 3
Na srečanju mladih maturantov je 7 gospe in 6 gospodov. Med dekleti so bile 4 študije humanistike in 3 znanosti. V skupini dečkov 1 študij humanistike in 5 znanosti. Izračunajte naslednje:
a) Naključno izberejo tri dekleta: kako verjetno je, da vsa študirajo humanistiko?
b) Če so trije udeleženci srečanja prijateljev izbrani naključno: Kakšna je možnost, da trije, ne glede na spol, študirajo naravoslovje vsi trije, ali humanistiko tudi vse tri?
c) Zdaj naključno izberite dva prijatelja in pokličite x naključno spremenljivko "število tistih, ki študirajo humanistiko". Med izbranima dvema določite povprečno ali pričakovano vrednost x in varianco σ ^ 2.
Rešitev za
Uporabljene vrednosti so:
-Policija: N = 14
-Kvaliteta, ki preučuje črke, je: n = 6 in
-Velikost vzorca: m = 3.
-Število prijateljev, ki študirajo humanistične vede: x
Glede na to x = 3 pomeni, da vse tri študirajo humanistike, x = 0 pa pomeni, da nobena ne preučuje humanistike. Verjetnost, da vsi trije študirajo enako, je podana z vsoto:
P (14, 6, 3, x = 0) + P (14, 6, 3, x = 3) = 0,0560 + 0,1539 = 0,2099
Potem imamo 21-odstotno verjetnost, da bodo trije udeleženci sestankov, izbrani naključno, preučili isto stvar.
Rešitev c
Tu imamo naslednje vrednosti:
N = 14 celotne populacije prijateljev, n = 6 skupno število v populaciji, ki preučuje humanistične vede, velikost vzorca je m = 2.
Upanje je:
E (x) = m * (n / N) = 2 * (6/14) = 0,8572
In varianta:
σ (x) ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1) = 2 * (6/14) * (1-6 / 14) * ( 14-2) / (14-1) =
= 2 * (6/14) * (1-6 / 14) * (14-2) / (14-1) = 2 * (3/7) * (1-3 / 7) * (12) / ( 13) = 0,4521
Reference
- Diskretne verjetnostne porazdelitve. Pridobljeno: biplot.usal.es
- Statistika in verjetnost. Hipergeometrična porazdelitev. Pridobljeno: projektdescartes.org
- CDPYE-UGR. Hipergeometrična porazdelitev. Pridobljeno: ugr.es
- Geogebra. Klasična geogebra, verjetnostno računanje. Pridobljeno z geogebra.org
- Poskusite enostavno. Rešeni problemi hipergeometrične porazdelitve. Pridobljeno: probafacil.com
- Minitab. Hipergeometrična porazdelitev. Pridobljeno: support.minitab.com
- Univerza v Vigu. Glavne diskretne porazdelitve. Obnovljeno iz: anapg.webs.uvigo.es
- Vitutor. Statistika in kombinatorika. Pridobljeno: vitutor.net
- Weisstein, Eric W. Hipergeometrična porazdelitev. Pridobljeno: mathworld.wolfram.com
- Wikipedija. Hipergeometrična porazdelitev. Pridobljeno: es.wikipedia.com
