- Vrste stopenj svobode
- V mehaničnem primeru
- V nizu naključnih vrednosti
- Primeri
- Različnost in stopnje svobode
- V distribuciji kvadratov Chi
- V testu hipotez (z rešenim primerom)
- Reference
V prostostne stopnje v statistiki je število neodvisnih komponent naključnega vektorja. Če ima vektor n komponent in obstajajo p linearne enačbe, ki se nanašajo na njegove komponente, potem je stopnja svobode np.
Koncept stopenj svobode se pojavlja tudi v teoretični mehaniki, kjer približno enačijo dimenzijo prostora, kjer se delček premika, minus število vezi.

Slika 1. Nihalo se giblje v dveh dimenzijah, vendar ima le eno stopnjo svobode, ker se je prisiljena premikati v loku polmera L. Vir: F. Zapata.
Ta članek bo obravnaval koncept stopenj svobode, ki se uporablja za statistiko, mehanski primer pa je lažje prikazati v geometrijski obliki.
Vrste stopenj svobode
Način izračuna števila stopinj svobode se lahko razlikuje, odvisno od konteksta, v katerem se uporablja, vendar je osnovna ideja vedno enaka: skupne dimenzije, manjše število omejitev.
V mehaničnem primeru
Upoštevajmo nihajni delček, vezan na vrvico (nihalo), ki se premika v navpični xy ravnini (2 dimenziji). Vendar pa se mora delček gibati po obodu polmera, ki je enak dolžini akorda.
Ker se delček lahko premika samo po tej krivulji, je število stopenj svobode 1. To lahko vidimo na sliki 1.
Število stopinj svobode lahko izračunamo tako, da upoštevamo razliko števila dimenzij, zmanjšanih za število omejitev:
stopinj svobode: = 2 (dimenzije) - 1 (ligatura) = 1
Druga razlaga, ki nam omogoča doseči rezultat, je naslednja:
-Vemo, da je položaj v dveh dimenzijah predstavljen s točko koordinat (x, y).
-Ampak, ker mora biti točka v skladu z enačbo obsega (x 2 + y 2 = L 2 ) za določeno vrednost spremenljivke x, se spremenljivka y določi z enačbo ali omejitvijo.
Na ta način je samo ena od spremenljivk neodvisna in sistem ima eno (1) stopnjo svobode.
V nizu naključnih vrednosti
Za ponazoritev, kaj pojem pomeni, predpostavimo, da je vektor
x = (x 1 , x 2 ,…, x n )
Predstavlja vzorec n normalno razporejenih naključnih vrednosti. V tem primeru ima naključni vektor x n neodvisnih komponent, zato naj bi imel x stopnjo svobode.
Zdaj konstruirajmo vektor r ostankov
r = (x 1 -
Kje
Torej vsoto
(x 1 -
Gre za enačbo, ki predstavlja omejitev (ali vezavo) v elementih vektorja r ostankov, saj če so n-1 komponente vektorja r znane , restriktivna enačba določa neznano komponento.
Zato je vektor r dimenzije n z omejitvijo:
∑ (x i -
Ima (n - 1) stopnje svobode.
Ponovno velja, da je izračun števila stopinj svobode:
stopinj svobode: = n (dimenzije) - 1 (omejitve) = n-1
Primeri
Različnost in stopnje svobode
Variance s 2 je definirana kot sredina kvadrata deviacij (ali ostankov) vzorca n podatkov:
s 2 = ( r • r ) / (n-1)
kjer je r vektor ostankov r = (x1 -
s 2 = ∑ (x i -
Vsekakor je treba upoštevati, da se pri izračunu povprečja kvadrata ostankov deli s (n-1) in ne s n, saj je, kot je razvidno v prejšnjem razdelku, število stopenj svobode vektorja r ( n-1).
Če bi za izračun variance delili z n namesto na (n-1), bi imel rezultat pristranskost, ki je zelo pomembna za vrednosti n manj kot 50.
V literaturi se formula variance pojavi tudi z deliteljem n namesto z (n-1), kadar gre za variacijo populacije.
Toda množica naključne spremenljivke ostankov, ki jo predstavlja vektor r , čeprav ima dimenzijo n, ima le (n-1) stopnje svobode. Če pa je število podatkov dovolj veliko (n> 500), se obe formuli zbližata z enakim rezultatom.
Kalkulatorji in preglednice ponujajo tako različice variance kot standardni odklon (kar je kvadratni koren variance).
Naše priporočilo je glede na predstavljeno analizo vedno izbrati različico z (n-1) vsakič, ko je treba izračunati odstopanje ali standardni odklon, da se izognemo pristranskim rezultatom.
V distribuciji kvadratov Chi
Nekatere porazdelitve verjetnosti v neprekinjeni naključni spremenljivki so odvisne od parametra, imenovanega stopnja svobode, to je primer porazdelitve kvadrata Chi (χ 2 ).
Ime tega parametra izhaja natančno iz stopenj svobode osnovnega naključnega vektorja, za katerega velja ta porazdelitev.
Recimo, da imamo g populacije, iz katerih so bili odvzeti vzorci velikosti n:
X 1 = (x1 1 , x1 2 ,… ..x1 n )
X2 = (x2 1 , x2 2 ,… ..x2 n )
….
X j = (xj 1 , xj 2 ,… ..xj n )
….
Xg = (xg 1 , xg 2 ,… ..xg n )
Populacija j, ki ima srednjo vrednost
Standardizirana ali normalizirana spremenljivka zj i je opredeljena kot:
zj i = (xj i -
In vektor Zj je opredeljen tako:
Zj = ( zj 1 , zj 2 ,…, zj i ,…, zj n ) in sledi standardizirani normalni porazdelitvi N (0,1).
Torej spremenljivka:
Q = ((z1 1 ^ 2 + z2 1 ^ 2 +…. + Zg 1 ^ 2),…., (Z1 n ^ 2 + z2 n ^ 2 +…. + Zg n ^ 2))
sledi porazdelitvi χ 2 (g), ki se imenuje hi-kvadratna porazdelitev s stopnjo svobode g.
V testu hipotez (z rešenim primerom)
Če želite preizkusiti hipoteze na podlagi določenega niza naključnih podatkov, morate vedeti število stopinj svobode g, če želite uporabiti test Chi-kvadrat.

Slika 2. Ali obstaja razmerje med prednostjo sladoleda ZAČETEK in SPODNJEGA SPOLA? Vir: F. Zapata.
Kot primer bodo analizirani podatki o preferencah čokoladnega ali jagodnega sladoleda med moškimi in ženskami v določenem sladoledu. Pogostost, s katero moški in ženske izbirajo jagode ali čokolado, je povzeta na sliki 2.
Najprej se izračuna tabela pričakovanih frekvenc, ki se pripravi tako, da se množi število vrstic na skupno število stolpcev, deljeno s skupnimi podatki. Rezultat je prikazan na naslednji sliki:

Slika 3. Izračun pričakovanih frekvenc na podlagi opazovanih frekvenc (vrednosti v modri barvi na sliki 2). Vir: F. Zapata.
Nato se izračuna kvadrat Chi (iz podatkov) po naslednji formuli:
χ 2 = ∑ (F o - F e ) 2 / F e
Kjer so F o opazovane frekvence (slika 2) in F e pričakovane frekvence (slika 3). Povzetek gre čez vse vrstice in stolpce, ki v našem primeru dajejo štiri izraze.
Po opravljenih operacijah dobite:
χ 2 = 0,2043.
Zdaj je treba primerjati s teoretičnim Chi kvadratom, ki je odvisen od števila stopinj svobode g.
V našem primeru je to število določeno na naslednji način:
g = (# vrstice - 1) (# stolpci - 1) = (2 - 1) (2 - 1) = 1 * 1 = 1.
Izkaže se, da je število stopinj svobode g v tem primeru 1.
Če želite preveriti ali zavrniti ničelno hipotezo (H0: ni povezave med TASTE in spolom) s stopnjo pomembnosti 1%, se teoretična Chi-kvadratna vrednost izračuna s stopnjo svobode g = 1.
Išče se vrednost, zaradi katere je akumulirana frekvenca (1 - 0,01) = 0,99, torej 99%. Ta vrednost (ki jo lahko dobite iz tabel) je 6.636.
Ker teoretični Chi presega izračunano, potem je nična hipoteza preverjena.
Z drugimi besedami, z zbranimi podatki ni opaziti nobene povezave med spremenljivkama TASTE in SPOL.
Reference
- Minitab. Kakšne so stopnje svobode? Pridobljeno: support.minitab.com.
- Moore, David. (2009) Osnovne uporabne statistike. Antoni Bosch urednik.
- Leigh, Jennifer. Kako izračunati stopnje svobode v statističnih modelih. Pridobljeno: geniolandia.com
- Wikipedija. Stopnja svobode (statistika). Pridobljeno: es.wikipedia.com
- Wikipedija. Stopnja svobode (fizična). Pridobljeno: es.wikipedia.com
