- Kako izračunati koeficient določanja?
- Ilustrativni primer
- Interpretacija
- Primeri
- - Primer 1
- Rešitev
- - Primer 2
- Rešitev
- - Primer 3
- Rešitev
- Primerjava primerjava
- Sklepi
- Reference
Koeficient določanja je število med 0 in 1, ki predstavlja del točk (x, y), ki sledijo regresijsko linijo prileganje podatkovnega niza z dvema spremenljivkama.
Znan je tudi kot dobro prileganje in ga označujemo z R 2 . Za njegovo izračunavanje se vzame količnik med varianco podatkov Ŷi, ki jih oceni regresijski model, in varianco podatkov Yi, ki ustreza vsakemu Xi podatkov.
R 2 = Sy / Sy

Slika 1. Koeficient korelacije za štiri pare podatkov. Vir: F. Zapata.
Če je 100% podatkov na liniji regresijske funkcije, potem bo koeficient določitve 1.
Nasprotno, če iz nabora podatkov in določeno funkcijo prilagajanja koeficient R 2 izkaže za enako 0,5, potem lahko rečemo, da je prilagoditev 50% zadovoljivo ali dobro.
Podobno je pri regresijski model popusti R 2 vrednosti pod 0,5, to pomeni, da je izbrana funkcija prilagoditev ne prilagodi zadovoljivo s podatki, zato je potrebno poiskati drugo funkcijo prilagajanja.
Ko je kovarianca ali korelacijski koeficient nagiba k nič, potem spremenljivke X in Y v podatkih niso povezana, in zato R 2 bo ponavadi tudi nič.
Kako izračunati koeficient določanja?
V prejšnjem razdelku je bilo rečeno, da se koeficient določanja izračuna z iskanjem količnika med odkloni:
-Ocenjeno z regresijsko funkcijo spremenljivke Y
-Ti spremenljivke Yi, ki ustreza vsakemu od spremenljivk Xi N podatkovnih parov.
Matematično rečeno, izgleda tako:
R 2 = Sy / Sy
Iz te enačbe sledi, da R 2 predstavlja delež variance razložiti z regresijski model. Alternativno R 2 lahko izračuna z uporabo naslednje formule, popolnoma ustreza prejšnjim:
R 2 = 1 - (Sε / Sy)
Kjer Sε predstavlja varianco ostankov εi = Ŷi - Yi, medtem ko je Sy varianca nabora vrednosti Yi podatkov. Za določitev Ŷi uporabimo regresijsko funkcijo, kar pomeni potrditi, da je Ŷi = f (Xi).
Variacija podatkovnega niza Yi z i od 1 do N se izračuna na ta način:
Sy =
Nato nadaljujte na podoben način kot Sŷ ali Sε.
Ilustrativni primer
Za prikaz podrobnosti, kako se izračuna koeficient določanja, bomo vzeli naslednji niz štirih parov podatkov:
(X, Y): {(1, 1); (2. 3); (3, 6) in (4, 7)}.
Za ta niz podatkov je predlagano linearno regresijsko prileganje, ki je pridobljeno z metodo najmanjših kvadratov:
f (x) = 2,1 x - 1
Z uporabo te funkcije prilagajanja dobite navori:
(X, Ŷ): {(1, 1.1); (2, 3.2); (3, 5.3) in (4, 7.4)}.
Nato izračunamo aritmetično srednjo vrednost za X in Y:
Variance Sy
Sy = / (4-1) =
= = 7.583
Varianta Sŷ
Sŷ = / (4-1) =
= = 7,35
Koeficient določitve R 2
R 2 = Sy / Sy = 7,35 / 7,58 = 0,97
Interpretacija
Koeficient določitve za ilustrativni primer iz prejšnjega segmenta se je izkazal za 0,98. Z drugimi besedami, linearna prilagoditev skozi funkcijo:
f (x) = 2,1 x 1
98% zanesljivo razlaga podatke, s katerimi so bili pridobljeni po metodi najmanjših kvadratov.
Poleg koeficienta določitve obstaja koeficient linearne korelacije ali znan tudi kot Pearsonov koeficient. Ta koeficient, označen kot r, se izračuna z naslednjim razmerjem:
r = Sxy / (Sx Sy)
Tu števec predstavlja kovarijanco med spremenljivkama X in Y, imenovalec pa je produkt standardnega odklona za spremenljivko X in standardnega odklona za spremenljivko Y.
Pearsonov koeficient lahko sprejme vrednosti med -1 in +1. Kadar je ta koeficient enak +1, obstaja neposredna linearna korelacija med X in Y. Če se namesto tega nagiba k -1, obstaja linearna korelacija, ko pa naraste X, se zmanjša. Končno je blizu 0, ni povezave med dvema spremenljivkama.
Treba je opozoriti, da koeficient določitve sovpada s kvadraturom Pearsonovega koeficienta, le če je bil prvi izračunan na podlagi linearnega prileganja, vendar ta enakost ne velja za druge nelinearne prileganje.
Primeri
- Primer 1
Skupina srednješolcev si je prizadevala določiti empirični zakon za obdobje nihala kot funkcijo njegove dolžine. Za dosego tega cilja opravijo vrsto meritev, s katerimi merijo čas nihanja nihala za različne dolžine, pri čemer dobijo naslednje vrednosti:
| Dolžina (m) | Obdobje (i) |
|---|---|
| 0,1 | 0,6 |
| 0,4 | 1,31 |
| 0,7 | 1.78 |
| eno | 1,93 |
| 1.3 | 2.19 |
| 1.6 | 2.66 |
| 1.9 | 2,77 |
| 3 | 3,62 |
Zahteva se, da naredi podatke o razpršitvi podatkov in izvede regresijo linearnega prileganja. Pokažite tudi regresijsko enačbo in njen koeficient določanja.
Rešitev

Slika 2. Graf rešitve za vajo 1. Vir: F. Zapata.
Opaziti je mogoče dokaj visok koeficient določanja (95%), zato bi bilo mogoče misliti, da je linearno prileganje optimalno. Če pa se točke gledajo skupaj, se zdi, da imajo tendenco, da se ukrivijo navzdol. O tej podrobnosti v linearnem modelu ne razmišljajo.
- Primer 2
Za iste podatke iz primera 1 naredite razčlenitev podatkov. Ob tej priložnosti se za razliko od primera 1 zahteva regresijska prilagoditev s pomočjo potencialne funkcije.

Slika 3. Graf raztopine za vajo 2. Vir: F. Zapata.
Pokažite tudi funkcijo prileganja in njen koeficient določanja R 2 .
Rešitev
Potencialna funkcija ima obliko f (x) = Ax B , kjer sta A in B konstanti, ki ju določimo z metodo najmanjših kvadratov.
Prejšnja slika prikazuje potencialno funkcijo in njene parametre, pa tudi koeficient določanja z zelo visoko vrednostjo 99%. Opazite, da podatki sledijo ukrivljenosti linije trenda.
- Primer 3
Z istimi podatki iz primera 1 in primera 2 izvedite polinom drugo stopnjo. Pokažite graf, ustrezen polinom in ustrezni koeficient določitve R 2 .
Rešitev

Slika 4. Graf rešitve za vajo 3. Vir: F. Zapata.
Z polinomom druge stopnje lahko vidite trendno črto, ki se dobro prilega ukrivljenosti podatkov. Koeficient določitve je nad linearnim prileganjem in pod potencialnim prileganjem.
Primerjava primerjava
Od treh prikazanih primerov je potencialno ustrezen tisti z najvišjim koeficientom določitve (primer 2).
Potencialno prileganje sovpada s fizikalno teorijo nihala, ki, kot je znano, določa, da je obdobje nihala sorazmerno s kvadratnim korenom njegove dolžine, pri čemer je konstanta sorazmernosti 2π / √g, kjer je g pospešek gravitacije.
Ta vrsta potencialnega prileganja nima le najvišjega koeficienta določanja, temveč se eksponent in konstanta sorazmernosti ujemata s fizičnim modelom.
Sklepi
- Prilagoditev regresije določa parametre funkcije, katere cilj je razložiti podatke z metodo najmanjših kvadratov. Ta metoda je sestavljena iz zmanjšanja vsote kvadratne razlike med prilagoditveno vrednostjo Y in vrednostjo Yi podatkov za vrednosti Xi podatkov. To določa parametre funkcije uglaševanja.
-Kot smo videli, je najpogostejša funkcija prilagajanja črta, vendar ni edina, saj so prilagoditve lahko tudi polinomske, potencialne, eksponentne, logaritmične in druge.
-V vsakem primeru je koeficient določanja odvisen od podatkov in vrste prilagoditve in je pokazatelj dobrosti uporabljene prilagoditve.
-Na koncu koeficient določitve označuje odstotek skupne spremenljivosti med vrednostjo Y glede na vrednost of prilagoditve za dani X.
Reference
- González C. Splošna statistika. Pridobljeno: tarwi.lamolina.edu.pe
- IACS. Aragonski inštitut za zdravstvene vede. Pridobljeno: ics-aragon.com
- Salazar C. in Castillo S. Osnovna načela statistike. (2018). Obnovljeno iz: dspace.uce.edu.ec
- Superprof. Koeficient določitve. Pridobljeno: superprof.es
- USAC. Opisni statistični priročnik. (2011). Pridobljeno iz: statistics.ingenieria.usac.edu.gt.
- Wikipedija. Koeficient določitve. Pridobljeno: es.wikipedia.com.
