Oznaka razreda , znana tudi kot sredina, je vrednost v središču razreda, ki predstavlja vse vrednosti, ki so v tej kategoriji. V bistvu se razredna znamka uporablja za izračun določenih parametrov, na primer aritmetična sredina ali standardni odklon.
Torej je oznaka razreda sredina vsakega intervala. Ta vrednost je zelo koristna tudi pri iskanju variance nabora podatkov, ki je že razvrščen v razrede, kar nam omogoča, da razumemo, kako daleč so od teh središč ti podatki.
Porazdelitev frekvenc
Da bi razumeli, kaj pomeni razred, je nujen koncept porazdelitve frekvenc. Glede na nabor podatkov je frekvenčna porazdelitev tabela, ki podatke deli na številne kategorije, ki se imenujejo razredi.
Ta tabela prikazuje število elementov, ki pripadajo vsakemu razredu; slednja je znana kot frekvenca.
Ta tabela žrtvuje del informacij, ki jih pridobimo iz podatkov, saj namesto posamezne vrednosti vsakega elementa vemo le, da pripada temu razredu.
Po drugi strani dobimo boljše razumevanje nabora podatkov, saj na ta način lažje cenimo ustaljene vzorce, kar olajša manipulacijo z omenjenimi podatki.
Koliko razredov upoštevati?
Za izvedbo frekvenčne porazdelitve moramo najprej določiti število razredov, ki jih želimo prevzeti, in izbrati njihove razredne omejitve.
Izbira, koliko razredov naj se udeleži, mora biti priročna, če upoštevamo, da lahko majhno število razredov skrije podatke o podatkih, ki jih želimo preučiti, zelo veliko pa lahko ustvari preveč podrobnosti, ki niso nujno uporabne.
Dejavniki, ki jih moramo upoštevati pri izbiri, koliko razredov bomo upoštevali, je nekaj, vendar med tema dvema izstopa: prvi je, da upoštevamo, koliko podatkov moramo upoštevati; drugo je vedeti, kako velik je razpon porazdelitve (to je razlika med največjim in najmanjšim opazovanjem).
Po tem, ko smo razrede že opredelili, nadaljujemo s štetjem, koliko podatkov obstaja v vsakem razredu. Ta številka se imenuje pogostost predavanj in je označena s fi.
Kot smo že povedali, imamo, da s frekvenčno porazdelitvijo izgubijo informacije, ki prihajajo posamično iz vsakega podatka ali opažanja. Zaradi tega se išče vrednost, ki predstavlja celoten razred, ki mu pripada; ta vrednost je oznaka razreda.
Kako se pridobi?
Oznaka razreda je osnovna vrednost, ki jo razred predstavlja. Dobimo ga tako, da dodamo meje intervala in to vrednost delimo na dva. To lahko izrazimo matematično na naslednji način:
x i = (spodnja meja + zgornja meja) / 2.
V tem izrazu x i označuje znamko i razreda.
Primer
Glede na naslednji niz podatkov navedite reprezentativno frekvenčno porazdelitev in dobite ustrezno oznako razreda.
Ker so podatki z najvišjo numerično vrednostjo 391, najnižjo pa 221, imamo razpon 391 -221 = 170.
Izbrali bomo 5 razredov, vsi z enako velikostjo. Eden od načinov izbire pouka je:
Upoštevajte, da so vsi podatki v razredu, ločeni in imajo isto vrednost. Drug način izbire razredov je tako, da podatke upoštevamo kot del neprekinjene spremenljivke, ki lahko doseže katero koli resnično vrednost. V tem primeru lahko upoštevamo razrede obrazca:
205-245, 245-285, 285-325, 325-365, 365-405
Vendar lahko tak način združevanja podatkov predstavi nekatere nejasnosti z mejami. Na primer, v primeru 245 se postavlja vprašanje: kateremu razredu pripada, prvi ali drugi?
Da bi se izognili tej zmedi, se pripravi konvencija o končni točki. Na ta način bo prvi razred interval (205,245], drugi (245,285] in tako naprej).
Ko so razredi definirani, nadaljujemo s izračunavanjem frekvence in imamo naslednjo tabelo:
Po pridobitvi frekvenčne porazdelitve podatkov nadaljujemo z iskanjem razrednih oznak vsakega intervala. Dejansko moramo:
x 1 = (205+ 245) / 2 = 225
x 2 = (245+ 285) / 2 = 265
x 3 = (285+ 325) / 2 = 305
x 4 = (325+ 365) / 2 = 345
x 5 = (365+ 405) / 2 = 385
To lahko predstavljamo z naslednjim grafom:
Za kaj gre?
Kot smo že omenili, je razredna znamka zelo funkcionalna za iskanje aritmetičnih sredin in variacije skupine podatkov, ki so že razvrščene v različne razrede.
Aritmetično srednjo vrednost lahko definiramo kot vsoto dobljenih opažanj med velikostjo vzorca. S fizičnega vidika je njegova interpretacija podobna ravnovesni točki podatkovnega niza.
Identifikacija celotnega niza podatkov z eno številko je lahko tvegana, zato je treba upoštevati tudi razliko med točko ločitve in dejanskimi podatki. Te vrednosti so znane kot odstopanje od aritmetične srednje vrednosti, s temi pa želimo ugotoviti, koliko se razlikuje aritmetična sredina podatkov.
Najpogostejši način za iskanje te vrednosti je po odstopanju, ki je povprečje kvadratov odklonov od aritmetične srednje vrednosti.
Za izračun aritmetične srednje vrednosti in variance nabora podatkov, razvrščenih v razred, uporabimo naslednje formule:
V teh izrazih je x i oznaka i-tega razreda, f i predstavlja ustrezno frekvenco in k število razredov, v katere so bili razvrščeni podatki.
Primer
S pomočjo podatkov iz prejšnjega primera smo lahko nekoliko bolj razširili podatke tabele za porazdelitev frekvenc. Dobite naslednje:
Nato nam z zamenjavo podatkov v formuli ostane aritmetična sredina kot:
Njena varianca in standardni odklon sta:
Iz tega lahko sklepamo, da imajo originalni podatki aritmetično srednjo vrednost 306,6 in standardni odklon 39,56.
Reference
- Fernandez F. Santiago, Cordoba L. Alejandro, Cordero S. Jose M. Deskriptivna statistika. Uredništvo Esic.
- Jhonson Richard A. Miller in Freund Verjetnost in državniki za inženirje.
- Miller I in Freund J. Verjetnost in državniki za inženirje. REVERT.
- Sarabia A. Jose Maria, Pascual Marta. Osnovni statistični tečaj za podjetja
- Llinás S. Humberto, Rojas A. Carlos Opisna statistika in verjetnostne porazdelitve, Universidad del Norte