- Primeri
- Razvrstitev kategorijskih spremenljivk
- Nominalne kategorije
- Navadni kategorični
- Binarne kategorije
- Statistika s kategoričnimi spremenljivkami
- Grafični prikaz kategoričnih spremenljivk
- Rešene vaje
- Vaja 1
- Primer 2
- Primer 3
- Reference
Kategorično spremenljivka je tista uporablja v statistiki za dodelitev niso številčno ali kakovostno značilnost ali lastnost nekega objekta, posameznika, osebe, stanja ali postopek. Možno je določiti vse vrste kategoričnih spremenljivk glede na vsako potrebo.
Primeri kategoričnih spremenljivk so: barva, spol, krvna skupina, zakonski stan, vrsta gradiva, način plačila ali vrsta bančnega računa, ki jih veliko uporabljamo.

Slika 1: Barva je kategorična spremenljivka. Vir: pixabay
Zgoraj so spremenljivke, vendar so njihove možne vrednosti kvalitativne, torej kakovostne ali značilne in ne številčne meritve. Na primer, možne vrednosti spremenljivega spola so: moški, h embra.
Ko je ta spremenljivka shranjena v računalniškem programu, jo lahko deklariramo kot besedilno spremenljivko in edine sprejete vrednosti bodo tiste, ki so že imenovane: Moški, Ženska.
Vendar pa lahko isti spremenljiv spol deklariramo in shranimo kot celo število, če je moški dodeljen 1 in ženski dodeljena vrednost 2. Zaradi tega se kategorične spremenljivke včasih imenujejo našteta vrsta.
Glavna značilnost kategoričnih spremenljivk je, da za razliko od drugih spremenljivk, kot so neprekinjene in diskretne spremenljivke, z njimi ni mogoče opraviti aritmetike. Vendar pa je z njimi mogoče narediti statistiko, kot bomo videli kasneje.
Primeri
Upoštevajte naslednje primere kategoričnih spremenljivk in njihove možne vrednosti:
- Group_Sanguíneo, razpon vrednosti: A, B, AB, O
- Civilni_Status, kategorične vrednosti: samski (A), poročen (B), vdovec (C), razvezan (D).
- Tipo_de_Material, kategorije ali vrednosti: 1 = les, 2 = kovina, 3 = plastika
-Form_of_Payment, vrednostni papirji ali kategorije: (1) gotovina, (2) bremenitev, (3) prenos, (4) kredit
V prejšnjih primerih je bilo število z vsako kategorijo povezano na popolnoma poljuben način.
Potem bi lahko pomislili, da je ta poljubna številčna združitev enaka diskretni kvantitativni spremenljivki, vendar ni, saj aritmetičnih operacij s temi števili ni mogoče izvesti.
Za ponazoritev ideje v spremenljivki Form_of_Payment operacija vsote nima smisla:
(1) Gotovina + (2) Dolg nikoli ne bo enak (3) Prenos
Razvrstitev kategorijskih spremenljivk
Uvrstitev temelji na tem, ali imajo implicitno hierarhijo ali ne, ali je število možnih izidov večje od dveh ali dveh.
Kategorična spremenljivka z le enim možnim rezultatom ni spremenljivka, temveč kategorična konstanta.
Nominalne kategorije
Kadar jih ni mogoče zastopati s številko ali imeti naročil. Na primer, spremenljivka: Type_of_Material ima nominalne vrednosti (les, kovina, plastika), nimajo hierarhije ali vrstnega reda, tudi če je vsakemu odzivu ali kategoriji dodeljeno poljubno število.
Navadni kategorični
Spremenljivka: Academic_performance
Nominalne vrednosti: visoka, srednja, nizka
Čeprav vrednosti te spremenljivke niso numerične, imajo implicitni vrstni red ali hierarhijo.
Binarne kategorije
Gre za nominalne spremenljivke z dvema možnima odgovoroma, na primer:
-Spremenljivo: odziv
-Nominalne vrednosti: Res, napačno
Upoštevajte, da spremenljivka Response nima implicitne hierarhije in ima samo dva možna izida, torej je binarna kategorična spremenljivka.
Nekateri avtorji to vrsto imenujejo binarna spremenljivka in ne menijo, da pripada kategoričnim spremenljivkam, ki so omejene na tiste z več kot tremi možnimi kategorijami.
Statistika s kategoričnimi spremenljivkami
Statistični podatki se lahko izvajajo s kategoričnimi spremenljivkami, čeprav niso numerične ali količinske spremenljivke. Na primer, za poznavanje trenda ali najverjetnejše vrednosti kategorične spremenljivke se vzame način.
Način je v tem primeru najbolj ponovljen rezultat ali vrednost kategorične spremenljivke. Za kategorične spremenljivke ni mogoče izračunati niti srednje niti mediane.
Srednje vrednosti ni mogoče izračunati, ker aritmetike ne morete narediti s kategoričnimi spremenljivkami. Niti srednje ni, ker kvantitativne ali kategorične spremenljivke nimajo urejenosti ali hierarhije, zato ni mogoče določiti osrednje vrednosti.
Grafični prikaz kategoričnih spremenljivk
Glede na določeno kategorično spremenljivko je mogoče najti pogostost ali število ponovitev rezultata te spremenljivke. Če je to narejeno za vsak rezultat, potem je mogoče narediti graf pogostnosti glede na vsako kategorijo ali rezultat.
Tu je nekaj primerov, kako je mogoče kategorične spremenljivke grafično predstaviti.
Rešene vaje
Vaja 1
Podjetje ima podatke o 170 zaposlenih. Ena od spremenljivk, ki je v teh zapisih, je: Estado_Civil. Ta spremenljivka ima štiri kategorije ali možne vrednosti:
Samski (A), poročen (B), vdovec (C), ločen (D).
Čeprav gre za neštevilčno spremenljivko, je mogoče vedeti, koliko skupnih zapisov je v določeni kategoriji in je predstavljeno v obliki črtnega grafa, kot je prikazano na naslednji sliki:

Slika 2. Predstavitev rezultatov kategorične spremenljivke. Vir: self made
Primer 2
Trgovina s čevlji spremlja njegovo prodajo. Med spremenljivkami, ki upravljajo njihove zapise, je barva čevljev za vsak model. Spremenljivka:
Color_Shoe_Model_AW3
Je kategoričnega tipa in ima pet kategorij ali možnih vrednosti. Za vsako kategorijo te spremenljivke se število proda in določi njihov odstotek. Rezultati so predstavljeni v grafu naslednje slike:

Slika 3. Kategorična spremenljivka Barva _Shoe. V tej spremenljivki je način Bela. Vir: self made.
Potem lahko rečemo, da je v modi model čevljev AW3, ki se najpogosteje prodaja, beli, za njim pa tesno sledi črn.
Prav tako lahko rečemo, da bo naslednji 70 čevelj, ki se prodaja v tem modelu, beli ali črni.
Te informacije so lahko v trgovini koristne pri oddaji novih naročil, lahko pa celo uporabijo popuste na najmanj prodanih barvah zaradi presežka zalog.
Primer 3
Za določeno populacijo krvodajalcev želite predstavljati število ljudi, ki pripadajo določeni krvni skupini. Grafični način vizualizacije rezultatov je s piktogramom, ki je na dnu tabele.
Prvi stolpec predstavlja spremenljivko group_sanguíneo in njene možne rezultate ali kategorije. Drugi stolpec ima v ikonični ali slikovni obliki prikazano število ljudi v posamezni kategoriji. V našem primeru se kot ikona uporablja rdeča kapljica, od katerih vsaka predstavlja 10 ljudi.

Slika 4. Piktogram. Vir: self made
Reference
- Akademija Khan. Analiza kategoričnih podatkov. Pridobljeno: khanacademy.org
- Formule univerzuma. Kakovostna spremenljivka. Pridobljeno: univesoformulas.com
- Minitab. Katere so kategorične, diskretne in neprekinjene spremenljivke. Pridobljeno: support.minitab.com
- Excel vadnica. Karakterizacija spremenljivk. Pridobljeno: help.xlslat.com.
- Wikipedija. Statistična spremenljivka. Pridobljeno iz wikipedia.com
- Wikipedija. Kategorična spremenljivka. Pridobljeno iz wikipedia.com
- Wikipedija. Kategorična spremenljivka. Pridobljeno iz wikipedia.com
