- Piemēri
- Kategorisko mainīgo klasifikācija
- Nominālās kategorijas
- Parasts kategorisks
- Binārās kategorijas
- Statistika ar kategoriskiem mainīgajiem
- Kategorisku mainīgo lielumu grafiskais attēlojums
- Atrisināti vingrinājumi
- 1. vingrinājums
- 2. piemērs
- 3. piemērs
- Atsauces
Kategorisks mainīgais ir viens, ko izmanto statistikas datiem, lai piešķirtu nav skaitlisks vai kvalitatīvu raksturojumu vai īpašumu uz kādu objektu, individuālā, organizāciju, nosacījumu vai procedūru. Pēc katras vajadzības ir iespējams definēt visa veida kategoriskos mainīgos.
Kategorisku mainīgo piemēri ir: krāsa, dzimums, asins grupa, ģimenes stāvoklis, materiāla tips, maksājuma veids vai bankas konta tips, un tos ikdienā izmanto ļoti daudz.
1. attēls. Krāsa ir kategorisks mainīgais. Avots: pixabay
Iepriekš minētie ir mainīgie, bet to iespējamās vērtības ir kvalitatīvas, tas ir, kvalitatīvas vai raksturīgas, nevis skaitliskas. Piemēram, mainīgā dzimuma iespējamās vērtības ir: vīrietis, h embra.
Kad šis mainīgais tiek saglabāts datorprogrammā, to var deklarēt kā teksta mainīgo, un vienīgās pieņemtās vērtības būs tās, kuras jau ir nosauktas: Vīrietis, Sieviete.
Tomēr to pašu mainīgo dzimumu var deklarēt un saglabāt kā veselu skaitli, ja vīrietim ir piešķirta 1 un sievietei ir piešķirta vērtība 2. Tieši šī iemesla dēļ kategoriskos mainīgos dažreiz sauc par uzskaitīto tipu.
Kategorisko mainīgo galvenā īpašība ir tāda, ka atšķirībā no citiem mainīgajiem, piemēram, nepārtrauktajiem un diskrētajiem mainīgajiem, ar tiem nav iespējams veikt aritmētiku. Tomēr statistiku ar viņiem var veikt, kā tas būs redzams vēlāk.
Piemēri
Ņemiet vērā šādus kategorisko mainīgo un to iespējamo vērtību piemērus:
- Group_Sanguíneo, vērtību diapazons: A, B, AB, O
- Civil_Status, Kategoriskās vērtības: Vientuļš (A), precējies (B), atraitnis (C), šķīries (D).
- Tipo_de_Materiāls, kategorijas vai vērtības: 1 = koks, 2 = metāls, 3 = plastmasa
Maksājuma forma, vērtspapīri vai kategorijas: (1) skaidra nauda, (2) debets, (3) pārskaitījums, (4) kredīts
Iepriekšējos piemēros skaitlis ir bijis saistīts ar katru kategoriju pilnīgi patvaļīgā veidā.
Tad varētu domāt, ka šī patvaļīgā skaitliskā saistība padara to līdzvērtīgu diskrētam kvantitatīvajam mainīgajam, bet tā nav, jo ar šiem skaitļiem nevar veikt aritmētiskās operācijas.
Idejas ilustrēšanai mainīgajā Form_of_Payment summas operācijai nav jēgas:
(1) Nauda + (2) Debets nekad nebūs vienāds (3) Pārskaitījums
Kategorisko mainīgo klasifikācija
Klasifikācija tiek balstīta uz to, vai viņiem ir netieša hierarhija, vai arī iespējamo rezultātu skaits ir lielāks par diviem vai diviem.
Kategorisks mainīgais ar tikai vienu iespējamo iznākumu nav mainīgais, tā ir kategoriska konstante.
Nominālās kategorijas
Kad viņus nevar apzīmēt ar numuru vai viņiem nav nekādas kārtas. Piemēram, mainīgajam: Type_of_Material, ir nominālās vērtības (koks, metāls, plastmasa), tiem nav hierarhijas vai secības, pat ja katrai atbildei vai kategorijai tiek piešķirts patvaļīgs numurs.
Parasts kategorisks
Mainīgais: Academic_perfor performance
Nominālās vērtības: augsta, vidēja, zema
Kaut arī šī mainīgā vērtības nav skaitliskas, tām ir netieša secība vai hierarhija.
Binārās kategorijas
Tie ir nominālie mainīgie ar divām iespējamām atbildēm, piemēram:
-Dažādi: atbilde
-Nominālvērtības: True, False
Ņemiet vērā, ka Response mainīgajam nav netiešas hierarhijas, un tam ir tikai divi iespējamie rezultāti, tāpēc tas ir binārs kategorisks mainīgais.
Daži autori šo tipu sauc par bināro mainīgo un neuzskata to par piederīgu kategoriskiem mainīgiem, kas aprobežojas ar tiem, kuriem ir vairāk nekā trīs iespējamās kategorijas.
Statistika ar kategoriskiem mainīgajiem
Statistiku var veikt ar kategoriskiem mainīgajiem, neskatoties uz to, ka tie nav skaitliski vai kvantitatīvi. Piemēram, lai zinātu kategoriskā mainīgā tendenci vai visticamāko vērtību, tiek izvēlēts režīms.
Režīms šajā gadījumā ir kategoriskā mainīgā lielākais atkārtotais rezultāts vai vērtība. Kategoriskiem mainīgajiem nav iespējams aprēķināt ne vidējo, ne vidējo.
Vidējo vērtību nevar aprēķināt, jo jūs nevarat veikt aritmētiku ar kategoriskiem mainīgajiem. Tā nav arī mediāna, jo kvantitatīvajiem vai kategoriskajiem mainīgajiem nav kārtas vai hierarhijas, tāpēc nav iespējams noteikt centrālo vērtību.
Kategorisku mainīgo lielumu grafiskais attēlojums
Ņemot vērā noteiktu kategorisku mainīgo, var atrast šī mainīgā rezultāta atkārtošanās biežumu vai skaitu. Ja tas tiek darīts katram iznākumam, tad var izveidot biežuma grafiku attiecībā pret katru kategoriju vai iznākumu.
Šeit ir daži piemēri, kā kategoriskus mainīgos var attēlot grafiski.
Atrisināti vingrinājumi
1. vingrinājums
Uzņēmumā ir reģistrēti dati par 170 darbiniekiem. Viens no mainīgajiem lielumiem, kas atrodas šajos ierakstos, ir: Estado_Civil. Šim mainīgajam ir četras kategorijas vai iespējamās vērtības:
Neprecēts (A), precējies (B), atraitnis (C), šķīries (D).
Lai arī tas nav skaitlisks mainīgais, ir iespējams zināt, cik no visiem ierakstiem ir noteiktā kategorijā un ir attēloti joslu diagrammas veidā, kā parādīts šajā attēlā:
2. attēls. Kategoriska mainīgā rezultātu attēlojums. Avots: pašu gatavots
2. piemērs
Apavu veikals seko pārdošanas apjomiem. Starp mainīgajiem, kas pārvalda savus ierakstus, ir katra modeļa apavu krāsa. Mainīgais lielums:
Color_Shoe_Model_AW3
Tas ir kategoriska tipa, un tam ir piecas kategorijas vai iespējamās vērtības. Katrā šī mainīgā kategorijā tiek summēts pārdošanas skaits un noteikts to procentuālais sastāvs. Rezultāti ir parādīti šāda attēla diagrammā:
3. attēls. Kategoriskais mainīgais Krāsa _Shoe. Šajā mainīgajā režīmā ir balts. Avots: pašu gatavots.
Tad var teikt, ka modē esošais AW3 apavu modelis visbiežāk tiek pārdots White, kam cieši seko Black.
Var arī teikt, ka ar 70% varbūtību nākamās šī modeļa pārdotās kurpes būs baltas vai melnas.
Šī informācija var būt noderīga veikalam, veicot jaunus pasūtījumus, vai arī pārmērīga krājuma dēļ tā varētu piemērot atlaides vismazāk pārdotajām krāsām.
3. piemērs
Atsevišķai asins donoru grupai jūs vēlaties pārstāvēt to cilvēku skaitu, kuri pieder noteiktai asins grupai. Grafisks rezultātu vizualizācijas veids ir piktogramma, kas atrodas tabulas apakšā.
Pirmā kolonna attēlo mainīgo group_sanguíneo un tā iespējamos rezultātus vai kategorijas. Otrajā kolonnā ir attēlots katras kategorijas cilvēku skaits ikonu vai attēlu veidā. Mūsu piemērā kā ikona tiek izmantots sarkans piliens, no kuriem katrs apzīmē 10 cilvēkus.
4. attēls. Piktogramma. Avots: pašu gatavots
Atsauces
- Hanas akadēmija. Kategorisko datu analīze. Atgūts no: khanacademy.org
- Visuma formulas. Kvalitatīvais mainīgais. Atgūts no: univesoformulas.com
- Minitab. Kas ir kategoriski, diskrēti un nepārtraukti mainīgie. Atgūts no: support.minitab.com
- Excel apmācība. Mainīgo raksturojums. Atgūts no: help.xlslat.com.
- Wikipedia. Statistiskais mainīgais. Atgūts no wikipedia.com
- Wikipedia. Kategoriskais mainīgais. Atgūts no wikipedia.com
- Wikipedia. Kategorisks mainīgais. Atgūts no wikipedia.com