- Priekšrocības un trūkumi
- Diapazona kā izkliedes mēra trūkumi
- Starpkvartilu diapazons, kvartiles un izstrādātais piemērs
- - Kvarilu aprēķināšana
- Pirmā kvartile
- Otrā kvartila vai mediāna
- Trešā kvartile
- Darbojies piemērs
- Risinājums
- Risinājums b
- Risinājums c
- Atsauces
Diapazons , diapazons vai amplitūdu, statistikā, ir atšķirība (atņemšanu) starp maksimālo vērtību un minimālo vērtību kopumu datus no parauga vai iedzīvotājiem. Ja diapazonu apzīmē ar burtu R un datus attēlo ar x, diapazona formula ir vienkārši:
R = x max - x min
Kur x max ir maksimālā datu vērtība un x min ir minimālā.
1. attēls. Datu diapazons, kas atbilst Kadisas iedzīvotāju skaitam pēdējos divos gadsimtos. Avots: Wikimedia Commons.
Koncepcija ir ļoti noderīga kā vienkāršs izkliedes mērs, lai ātri novērtētu datu mainīgumu, jo tas norāda intervāla pagarinājumu vai garumu, kur tie tiek atrasti.
Piemēram, pieņemsim, ka universitātē mēra 25 vīriešu grupas pirmā kursa inženierzinātņu studentu grupas augstumu. Grupas garākais audzēknis ir 1,93 m, bet īsākais - 1,67 m. Šīs ir izlases datu galējās vērtības, tāpēc to ceļš ir šāds:
R = 1,93 - 1,67 m = 0,26 m vai 26 cm.
Šajā grupā audzēkņu augums ir sadalīts.
Priekšrocības un trūkumi
Diapazons ir, kā mēs teicām iepriekš, datu izkliedēšanas mērs. Neliels diapazons norāda, ka dati ir vairāk vai mazāk tuvu un izplatība ir zema. No otras puses, lielāks diapazons norāda, ka dati ir izkliedētāki.
Diapazona aprēķināšanas priekšrocības ir acīmredzamas: to ir ļoti viegli un ātri atrast, jo tā ir vienkārša atšķirība.
Tam ir arī tās pašas vienības kā datiem, ar kuriem tas darbojas, un jēdzienu ir ļoti viegli interpretēt jebkuram novērotājam.
Inženierzinātņu studentu augstuma piemērā, ja diapazons būtu bijis 5 cm, mēs teiktu, ka visi studenti ir aptuveni vienādi. Bet ar diapazonu 26 cm mēs uzreiz pieņemam, ka izlasē ir visu starpposma augstumu studenti. Vai šis pieņēmums vienmēr ir pareizs?
Diapazona kā izkliedes mēra trūkumi
Ja paskatāmies uzmanīgi, iespējams, ka mūsu 25 inženierzinātņu studentu izlasē tikai viens no viņiem mēra 1,93, bet atlikušajiem 24 augstums ir tuvu 1,67 m.
Un tomēr diapazons paliek tāds pats, kaut arī pilnīgi iespējams pilnīgi pretējs: vairākuma augstums ir ap 1,90 m un tikai viens ir 1,67 m.
Abos gadījumos datu izplatīšana ir diezgan atšķirīga.
Diapazona kā izkliedes mēra trūkumi ir tāpēc, ka tas izmanto tikai galējās vērtības un ignorē visus pārējos. Tā kā tiek zaudēta lielākā daļa informācijas, jums nav ne mazākās nojausmas, kā izlases dati tiek izplatīti.
Vēl viena svarīga iezīme ir tā, ka parauga diapazons nekad nesamazinās. Ja pievienojam vairāk informācijas, tas ir, ņem vērā vairāk datu, diapazons palielinās vai paliek nemainīgs.
Jebkurā gadījumā tas ir noderīgi tikai tad, ja strādā ar maziem paraugiem, nav ieteicams to izmantot tikai kā izkliedes mēru lielos paraugos.
Jāveic, lai to papildinātu ar citu izkliedes mēru aprēķinu, kuros ņemta vērā informācija, ko sniedz kopējie dati: starpkvartilu diapazons, dispersija, standartnovirze un variācijas koeficients.
Starpkvartilu diapazons, kvartiles un izstrādātais piemērs
Mēs esam sapratuši, ka diapazona kā izkliedes mēra vājums ir tas, ka tas izmanto tikai datu izplatīšanas galējās vērtības, izlaižot citas.
Lai izvairītos no šīm neērtībām, tiek izmantotas kvartiles: trīs vērtības, kas pazīstamas kā pozīcijas mērījumi.
Nesagrupētos datus viņi sadala četrās daļās (citi plaši izmantotie pozīcijas mēri ir decili un procentiļi). Tās ir tās īpašības:
-Pirmā kvartile Q 1 ir tādu datu vērtība, ka 25% no visiem tiem ir mazāki par Q 1 .
-Otrais kvartils Q 2 ir sadalījuma mediāna, kas nozīmē, ka puse (50%) datu ir mazāka par šo vērtību.
-Visbeidzot, trešā ceturtdaļa Q 3 norāda, ka 75% datu ir mazāki par Q 3 .
Pēc tam starpkvartilu diapazonu vai starpkvartilu diapazonu definē kā starpību starp trešās kvartiles Q 3 un pirmās kvartiles Q 1 datiem:
Starpkvartilu diapazons = R Q = Q 3 - Q 1
Tādā veidā diapazona R Q vērtību tik ļoti neietekmē galējās vērtības. Šī iemesla dēļ ieteicams to izmantot, strādājot ar šķībiem sadalījumiem, piemēram, iepriekš aprakstītajiem ļoti augstiem vai ļoti īsiem studentiem.
- Kvarilu aprēķināšana
Ir vairāki veidi, kā tos aprēķināt, šeit mēs piedāvāsim vienu, taču jebkurā gadījumā ir jāzina kārtas numurs "N o ", kas ir vieta, kuru attiecīgais kvartils ieņem sadalījumā.
Tas ir, ja, piemēram, apzīmējums, kas atbilst Q 1, ir sadalījuma otrais, trešais vai ceturtais un tā tālāk.
Pirmā kvartile
N vai (Q 1 ) = (N + 1) / 4
Otrā kvartila vai mediāna
N vai (Q 2 ) = (N + 1) / 2
Trešā kvartile
N vai (Q 3 ) = 3 (N + 1) / 4
Kur N ir datu skaits.
Mediāna ir vērtība, kas atrodas tieši sadalījuma vidū. Ja datu skaits ir nepāra, to atrast nav problēmu, bet, ja tas ir pat, tad abām centrālajām vērtībām tiek aprēķināta vidējā vērtība, lai tās kļūtu par vienu.
Kad pasūtījuma numurs ir aprēķināts, tiek ievērots viens no šiem trim noteikumiem:
-Ja nav decimāldaļu, tiek meklēti dati, kas norādīti sadalījumā, un tā būs meklētā kvartila.
-Kad pasūtījuma numurs ir pusceļā starp diviem, tad skaitļiem, kas norādīti ar vesela skaitļa daļu, vidējo aprēķina ar šādiem datiem, un rezultāts ir atbilstošā kvartile.
-Jebkurā gadījumā tas ir noapaļots līdz tuvākajam veselajam skaitlim, un tā būs kvartilija pozīcija.
Darbojies piemērs
Skalā no 0 līdz 20 16 matemātikas studentu grupa vidējā eksāmenā ieguva šādas atzīmes (punktus):
16, 10, 12, 8, 9, 15, 18, 20, 9, 11, 1, 13, 17, 9, 10, 14
Atrodi:
a) datu diapazons vai diapazons.
b) Kvarilu Q 1 un Q 3 vērtības
c) starpkvartilu diapazons.
2. attēls. Vai šī matemātikas testa rezultātiem ir tik liela mainība? Avots: Pixabay.
Risinājums
Pirmais, kas jādara, lai atrastu maršrutu, ir jāpasūta dati pieaugošā vai samazinošā secībā. Piemēram, pieaugošā secībā jums ir:
1, 8, 9, 9, 9, 10, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20
Izmantojot sākumā doto formulu: R = x max - x min
R = 20 - 1 punkts = 19 punkti.
Saskaņā ar rezultātu šie vērtējumi ir ļoti izkliedēti.
Risinājums b
N = 16
N vai (Q 1 ) = (N + 1) / 4 = (16 + 1) / 4 = 17/4 = 4,25
Tas ir skaitlis ar decimāldaļām, kura veselā daļa ir 4. Tad mēs ejam uz sadalījumu, mēs meklējam datus, kas ieņem ceturto vietu, un tā vērtība tiek aprēķināta, salīdzinot ar piekto pozīciju. Tā kā viņi abi ir 9, vidējais ir arī 9 un tā:
Q 1 = 9
Tagad mēs atkārtojam procedūru, lai atrastu Q 3 :
N vai (Q 3 ) = 3 (N + 1) / 4 = 3 (16 +1) / 4 = 12,75
Atkal tas ir aiz komata, bet, tā kā tas nav pusceļš, tas tiek noapaļots līdz 13. Meklētā kvartila ieņem trīspadsmito pozīciju un ir:
Q 3 = 16
Risinājums c
R Q = Q 3 - Q 1 = 16 - 9 = 7 punkti.
Kas, kā redzam, ir daudz mazāks par a) apakšpunktā aprēķināto datu diapazonu, jo minimālais punktu skaits bija 1 punkts, vērtība, kas daudz tālāk no pārējiem.
Atsauces
- Berensons, M. 1985. Vadības un ekonomikas statistika. Interamericana SA
- Canavos, G. 1988. Varbūtība un statistika: lietojumi un metodes. Makgreiva kalns.
- Devore, J. 2012. Varbūtība un statistika inženierzinātnēs un zinātnē. 8. Izdevums. Cengage.
- Kvarilu piemēri. Atgūts no: matematicas10.net.
- Levins, R. 1988. Administratoru statistika. 2. Izdevums. Prentice zāle.
- Walpole, R. 2007. Varbūtība un statistika inženierzinātnēs un zinātnēs. Pīrsons.