- Problēmas izklāsts Manna-Vitnija U testā
- Kvalitatīvie mainīgie pret kvantitatīvajiem mainīgajiem
- Parasts gadījums
- Gadījums ar normālu tendenci
- Pārī vai nesapāroti paraugi
- Manna Vitnija U testa raksturojums
- Manns - Vitnija formula
- Testa piemērošanas soļi
- Praktiska pielietojuma piemērs
- - 1. solis
- - 2. solis
- A reģions
- B reģions
- 3. solis
- 4. solis
- Salīdzināšanas kritēriji
- Tiešsaistes kalkulatori Manna - Vitnija U testam
- Atsauces
Mann - Whitney U testu tiek piemērota salīdzināšanas divu neatkarīgu paraugu, kad tie ir maz datu, vai neievēro normālu sadalījumu. Tādā veidā tas tiek uzskatīts par neparametrisku testu atšķirībā no tā homologā Studenta t testa, ko izmanto, ja paraugs ir pietiekami liels un seko normālajam sadalījumam.
Frenks Vilkoksons to pirmo reizi ierosināja 1945. gadā vienāda lieluma paraugiem, bet divus gadus vēlāk Henrijs Manns un DR Vitnijs to pagarināja arī dažāda lieluma paraugiem.
1. attēls. Neatkarīgo paraugu salīdzināšanai tiek izmantots Mann-Whitney U tests. Avots: Pixabay.
Testu bieži izmanto, lai pārbaudītu, vai pastāv saistība starp kvalitatīvo un kvantitatīvo mainīgo.
Ilustratīvs piemērs ir ņemt hipertensijas slimnieku kopu un izdalīt divas grupas, no kurām ikdienas datus par asinsspiedienu reģistrē vienu mēnesi.
Ārstēšanu A piemēro vienai grupai, bet ārstēšanu - otrai B. Šeit asinsspiediens ir kvantitatīvais mainīgais, bet ārstēšanas veids - kvalitatīvais.
Mēs vēlamies uzzināt, vai izmērīto vērtību vidējā vērtība, nevis vidējā, ir statistiski vienāda vai atšķirīga, lai noteiktu, vai starp abām ārstēšanas metodēm ir atšķirība. Lai iegūtu atbildi, tiek izmantota Vilkoksona statistika vai Manna-Vitnija U pārbaude.
Problēmas izklāsts Manna-Vitnija U testā
Vēl viens piemērs, kurā var izmantot testu, ir šāds:
Pieņemsim, ka vēlaties uzzināt, vai bezalkoholisko dzērienu patēriņš ievērojami atšķiras divos valsts reģionos.
Vienu no tiem sauc par A reģionu, bet otru par reģionu B. Ierakstu par nedēļā patērētajiem litriem reģistrē divos paraugos: vienā no 10 cilvēkiem A reģionā un vēl no 5 cilvēkiem B reģionā.
Dati ir šādi:
-A reģions : 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
-B reģions : 12,14, 11, 30, 10
Rodas šāds jautājums:
Kvalitatīvie mainīgie pret kvantitatīvajiem mainīgajiem
-Kvalitatīvais mainīgais X : reģions
-Kvantitatīvais mainīgais Y : bezalkoholisko dzērienu patēriņš
Ja abos reģionos patērēto litru daudzums ir vienāds, jāsecina, ka starp abiem mainīgajiem nav atkarības. Veids, kā to uzzināt, ir salīdzināt abu reģionu vidējo vai vidējo tendenci.
Parasts gadījums
Ja dati seko normālam sadalījumam, tiek ierosinātas divas hipotēzes: nulles vērtība H0 un alternatīva H1, salīdzinot vidējos lielumus:
- H0 : starp diviem reģioniem nav atšķirības.
- H1 : abu reģionu līdzekļi ir atšķirīgi.
Gadījums ar normālu tendenci
Tieši pretēji, ja dati neatbilst normālam sadalījumam vai izlase ir vienkārši par mazu, lai to zinātu, tā vietā, lai salīdzinātu vidējo, salīdzinātu abu reģionu vidējo rādītāju.
- H0 : starp diviem reģioniem nav atšķirības.
- H1 : abu reģionu mediānas ir atšķirīgas.
Ja mediānas sakrīt, tad tiek izpildīta nulles hipotēze: starp bezalkoholisko dzērienu patēriņu un reģionu nav nekādas saistības.
Un, ja notiek pretējais, ir taisnība, ka pastāv alternatīva hipotēze: starp patēriņu un reģionu ir saistība.
Šajos gadījumos ir norādīts Manna-Vitnija U tests.
Pārī vai nesapāroti paraugi
Nākamais svarīgais jautājums, izlemjot, vai piemērot Manna Vitnija U testu, ir tas, vai datu skaits abos paraugos ir identisks, proti, tie ir nominālvērtībā.
Ja abi paraugi ir savienoti pārī, tiks piemērota sākotnējā Wilcoxon versija. Bet ja nē, kā tas ir piemērā, tad tiek piemērots modificētais Vilkoksona tests, kas ir precīzi Manna Vitnija U tests.
Manna Vitnija U testa raksturojums
Manna - Vitneja U tests nav parametrs, kas piemērojams paraugiem, kas neatbilst normālajam sadalījumam vai ir maz datu. Tam ir šādas īpašības:
1.- Salīdziniet mediānas
2.- Tas darbojas pasūtītajos diapazonos
3.- Tas ir mazāk spēcīgs, kas nozīmē, ka vara ir varbūtība noraidīt nulles hipotēzi, kad tā faktiski ir nepatiesa.
Ņemot vērā šos raksturlielumus, Manna-Vitnija U testu piemēro, ja:
- Dati ir neatkarīgi
-Viņi neievēro parasto sadalījumu
- Nulles hipotēze H0 tiek pieņemta, ja divu paraugu mediānas sakrīt: Ma = Mb
-Alternatīvā hipotēze H1 tiek pieņemta, ja abu paraugu mediānas atšķiras: Ma ≠ Mb
Manns - Vitnija formula
Mainīgais U ir kontrasta statistika, ko izmanto Manna-Vitnija testā, un to definē šādi:
Tas nozīmē, ka U ir mazākā no vērtībām starp Ua un Ub, ko piemēro katrai grupai. Mūsu piemērā tas būtu katram reģionam: A vai B.
Mainīgos lielumus Ua un Ub definē un aprēķina pēc šādas formulas:
Ua = Na Nb + Na (Na +1) / 2 - Ra
Ub = Na Nb + Nb (Nb +1) / 2 - Rb
Na un Nb vērtības ir paraugu lielumi, kas attiecīgi atbilst A un B reģioniem, un, no savas puses, Ra un Rb ir ranga summas, kuras mēs definēsim turpmāk.
Testa piemērošanas soļi
1.- Sakārtojiet abu paraugu vērtības.
2. - Katrai vērtībai piešķiriet pasūtījuma pakāpi.
3.- Izlabojiet esošās datu saites (atkārtotas vērtības).
4.- Aprēķiniet Ra = A parauga rangu summu.
5.- Atrodiet Rb = B parauga rangu summa.
6.- Nosakiet vērtības Ua un Ub saskaņā ar formulām, kas dotas iepriekšējā sadaļā.
7. Salīdziniet Ua un Ub, un mazākais no diviem tiek piešķirts eksperimentālajai U statistikai (tas ir, datiem), ko salīdzina ar teorētisko vai parasto U statistiku.
Praktiska pielietojuma piemērs
Tagad mēs piemērojam iepriekš minēto bezalkoholisko dzērienu problēmai:
A reģions: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
B reģions: 12,14, 11, 30, 10
Atkarībā no tā, vai abu paraugu vidējie rādītāji ir statistiski vienādi vai atšķirīgi, nulles hipotēze tiek pieņemta vai noraidīta: starp mainīgajiem Y un X nav saistības, tas ir, bezalkoholisko dzērienu patēriņš nav atkarīgs no reģiona:
H0: Ma = Mb
H1: Ma ≠ Mb
2. attēls. Dati par bezalkoholisko dzērienu patēriņu reģionos A un B. Avots: F. Zapata.
- 1. solis
Mēs turpinām pasūtīt datus abiem paraugiem kopā, pasūtot vērtības no zemākās līdz augstākajai:
Ņemiet vērā, ka vērtība 11 parādās 2 reizes (vienu reizi katrā paraugā). Sākotnēji tam ir pozīcijas vai diapazons 3 un 4, bet, lai nenovērtētu vai nenovērtētu vienu vai otru, vidējā vērtība tiek izvēlēta kā diapazons, tas ir, 3,5.
Līdzīgā veidā mēs turpinām ar vērtību 12, ko trīs reizes atkārto ar diapazonu 5, 6 un 7.
Nu, vērtībai 12 tiek piešķirts vidējais diapazons 6 = (5 + 6 + 7) / 3. Un tas pats 14. vērtībai, kurai ir ligatūra (parādās abos paraugos) 8. un 9. pozīcijā, tai piešķir vidējo diapazonu 8,5 = (8 + 9) / 2.
- 2. solis
Pēc tam atkal tiek atdalīti dati par reģionu A un B, bet tagad tiem atbilstošie diapazoni ir piešķirti citā rindā:
A reģions
B reģions
Ra un Rb diapazonus iegūst no otrās rindas elementu summām katrā gadījumā vai reģionā.
3. solis
Tiek aprēķinātas atbilstošās Ua un Ub vērtības:
Ua = 10 × 5 + 10 (10 + 1) / 2 - 86 = 19
Ub = 10 × 5 + 5 (5 + 1) / 2 -34 = 31
Eksperimenta vērtība U = min (19, 31) = 19
4. solis
Tiek pieņemts, ka teorētiskā U seko normālajam sadalījumam N ar parametriem, ko nosaka tikai paraugu lielums:
N ((na⋅nb) / 2, √)
Lai salīdzinātu eksperimentāli iegūto mainīgo U ar teorētisko U, jāveic mainīgā mainīšana. Pārejam no eksperimentālā mainīgā U uz tā standartizēto vērtību, kas tiks saukta par Z, lai varētu salīdzināt ar standartizētā normālā sadalījuma vērtību.
Mainīgā lieluma izmaiņas ir šādas:
Z = (U - nav.nb / 2) / √
Jāatzīmē, ka mainīgā lieluma maiņai tika izmantoti U teorētiskā sadalījuma parametri, pēc tam jaunais mainīgais Z, kas ir hibrīds starp teorētisko U un eksperimentālo U, tiek kontrastēts ar standartizētu normālo sadalījumu N (0,1). ).
Salīdzināšanas kritēriji
Ja Z ≤ Zα ⇒, tiek pieņemta nulles hipotēze H0
Ja Z> Zα ⇒ noraida nulles hipotēzi H0
Standartizētās Zα kritiskās vērtības ir atkarīgas no nepieciešamā ticamības līmeņa, piemēram, ja ticamības līmenim α = 0,95 = 95%, kas ir visizplatītākais, iegūst kritisko vērtību Zα = 1,96.
Šeit parādītajiem datiem:
Z = (U - nav nb / 2) / √ = -0,73
Kas ir zem kritiskās vērtības 1,96.
Tātad galīgais secinājums ir tāds, ka tiek pieņemta nulles hipotēze H0:
Tiešsaistes kalkulatori Manna - Vitnija U testam
Statistiskām aprēķiniem ir īpašas programmas, ieskaitot SPSS un MINITAB, taču šīs programmas ir apmaksātas, un to izmantošana ne vienmēr ir vienkārša. Tas ir saistīts ar faktu, ka tie piedāvā tik daudz iespēju, ka to izmantošana praktiski ir paredzēta tikai statistikas ekspertiem.
Par laimi, ir vairākas ļoti precīzas, bezmaksas un ērti lietojamas tiešsaistes programmas, kas cita starpā ļauj palaist Mann-Whitney U testu.
Šīs programmas ir:
-Sociālā zinātnes statistika (socscistatistics.com), kurai ir gan Manna-Vitnija U tests, gan Vilkoksona tests līdzsvarotu vai pāru paraugu gadījumā.
-AI terapijas statistika (ai-therapy.com), kurā ir vairāki parastie aprakstošās statistikas testi.
-Statistiski lietot (fizika.csbsju.edu/stats), kas ir viens no vecākajiem, tāpēc tā saskarne var izskatīties novecojusi, lai gan tā tomēr ir ļoti efektīva bezmaksas programma.
Atsauces
- Dītrihsons. Kvantitatīvās metodes: ranga pārbaude. Atgūts no: bookdown.org
- Marín J P. SPSS ceļvedis: Parametru testu analīze un procedūras. Atgūts no: halweb.uc3m.es
- USAL MOOC. Neparametriski testi: Mann-Whitney U. Atgūts no: youtube.com
- Wikipedia. Manna-Vitnija U tests. Atgūts no: es.wikipedia.com
- XLSTAT. Palīdzības centrs. Manns - Vitnija testa apmācība programmā Excel. Atgūts no: help.xlsat.com