- Brīvības pakāpes veidi
- Mehāniskajā gadījumā
- Nejaušu vērtību kopā
- Piemēri
- Variants un brīvības pakāpes
- Chi kvadrātā sadalījumā
- Hipotēzes pārbaudē (ar atrisinātu piemēru)
- Atsauces
Ar brīvības grādi statistikā ir skaits neatkarīgo komponentu nejaušības vektors. Ja vektoram ir n komponenti un ir p lineāri vienādojumi, kas attiecas uz tā komponentiem, tad brīvības pakāpe ir np.
Brīvības pakāpju jēdziens parādās arī teorētiskajā mehānikā, kur tie ir aptuveni līdzvērtīgi telpas dimensijai, kurā daļiņa pārvietojas, atņemot saišu skaitu.
1. attēls. Svārsts pārvietojas divās dimensijās, bet tam ir tikai viena brīvības pakāpe, jo tas ir spiests pārvietoties L rādiusa lokā. Avots: F. Zapata.
Šajā rakstā tiks aplūkots statistikā izmantotais brīvības pakāpju jēdziens, taču mehānisku piemēru ir vieglāk vizualizēt ģeometriskā formā.
Brīvības pakāpes veidi
Atkarībā no konteksta, kurā tas tiek piemērots, brīvības pakāpju skaita aprēķināšanas veids var atšķirties, taču pamatā esošā ideja vienmēr ir vienāda: kopējie izmēri mīnus ierobežojumu skaits.
Mehāniskajā gadījumā
Apsvērsim svārstīgu daļiņu, kas piesaistīta virknei (svārstam), kas pārvietojas vertikālā xy plaknē (2 dimensijas). Tomēr daļiņa ir spiesta pārvietoties pa rādiusa apkārtmēru, kas vienāds ar akorda garumu.
Tā kā daļiņa var kustēties tikai pa šo līkni, brīvības pakāpju skaits ir 1. To var redzēt 1. attēlā.
Brīvības pakāpju skaita aprēķināšanas paņēmiens ir dimensiju skaita starpība, no kuras atņem ierobežojumu skaits:
brīvības pakāpes: = 2 (izmēri) - 1 (ligatūra) = 1
Vēl viens skaidrojums, kas ļauj mums nonākt pie rezultāta, ir šāds:
-Mēs zinām, ka stāvokli divās dimensijās attēlo koordinātu punkts (x, y).
-Bet tā kā punktam jāatbilst apkārtmēra vienādojumam (x 2 + y 2 = L 2 ) dotajai mainīgā lieluma x vērtībai, mainīgo y nosaka ar minēto vienādojumu vai ierobežojumu.
Tādā veidā tikai viens no mainīgajiem ir neatkarīgs, un sistēmai ir viena (1) brīvības pakāpe.
Nejaušu vērtību kopā
Lai ilustrētu, ko jēdziens nozīmē, pieņemsim, ka vektors
x = (x 1 , x 2 ,…, x n )
Pārstāv n normāli izkliedētu izlases vērtību paraugu. Šajā gadījumā izlases veida vektoram x ir n neatkarīgas sastāvdaļas, un tāpēc tiek uzskatīts, ka x ir n brīvības pakāpe.
Tagad konstruēsim atlikumu vektoru r
r = (x 1 -
Kur
Tātad summa
(x 1 -
Tas ir vienādojums, kas apzīmē ierobežojumu (vai saistību) atlikumu vektora r elementos , jo, ja ir zināmi r vektora n-1 komponenti , tad ierobežojuma vienādojums nosaka nezināmo komponentu.
Tāpēc n dimensijas vektors r ar ierobežojumu:
∑ (x i -
Tam ir (n - 1) brīvības pakāpe.
Atkal tiek piemērots, ka brīvības pakāpju skaita aprēķins ir šāds:
brīvības pakāpes: = n (izmēri) - 1 (ierobežojumi) = n-1
Piemēri
Variants un brīvības pakāpes
Dispersiju s 2 definē kā n datu parauga noviržu (vai atlikumu) kvadrāta vidējo lielumu:
s 2 = ( r • r ) / (n-1)
kur r ir atlikumu vektors r = (x1 -
s 2 = ∑ (x i -
Jebkurā gadījumā jāņem vērā, ka, aprēķinot atlikumu kvadrāta vidējo lielumu, to dala ar (n-1), nevis ar n, jo, kā apspriests iepriekšējā sadaļā, vektora r brīvības pakāpju skaits ir ( n-1).
Ja dispersijas aprēķināšanai to dalītu ar n, nevis (n-1), rezultātam būtu novirze, kas ir ļoti nozīmīga vērtībām, kas n ir mazākas par 50.
Literatūrā dispersijas formula parādās arī ar dalītāju n, nevis (n-1), kad runa ir par populācijas dispersiju.
Bet atlikumu nejaušā mainīgā lieluma kodam, ko attēlo vektors r , kaut arī tam ir dimensija n, ir tikai (n-1) brīvības pakāpe. Tomēr, ja datu skaits ir pietiekami liels (n> 500), abas formulas saplūst ar vienu un to pašu rezultātu.
Kalkulatori un izklājlapas nodrošina gan dispersijas versijas, gan standarta novirzes (kas ir dispersijas kvadrātsakne).
Ņemot vērā šeit sniegto analīzi, mūsu ieteikums ir vienmēr izvēlēties versiju ar (n-1) katru reizi, kad nepieciešams aprēķināt dispersiju vai standartnovirzi, lai izvairītos no neobjektīviem rezultātiem.
Chi kvadrātā sadalījumā
Daži varbūtības sadalījumi nepārtrauktā nejaušā mainīgā lielumā ir atkarīgi no parametra, ko sauc par brīvības pakāpi, tas ir gadījumā ar Chi-kvadrāta sadalījumu (χ 2 ).
Šī parametra nosaukums precīzi nāk no pamata izlases veida vektora brīvības pakāpēm, uz kurām attiecas šis sadalījums.
Pieņemsim, ka mums ir g populācijas, no kurām ņem n lieluma paraugus:
X 1 = (x1 1 , x1 2 ,… ..x1 n )
X2 = (x2 1 , x2 2 ,… ..x2 n )
…
X j = (xj 1 , xj 2 ,… ..xj n )
…
Xg = (xg 1 , xg 2 ,… ..xg n )
Populācija j, kurai ir vidējā nozīme
Standartizēto vai normalizēto mainīgo zj i definē šādi:
zj i = (xj i -
Un vektors Zj ir definēts šādi:
Zj = ( zj 1 , zj 2 ,…, zj i ,…, zj n ) un seko standartizētajam normālajam sadalījumam N (0,1).
Tātad mainīgais:
Q = ((z1 1 ^ 2 + z2 1 ^ 2 +…. + Zg 1 ^ 2),…., (Z1 n ^ 2 + z2 n ^ 2 +…. + Zg n ^ 2))
seko χ 2 (g) sadalījumam, ko sauc par či-kvadrāta sadalījumu ar brīvības pakāpi g.
Hipotēzes pārbaudē (ar atrisinātu piemēru)
Kad vēlaties pārbaudīt hipotēzes, pamatojoties uz noteiktu nejaušu datu kopu, jums jāzina brīvības pakāpju skaits g, lai piemērotu Chi-kvadrāta testu.
2. attēls. Vai ir kāda saistība starp saldējuma izvēli FLAVOR un klienta DZIMUMU? Avots: F. Zapata.
Piemēram, tiks analizēti dati, kas savākti par šokolādes vai zemeņu saldējuma izvēli vīriešu un sieviešu vidū noteiktā saldējuma salonā. Biežums, ar kādu vīrieši un sievietes izvēlas zemenes vai šokolādi, ir apkopots 2. attēlā.
Vispirms tiek aprēķināta paredzamo frekvenču tabula, kuru sagatavo, reizinot rindu kopsummu ar kolonnu kopsummu, dalot to ar kopējiem datiem. Rezultāts parādīts šajā attēlā:
3. attēls. Paredzamo frekvenču aprēķins, pamatojoties uz novērotajām frekvencēm (vērtības zilā krāsā 2. attēlā). Avots: F. Zapata.
Tad Chi kvadrātu aprēķina (no datiem), izmantojot šādu formulu:
χ 2 = ∑ (F o - F e ) 2 / F e
Kur F o ir novērotās frekvences (2. attēls) un F e ir paredzamās frekvences (3. attēls). Summēšana iet pāri visām rindām un kolonnām, kuras mūsu piemērā dod četrus terminus.
Pēc operāciju veikšanas jūs saņemat:
χ 2 = 0,2043.
Tagad ir jāsalīdzina ar teorētisko Chi kvadrātu, kas ir atkarīgs no brīvības pakāpju skaita g.
Mūsu gadījumā šis skaitlis tiek noteikts šādi:
g = (# rindas - 1) (# kolonnas - 1) = (2 - 1) (2 - 1) = 1 * 1 = 1.
Izrādās, ka šajā piemērā brīvības pakāpju skaits g ir 1.
Ja vēlaties pārbaudīt vai noraidīt nulles hipotēzi (H0: starp TASTE un GENDER nav korelācijas) ar nozīmīguma līmeni 1%, teorētisko Chi-kvadrāta vērtību aprēķina ar brīvības pakāpi g = 1.
Tiek meklēta vērtība, kas veido uzkrāto frekvenci (1 - 0,01) = 0,99, tas ir, 99%. Šī vērtība (ko var iegūt no tabulām) ir 6,636.
Tā kā teorētiskais Chi pārsniedz aprēķināto, tad tiek pārbaudīta nulles hipotēze.
Citiem vārdiem sakot, ar apkopotajiem datiem netiek novērota saistība starp mainīgajiem TASTE un GENDER.
Atsauces
- Minitab. Kādas ir brīvības pakāpes? Atgūts no: support.minitab.com.
- Mūra, Deivids. (2009) Pamatlietotā statistika. Antoni Bosch redaktors.
- Leiga, Dženifera. Kā aprēķināt brīvības pakāpi statistiskajos modeļos. Atgūts no: geniolandia.com
- Wikipedia. Brīvības pakāpe (statistika). Atgūts no: es.wikipedia.com
- Wikipedia. Fiziskās brīvības pakāpe. Atgūts no: es.wikipedia.com