- Formulas un vienādojumi
- Kā aprēķināt izlases kļūdu
- Par pārliecības līmeni
- Piemēri
- - 1. piemērs
- Risinājums
- - 2. piemērs
- Risinājums
- - 3. piemērs
- Risinājums
- - 4. piemērs
- Risinājums
- - 5. vingrinājums
- Risinājums
- Atsauces
Izlases kļūda vai izlases kļūda statistikā ir starpība starp vidējo vērtību paraugu, un vidējo vērtību no kopējā iedzīvotāju skaita. Lai ilustrētu šo ideju, iedomāsimies, ka pilsētas kopējais iedzīvotāju skaits ir viens miljons cilvēku, no kuriem jūs vēlaties tās vidējo apavu lielumu, no kura tiek ņemts nejaušs paraugs - viens tūkstotis cilvēku.
Vidējais izlases lielums ne vienmēr sakrīt ar kopējās populācijas lielumu, lai gan, ja izlase nav neobjektīva, vērtībai jābūt tuvu. Šī atšķirība starp parauga vidējo vērtību un kopējā populācijas vērtību ir paraugu ņemšanas kļūda.
1. attēls. Tā kā izlase ir kopas kopums, parauga vidējam lielumam ir kļūdas robeža. Avots: F. Zapata.
Kopējā populācijas vidējā vērtība parasti nav zināma, taču ir paņēmieni, kā samazināt šo kļūdu, un formulas, lai novērtētu izlases kļūdas robežu, kas tiks apskatīts šajā rakstā.
Formulas un vienādojumi
Teiksim, ka mēs vēlamies uzzināt noteikta izmērāmā raksturlieluma x vidējo vērtību N lieluma populācijā, bet, tā kā N ir liels skaitlis, nav iespējams veikt pētījumu par kopējo iedzīvotāju skaitu, tad mēs turpinām ņemt izlases veida izmērs n <
Parauga vidējo vērtību apzīmē ar
Pieņemsim, ka m paraugus ņem no kopējās populācijas N, visi ir vienāda lieluma n ar vidējām vērtībām
Šīs vidējās vērtības nebūs identiskas viena otrai, un tās visas būs ap populācijas vidējo vērtību μ. Izlases kļūdas robeža E norāda vidējo vērtību paredzamo atdalīšanu
N lieluma parauga standarta kļūdas robeža ε ir:
ε = σ / √n
kur σ ir standarta novirze (dispersijas kvadrātsakne), ko aprēķina, izmantojot šādu formulu:
σ = √
Standarta kļūdas robežas ε nozīme ir šāda:
Vidējā vērtība
Kā aprēķināt izlases kļūdu
Iepriekšējā sadaļā tika dota formula n lieluma parauga standarta kļūdas robežas atrašanai, kur vārds standard norāda, ka tā ir kļūdas robeža ar 68% ticamību.
Tas norāda, ka, ja tika ņemti daudzi tāda paša izmēra n paraugi, 68% no tiem tiks dotas vidējās vērtības
Pastāv vienkāršs noteikums, ko sauc par 68-95-99.7 noteikumu, kas ļauj viegli atrast izlases kļūdas robežu E ticamības līmeņiem 68%, 95% un 99,7%, jo šī robeža ir 1⋅ ε, 2 Attiecīgi ⋅ ε un 3⋅ ε.
Par pārliecības līmeni
Ja ticamības līmenis γ nav viens no iepriekšminētajiem, tad izlases kļūda ir standartnovirze σ, kas reizināta ar koeficientu Zγ, ko iegūst ar šādu procedūru:
1.- Vispirms nosaka nozīmīguma līmeni α, ko aprēķina no ticamības līmeņa γ, izmantojot šādu attiecību: α = 1 - γ
2.- Tad mums jāaprēķina vērtība 1 - α / 2 = (1 + γ) / 2, kas atbilst uzkrātajam normālajam frekvencei no -∞ līdz Zγ, parastā vai Gausa sadalījumā, kas raksturots ar F (z), kura definīcija var redzēt 2. attēlā.
3.- Vienādojumu F (Zγ) = 1 - α / 2 atrisina, izmantojot normālā (kumulatīvā) sadalījuma F tabulas vai izmantojot datoru, kurai ir apgrieztā Gausa funkcija F -1 .
Pēdējā gadījumā mums ir:
Zγ = G -1 (1 - α / 2).
4.- Visbeidzot, šo formulu piemēro izlases kļūdai ar ticamības līmeni γ:
E = Zγ ⋅ (σ / √n)
2. attēls. Normālā sadalījuma tabula. Avots: Wikimedia Commons.
Piemēri
- 1. piemērs
Aprēķiniet standarta kļūdas robežu 100 jaundzimušo parauga vidējā svarā. Vidējā svara aprēķins bija
Risinājums
Standarta kļūdas robeža ir ε = σ / √n = (1500 kg) / √100 = 0,15 kg. Tas nozīmē, ka ar šiem datiem var secināt, ka 68% jaundzimušo svars ir no 2 950 kg līdz 3,25 kg.
- 2. piemērs
Nosaka parauga ņemšanas robežu ar kļūdu E un 100 jaundzimušo svara diapazonu ar 95% ticamības pakāpi, ja vidējais svars ir 3100 kg ar standarta novirzi σ = 1500 kg.
Risinājums
Ja tiek piemērots 68. noteikums; 95; 99,7 → 1⋅ ε; 2⋅ ε; 3⋅ ε, mums ir:
E = 2⋅ε = 2⋅0,15 kg = 0,30 kg
Citiem vārdiem sakot, 95% jaundzimušo svars būs no 2800 kg līdz 3 400 kg.
- 3. piemērs
Nosakiet jaundzimušo svaru diapazonu 1. piemērā ar ticamības robežu 99,7%.
Risinājums
Izlases kļūda ar 99,7% ticamību ir 3 σ / √n, kas mūsu piemērā ir E = 3 * 0,15 kg = 0,45 kg. No šejienes izriet, ka 99,7% jaundzimušo svars būs no 2650 kg līdz 3 550 kg.
- 4. piemērs
Nosakiet koeficientu Zγ, lai ticamības pakāpe būtu 75%. Nosakiet izlases kļūdas robežu ar šo ticamības līmeni 1. piemērā aprakstītajam gadījumam.
Risinājums
Uzticamības līmenis ir γ = 75% = 0,75, kas ir saistīts ar nozīmīguma līmeni α caur attiecību γ = (1 - α), tā ka nozīmīguma līmenis ir α = 1 - 0,75 = 0 , 25.
Tas nozīmē, ka kumulatīvā normālā varbūtība starp -∞ un Zγ ir:
P (Z ≤ Zγ) = 1 - 0,125 = 0,875
Kas atbilst Zγ vērtībai 1,1503, kā parādīts 3. attēlā.
3. attēls. Zγ koeficienta noteikšana, kas atbilst 75% ticamības līmenim. Avots: F. Zapata caur Geogebra.
Citiem vārdiem sakot, izlases kļūda ir E = Zγ ⋅ (σ / √n) = 1,15 ⋅ (σ / √n).
Ja tas tiek piemērots datiem no 1. piemēra, tas rada kļūdu:
E = 1,15 * 0,15 kg = 0,17 kg
Ar pārliecības līmeni 75%.
- 5. vingrinājums
Kāds ir ticamības līmenis, ja Z α / 2 = 2,4?
Risinājums
P (Z ≤ Z α / 2 ) = 1 - α / 2
P (Z ≤ 2,4) = 1 - α / 2 = 0,9918 → α / 2 = 1 - 0,9918 = 0,0082 → α = 0,0164
Svarīguma līmenis ir:
α = 0,0164 = 1,64%
Visbeidzot, ticamības līmenis saglabājas:
1- α = 1 - 0,0164 = 100% - 1,64% = 98,36%
Atsauces
- Canavos, G. 1988. Varbūtība un statistika: lietojumi un metodes. Makgreiva kalns.
- Devore, J. 2012. Varbūtība un statistika inženierzinātnēs un zinātnē. 8. Izdevums. Cengage.
- Levins, R. 1988. Administratoru statistika. 2. Izdevums. Prentice zāle.
- Sudmans, S. 1982. Jautājumu uzdošana: praktisks ceļvedis anketas noformēšanai. Sanfrancisko. Jossey Bass.
- Walpole, R. 2007. Varbūtība un statistika inženierzinātnēs un zinātnēs. Pīrsons.
- Wonnacott, TH un RJ Wonnacott. 1990. Ievada statistika. 5. izdevums Vailijs
- Wikipedia. Kļūda izlasē. Atgūts no: en.wikipedia.com
- Wikipedia. Kļūdas robeža. Atgūts no: en.wikipedia.com