Noteikums Sturges ir kritērijs, ko izmanto, lai noteiktu skaitu, klašu vai diapazonu, kas ir nepieciešami, lai uzzīmējot kopums statistikas datiem. Šo noteikumu 1926. gadā pasludināja vācu matemātiķis Herberts Sturges.
Sturges ierosināja vienkāršu metodi, kuras pamatā ir paraugu skaits x, kas ļautu mums atrast klašu skaitu un to diapazona platumu. Stūres noteikums tiek plaši izmantots, īpaši statistikas jomā, īpaši frekvences histogrammu konstruēšanai.
Paskaidrojums
Stūres noteikums ir empīriska metode, ko plaši izmanto aprakstošajā statistikā, lai noteiktu klašu skaitu, kam jābūt frekvences histogrammā, lai klasificētu datu kopu, kas apzīmē izlasi vai populāciju.
Pamatā šis noteikums nosaka grafisko konteineru platumu, frekvences histogrammas.
Lai izveidotu savu noteikumu, Herberts Stūres uzskatīja par ideālu frekvences diagrammu, kas sastāv no K intervāliem, kur i-tajā intervālā ir noteikts paraugu skaits (i = 0,… k - 1), kas attēloti kā:
Šo paraugu skaitu norāda pēc skaita, kādā var iegūt kopas apakškopu; tas ir, ar binomālo koeficientu, kas izteikts šādi:
Lai vienkāršotu izteiksmi, viņš abās vienādojuma daļās piemēroja logaritmu īpašības:
Tādējādi Sturges secināja, ka optimālo intervālu skaitu k izsaka izteiksme:
To var izteikt arī kā:
Šajā izteicienā:
- k ir klašu skaits.
- N ir kopējais novērojumu skaits izlasē.
- Žurnāls ir 10. bāzes logaritms.
Piemēram, lai izveidotu frekvences histogrammu, kas izsaka nejaušu 142 bērnu auguma paraugu, intervālu vai klašu skaits, kāds būs sadalījumam, ir šāds:
k = 1 + 3.322 * log 10 (N)
k = 1 + 3 322 * žurnāls (142)
k = 1 + 3.322 * 2.1523
k = 8,14 ≈ 8
Tādējādi sadalījums notiks ar 8 intervāliem.
Intervālu skaitam vienmēr jābūt attēlotam ar veselajiem skaitļiem. Gadījumos, kad vērtība ir aiz komata, tuvinājums jāveic līdz tuvākajam veselajam skaitlim.
Lietojumprogrammas
Stūres likumu piemēro galvenokārt statistikā, jo tas ļauj sadalīt frekvenci, aprēķinot klašu skaitu (k), kā arī katras no tām garumu, ko sauc arī par amplitūdu.
Amplitūda ir klases augšējās un apakšējās robežas starpība, dalīta ar klašu skaitu, un to izsaka:
Ir daudz īkšķa likumu, kas ļauj sadalīt frekvenci. Tomēr Stūres likumu parasti izmanto, jo tas tuvina klašu skaitu, kas parasti svārstās no 5 līdz 15.
Tādējādi tā uzskata vērtību, kas pietiekami atspoguļo izlasi vai kopumu; tas ir, tuvinājums nepārstāv galējus grupējumus, kā arī nedarbojas ar pārmērīgu klašu skaitu, kas neļauj apkopot izlasi.
Piemērs
Biežuma histogramma jāveic saskaņā ar sniegtajiem datiem, kas atbilst vecumam, kas iegūts aptaujā par vīriešiem, kuri vingro vietējā sporta zālē.
Lai noteiktu intervālus, jāzina parauga lielums vai novērojumu skaits; šajā gadījumā ir 30.
Tad tiek piemērots Stūres noteikums:
k = 1 + 3.322 * log 10 (N)
k = 1 + 3322 * žurnāls (30)
k = 1 + 3,3322 * 1,4771
k = 5,90 ≈ 6 intervāli.
No intervālu skaita var aprēķināt amplitūdu, kāda tiem būs; tas ir, katras joslas platums, kas attēlots frekvences histogrammā:
Apakšējā robeža tiek uzskatīta par datu mazāko vērtību, un augšējā robeža ir lielākā vērtība. Starpību starp augšējo un apakšējo robežu sauc par mainīgā diapazonu vai diapazonu (R).
No tabulas mums redzams, ka augšējā robeža ir 46 un apakšējā robeža ir 13; tādējādi katras klases amplitūda būs:
Intervālus veidos augšējā un apakšējā robeža. Lai noteiktu šos intervālus, mēs sākam ar skaitīšanu no apakšējās robežas, pievienojot amplitūdu, kas noteikta ar noteikumu (6), šādā veidā:
Tad tiek aprēķināts absolūtais biežums, lai noteiktu vīriešu skaitu, kas atbilst katram intervālam; šajā gadījumā tas ir:
- 1. intervāls: 13 - 18 = 9
- 2. intervāls: 19 - 24 = 9
- 3. intervāls: 25 - 30 = 5
- 4. intervāls: 31–36 = 2
- 5. intervāls: 37 - 42 = 2
- 6. intervāls: 43 - 48 = 3
Pievienojot katras klases absolūto frekvenci, tam jābūt vienādam ar kopējo parauga skaitu; šajā gadījumā 30.
Pēc tam aprēķina katra intervāla relatīvo biežumu, dalot tā absolūto frekvenci ar kopējo novērojumu skaitu:
- 1. intervāls: fi = 9 ÷ 30 = 0.30
- 2. intervāls: fi = 9 ÷ 30 = 0.30
- 3. intervāls: fi = 5 ÷ 30 = 0,1666
- 4. intervāls: fi = 2 ÷ 30 = 0,0666
- 5. intervāls: fi = 2 ÷ 30 = 0,0666
- 4. intervāls: fi = 3 ÷ 30 = 0,10
Tad jūs varat izveidot tabulu, kas atspoguļo datus, kā arī diagrammu no relatīvās frekvences attiecībā pret iegūtajiem intervāliem, kā redzams šādos attēlos:
Šādā veidā Sturges noteikums ļauj noteikt klašu skaitu vai intervālus, kuros izlasi var sadalīt, lai apkopotu datu paraugu, izveidojot tabulas un grafikus.
Atsauces
- Alfonso Urquía, MV (2013). Diskrētu notikumu modelēšana un modelēšana. UNED,.
- Altmans Naomi, MK (2015). "Vienkārša lineārā regresija." Dabas metodes.
- Antúnez, RJ (2014). Statistika izglītībā. Digitālā vienība.
- Fox, J. (1997.). Lietišķās regresijas analīze, lineārie modeļi un saistītās metodes. SAGE publikācijas.
- Humberto Llinás Solano, CR (2005). Aprakstošā statistika un varbūtības sadalījums. Ziemeļu universitāte.
- Panteleeva, OV (2005). Varbūtības un statistikas pamati.
- O. Kuehl, MO (2001). Eksperimentu plānošana: Pētījuma plānošanas un analīzes statistikas principi. Thomson redaktori.