Standartinis nuokrypis ir dispersija yra statistiniai DMS sklaidos rodikliai
Standartinio nuokrypio ir dispersijos formulė dažnai išreiškiama naudojant:
Rinkinio dispersija n lygiai taip pat tikėtinos vertės gali būti parašytos taip:
Standartinis nuokrypis yra dispersijos kvadratinė šaknis:
Formulės su graikiškomis raidėmis gali atrodyti bauginančiai, tačiau tai ne taip sudėtinga, kaip atrodo. Paprastas žingsnis:
Tai suteikia dispersiją. Paimkite dispersijos kvadratinę šaknį, norėdami rasti standartinį nuokrypį.
Šis puikus „Khan Academy“ vaizdo įrašas paaiškina dispersijos ir standartinio nuokrypio sąvokas:
Tarkime, kad duomenų rinkinyje yra šešių kiaulpienių aukštis: 3 coliai, 4 coliai, 5 coliai, 4 coliai, 11 coliai ir 6 coliai.
Pirmiausia suraskite duomenų taškų vidurkį: (3 + 4 + 5 + 4 + 11 + 7) / 6 = 5,5
Taigi vidutinis aukštis yra 5,5 colio. Dabar mums reikia nuokrypių, todėl randame kiekvieno augalo skirtumą nuo vidurkio: -2,5, -1,5, -,5, -1,5, 5,5, 1,5
Dabar kvadratuokite kiekvieną nuokrypį ir raskite jų sumą: 6,25 + 2,25 + .25 + 2,25 + 30,25 + 2,25 = 43,5
Dabar padalinkite kvadratų sumą iš duomenų taškų skaičiaus, šiuo atveju augalų: 43,5 / 6 = 7,25
Taigi šio duomenų rinkinio dispersija yra 7,25, tai yra gana savavališkas skaičius. Norėdami konvertuoti jį į realaus pasaulio matavimą, paimkite kvadratinę šaknį 7,25 ir suraskite standartinį nuokrypį coliais.
Standartinis nuokrypis yra apie 2,69 colio. Tai reiškia, kad mėginyje bet koks kiaulpienės vidurkis (2,69 colio) (5,5 colio) yra „normalus“.
Nuokrypiai yra padalinti į kvadratą, kad neigiamos vertės (nuokrypiai žemiau vidurkio) negalėtų panaikinti teigiamų verčių. Tai veikia, nes neigiamas skaičius kvadratu tampa teigiama verte. Jei turėtumėte paprastą duomenų rinkinį su nukrypimais nuo +5, +2, -1 ir -6 vidurkio, nuokrypių suma bus lygi nuliui, jei reikšmės nebus padalintos į kvadratą (ty 5 + 2 - 1 - 6 = 0).
Variacija išreiškiama kaip matematinė dispersija. Kadangi tai yra savavališkas skaičius, palyginti su pradiniais duomenų rinkinio matavimais, jį sunku vizualizuoti ir pritaikyti realia prasme. Varianso nustatymas paprastai yra paskutinis žingsnis prieš nustatant standartinį nuokrypį. Variantų vertės kartais naudojamos finansinėse ir statistinėse formulėse.
Standartinis nuokrypis, išreikštas pirminiais duomenų rinkinio vienetais, yra daug intuityvesnis ir artimesnis pradinio duomenų rinkinio vertėms. Dažniausiai jis naudojamas analizuoti demografinius rodiklius ar populiacijos pavyzdžius, kad būtų galima suprasti, kas yra normalu populiacijoje.
Normaliame pasiskirstyme maždaug 68% populiacijos (arba verčių) patenka į 1 standartinį nuokrypį (1σ) nuo vidurkio, o apie 94% patenka į 2σ. Reikšmės, kurios nuo vidurkio skiriasi 1,7σ ar daugiau, paprastai laikomos nuokrypėmis.
Praktiškai tokios kokybės sistemos kaip „Six Sigma“ bando sumažinti klaidų procentą, kad klaidos taptų pašalinėmis. Sąvoka „šešių sigmų procesas“ kilusi iš supratimo, kad jei yra šeši standartiniai nuokrypiai tarp proceso vidurkio ir artimiausios specifikacijos ribos, praktiškai nė vienas elementas neatitiks specifikacijų.[1]
Realiojo pasaulio programose naudojami duomenų rinkiniai paprastai atspindi populiacijos imtį, o ne visas populiacijas. Šiek tiek pakeista formulė naudojama, jei iš dalinės imties reikia daryti išvadas iš visos populiacijos.
„Imties standartinis nuokrypis“ naudojamas, jei viskas, ką turite, yra pavyzdys, tačiau norite pasakyti apie populiacijos standartinį nuokrypį, iš kurio imamas pavyzdys.
Vienintelis pavyzdinio standartinio nuokrypio formulės skirtumas nuo standartinio nuokrypio formulės yra vardiklis „-1“.
Naudojant kiaulpienių pavyzdį, ši formulė būtų reikalinga, jei imtume mėginius tik iš 6 kiaulpienių, tačiau norėjome naudoti tą pavyzdį norėdami nurodyti standartinį viso lauko nuokrypį su šimtais kiaulpienių.
Dabar kvadratų suma būtų padalinta iš 5, o ne iš 6 (n - 1), o tai suteikia 8,7 (vietoj 7,25), o imties standartinis nuokrypis yra 2,95 colio, o ne 2,69 colio už pradinį standartinį nuokrypį. Šis pakeitimas naudojamas norint rasti klaidos ribą imtyje (šiuo atveju 9%).