Statistikoje terminas atranka reiškia apibendrintų statistinių duomenų dalies parinkimą tam, kad būtų galima gauti reikiamos informacijos apie visumą. Apibendrinta ar visa statistinė informacija apie visų tyrime dalyvavusių asmenų tam tikrą charakterį vadinama „populiacija“ arba „visata“. (Das, N. G., 2010). Pasirinkta populiacijos dalis, kuri naudojama populiacijos ar visatos ypatybėms gauti, vadinama „imtimi“. Imta, kad gyventojai sudaromi iš atskirų vienetų ar narių, o kai kurie vienetai yra įtraukti į imtį. Bendras populiacijos vienetų skaičius vadinamas populiacijos dydžiu, o imties skaičius - imties dydžiu. Populiacija ir mėginys gali būti riboti arba begaliniai, panašiai jie gali būti arba hipotetiniai.
Variacija: Variacija yra skaitinė reikšmė, parodanti, kaip plačiai atskiri skaičiai duomenų rinkinyje pasiskirsto apie vidurkį. Tai yra, kiek kiekvienas skaičius yra nuo vidurkio, taigi ir nuo kito. Nulinės vertės dispersija reiškia, kad visi duomenys yra vienodi. Kuo daugiau dispersijos, tuo daugiau vertybių yra išskaidytos apie vidurkį, taigi viena nuo kitos. Mažesnis dispersija, tuo mažesnės vertės pasiskirstomos pagal vidurkį, vadinasi, viena nuo kitos, ir dispersija negali būti neigiama.
Pagrindinis skirtumas tarp populiacijos ir imties dispersijos yra susijęs su dispersijos apskaičiavimu. Variacija apskaičiuojama penkiais etapais. Apskaičiuojamas pirmasis vidurkis, tada apskaičiuojami nuokrypiai nuo vidurkio. Trečia, nuokrypiai yra padalijami į kvadratą, ketvirta, sudedami kvadratiniai nuokrypiai ir galiausiai ši suma padalinta iš elementų, kuriems apskaičiuojamas dispersija, skaičiaus. Taigi dispersija = Σ (xi-x -) / n. Kur xi = i. Skaičius, x- = vidurkis ir n = daiktų skaičius ...
Dabar, kai dispersija turi būti apskaičiuojama pagal gyventojų duomenis, n yra lygus elementų skaičiui. Taigi, jei visų 1000 žmonių kraujospūdžio pokytis turi būti apskaičiuojamas pagal duomenis apie visų 1000 žmonių kraujospūdį, tada n = 1000. Tačiau kai dispersija apskaičiuojama pagal imties duomenis 1, prieš dalijant kvadratinių nuokrypių suma. Taigi aukščiau pateiktame pavyzdyje, jei imties duomenys turi 100 elementų, vardiklis būtų 100–1 = 99.
Dėl šios priežasties dispersijos vertė, apskaičiuota pagal imties duomenis, yra didesnė už vertę, kurią būtų buvę galima sužinoti naudojant populiacijos duomenis. Tai darymo logika yra kompensuoti mūsų informacijos apie gyventojus trūkumą. Neįmanoma išsiaiškinti žmonių ūgio kitimo, nes mums visiškai trūksta informacijos apie visų gyvų žmonių ūgį, o ne kalbėti apie ateitį. Net jei imtume vieną vidutinį pavyzdį, pavyzdžiui, duomenis apie visų gyvų vyrų ūgį JAV, tai yra fiziškai įmanoma, tačiau su tuo susijusios išlaidos ir laikas sugadins jo tikslą. Dėl šios priežasties imčių duomenys imami didžiąją dalį statistikos tikslų, o kartu trūksta informacijos apie daugumą duomenų. Norint tai kompensuoti, imties duomenų dispersijos vertė ir standartinis nuokrypis, išreikštas kvadratine dispersijos šaknimi, yra didesni nei dispersija pagal populiacijos duomenis.
Tai veikia kaip automatinis skydas analitikams ir sprendimus priimantiems asmenims. Logika taikoma priimant sprendimus dėl kapitalo biudžeto sudarymo, asmeninio ir verslo finansavimo, statybos, eismo valdymo ir daugelio kitų sričių. Tai padeda suinteresuotam subjektui būti saugiam, priimant sprendimą ar atliekant kitas išvadas.
Santrauka: Populiacijos dispersija reiškia dispersijos vertę, kuri apskaičiuojama pagal populiacijos duomenis, o imties dispersija - dispersija, apskaičiuota pagal imties duomenis. Dėl šios vardiklio reikšmės dispersijos formulėje imties duomenys yra 'n-1', o populiacijos duomenims - 'n'. Dėl šios priežasties tiek dispersija, tiek standartinis nuokrypis, gauti remiantis imties duomenimis, yra didesni nei tie, kurie nustatyti remiantis populiacijos duomenimis.