Variacija vs kovariacija
Variantas ir kovariacija yra dvi statistikoje naudojamos priemonės. Variacija yra duomenų išsibarstymo matas, o kovariacija rodo dviejų atsitiktinių kintamųjų pasikeitimo laipsnį kartu. Variacija yra labiau intuityvi sąvoka, tačiau kovariacija matematine prasme apibrėžiama ne iš pradžių intuityviai.
Daugiau apie „Variance“
Variacija yra duomenų pasiskirstymo iš vidutinės pasiskirstymo vertės matas. Tai nurodo, kiek duomenų taškai nutolę nuo paskirstymo vidurkio. Tai yra vienas iš pirminių tikimybių pasiskirstymo aprašų ir vienas iš paskirstymo momentų. Be to, dispersija yra populiacijos parametras, o imties iš dispersijos populiacija yra populiacijos dispersijos įvertis. Žiūrint iš vienos pusės, jis apibrėžiamas kaip standartinio nuokrypio kvadratas.
Aiškiai tariant, tai galima apibūdinti kaip atstumo tarp kiekvieno duomenų taško ir paskirstymo vidurkio kvadratų vidurkį. Dispersijai apskaičiuoti naudojama ši formulė.
Var (X) = E [(X-µ)2 gyventojų) ir
Var (X) = E [(X-‾x)2 ] mėginiui
Tai galima dar labiau supaprastinti, kad Var (X) = E [X2 ] - (E [X])2.
Variantas turi keletą parašo savybių ir dažnai naudojamas statistikoje, kad naudojimas būtų paprastesnis. Variacija nėra neigiama, nes tai yra atstumų kvadratas. Tačiau dispersijos diapazonas nėra ribojamas ir priklauso nuo konkretaus pasiskirstymo. Pastovaus atsitiktinio kintamojo dispersija yra lygi nuliui, o dispersija nesikeičia vietos parametro atžvilgiu.
Daugiau apie „Covariance“
Statistinėje teorijoje kovariacija yra tai, kiek du atsitiktiniai kintamieji keičiasi kartu. Kitaip tariant, kovariacija yra dviejų atsitiktinių kintamųjų koreliacijos stiprumo matas. Tai taip pat gali būti laikoma dviejų atsitiktinių kintamųjų dispersijos sampratos apibendrinimu.
Dviejų atsitiktinių kintamųjų X ir Y, kurie yra pasiskirstę kartu su baigtiniu antruoju impulsu, kovariacija yra žinoma σXY= E [(X-E [X]) (Y-E [Y])]. Taigi dispersija gali būti vertinama kaip ypatingas kovariacijos atvejis, kai du kintamieji yra vienodi. Cov (X, X) = Var (X)
Normalizavus kovariaciją, gali būti gautas tiesinis koreliacijos koeficientas arba Pearsono koreliacijos koeficientas, kuris apibūdinamas kaip ρ = E [(X-E [X]) (Y-E [Y])] / (σX σY ) = (Cov (X, Y)) / (σX σY)
Grafiškai kovariacija tarp duomenų taškų poros gali būti vertinama kaip stačiakampio ir duomenų taškų priešingose viršūnėse plotas. Tai gali būti suprantama kaip dviejų duomenų taškų atskyrimo dydžio matas. Atsižvelgiant į visos populiacijos stačiakampius, atskyrimo stiprumu galima laikyti stačiakampių, atitinkančių visus duomenų taškus, persidengimą; dviejų kintamųjų dispersija. Kovariancija yra dviejų matmenų, nes yra du kintamieji, tačiau supaprastinus ją vienu kintamuoju, gaunamas vieno varianto, kaip atskyrimo vienoje dimensijoje, dispersija..
Kuo skiriasi dispersija ir kovariacija?
• dispersija yra populiacijos sklaidos / sklaidos matas, tuo tarpu kovariacija laikoma dviejų atsitiktinių kintamųjų variacijos arba koreliacijos stiprumo matu;.
• dispersija gali būti laikoma ypatingu kovariancijos atveju.
• dispersija ir kovariacija priklauso nuo duomenų verčių dydžio ir jų negalima palyginti; todėl jie yra normalizuoti. Kovariacija normalizuojama į koreliacijos koeficientą (padalijant iš dviejų atsitiktinių kintamųjų standartinių nuokrypių sandaugos), o dispersija normalizuojama į standartinį nuokrypį (imant kvadratinę šaknį).