Koreliacija ir regresija yra statistiniai įrankiai, nagrinėjantys du ar daugiau kintamųjų. Nors abu dalykai yra susiję su ta pačia tema, tarp jų yra skirtumų. Skirtumai tarp šių dviejų aiškinami toliau.
Sąvoka koreliacija su dviem ar daugiau kintamųjų reiškia, kad kintamieji yra tam tikru būdu susiję. Koreliacijos analizė nustato, ar egzistuoja ryšys tarp dviejų kintamųjų, ir koks ryšys yra stiprus. Jei du kintamieji x (nepriklausomi) ir y (priklausomi) yra taip susieti, kad nepriklausomo kintamojo dydžio pokytį lydi priklausomo kintamojo dydžio kitimas, tada šie du kintamieji yra koreliuojami.
Koreliacija gali būti tiesinė arba netiesinė. Tiesinė koreliacija yra tokia, kai kintamieji yra tokie susiję, kad vieno kintamojo vertės pasikeitimas nuosekliai pakeistų kito kintamojo vertę. Taikant tiesinę koreliaciją, išsklaidyti taškai, susiję su atitinkamomis priklausomų ir nepriklausomų kintamųjų reikšmėmis, susiliestų aplink ne horizontalią tiesę, nors horizontali tiesė taip pat nurodytų tiesinį ryšį tarp kintamųjų, jei tiesė galėtų sujungti taškus, vaizduojančius tašką kintamieji.
Regresinė analizė, atvirkščiai, naudoja esamus duomenis matematiniam ryšiui tarp kintamųjų nustatyti, kuris gali būti naudojamas priklausomo kintamojo reikšmei nustatyti, atsižvelgiant į bet kurią nepriklausomo kintamojo vertę..
Koreliacija yra susijusi su asociacijos stiprumo ar ryšių intensyvumo matavimu, kai regresija yra susijusi su priklausomo kintamojo vertės numatymu, atsižvelgiant į žinomą nepriklausomo kintamojo vertę. Tai galima paaiškinti šiomis formulėmis.
Koreliacijos koeficientas arba koeficiento koreliacija (r) tarp x ir y nustatomi pagal šią formulę;
r = kovariacija (x, y) /σx.σy, cov (x, y) = Σxy / n - (Σx / n) (Σy / n), σx ir σy yra atitinkamai x ir y standartiniai nuokrypiai ir, - 1 < r 0, then correlation coefficient between x and y = correlation coefficient between u and v.
Koreliacijos koeficientas r yra grynas skaičius ir nepriklauso nuo matavimo vieneto. Taigi, jei x yra aukštis (coliais), o y yra tam tikro regiono žmonių svoris (svarus), tai r nėra nei coliais, nei svarais, o tiesiog yra skaičius.
Regresijos lygtis apskaičiuojama pagal šią formulę:
Y regresijos lygtis x (norint sužinoti y vertę) yra y - y '= byx (x-x‾), byx vadinamas y regresijos koeficientu x. X regresijos lygtis y (norint sužinoti x vertę) yra x - x '= bxy (y-y‾), bxy vadinamas x y regresijos koeficientu y.
Koreliacijos analizė nereiškia, kad kuris nors kintamasis priklauso nuo kito kintamojo, taip pat nebandoma išsiaiškinti šių dviejų ryšių. Tiesiog įvertinamas kintamųjų asociacijos laipsnis. Kitaip tariant, koreliacijos analizė patikrina kintamųjų tarpusavio priklausomybę. Regresijos analizė, kita vertus, apibūdina priklausomo kintamojo ar atsako kintamojo priklausomybę nuo nepriklausomo ar aiškinamojo kintamojo (-ų). Regresinė analizė daro prielaidą, kad tarp aiškinamųjų ir atsako kintamųjų egzistuoja vienpusis priežastinis ryšys, ir neatsižvelgiama į tai, ar tas priežastinis ryšys yra teigiamas, ar neigiamas. Koreliacijai tiek priklausomų, tiek nepriklausomų kintamųjų vertės yra atsitiktinės, tačiau nepriklausomų kintamųjų regresijos reikšmės nebūtinai turi būti atsitiktinės..
1. Koreliacijos analizė yra dviejų kintamųjų tarpusavio priklausomybės testas. Regresinė analizė suteikia matematinę formulę priklausomo kintamojo reikšmei nustatyti, atsižvelgiant į nepriklausomo kintamojo (-ų) vertę.
2. Koreliacijos koeficientas nepriklauso nuo kilmės ir masto pasirinkimo, tačiau regresijos koeficientas nėra toks.
Koreliacijai abiejų kintamųjų reikšmės turi būti atsitiktinės, tačiau tai netaikoma regresijos koeficientui.
1. Das, N. G., (1998), Statistics Methods, Calcutta
2. Koreliacija ir regresija, kurią galima rasti tinklalapyje www.le.ac.uk/bl/gat/virtualfc/stats/regression
3. Regresija ir koreliacija, kurią galima rasti tinklalapyje www.abyss.uoregon.edu