Regresija vs koreliacija
Statistikoje svarbu nustatyti santykį tarp dviejų atsitiktinių kintamųjų. Tai suteikia galimybę numatyti vienus kintamuosius kitų atžvilgiu. Regresinė analizė ir koreliacija taikoma prognozuojant orus, finansinės rinkos elgsenai, fizinių ryšių užmezgimui eksperimentais ir daug realesniame pasaulyje scenarijuose..
Kas yra regresija?
Regresija yra statistinis metodas, naudojamas santykiams tarp dviejų kintamųjų nustatyti. Dažnai renkant duomenis gali būti kintamųjų, kurie priklauso nuo kitų. Tikslų šių kintamųjų ryšį galima nustatyti tik taikant regresijos metodus. Šio santykio nustatymas padeda suprasti ir numatyti vieno kintamojo elgesį su kitais.
Dažniausiai taikoma regresinė analizė yra įvertinti priklausomo kintamojo reikšmę tam tikrai vertei arba nepriklausomų kintamųjų verčių diapazonui. Pvz., Naudodamiesi regresija, galime nustatyti santykį tarp prekės kainos ir vartojimo, remiantis atsitiktinės imties surinktais duomenimis. Regresinė analizė sukuria duomenų rinkinio regresijos funkciją, kuri yra matematinis modelis, geriausiai tinkantis prie turimų duomenų. Tai lengvai gali pavaizduoti išsklaidytas siužetas. Grafiškai regresija yra lygi tinkamiausios duoti duomenų rinkinio kreivės nustatymui. Kreivės funkcija yra regresijos funkcija. Taikant matematinį modelį, prekės paklausą galima numatyti už tam tikrą kainą.
Todėl regresijos analizė plačiai naudojama numatant ir prognozuojant. Jis taip pat naudojamas ryšiams užmegzti su eksperimentiniais duomenimis, fizikos, chemijos, daugelio gamtos mokslų ir inžinerijos disciplinų srityse. Jei santykis arba regresijos funkcija yra tiesinė funkcija, tada procesas žinomas kaip tiesinė regresija. Sklaidos brėžinyje jis gali būti pavaizduotas kaip tiesė. Jei funkcija nėra linijinis parametrų derinys, tada regresija yra netiesinė.
Kas yra koreliacija?
Koreliacija yra ryšio tarp dviejų kintamųjų stiprumas. Koreliacijos koeficientas išreiškia vieno kintamojo pokyčio laipsnį, pagrįstą kito kintamojo pasikeitimu. Statistikoje koreliacija yra susijusi su priklausomybės sąvoka, kuri yra statistinis ryšys tarp dviejų kintamųjų.
„Pearsons“ koreliacijos koeficientas arba tiesiog koreliacijos koeficientas r yra reikšmė tarp -1 ir 1 (-1≤r≤ + 1). Tai yra dažniausiai naudojamas koreliacijos koeficientas ir galioja tik tiesiniam ryšiui tarp kintamųjų. Jei r = 0, ryšių nėra, o jei r≥0, santykis yra tiesiogiai proporcingas; y., vieno kintamojo vertė didėja didėjant kitam. Jei r≤0, santykis yra atvirkščiai proporcingas; y., vienas kintamasis mažėja, kai kitas didėja.
Dėl tiesiškumo sąlygos koreliacijos koeficientas r taip pat gali būti naudojamas nustatyti tiesinį ryšį tarp kintamųjų.
Kuo skiriasi regresija ir koreliacija?
Regresija suteikia santykio tarp dviejų atsitiktinių kintamųjų formą, o koreliacija suteikia ryšio stiprumo laipsnį.
Regresijos analizė sukuria regresijos funkciją, kuri padeda ekstrapoliuoti ir numatyti rezultatus, o koreliacija gali suteikti tik informacijos apie tai, kuria kryptimi ji gali keistis.
Tikslesni tiesinės regresijos modeliai pateikiami analizės būdu, jei koreliacijos koeficientas yra didesnis. (| r | ≥0,8)