Linijinė ir logistinė regresija
Atliekant statistinę analizę svarbu nustatyti ryšius tarp tiriamų kintamųjų. Kartais tai gali būti vienintelis pačios analizės tikslas. Viena iš stiprių priemonių, naudojamų ryšiui nustatyti ir ryšiui nustatyti, yra regresinė analizė.
Paprasčiausia regresijos analizės forma yra tiesinė regresija, kai santykis tarp kintamųjų yra tiesinis. Statistiškai ji paaiškina ryšį tarp aiškinamojo ir atsakymo kintamojo. Pvz., Naudodamiesi regresija, mes galime nustatyti prekių kainos ir vartojimo santykį, remiantis duomenimis, surinktais iš atsitiktinės imties. Regresinė analizė leis gauti duomenų rinkinio regresijos funkciją, kuri yra matematinis modelis, geriausiai tinkantis prieinamiems duomenims. Tai lengvai gali pavaizduoti išsklaidytas siužetas. Grafinė regresija yra lygi tinkamiausios duotosios duomenų kreivės nustatymui. Kreivės funkcija yra regresijos funkcija. Taikant matematinį modelį, prekės kainą galima numatyti už tam tikrą kainą.
Todėl regresijos analizė plačiai naudojama numatant ir prognozuojant. Jis taip pat naudojamas norint nustatyti ryšius su eksperimentiniais duomenimis, fizikos, chemijos, daugelyje gamtos mokslų ir inžinerijos disciplinų. Jei santykis arba regresijos funkcija yra tiesinė funkcija, tada procesas žinomas kaip tiesinė regresija. Sklaidos brėžinyje jis gali būti pavaizduotas kaip tiesė. Jei funkcija nėra linijinis parametrų derinys, tada regresija yra netiesinė.
Logistinė regresija yra panaši į daugiamatę regresiją ir ji sukuria modelį, paaiškinantį kelių prognozatorių poveikį atsako kintamajam. Tačiau atliekant logistinę regresiją, galutinio rezultato kintamasis turėtų būti kategoriškas (paprastai padalijamas; t. Y. Pasiekiamų pasekmių, tokių kaip mirtis ar išgyvenimas, pora, nors specialūs metodai leidžia modeliuoti labiau kategorizuotą informaciją). Ištisinis kintamasis gali būti paverstas kategoriniu kintamuoju, kuris bus naudojamas logistinei regresijai; tačiau tokiu būdu nerodomi nuolatiniai kintamieji, nes tai sumažina tikslumą.
Skirtingai nei tiesinėje regresijoje, logistinės regresijos prognozuojamieji kintamieji, atsižvelgiant į vidurkį, neturi būti verčiami būti linijiškai sujungti, paprastai paskirstyti ar turėti vienodą dispersiją kiekvienoje klasteryje. Todėl santykis tarp numatytojo ir rezultato kintamųjų greičiausiai nebus tiesinė funkcija.
Kuo skiriasi logistinė ir tiesinė regresija?
• Taikant tiesinę regresiją, daroma prielaida, kad aiškinamasis kintamasis ir atsako kintamasis yra tiesinis, o modelį atitinkantys parametrai randami analizės būdu, kad būtų gautas tikslus ryšys..
• Kiekybiniams kintamiesiems atliekama tiesinė regresija, o gauta funkcija yra kiekybinė.
• Logistinėje regresijoje naudojami duomenys gali būti kategoriniai arba kiekybiniai, tačiau rezultatas visada yra kategoriškas.