Skirtumas tarp klasifikavimo ir regresijos

pagrindinis skirtumas tarp klasifikavimo ir regresijos medžio yra tai klasifikuojant priklausomi kintamieji yra kategoriški ir netvarkingi, tuo tarpu regresijoje priklausomi kintamieji yra ištisinės arba išdėstytos ištisinės vertės.

Klasifikavimas ir regresija yra mokymosi metodai, skirti sukurti prognozavimo modelius iš surinktų duomenų. Abi metodikos yra grafiškai pateiktos kaip klasifikavimo ir regresijos medžiai, arba veikiau schemos su duomenų padalijimais po kiekvieno žingsnio, arba, tiksliau, „šaka“ medyje. Šis procesas vadinamas rekursiniu skaidymu. Tokiose srityse kaip kalnakasyba naudojami šie klasifikavimo ir regresinio mokymosi metodai. Šis straipsnis skirtas klasifikavimo medžiui ir regresijos medžiui.

TURINYS

1. Apžvalga ir svarbiausias skirtumas
2. Kas yra klasifikacija
3. Kas yra regresija
4. Šalutinis palyginimas - klasifikacija vs regresija lentelės pavidalu
5. Santrauka

Kas yra klasifikacija?

Klasifikacija yra metodas, naudojamas gauti schemą, parodančią duomenų organizavimą pradedant pirmtako kintamuoju. Duomenys klasifikuojami priklausomais kintamaisiais.

01 paveikslas: Duomenų gavyba

Klasifikavimo medis prasideda nepriklausomu kintamuoju, kuris išsidalijamas į dvi grupes, kurias nustato priklausomi kintamieji. Tai skirta išsiaiškinti atsakymus į kategorijas, atsirandančias priklausomų kintamųjų pavidalu.

Kas yra regresija

Regresija yra numatymo metodas, pagrįstas numanoma ar žinoma skaitmenine išvesties verte. Ši išvesties vertė yra rekursinio skaidymo eilės rezultatas, kiekviename žingsnyje yra viena skaitinė reikšmė ir kita priklausomų kintamųjų grupė, išsišakojanti į kitą porą, tokią kaip ši.

Regresijos medis prasideda vienu ar keliais pirmtakų kintamaisiais ir baigiasi vienu galutiniu išvesties kintamuoju. Priklausomi kintamieji yra ištisiniai arba atskirieji skaitiniai kintamieji.

Kuo skiriasi klasifikacija ir regresija??

 Klasifikacija vs regresija

Medžio modelis, kuriame tikslinis kintamasis gali būti atskiras verčių rinkinys. Medžio modelis, kuriame tikslinis kintamasis gali turėti nuolatines reikšmes, paprastai realiuosius skaičius.
Priklausomas kintamasis
Klasifikavimo medžiui priklausomi kintamieji yra kategoriški. Regresijos mediui priklausomi kintamieji yra skaitiniai.
Vertybės
Turi nustatytą netvarkytų verčių kiekį. Turi diskretines, bet užsakytas reikšmes arba nenuobodžius.
Statybos tikslas
Regresijos medžio konstravimo tikslas yra pritaikyti regresijos sistemą prie kiekvienos lemiančios šakos taip, kad kiltų laukiama išėjimo vertė.. Klasifikavimo medis išsišakoja, kaip nustato priklausomas kintamasis, gautas iš ankstesnio mazgo.

Santrauka - klasifikacija vs regresija

Regresijos ir klasifikavimo medžiai yra naudingi metodai, skirti nubrėžti procesą, kuris nurodo tiriamą rezultatą klasifikavimo ar vienos skaitinės vertės atžvilgiu. Skirtumas tarp klasifikavimo medžio ir regresijos medžio yra nuo jų priklausomas kintamasis. Klasifikavimo medžiai turi priklausomus kintamuosius, kurie yra kategoriški ir netvarkingi. Regresijos medžiai turi priklausomus kintamuosius, kurie yra ištisinės vertės arba užsakytos visos vertės.

Nuoroda:

1. „Sprendimų medžio mokymasis“. Vikipedija, „Wikimedia Foundation“, 2018 m. Gegužės 13 d. Galima rasti čia 

Vaizdo mandagumas:

1.Data Mining'By Arbeckas - savo darbas, (CC BY 3.0) per „Commons Wikimedia“