Skirtumas tarp giluminio ir sustiprintojo mokymosi

Tiek giluminis, tiek sustiprinamasis mokymasis yra labai susiję su dirbtinio intelekto (AI) skaičiavimo galia. Tai yra savarankiškos mašinų mokymosi funkcijos, leidžiančios kompiuteriams kurti savo principus, susijusius su sprendimų priėmimu. Šios dvi mokymosi rūšys taip pat gali egzistuoti keliose programose. Paprastai gilinantis mokomi nauji duomenys, tuo tarpu sustiprinantis mokymasis naudoja bandymų ir klaidų metodą prognozėms skaičiuoti. Tolesniuose aptarimuose toliau nagrinėjami tokie skirtumai.

Kas yra gilus mokymasis?

Giluminis mokymasis taip pat vadinamas giliai struktūrizuotu arba hierarchiniu mokymu. Tai pirmą kartą pristatė 1986 m. Rina Dechter, informatikos profesorė. Mokymo algoritmuose naudojama naujausia informacija ieškoma tinkamų modelių, kurie yra būtini prognozuojant duomenis. Tokia sistema naudoja skirtingus dirbtinių nervinių tinklų lygius, panašius į žmogaus smegenų neuronų makiažą. Naudodamas sudėtingas nuorodas, algoritmas gali būti pajėgus apdoroti milijonus informacijos ir zoną įvesti konkretesnę prognozę..

Toks mokymasis gali būti pritaikytas, kai kūrėjai nori, kad programinė įranga pastebėtų violetinę spalvą ant įvairių paveikslėlių. Tada programa bus maitinama daugybe vaizdų (taigi, „gilaus“ mokymosi) su violetinėmis spalvomis ir be jų. Grupuodama programa galės atpažinti modelius ir sužinoti, kada pažymėti spalvą kaip violetinę. Giluminis mokymasis naudojamas įvairiose atpažinimo programose, tokiose kaip vaizdų analizė ir prognozavimo užduotys, pavyzdžiui, prognozuojant laiko eilutes.

Kas yra mokymasis sustiprinimo?

Mokymasis sustiprinti paprastai numato prognozes bandymų ir klaidų būdu. Atsižvelgiant į jos istoriją iš PG perspektyvos, ji buvo sukurta devintojo dešimtmečio pabaigoje; jis buvo pagrįstas eksperimentų su gyvūnais rezultatais, optimalios kontrolės koncepcijomis ir laiko skirtumų metodais. Šalia prižiūrimo ir neprižiūrimo mokymosi, sustiprinimas yra viena iš pagrindinių mašininio mokymosi paradigmų. Kaip rodo jo pavadinimas, algoritmas mokomas atlygio.

Pavyzdžiui, AI yra sukurtas žaisti su žmonėmis tam tikrame mobiliajame žaidime. Kiekvieną kartą praradus AI, algoritmas yra peržiūrimas, kad būtų padidintas jo balas. Taigi iš šios technikos mokomasi iš savo klaidų. Po daugybės ciklų AI vystėsi ir tapo geresnė mušant žaidėjus. Sustiprinimas mokomasi naudojant įvairias pažangiausias technologijas, tokias kaip robotikos, teksto gavybos ir sveikatos priežiūros tobulinimas.

Skirtumas tarp giluminio ir sustiprintojo mokymosi

Mokymosi technika

Giluminis mokymasis sugeba įvykdyti tikslinį elgesį analizuojant esamus duomenis ir pritaikant tai, kas išmokta, naujam informacijos rinkiniui. Kita vertus, mokymasis stiprinti gali pakeisti savo reakciją pritaikant nuolatinį grįžtamąjį ryšį.

Duomenų buvimas

Gilus mokymasis veikia su jau turimais duomenimis, nes tai būtina treniruojant algoritmą. Kompetencijos mokymasis yra tiriamojo pobūdžio ir gali būti plėtojamas neturint dabartinių duomenų rinkinio, nes jis mokomasi atliekant bandymus ir klaidas..

Taikymas

Giluminis mokymasis naudojamas atvaizdo ir kalbos atpažinimui, giluminiam tinklo paruošimui ir dimensijų mažinimo užduotims. Palyginimui, sustiprinimas mokomasi sąveikaujant su išoriniais dirgikliais ir užtikrinant optimalų valdymą, pavyzdžiui, robotikoje, lifto planavime, telekomunikacijose, kompiuteriniuose žaidimuose ir sveikatos priežiūros AI..

Taip pat žinomas kaip

Giluminis mokymasis taip pat žinomas kaip hierarchinis mokymasis arba giluminis struktūrizuotas mokymasis, o mokymasis sustiprinti neturi kitų plačiai žinomų terminų.

Mašinų mokymasis

Gilus mokymasis yra vienas iš daugelio mašininio mokymosi metodų. Kita vertus, mokymasis sustiprinti yra mašinų mokymosi sritis; Tai yra viena iš trijų pagrindinių paradigmų.

Žmogaus smegenys

Palyginti su giluminiu mokymu, sustiprinimasis mokymasis yra artimesnis žmogaus smegenų galimybėms, nes tokį intelektą galima patobulinti teikiant grįžtamąjį ryšį. Gilus mokymasis daugiausia skirtas atpažinimui ir yra mažiau susijęs su sąveika.

Istorija

Giluminį mokymąsi pirmą kartą pristatė 1986 m. Rina Dechter, o sustiprintasis mokymasis buvo išplėtotas devintojo dešimtmečio pabaigoje remiantis eksperimentų su gyvūnais, optimalios kontrolės ir laiko skirtumų metodais..

Giluminis mokymasis prieš stiprinimą

Santrauka

  • Giluminis ir sustiprinamasis mokymasis yra savarankiškos mašinų mokymosi funkcijos, leidžiančios kompiuteriams sukurti savo principus, siūlant sprendimus.
  • Giluminis mokymasis naudoja esamą informaciją mokymo algoritmuose ieškant tinkamų modelių, kurie yra būtini prognozuojant duomenis.
  • Mokymasis sustiprinti paprastai numato prognozes bandymų ir klaidų būdu.
  • Giluminis mokymasis pritaiko išmoktus modelius naujam duomenų rinkiniui, tuo pačiu sustiprindamas mokymąsi įgyja grįžtamojo ryšio.
  • Norint mokytis giliai, reikalingas jau esamas duomenų rinkinys, o norint mokytis, norint sustiprinti, nereikia dabartinio duomenų rinkinio.
  • Giluminis mokymasis dažniausiai taikomas atpažinimo ir srities mažinimo užduotims, o mokymasis stiprinti paprastai yra susijęs su aplinkos sąveika ir optimalia kontrole.
  • Giluminis mokymasis taip pat žinomas kaip hierarchinis mokymasis arba giluminis struktūrizuotas mokymasis, o stiprinamasis mokymasis neturi kito termino.
  • Giluminis mokymasis yra vienas iš daugelio mašininio mokymosi metodų, o stiprinimasis mokymasis yra vienas iš trijų pagrindinių mašininio mokymosi paradigmų.
  • Giluminis mokymasis buvo įvestas 1986 m., O sustiprinamasis mokymasis buvo išplėtotas 1980-ųjų pabaigoje.