Duomenų gavyba vs OLAP
Duomenų gavyba ir OLAP yra dvi įprastos verslo žvalgybos (BI) technologijos. Verslo žvalgyba reiškia kompiuterinius metodus, leidžiančius identifikuoti ir iš verslo duomenų gauti naudingą informaciją. Duomenų gavyba yra kompiuterių mokslo sritis, kurioje nagrinėjami įdomių modelių gavimo iš didelių duomenų rinkinių duomenys. Tai derina daugelį metodų, įskaitant dirbtinį intelektą, statistiką ir duomenų bazių valdymą. OLAP (internetinis analitinis apdorojimas), kaip rodo pavadinimas, yra kelių dimensijų duomenų bazių užklausų sudarymo būdų rinkinys.
Duomenų gavyba taip pat žinoma kaip žinių atradimas duomenyse (KDD). Kaip minėta pirmiau, tai kompiuterių mokslo sritis, kurioje nagrinėjama anksčiau nežinomos ir įdomios informacijos iš neapdorotų duomenų gavyba. Dėl eksponentinio duomenų augimo, ypač tokiose srityse kaip verslas, duomenų gavyba tapo labai svarbia priemone, leidžiančia šį didelį duomenų turtą paversti verslo analize, nes per pastaruosius kelis dešimtmečius rankiniu būdu išgauti modelius tapo neįmanoma. Pavyzdžiui, šiuo metu jis naudojamas įvairioms programoms, tokioms kaip socialinių tinklų analizė, sukčiavimo aptikimas ir rinkodara. Duomenų gavyba paprastai apima šias keturias užduotis: grupavimą, klasifikavimą, regresiją ir susiejimą. Klasteriai identifikuoja panašias grupes iš nestruktūrizuotų duomenų. Klasifikacija yra mokymosi taisyklės, kurios gali būti pritaikytos naujiems duomenims ir kurias paprastai sudaro šie etapai: pirminis duomenų apdorojimas, modeliavimas, mokymosi / ypatybių pasirinkimas ir vertinimas / patvirtinimas. Regresija - tai funkcijų paieška su minimaliomis klaidomis modeliuojant duomenis. Asociacija ieško santykių tarp kintamųjų. Duomenų gavyba paprastai naudojama atsakant į klausimus, pvz., Kurie yra pagrindiniai produktai, galintys padėti kitais metais gauti didelį pelną iš „Wal-Mart“.
OLAP yra sistemų klasė, teikianti atsakymus į daugialypius klausimus. Paprastai OLAP naudojamas rinkodaros, biudžeto sudarymo, prognozavimo ir panašioms programoms. Savaime suprantama, kad OLAP naudojamos duomenų bazės yra sukonfigūruotos sudėtingoms ir ad-hoc užklausoms, atsižvelgiant į greitą našumą. Paprastai OLAP išvesties atvaizdavimui naudojama matrica. Eilutės ir stulpeliai formuojami pagal užklausos matmenis. Norėdami gauti suvestines, jie dažnai naudoja kaupimo keliose lentelėse metodus. Pavyzdžiui, juo galima sužinoti apie šių metų „Wal-Mart“ pardavimus, palyginti su praėjusiais metais? Kokia prognozuojama kito ketvirčio pardavimai? Ką galima pasakyti apie tendenciją, pažiūrėjus į procentų pokytį?
Nors akivaizdu, kad Duomenų gavyba ir OLAP yra panašios, nes naudoja duomenis, kad gautų žvalgybos duomenis, pagrindinis skirtumas yra tas, kaip jie veikia su duomenimis. OLAP įrankiai teikia daugialypę duomenų analizę ir pateikia duomenų santraukas, tačiau priešingai - duomenų gavime pagrindinis dėmesys skiriamas santykiams, modeliams ir įtakai duomenų rinkinyje. Tai yra OLAP sandoris su apibendrinimu, kuris susijęs su duomenų valdymu per „papildymą“, tačiau duomenų gavyba atitinka „padalijimą“. Kitas pastebimas skirtumas yra tas, kad nors duomenų gavybos įrankiai modeliuoja duomenis ir grąžina įgyvendinamas taisykles, OLAP realiuoju laiku atliks palyginimo ir kontrastavimo metodus verslo aspektu..