DBVS prieš duomenų gavybą
DBMS (duomenų bazių valdymo sistema) - tai visa sistema, naudojama skaitmeninėms duomenų bazėms valdyti, leidžianti saugoti duomenų bazių turinį, kurti / prižiūrėti duomenis, ieškoti ir kitas funkcijas. Kita vertus, „Data Mining“ yra kompiuterių mokslo sritis, nagrinėjanti anksčiau nežinomos ir įdomios informacijos iš neapdorotų duomenų gavimą. Paprastai duomenys, naudojami kaip duomenų gavybos proceso įvestis, saugomi duomenų bazėse. Į statistiką linkę vartotojai naudojasi duomenų gavyba. Jie pasitelkia statistinius modelius, norėdami ieškoti paslėptų duomenų modelių. Duomenų išminuotojai yra suinteresuoti rasti naudingus ryšius tarp skirtingų duomenų elementų, o tai iš esmės yra pelninga įmonėms.
DBVS
DBVS, kartais tiesiog vadinama duomenų bazių tvarkykle, yra kompiuterinių programų rinkinys, skirtas visų sistemoje (t. Y. Kietajame diske ar tinkle) įdiegtų duomenų bazių valdymui (t. Y. Tvarkymui, saugojimui ir gavimui). Pasaulyje egzistuoja įvairių tipų duomenų bazių valdymo sistemos, ir kai kurios iš jų yra skirtos tinkamam duomenų bazių, sukonfigūruotų konkretiems tikslams, valdymui. Populiariausios komercinės duomenų bazių valdymo sistemos yra „Oracle“, „DB2“ ir „Microsoft Access“. Visi šie produktai suteikia galimybę skirtingiems vartotojams paskirstyti skirtingas privilegijas, leidžiančias DBMS centralizuotai valdyti vienam administratoriui arba paskirstyti keliems skirtingiems žmonėms. Bet kurioje duomenų bazių valdymo sistemoje yra keturi svarbūs elementai. Jie yra modeliavimo kalba, duomenų struktūros, užklausų kalba ir operacijų mechanizmas. Modeliavimo kalba apibrėžia kiekvienos duomenų bazės, esančios DBVS, kalbą. Šiuo metu praktikoje naudojami keli populiarūs metodai, tokie kaip hierarchija, tinklas, reliacinis ryšys ir objektas. Duomenų struktūros padeda tvarkyti tokius duomenis kaip atskiri įrašai, failai, laukai ir jų apibrėžimai bei objektai, tokie kaip vaizdinė laikmena. Duomenų užklausos kalba palaiko duomenų bazės saugumą stebint prisijungimo duomenis, prieigos teises skirtingiems vartotojams ir protokolus norint pridėti duomenis į sistemą. SQL yra populiari užklausų kalba, naudojama santykinių duomenų bazių valdymo sistemose. Galiausiai sandorius leidžiantis mechanizmas padeda suderinti ir dauginti. Taikant šį mechanizmą bus užtikrinta, kad keli vartotojai tuo pačiu metu nepakeis to paties įrašo, tokiu būdu išlaikant duomenų vientisumą. Be to, DBVS taip pat teikia atsargines ir kitas galimybes.
Duomenų gavyba
Duomenų gavyba taip pat žinoma kaip žinių atradimas duomenyse (KDD). Kaip minėta aukščiau, tai yra informatikos felidas, nagrinėjantis anksčiau nežinomos ir įdomios informacijos iš neapdorotų duomenų gavimą. Dėl eksponentinio duomenų augimo, ypač tokiose srityse kaip verslas, duomenų gavyba tapo labai svarbia priemone, leidžiančia šį didelį duomenų turtą paversti verslo analize, nes per pastaruosius kelis dešimtmečius rankiniu būdu išgauti modelius tapo neįmanoma. Pavyzdžiui, šiuo metu jis naudojamas įvairioms programoms, tokioms kaip socialinių tinklų analizė, sukčiavimo aptikimas ir rinkodara. Duomenų gavyba paprastai apima šias keturias užduotis: grupavimą, klasifikavimą, regresiją ir susiejimą. Klasteriai identifikuoja panašias grupes iš nestruktūrizuotų duomenų. Klasifikacija yra mokymosi taisyklės, kurios gali būti pritaikytos naujiems duomenims ir kurias paprastai sudaro šie etapai: pirminis duomenų apdorojimas, modeliavimo projektavimas, mokymosi / ypatybių pasirinkimas ir vertinimas / patvirtinimas. Regresija - tai funkcijų paieška su minimaliomis klaidomis modeliuojant duomenis. Asociacija ieško santykių tarp kintamųjų. Duomenų gavyba paprastai naudojama atsakant į klausimus, pvz., Kurie yra pagrindiniai produktai, kurie kitais metais gali padėti gauti didelį pelną iš „Wal-Mart“?
Kuo skiriasi DBVS ir duomenų gavyba??
DBVS yra visavertė sistema, skirta skaitmeninių duomenų bazių rinkiniui laikyti ir valdyti. Tačiau duomenų gavyba yra kompiuterijos mokslo metodas arba koncepcija, skirta naudingos ir anksčiau nežinomos informacijos iš neapdorotų duomenų gavimui. Dažniausiai šie neapdoroti duomenys saugomi labai didelėse duomenų bazėse. Todėl duomenų gavikliai naudoja esamas DBVS funkcijas tvarkydami, tvarkydami ir net apdorodami neapdorotus duomenis prieš duomenų gavybos procesą ir jo metu. Tačiau duomenims analizuoti negali būti naudojama tik DBVS sistema. Tačiau kai kuriose DBVS šiuo metu yra įmontuoti duomenų analizės įrankiai ar galimybės.