Skirtumas tarp HBase ir avilio

„HBase“ ir „Hive“ yra „Hadoop“ duomenų saugyklų struktūros, kurios labai skiriasi tuo, kaip jos saugo ir užklausa duomenis. Naudojant įprastas duomenų bazių valdymo priemones, vis sunkiau valdyti ir apdoroti didžiulį internetinių duomenų kiekį. Tai yra vieta, kur „HBase“ pasiekia nuotrauką. „HBase“ yra tinkamiausias pasirinkimas tvarkant didelius duomenų kiekius. Pvz., Jei jums reikia filtruoti per didelę elektroninių laiškų parduotuvę, kad galėtumėte išsitraukti vieną auditui ar kitam tikslui, tai bus puikus „HBase“ naudojimo atvejis. Avilys, kita vertus, labiau primena tradicinę duomenų saugyklų ataskaitų teikimo sistemą, veikiančią Hadoop viršuje. „Hive“ siūlo į SQL panašią užklausų kalbą, leidžiančią pateikti užklausą apie „Hadoop“ saugomus pusiau struktūruotus duomenis. Tam reikia nereikalingų pastangų, kai reikia parašyti „MapReduce“ kodą. Nors tiek „HBase“, tiek „avilys“ yra naudojami kaip duomenų saugyklos nestruktūrizuotiems duomenims saugoti, jie skiriasi.

Kas yra Hbase?

„HBase“ yra atvirojo kodo, nesusijusi, duomenų bazių valdymo sistema, įkvėpta „Google“ didžiojo stalo architektūros ir parašyta „Java“. Iš esmės „HBase“ yra į kolonėles orientuota paskirstyta „NoSQL“ duomenų bazė, veikianti „Hadoop“ paskirstytųjų failų sistemos (HDFS) viršuje. Jį sukūrė ir sukūrė daugelis inžinierių, remdamiesi „Apache Software Foundation“. Jis yra „Apache Hadoop“ ir yra maitinamas iš trikdžiams atsparios paskirstytos failų struktūros, žinomos kaip HDFS. Tai suteikia galimybę saugoti negausius duomenų rinkinius, kurie yra įprasti didelių duomenų naudojimo atvejais. Tai leidžia greitai nuskaityti atsitiktinės prieigos duomenis iš didelių duomenų kiekių, remiantis pagrindinėmis vertėmis. Tačiau jis nėra skirtas duomenims kaupti.

Kas yra avilys?

„Hive“ nėra tiksliai duomenų bazė, bet duomenų saugojimo paketas, pastatytas ant „Hadoop“. Avilys yra kitokia nei HBase technologija; Tai struktūrizuoja duomenis lentelių rinkinyje, kurį galima sujungti, sujungti ir pateikti užklausą naudojant užklausos kalbą, vadinamą „Hive Query Language“ (HQL), kuri yra labai panaši į SQL, naudojamą didelių duomenų paketui apdoroti. Tai leidžia jums užduoti užklausą apie „Hadoop“ saugomus pusiau struktūruotus duomenis, kurie ilgainiui paverčiami „MapReduce“ užduotimi, vykdomomis vietoje arba paskirstytoje „MapReduce“ grupėje. „Hive“ iš esmės yra „Hadoop“ duomenų saugyklos sistema, palengvinanti duomenų apibendrinimą, ad-hoc užklausas ir didelių duomenų rinkinių, saugomų „Hadoop“ suderinamose failų sistemose, analizę. Duomenis galima skaityti ir rašyti iš „Hive“ ir „HBase“ ir atvirkščiai. Tačiau jis negali būti naudojamas duomenų apdorojimui realiuoju laiku.

Skirtumas tarp HBase ir Hive

Technologija

- Nors „HBase“ ir „Hive“ yra „Hadoop“ duomenų saugyklų struktūros, naudojamos saugoti ir apdoroti didelius duomenų kiekius, jos labai skiriasi tuo, kaip jos saugo ir užklausa duomenis. Iš esmės „HBase“ yra į stulpelius orientuota paskirstyta „NoSQL“ duomenų bazė, veikianti naudojant „Hadoop“ paskirstytą failų sistemą (HDFS) ir užtikrinanti gedimams atsparų būdą kaupti negausius duomenų rinkinius, kurie yra įprasti didelių duomenų naudojimo atvejais. Kita vertus, „Hive“ nėra tiksliai duomenų bazė, o duomenų saugojimo paketas, pastatytas „Hadoop“ viršuje. Avilys labiau primena tradicinę duomenų saugyklų ataskaitų teikimo sistemą.

Architektūra

- „HBase“ yra „NoSQL“ duomenų bazė ir atvirojo kodo „Google Big Table“ architektūros įgyvendinimas, esantis „Apache Hadoop“ ir maitinamas gedimams atsparios paskirstytos failų struktūros, žinomos kaip HDFS. Tai yra keičiamo dydžio saugojimo sprendimas, skirtas talpinti beveik begalinį duomenų kiekį. Tai duomenų saugojimo architektūra, naudojama nestruktūrizuotiems duomenims saugoti. Kita vertus, „Hive“ yra SQL variklis, pastatytas ant HDFS viršaus ir naudojantis „MapReduce“ iš vidaus, leidžiantis užklausti duomenis, saugomus HDFS, naudojant SQL tipo užklausų kalbą, vadinamą HQL („Hive Query Language“)..

Naudokite

- „HBase“ naudojama kuriant pigias, lanksčias ir lengvai prižiūrimas plytelių sluoksnio paslaugas - „Hadoop“ pagrįstą geografinės informacijos sistemą (HBGIS) - siekiant masiškai saugoti duomenis. Tai yra disko stulpelių saugojimo formatas, suteikiantis būdą saugoti negausius duomenų rinkinius, kurie yra įprasti didelių duomenų naudojimo atvejais. Tai leidžia greitai nuskaityti atsitiktinės prieigos duomenis iš didelių duomenų kiekių, remiantis pagrindinėmis vertėmis. „Hive“, kita vertus, yra SQL užklausų, susijusių su „Hadoop“ duomenų petabaitais, standartas ir teikia į SQL panašią užklausų kalbą, vadinamą HQL, skirtą užklausai apie duomenis, saugomus „Hadoop“ klasteryje..

„HBase“ ir „avilys“: palyginimo diagrama

Santrauka

Nors „HBase“ ir „Hive“ yra „Hadoop“ duomenų saugyklų struktūros, naudojamos saugoti ir apdoroti didelius duomenų kiekius, jos labai skiriasi tuo, kaip jos saugo ir užklausa duomenis. „HBase“ yra į stulpelius orientuota duomenų bazių valdymo sistema, naudojama dideliam duomenų saugojimui ir suteikia galimybę laikyti negausius duomenų rinkinius, kurie yra įprasti keliais dideliais duomenų naudojimo atvejais. „Hive“, kita vertus, labiau primena tradicinę duomenų saugyklų ataskaitų teikimo sistemą, pastatytą ant „Hadoop“, naudojamą apdoroti pagal tvarkaraščių užduotis, o tada įkelti rezultatus į suvestinės tipo lentelę, kurią gali toliau teirautis klientų programos.