Skirtumas tarp žvaigždės ir snaigės schemos

Duomenų saugykla yra sistema, skirta saugoti ir tvarkyti duomenis centrinėse saugyklose, įskaitant duomenis iš kitų šaltinių. Tai yra pagrindinė verslo intelekto koncepcija santykiniuose duomenų bazių modeliuose, kurioje naudojami analizės metodai, skirti verslo duomenims integruoti į centrinę duomenų bazę..

Duomenų saugykloje naudojami du įprasti architektūriniai modeliai:

  • Žvaigždžių schema
  • Snaigės schema

Abu yra įprasti daugialypiai duomenų bazių modeliai, naudojami didelių duomenų bazių poreikiams tenkinti analizės tikslais realiuose duomenų sandėliuose..

Pateikiame nešališką dviejų palyginimą, kad geriau suprastume, kuris yra geresnis už kitą.

Kas yra žvaigždžių schema?

Tai yra labiausiai paplitęs ir plačiai priimtas architektūrinis modelis, naudojamas kuriant duomenų sandėlius ir duomenų žemėlapius, kuriuose duomenys suskirstyti į faktus ir matmenis. Tai yra paprasčiausias architektūrinis modelis, kuriame viena faktų lentelė naudojama nuorodoms į kelių matmenų lenteles, imituojančioms žvaigždės modelį.

Kaip rodo pavadinimas, diagrama primena žvaigždę su faktų lentele centre ir iš jos spinduliuojančiomis kelių matmenų lentelėmis, sukuriančiomis žvaigždės pavidalo modelį.

Ji taip pat žinoma kaip „Star Join Schema“ ir joje visi dimensijos atributai kaupiami vienoje denormalizuotoje faktų lentelėje, kad būtų galima greitai naršyti po didelius daugialypius duomenų rinkinius, kurie atspindi greitą užklausos atsakymo laiką..

Kas yra snaigės schema?

Tai yra žvaigždės schemos pratęsimas su papildomomis funkcijomis. Skirtingai nuo žvaigždės schemos, snaigės schemos matmenų lentelės yra normalizuotos į keletą susijusių lentelių.

Architektūrinis modelis atspindi loginį lentelių išdėstymą daugelio santykio hierarchijoje, kai kelių dimensijų lentelės yra normalizuotos į subdimensijų lenteles, panašias į snaigės modelį, taigi ir pavadinimas.

Tai yra sudėtingesnė žvaigždės schemos versija, turinti daugiau jungčių tarp matmenų lentelių, todėl duomenų apdorojimo laikas yra lėtas, o tai reiškia, kad užklausos atsakymo laikas yra lėtas. Tai sumažina duomenų dubliavimą, o tai savo ruožtu pagerina užklausos našumą.

Skirtumas tarp žvaigždės ir snaigės schemos

Žvaigždžių ir snaigių schemos architektūra

Reliacinėse duomenų bazėse žvaigždžių schema yra paprasčiausias architektūrinis modelis, naudojamas kuriant duomenų sandėlius ir daugialypius duomenų žemėlapius. Kaip rodo pavadinimas, modelis primena žvaigždę, kurios taškai spinduliuoja nuo centro, ty faktų lentelė yra centras, o taškai yra matmenų lentelės. Kaip ir kiti matmenų modeliai, ją sudaro duomenys faktų ir matmenų pavidalu. Kita vertus, snaigės schema yra sudėtingesnis architektūrinis modelis, kuris nurodo daugialypę duomenų bazę su loginiu lentelių išdėstymu snaigės pavidalu..

Matmenų lentelė

Snaigės schema yra gana panaši į žvaigždės schemą, išskyrus tai, kad ji gali turėti daugiau nei vieną dimensijų lentelę, kuri toliau normalizuojama į keletą susijusių lentelių, vadinamų antrinių dimensijų lentelėmis. Tai atspindi įvairius santykių lygius, kurie išsiskiria į snaigės modelį. Tačiau žvaigždžių schema visus susijusius matmens atributus saugo vienoje denormalizuotoje dimensijų lentelėje, kuri leidžia lengvai suprasti ir tvarkyti paprastesnes užklausas..

Žvaigždžių ir snaigių schemos verslo modelis

Matmenų lentelėje negali būti egzempliorių, esančių reliacinių duomenų bazių modeliuose, pasikartojančių vien dėl to, kad ji gali sukelti dviprasmybių ieškant. Kiekvienoje lentelėje turėtų būti stulpelis arba stulpelių derinys, vadinamas pirminiu raktu, kuris unikaliai identifikuoja visus lentelės įrašus. Svetimas raktas yra stulpelis arba stulpelių grupė, teikianti ryšį tarp dviejų lentelių. Žvaigždžių schemoje kiekvienoje matmenų lentelėje yra pagrindinis raktas, kuris yra susietas su pašaliniu raktu faktų lentelėje. Verslo hierarchija snaigės schemoje pavaizduota pirminio rakto ir užsienio rakto ryšiu tarp matmenų lentelių.

Duomenų vientisumas žvaigždės ir snaigės schemoje

Pagrindinis skirtumas tarp dviejų reliacinių duomenų bazių modelių yra normalizavimas. Žvaigždučių schemoje esančios dimensijų lentelės nėra normalizuotos, tai reiškia, kad verslo modeliui reikės palyginti daugiau vietos dimensijų lentelėms laikyti, o daugiau vietos reiškia nereikalingus įrašus, kurie galų gale sukeltų nenuoseklumą. Kita vertus, snaigės schema sumažina duomenų dubliavimą, nes normalizuojamos matmenų lentelės, kurios sudaro daug mažiau nereikalingų įrašų. Verslo hierarchija ir jos matmenys išsaugomi remiantis referenciniu vientisumu, ty santykiai gali būti atnaujinami savarankiškai duomenų saugyklose.

Užklausos atlikimas

Žvaigždžių schemoje yra mažiau sujungimų tarp matmenų lentelės ir faktų lentelės, palyginti su snaigės schema, kurioje yra keli jungimai, dėl kurių užklausos yra mažiau sudėtingos. Kadangi žvaigždės schemos matmenys yra susieti per centrinę faktų lentelę, joje yra aiškūs sujungimo keliai, kurie reiškia greitą užklausos atsakymo laiką, o greitas atsakymo laikas reiškia geresnį našumą. Snaigės schemoje yra didesnis prisijungimų skaičius, todėl ilgesni užklausų atsakymo laikai, todėl gaunamos sudėtingesnės užklausos, kurios galiausiai pakenkia našumui.

Žvaigždžių schema ir snaigės schema: palyginimo diagrama


Žvaigždžių stichijų santrauka Snieguolės schema

Abu yra labiausiai paplitę ir plačiai pritaikyti architektūros modeliai, naudojami kuriant duomenų bazių sandėlius ir duomenų žemėlapius. Tačiau kiekvienam verslo modeliui priskiriama nemaža jo privalumų ir trūkumų dalis. Nors žvaigždžių schema yra paprasčiausias daugiamatis modelis, naudojamas duomenims suskirstyti į faktus ir dimensijas, jis idealiai tinka kurti duomenų žemėlapius, kuriuose naudojami ne tokie sudėtingi santykiai. Snaigės schema yra loginis lentelių, esančių daugiamatėje duomenų bazėje, vaizdavimas, kuriame matmenys yra kaupiami subdimensijų lentelėse. Pagrindinis skirtumas tarp šių dviejų yra normalizavimas. Snaigės schemos matmenų lentelės yra visiškai normalizuotos į kelias paieškų lenteles, o žvaigždės schemoje matmenų lentelės yra denormalizuotos į vieną centrinę faktų lentelę..