Skirtumas tarp GZIP ir BZIP2

„GZIP“ ir „BZIP2“

GNU ZIP (dar žinomas kaip GZIP) yra programinė įranga, skirta suspausti failus. Iš pradžių buvo numatyta pakeisti suspaudimo programą, naudojamą ankstyvosiose „Unix“ sistemose - naudoti GNU projekte (nemokamas programinės įrangos projektas)..

„BZIP2“ yra atvirojo kodo duomenų negrąžinamų duomenų glaudinimo algoritmas - iš esmės duomenų glaudinimo algoritmų klasė, leidžianti visiškai susigrąžinti suspausto failo pradinius duomenis iš suspausto duomenų..

GZIP yra pagrįstas algoritmu, vadinamu DEFLATE. Tai taip pat yra nuostolingas duomenų glaudinimo algoritmas. Tam naudojamas tiek LZ77 algoritmas, tiek Huffmano kodavimas. Iš esmės GZIP nurodo to paties pavadinimo failo formatą. Šis formatas yra 10 baitų antraštė, kurioje yra stebuklingas skaičius (tai reiškia skaitinę ar tekstinę vertę, kuri niekada nesikeičia ir naudojama reikšti failo formatą ar protokolą, bevardę skaitinę reikšmę, kuri niekada nesikeičia, arba atskiras reikšmes, kurių negalima suklysti. viskam kitam), papildomos antraštės, kurios gali būti reikalingos arba nebūtinai reikalingos (pavyzdžiui, originalus failo pavadinimas), korpusas, kuriame yra suspausta naudinga apkrova (kuri yra antraščių duomenys) ir 8 baitų poraštė. kuriame yra CRC-32 kontrolinė suma, taip pat tikrasis pirminių nesuspaustų duomenų ilgis.

Yra daugybė BZIP2 formato naudojamų glaudinimo būdų, kurie yra sudedami vienas ant kito keliais sluoksniais. Jie vyksta labai savita tvarka: vykdymo ilgio kodavimas (tai yra bet kuri keturių iki 255 simbolių kopijų seka, kuri pakeičiama pirmaisiais keturiais simboliais, ir kodavimo trukmė, kuri kartojasi nuo 0 iki 251), Burrows-Wheeler transformacija ( tai yra grįžtamasis blokų rūšiavimas, sudarantis pačią BZIP2 šerdį), judėjimas į priekį (paliekamas nepakeistas apdoroto bloko dydis), vykdymo ilgio kodavimas (kurį sudaro ilgos simbolių sruogos - paprastai nuliai), kurios nuolatos pakartoti išvestyje ir pakeisti tiek simboliu, tiek dviejų kodų seka), Huffmano kodavimas (tai yra procesas, pakeičiantis fiksuoto ilgio 8 bitų baitus keičiamais ilgio kodais), daugybinis Hoffmano kodavimas (kurį sudaro kelios vienodo dydžio „Hoffman“ lentelės), „Unary base 1“ kodavimas, „Delta“ kodavimas ir „Retas bitų“ masyvas.

Santrauka:

1. GZIP yra nemokama programa, naudojama failams suspausti; „BZIP2“ yra atvirojo kodo duomenų negrįžtamo suspaudimo algoritmas, leidžiantis atkurti suspausto failo pradinius duomenis.

2. GZIP sudaro 10 baitų antraštė, pasirinktinės antraštės, korpusas ir 8 baitų poraštė; „BZIP2“ sudaro ne mažiau kaip devyni glaudinimo būdų sluoksniai.