A tömörítésről általában, alapok, algoritmusok
Minden információ tartalmaz ismétlődő jeleket. (Redundancia) A tömörítés nem más, mint a redundancia csökkentése. A tömörítési arány függ a fájl típusától, átlagosan 2-4 szeres. Egyes képfájlok esetében az arány 8-12 szeres, szövegfájlok esetében 3-6 szoros, futtatható fájlok esetében 1,5-2,5 szeres.
A tömörítés és az archiválás fogalma nem ugyanaz. Az archiválás (archívumba rakás) az több fájl „összegyűjtése” egy fájlba. Előfordulhat ugyan, hogy a több fájl összegyűjtésekor tömörít is, de általában csak „összerakja” egy fájlba a többet.
Tömörítéskor megoldódó problémák:
- Az állományok méretet kisebb lesz, így kevesebb helyre lesz szükség a tárolásukhoz.
- A tömörített állományok kiterjesztése nem EXE vagy COM, ezért az ilyenekre "vadászó" vírusok nem fogják megfertőzni.
- Az tömörített állományok megadott méretű részekre szeletelhetők. ez azt jelenti, hogy az arcívum tartalma több különálló fájlra lesz elosztva. Ezzel a megoldással nagy állományokat tudunk lementeni több 1,44 MB-os lemezre.
A tömörítés típusai:
veszteségmentes: A kicsomagolt adat pontosan megegyezik a tömörítés előttivel. Fájlok tömörítésére használjuk. A veszteséges tömörítéshez képest lassabb, kevésbé hatékony, ellenben garantálható a tömörített adatok százszázalékos visszaállíthatósága.
veszteséges: A kicsomagolt adat csak hasonlít az eredeti adathoz, azonban kompromisszumot kötve ezt elfogadjuk. Ezt a módszert használjuk a képek, hangok és videók tömörítése esetén. A visszaállított kép minősége rosszabb, mint az eredetié, az emberi szem nem érzékeli, vagy nem olyan mértékűnek érzékeli a romlást. Olyan módszereket alkalmaz, amely akár nagyságrendekkel is javítja a tömörítési hatékonyságot, ráadásul nagy sebességgel dolgozik. Ennek azonban az ára hogy az alkalmazott módszertől függően 1-10 százaléknyi, néha még ennél is nagyobb adatvesztés lép fel.
A veszteségmentes tömörítő eljárások egy csoportosítási lehetősége:
- Parancssorban, vagy DOS környezetben elérhető tömörítők (pl.: ARJ)
- Windows alapú alkalmazások (pl.: WINZIP)
- Az operációs rendszerbe integrált tömörítési eljárások (röptömörítők)
A veszteséges tömörítés csoportba tartozik a JPG, amely az egyik legelterjedtebb képtárolási formátum. Kifejlesztője a Joint Photographic Expert Group. Adatvesztő tömörítési eljárást használó formátum. A tömörítési arány 5:1 és 20:1 közötti (a kitömörítéshez nincs szükség segédprogramra, a megjelenítést végző program a megnyitáskor elvégzi azt). A JPEG formátum 24 bites színmélységet képes kezelni (több mint 16,7 millió színt), a tömörítési eljárás azonban az emberi szem becsaphatóságán alapul, és adatvesztéssel jár.
Tömörítés szempontjából megkülönböztetünk szöveges és bináris adatokat. A szöveges adatokat mindig veszteségmentes eljárásokkal tömörítjük.
