Konputazio zientzian datu-konpresioa tratatu beharreko datuen bolumenaren murriztea da, informazio jakin bat ahalik eta espazio kopuru txikiena erabiliz adierazteko. Datu-konpresioaren ekintza konpresio izendatzen da, eta kontrakoa deskonpresioa.
Konpresiorik gabeko informazio kodetu batek (datuak, seinale digitala, eta abar) hartzen duen lekua laginketaren maiztasunaren eta bereizmenaren arteko zatidura da. Beraz, zenbat eta bit gehiago erabili, orduan eta handiagoa izango da fitxategiaren tamaina. Dena den, lanerako erabiltzen den sistema digitalak ezartzen du bereizmena eta biten kopurua ezin da nahi bezala aldatu; hori dela eta, konpresioa erabiltzen da, bereizmen handiko informazio kantitate bera bit kopuru txikiagoan transmititzeko.
Datu konpresiorako erabiltzen diren algoritmoak zenbakiak zenbaki lehenen biderketa moduan adierazteko algortimoetan oinarritzen dira. Biderketa horretako zenbaki lehenen maiztasunak modu unibokoan adierazten du jatorrizko datua zein den.
Konpresioa kodeketa berezi bat da eta bere ezaugarri nagusia da, konpresioarekin lortutako kodeketak jatorrizkoak baino tamaina txikiagoa duela.
Datu-konpresioa, funtsean, datu-sekuentzien errepikapenak aurkitzean datza; ondoren, datua eta errepikapenen kopurua besterik ez da gordeko. Honela, adibidez, fitxategi batean 6 byte okupatzen duen "AAAAAA" sekuentzia agertzen bada, 2 byte besterik okupatzen ez duen " 6A" gorde ahal izango litzateke, RLE algoritmoa erabiliz.
Egia esan, prozesua askoz ere konplexuagoa da, gutxitan lortzen direlako hain zehatzak diren errepikapen-ereduak (irudiren batzuetan izan ezik). Honako konpresio-algoritmoak erabiltzen dira:
Konpresioari buruz hitz egiterakoan, honako bi kontzeptuak kontutan hartu behar dira:
Datuek emandako informazioa hiru motatako izan daiteke:
Hiru informazio mota horiek kontuan izanik, informazioaren konpresiorako hiru eredu ezartzen dira: