情報源データを,より短いデータ表現に変換すること. 変換後の表現から情報源のデータをそのまま復元できるものを 可逆圧縮 (無歪圧縮, lossless data compression),そうでないものを 不可逆圧縮 (lossy data compresson) と呼ぶ.
より短い表現を見つけるには,データの規則性を見つける必要がある. この規則性を見つける点において,機械学習と深い関連をもつ.
-- しましま