GZIP壓縮原理分析（02）——第二章背景簡介

原創

2020-06-22 15:42

以下文字摘自《數據壓縮導論（第4版）》：“……數據壓縮並不只是對數據的處理，它還是找出數據中已有結構的過程……在數據壓縮中，首先要爲各種數據中的不同結構建立模型，然後利用這些模型（可能還需要最終感知這些數據的一些應用環境），以更緊湊的方式來表示這些數據。這些結構可能是非常簡單的圖案，只要劃出數據的圖形就能看到；也可能比較複雜，需要更爲抽象的方法才能體會到。信息常常包含在數據的結構中，而不是包含在數據本身中，數據壓縮技術的發展過程與這些結構的發現分不開。”

要研究數據壓縮，必須先了解用於衡量壓縮性能的指標——壓縮率。以下內容是《數據壓縮導論（第4版）》中給出的定義（這裏只引用該書中對無損壓縮有用的部分，至於諸如“失真”等有損壓縮的概念，這裏暫且不表）：“要衡量一種壓縮算法對給定數據集進行壓縮時的表現，一種很合理的方法是看一下在壓縮前後，數據表示所需比特數之比。這個比值被稱爲壓縮比。假定有一副圖像由256像素×256像素的方形陣列組成，存儲它需要65536字節。對該圖像進行壓縮，壓縮後的版本需要16384字節。我們就說壓縮比爲4:1。壓縮比還有一種表示方式：將所需數據的減少量表示爲原數據大小的百分比。具體到這個例子，以這種方式計算得出的壓縮比爲75%。”

這裏之所以要提到壓縮比，完全是因爲我在進行相關項目開發時，發現好多研發人員，甚至一些資深研發，如果之前沒有搞過壓縮的話，很少有人能具體說清壓縮比的定義，對壓縮比的概念往往比較模糊，有時甚至不清楚壓縮比的大小是如何衡量壓縮性能的（比如，有人居然認爲壓縮比大壓縮性能反而小，顯然這是沒有高清壓縮比中誰充當比值的分子），如果研發尚且如此，那麼又如何與客戶交代呢？因此我在這裏首先明確壓縮比的定義，之後再開始下面的章節。再次提示，這個定義不是我給出的，而是從《數據壓縮導論（第4版）》摘錄的。

關於壓縮的歷史，請讀者參看該內容：http://blog.jobbole.com/77247/，如果該內容已經過期，請讀者在我博客後面留言，我將自己保存的該地址下的內容發過去。

向在壓縮領域作出過貢獻的各位前輩致敬！！！

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

GZIP壓縮原理分析（02）——第二章背景簡介

一鍵自動化博客發佈工具,用過的人都說好(頭條篇)

GZIP壓縮原理分析（03）——第三章 gzip文件格式詳解（三01）章前語

GZIP壓縮原理分析（06）——第三章 gzip文件格式詳解（三04） gzip文件格式實例分析以及本章總結

GZIP壓縮原理分析（09）——第四章基於gzip的HTTP壓縮詳解（四03）處理細節（關於流壓縮的問題）以及本章總結

GZIP壓縮原理分析（05）——第三章 gzip文件格式詳解（三03） gzip文件尾和文件體

GZIP壓縮原理分析（02）——第二章背景簡介

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

GZIP壓縮原理分析（02）——第二章 背景簡介

GZIP壓縮原理分析（02）——第二章背景簡介