GZIP壓縮原理分析(02)——第二章 背景簡介

以下文字摘自《數據壓縮導論(第4版)》:“……數據壓縮並不只是對數據的處理,它還是找出數據中已有結構的過程……在數據壓縮中,首先要爲各種數據中的不同結構建立模型,然後利用這些模型(可能還需要最終感知這些數據的一些應用環境),以更緊湊的方式來表示這些數據。這些結構可能是非常簡單的圖案,只要劃出數據的圖形就能看到;也可能比較複雜,需要更爲抽象的方法才能體會到。信息常常包含在數據的結構中,而不是包含在數據本身中,數據壓縮技術的發展過程與這些結構的發現分不開。” 

 

要研究數據壓縮,必須先了解用於衡量壓縮性能的指標——壓縮率。以下內容是《數據壓縮導論(第4版)》中給出的定義(這裏只引用該書中對無損壓縮有用的部分,至於諸如“失真”等有損壓縮的概念,這裏暫且不表):“要衡量一種壓縮算法對給定數據集進行壓縮時的表現,一種很合理的方法是看一下在壓縮前後,數據表示所需比特數之比。這個比值被稱爲壓縮比。假定有一副圖像由256像素×256像素的方形陣列組成,存儲它需要65536字節。對該圖像進行壓縮,壓縮後的版本需要16384字節。我們就說壓縮比爲4:1。壓縮比還有一種表示方式:將所需數據的減少量表示爲原數據大小的百分比。具體到這個例子,以這種方式計算得出的壓縮比爲75%。” 

 

這裏之所以要提到壓縮比,完全是因爲我在進行相關項目開發時,發現好多研發人員,甚至一些資深研發,如果之前沒有搞過壓縮的話,很少有人能具體說清壓縮比的定義,對壓縮比的概念往往比較模糊,有時甚至不清楚壓縮比的大小是如何衡量壓縮性能的(比如,有人居然認爲壓縮比大壓縮性能反而小,顯然這是沒有高清壓縮比中誰充當比值的分子),如果研發尚且如此,那麼又如何與客戶交代呢?因此我在這裏首先明確壓縮比的定義,之後再開始下面的章節。再次提示,這個定義不是我給出的,而是從《數據壓縮導論(第4版)》摘錄的。 

 

關於壓縮的歷史,請讀者參看該內容:http://blog.jobbole.com/77247/,如果該內容已經過期,請讀者在我博客後面留言,我將自己保存的該地址下的內容發過去。 

 

向在壓縮領域作出過貢獻的各位前輩致敬!!!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章