哈夫曼樹以及哈夫曼編碼的構造步驟

注意:哈夫曼樹並不唯一,但帶權路徑長度一定是相同的。

第一部分;由給定結點構造哈夫曼樹

(1)8個結點的權值大小如下:


(2)從19,21,2,3,6,7,10,32中選擇兩個權小結點。選中2,3。同時算出這兩個結點的和5。


(3)從19,21,6,7,10,32,5中選出兩個權小結點。選中5,6。同時計算出它們的和11。


(4)從19,21,7,10,32,11中選出兩個權小結點。選中7,10。同時計算出它們的和17。
(BTW:這時選出的兩個數字都不是已經構造好的二叉樹裏面的結點,所以要另外開一棵二叉樹;或者說,如果兩個數的和正好是下一步的兩個最小數的其中的一個,那麼這個樹直接往上生長就可以了,如果這兩個數的和比較大,不是下一步的兩個最小數的其中一個,那麼就並列生
長。)


(5)從19,21,32,11,17中選出兩個權小結點。選中11,17。同時計算出它們的和28。


(6)從19,21,32,28中選出兩個權小結點。選中19,21。同時計算出它們的和40。另起一顆二叉樹。


(7)從32,28, 40中選出兩個權小結點。選中28,32。同時計算出它們的和60。  


(8)從 40, 60中選出兩個權小結點。選中40,60。同時計算出它們的和100。 好了,此時哈夫曼樹已經構建好了。



第二部分:由上述所得哈夫曼樹寫出哈夫曼編碼

首先我們來看這棵構造好的哈夫曼樹:(經過左邊路徑爲0,經過右邊路徑爲1)

則可直接寫出編碼,例如:

A:11   B:001    C:011  D   E:0000    F:0001    G:0100    H:0101    I:1000   J:1001


爲了簡便起見,我們從樹的左邊開始考慮,即B,E,F節點。

對於節點B,其深度爲3,權值爲5,那麼其帶權路徑長度爲5*3 = 15;

那麼我們再看一下節點B的父親節點,其權值爲9,是由權值爲4和權值爲5的節點B構造而成,那麼即是9 = 4 + 5;

同樣的再往上一層,節點B的爺爺節點,其權值爲16,是由權值爲9和權值爲7的節點構造而成,而權值爲9的節點的構造前面已經說明,則有16 = 4 + 5 + 7;

再往上一層就到根節點了。

那麼到這裏我們可以看到,節點B的父親節點和爺爺節點的組成部分都有節點B的“功勞”,即節點B的權值是其另外兩個的“組成部分”,那麼節點B的帶權路徑長度即爲其到根節點路徑上(不包含根節點),與其(或者說是與其父節點,爺爺節點等)有父子關係的節點抽取出節點B的組成部分(包括節點B本身),再全部相加,這樣的話就得到了節點B的帶權路徑長度爲5 + 5 + 5 = 15;

同樣的,節點E,F按照同樣的方法進行推導。

所以我們從上面的分析得出:

每個帶權葉節點到根節點的帶權路徑長度等於其到根節點路徑上所有節點的包含該帶權葉節點權值組成部分之和。

因此,最後我們推導出,所有葉節點,即整棵哈夫曼樹的帶權路徑長度 WPL即爲:

除了根節點以外,所有節點的權值之和。

如上圖哈夫曼樹的帶權路徑長度 WPL即爲:

WPL = 16 + 10 + 9 + 7 + 5 + 5 + 4 + 5 + 3 + 4 + 2 + 3 + 2 + 2 + 2 + 1 + 1 + 1 = 82

有了這樣的判斷之後,我們便很容易計算出一顆哈夫曼樹的帶權路徑WPL了。

因此我們可以藉助一個叫做優先隊列的數據結構,而優先隊列的實現往往是藉助於二叉堆的結構實現,在這裏我們要實現的是小根堆的數據結構。一開始的時候,我們可以將所有的節點一個一個的壓入隊列中,每次有節點入隊,隊列都會進行自調整,使其保持一個小根堆的狀態。當所有的節點全部入隊之後,這時候我們根據以上推導出來的結論,每次取兩個權值最小的節點,將其值計算之後,然後再將兩個節點權值之和的節點壓入隊列中,直到隊列中只剩下一個節點(即根節點),跳出循環體,輸出最後的答案。即整棵哈夫曼樹的帶權路徑WPL。


發佈了134 篇原創文章 · 獲贊 240 · 訪問量 50萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章