Merkle Tree算法詳解

原創

zerok775

2020-02-22 16:10

Merkle Tree是Dynamo中用來同步數據一致性的算法，Merkle Tree是基於數據HASH構建的一個樹。它具有以下幾個特點：

1、數據結構是一個樹，可以是二叉樹，也可以是多叉樹（本BLOG以二叉樹來分析）

2、Merkle Tree的葉子節點的value是數據集合的單元數據或者單元數據HASH。

3、Merke Tree非葉子節點value是其所有子節點value的HASH值。

爲了更好的理解，我們假設有A和B兩臺機器，A需要與B相同目錄下有8個文件，文件分別是f1 f2 f3 ....f8。這個時候我們就可以通過Merkle Tree來進行快速比較。假設我們在文件創建的時候每個機器都構建了一個Merkle Tree。具體如下圖:

從上圖可得知，葉子節點node7的value = hash(f1),是f1文件的HASH;而其父親節點node3的value = hash(v7, v8)，也就是其子節點node7 node8的值得HASH。就是這樣表示一個層級運算關係。root節點的value其實是所有葉子節點的value的唯一特徵。

假如A上的文件5與B上的不一樣。我們怎麼通過兩個機器的merkle treee信息找到不相同的文件? 這個比較檢索過程如下:

1、首先比較v0是否相同,如果不同，檢索其孩子node1和node2.

2、v1 相同，v2不同。檢索node2的孩子node5 node6;

3、v5不同，v6相同，檢索比較node5的孩子node 11 和node 12

4、v11不同，v12相同。node 11爲葉子節點，獲取其目錄信息。

5、檢索比較完畢。

以上過程的理論複雜度是Log(N)。實際過程是大於這個複雜度的，因爲不同value的節點需要每個子節點進行比較。過程描述圖如下:

從上圖可以得知真個過程可以很快的找到對應的不相同的文件。

如果A機器的目錄下增加了一個文件f9。整個merkle tree就會變成這樣的:

其中紅色字體是需要進行運算的步驟，整個過程是從葉子節點發起的，直接回溯到root節點爲止。

假如目錄下的f1被刪除。整樹的運算變化圖如下:

紅色字體是需要進行的運算。

從上可以得知，merkle tree在大數據集合校驗可以提高校驗的效率的。從Dynamo論文中可以看出，大量使用merkle tree來同步分佈式節點的文件和寫操作，尤其是在服務節點異常後的情況，具體細節可以參看Dynamo論文中的描述。

zerok775

發佈了39 篇原創文章 · 獲贊 76 · 訪問量 18萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Merkle Tree算法詳解

如何使用 JS 判斷用戶是否處於活躍狀態

Mono 支持LoongArch架構

lightdb秒級增加列和刪除列（not null帶默認值）

lightdb數據庫超時相關控制參數

通過HPA+CronHPA組合應對業務複雜彈性伸縮場景

❤️‍🔥 Solon Cloud Event 新的事務特性與應用

網絡爬蟲的祕密：如何高效地抓取JD.com視頻鏈接

lightdb mysql 8.0兼容之不可見主鍵

使用 JS 實現在瀏覽器控制檯打印圖片 console.image()

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（四）使用域名訪問網站應用

C++高性能服務框架revolver:base結構分析

C++高性能服務框架revolver:同時支持100萬個的定時事件的定時器

linux和windows下UDP發送效率的有趣比較

一種服務器的負載均衡選取算法

關於C函數memcpy的實現細節思考

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結