Hadoop Secondarynamenode原理

原創

2018-09-11 02:12

namenode的文件存儲

namenode數據存儲分爲兩個文件，fsimage與edits文件，edits文件記錄了所有namenode的操作，相當於日誌記錄。fsimage記錄了namenode的數據。在namenode啓動時，會加載fsimage的數據到內存中，並從edits文件中解析所有數據信息到內存，兩個數據合併後共同組成了namenode全量信息。

secondarynamenode的作用

secondarynamenode 按一定規則將edits文件和fsimage文件合併，合併後namenode會啓用新的edits文件，這樣會減小edits文件的文件大小，控制edits文件的大小會減少namenode在啓動階段解析加載edits文件的時長。

secondarynamenode合併文件規則

配置 fs.checkpoint.period 執行檢查點合併文件檢查時間默認3600s

fs.checkpoint.size 實行檢查點合併文件閥值大小默認64M

兩個條件滿足其一則合併文件

工作原理示意圖

架構分析

fsimage與edits文件對於namenode存儲數據有什麼區別，爲什麼要分開兩個文件進行存儲？

fsimage存儲着所有目錄和文件的序列化信息，而edits保存了所有寫或更新的信息，在namenode運行過程中只向edits文件中寫相關的操作信息和文件信息

分兩個文件存儲是因爲fsimage由於保存了所有namenode的信息，所以文件大小通常比較大，這樣在一個大的文件中進行寫操作比較費系統資源而且延遲了系統的反應時間，而edits文件由於有secondarynamenode進行合併，通常大小要小於fsimage，所以在edits文件中進行更新寫操作會降低系統資源的消耗。

爲什麼會引入sencondarynamenode，只用namenode會有什麼問題？

由於namenode進行分文件保存，但又不能使edits文件過大，所以需要進行文件合併，但進行文件合併會佔用系統內存等資源，如果直接使用namenode進行文件合併，會導致在合併文件期間，系統文件管理能力下降卡頓等。另外由於secondarynamenode與namenode進行分離，可以將namenode和secondarynamenode分開部署到不同機器上，提高系統的穩定與安全性。除此之外，secondarynamenode由於進行了檢查點，在namenode完全宕機數據丟失的情況下，secondarynamenode可以在檢查點上恢復系統數據，當然，也會造成檢查點之後的數據丟失。

-----史龍剛

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Hadoop Secondarynamenode原理

釘釘打卡速度慢

Nginx R31 doc 官方文檔-01-nginx 如何安裝

Python 潮流週刊#51：用 Python 繪製美觀的圖表

Qt/C++音視頻開發74-合併標籤圖形/生成yolo運算結果圖形/文字和圖形合併成一個/水印濾鏡

挑戰程序設計競賽 2.2章習題 POJ - 3617 Best Cow Line 貪心

字節面試：MySQL什麼時候鎖表？如何防止鎖表？

.NET8連接SQL SERVER 2008 R2 報：證書鏈是由不受信任的頒發機構頒發的

golang開發環境搭建(win10)

python計算機視覺學習筆記——PIL庫的用法

Golang初學：獲取程序內存使用情況，std runtime

新型分佈式緩存方案構思，跟Redis說再見！

Centos-6.5安裝CDH-5.9.0教程

rpm包方式安裝mysql5.6

user.table.column, table.column 或列說明無效----解決辦法

Centos-6.5安裝CDH-5.9.0教程

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結