Hadoop Secondarynamenode原理

namenode的文件存儲

namenode數據存儲分爲兩個文件,fsimageedits文件,edits文件記錄了所有namenode的操作,相當於日誌記錄。fsimage記錄了namenode的數據。在namenode啓動時,會加載fsimage的數據到內存中,並從edits文件中解析所有數據信息到內存,兩個數據合併後共同組成了namenode全量信息。


secondarynamenode的作用

secondarynamenode 按一定規則將edits文件和fsimage文件合併,合併後namenode會啓用新的edits文件,這樣會減小edits文件的文件大小,控制edits文件的大小會減少namenode在啓動階段解析加載edits文件的時長。


secondarynamenode合併文件規則

   配置    fs.checkpoint.period 執行檢查點合併文件檢查時間 默認3600s 

               fs.checkpoint.size    實行檢查點合併文件閥值大小 默認64M

  兩個條件滿足其一則合併文件


工作原理示意圖

 wKioL1ir3NqhxRASAAIYPp5zDLQ928.png-wh_50

架構分析

    fsimage與edits文件對於namenode存儲數據有什麼區別,爲什麼要分開兩個文件進行存儲?

    fsimage存儲着所有目錄和文件的序列化信息,而edits保存了所有寫或更新的信息,在namenode運行過程中只向edits文件中寫相關的操作信息和文件信息

    分兩個文件存儲是因爲fsimage由於保存了所有namenode的信息,所以文件大小通常比較大,這樣在一個大的文件中進行寫操作比較費系統資源而且延遲了系統的反應時間,而edits文件由於有secondarynamenode進行合併,通常大小要小於fsimage,所以在edits文件中進行更新寫操作會降低系統資源的消耗。

    爲什麼會引入sencondarynamenode,只用namenode會有什麼問題?

    由於namenode進行分文件保存,但又不能使edits文件過大,所以需要進行文件合併,但進行文件合併會佔用系統內存等資源,如果直接使用namenode進行文件合併,會導致在合併文件期間,系統文件管理能力下降卡頓等。另外由於secondarynamenode與namenode進行分離,可以將namenode和secondarynamenode分開部署到不同機器上,提高系統的穩定與安全性。除此之外,secondarynamenode由於進行了檢查點,在namenode完全宕機數據丟失的情況下,secondarynamenode可以在檢查點上恢復系統數據,當然,也會造成檢查點之後的數據丟失。

                                                                                                                                       -----史龍剛


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章