hadoop的5個進程解釋

hadoop的五個守護進程                

 

一般如果正常啓動hadoop,我們可以在master上通過jps命令看到以下5個daemons:

[root@master ~]# jps
19803 SecondaryNameNode
19994 TaskTracker
31144 Jps
19571 NameNode



19672 DataNode
19887 JobTracker

 

下面依次介紹這些進程:

1. NameNode

它是Hadoop 中的主服務器,管理文件系統名稱空間和對集羣中存儲的文件的訪問。

參考資料:

http://www.linuxidc.com/Linux/2012-01/51614.htm

2. SecondaryNameNode

它不是 namenode 的冗餘守護進程,而是提供週期檢查點和清理任務。

出於對可擴展性和容錯性等考慮,我們一般將SecondaryNameNode運行在一臺非NameNode的機器上

參考資料:

http://www.linuxidc.com/Linux/2012-01/51628.htm
http://www.linuxidc.com/Linux/2012-01/51622.htm

3. DataNode

它負責管理連接到節點的存儲(一個集羣中可以有多個節點)。每個存儲數據的節點運行一個 datanode 守護進程。

4. JobTrackerTaskTracker

JobTracker負責調度 DataNode上的工作。每個 DataNode有一個TaskTracker,它們執行實際工作。

JobTracker和 TaskTracker採用主-從形式,JobTrackerDataNode分發工作,而 TaskTracker執行任務。

JobTracker還檢查請求的工作,如果一個 DataNode由於某種原因失敗,JobTracker會重新調度以前的任務。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章