hadoop的五個守護進程
一般如果正常啓動hadoop,我們可以在master上通過jps命令看到以下5個daemons:
[root@master ~]# jps
19803 SecondaryNameNode
19994 TaskTracker
31144 Jps
19571 NameNode
19672 DataNode
19887 JobTracker
下面依次介紹這些進程:
1. NameNode
它是Hadoop 中的主服務器,管理文件系統名稱空間和對集羣中存儲的文件的訪問。
參考資料:
http://www.linuxidc.com/Linux/2012-01/51614.htm
2. SecondaryNameNode
它不是 namenode 的冗餘守護進程,而是提供週期檢查點和清理任務。
出於對可擴展性和容錯性等考慮,我們一般將SecondaryNameNode運行在一臺非NameNode的機器上。
參考資料:
http://www.linuxidc.com/Linux/2012-01/51628.htm
http://www.linuxidc.com/Linux/2012-01/51622.htm
3. DataNode
它負責管理連接到節點的存儲(一個集羣中可以有多個節點)。每個存儲數據的節點運行一個 datanode 守護進程。
4. JobTracker和TaskTracker
JobTracker負責調度 DataNode上的工作。每個 DataNode有一個TaskTracker,它們執行實際工作。
JobTracker和 TaskTracker採用主-從形式,JobTracker跨DataNode分發工作,而 TaskTracker執行任務。
JobTracker還檢查請求的工作,如果一個 DataNode由於某種原因失敗,JobTracker會重新調度以前的任務。