大數據 常見端口號

HDFS

參數

描述

默認

配置文件

例子值

fs.default.name NameNode

NameNode  RPC交互端口

8020

core-site.xml

hdfs://master:8020/

dfs.http.address 

NameNode  web管理端口

50070

hdfs-site.xml

0.0.0.0:50070

dfs.DataNode .address

DataNode  控制端口

50010 

hdfs-site.xml

0.0.0.0:50010

dfs.DataNode .ipc.address

DataNode 的RPC服務器地址和端口

50020

hdfs-site.xml

0.0.0.0:50020

dfs.DataNode .http.address

DataNode 的HTTP服務器和端口

50075

hdfs-site.xml

0.0.0.0:50075

 

MapReduce

參數

描述

默認

配置文件

例子值

mapred.job.tracker

job-tracker交互端口 

8021

mapred-site.xml

hdfs://master:8021/

job

tracker的web管理端口

50030

mapred-site.xml

0.0.0.0:50030

mapred.task.tracker.http.address

task-tracker的HTTP端口

50060

mapred-site.xml

0.0.0.0:50060

 

yarn

下面代碼涉及到的縮寫:

RM :ResourceManager

AM :ApplicationMaster

NM :NodeManager

參數

默認值 

描述

yarn.resourcemanager.hostname

 

RM的hostname

yarn.resourcemanager.address

${yarn.resourcemanager.hostname}:8032

RM對客戶端暴露的地址,客戶端通過該地址向RM提交應用程序等

yarn.resourcemanager.scheduler.address

${yarn.resourcemanager.hostname}:8030

RM對AM暴露的地址,AM通過地址想RM申請資源,釋放資源等

yarn.resourcemanager.webapp.address

${yarn.resourcemanager.hostname}:8088

RM對外暴露的web  http地址,用戶可通過該地址在瀏覽器中查看集羣信息

yarn.resourcemanager.webapp.https.address

${yarn.resourcemanager.hostname}:8090

web https 地址

yarn.resourcemanager.resource-tracker.address

${yarn.resourcemanager.hostname}:8031

RM對NM暴露地址,NM通過該地址向RM彙報心跳,領取任務等

yarn.resourcemanager.resource-tracker.client.thread-count

50

處理來自NM的RPC請求的handler數

yarn.resourcemanager.admin.address

${yarn.resourcemanager.hostname}:8033

管理員可以通過該地址向RM發送管理命令等

yarn.resourcemanager.scheduler.class

org.apache.hadoop.yarn.server.resourcemanager

.scheduler.capacity.CapacityScheduler

資源調度器主類

yarn.resourcemanager.scheduler.client.thread-count

50

處理來自AM的RPC請求的handler數

yarn.scheduler.minimum-allocation-mb

1024

可申請的最少內存資源,以MB爲單位

yarn.scheduler.maximum-allocation-mb

8192

可申請的最大內存資源,以MB爲單位

yarn.scheduler.minimum-allocation-vcores

1

可申請的最小虛擬CPU個數

yarn.scheduler.maximum-allocation-vcores

32

可申請的最 大虛擬CPU個數

yarn.nodemanager.local-dirs

${hadoop.tmp.dir}/nm-local-dir

中間結果存放位置,可配置多目錄

yarn.log-aggregation-enable

false

是否啓用日誌聚合

yarn.nodemanager.remote-app-log-dir

/tmp/logs

日誌聚合目錄

yarn.nodemanager.resource.memory-mb

8192

NM總的可用物理內存,以MB爲單位。一旦設置,不可動態修改

yarn.nodemanager.resource.cpu-vcores

8

可分配的CPU個數

yarn.nodemanager.aux-services

 

NodeManager上運行的附屬服務。需配置成mapreduce_shuffle,纔可運行MapReduce程序

 

 

 

 

 

 

jobhistoryserver

jobhistoryserver的默認值我們可以在mapred-site.xml文件中進行修改

參數

默認值

描述

mapreduce.jobhistory.address

0.0.0.0:10020

JobHistory服務器IPC 主機:端口

mapreduce.jobhistory.webapp.address

0.0.0.0:19888

obHistory服務器Web UI地址,用戶可根據該地址查看Hadoop歷史作業情況

mapreduce.jobhistory.done-dir

${yarn.app.mapreduce.am.staging-dir}/history/done

在什麼目錄下存放已經運行完的Hadoop作業記錄

mapreduce.jobhistory.intermediate-done-dir

${yarn.app.mapreduce.am.staging-dir}/history/done_intermediate

正在運行的Hadoop作業記錄

  • 歷史作業記錄是存放在HDFS目錄中;
  • 由於歷史作業記錄可能非常多,所以歷史作業記錄是按照年/月/日的形式分別存放在相應的目錄中,這樣便於管理和查找;
  • 對於每一個Hadoop歷史作業記錄相關信息都用兩個文件存放,後綴名分別爲*.jhist,*.xml,其中:
  • *.jhist文件裏存放的是具體Hadoop作業的詳細信息
  • *.xml文件裏面記錄的是相應作業運行時候的完整參數配置
  • 每一個作業的歷史記錄都存放在一個單獨的文件中

 

其它端口

參數

描述

默認

配置文件

例子值

dfs.secondary.http.address

secondary NameNode  web管理端口

50090

hdfs-site.xml

0.0.0.0:50090

9083端口:

9083端口號是hive數據倉庫元數據metastore的端口號

當在配置hive客戶端的時候,需要在hive-site.xml文件下加上hive的端口號和服務端的信息(當然在配置服務端的時候,因爲表示建在HDFS上Linux系統的mys下ql中的,需要配置mysql的信息)

```xml
<property>  
  <name>hive.metastore.uris</name>  
  <value>thrift://192.168.57.5:9083</value>  
</property>  
```

2181

2181是zookeeper的端口號:

```xml
<property>
   <name>ha.zookeeper.quorum</name>
   <value>node02:2181,node03:2181,node04:2181</value>
 </property>
```

6379

6379:Redis的端口號

 

60010


60010:HBASE的端口號

9092


9092:kafka的端口號

 

41414


41414:flume監控的端口
 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章