kafka&zookeeper

原創

2019-07-16 13:32

一、搭建Zookeeper集羣
Zookeeper是一個分佈式開源框架，提供了協調分佈式應用的基本服務，它向外部應用暴露一組通用服務——分佈式同步（Distributed Synchronization）、命名服務（Naming Service）、集羣維護（Group Maintenance）等，簡化分佈式應用協調及其管理的難度，提供高性能的分佈式服務。ZooKeeper本身可以以單機模式安裝運行，不過它的長處在於通過分佈式ZooKeeper集羣（一個Leader，多個Follower），基於一定的策略來保證ZooKeeper集羣的穩定性和可用性，從而實現分佈式應用的可靠性。

1.在zookeeper.apache.org上下載zookeeper-3.4.8.tar.gz
2.解壓 tar -xzvf zookeeper-3.4.8.tar.gz
3.修改權限 sudo chown -R cms(ubuntu用戶名) zookeeper-3.4.8
4.修改配置文件 /etc/profile，增加

5.對Zookeeper的配置文件的參數進行設置
進入zookeeper-3.4.5/conf
1)cp zoo_sample.cfg zoo.cfg
2)在zookeeper下新建一個存放數據的目錄
mkdir zookerperdata
3)vim zoo.cfg
4)注意上圖的配置中master，slave1分別爲主機名
在上面的配置文件中"server.id=host:port:port"中的第一個port是從機器（follower）連接到主機器（leader）的端口號，第二個port是進行leadership選舉的端口號。
5)創建myid
接下來在dataDir所指定的目錄下(zookeeper-3.4.8/zookerperdata/)創建一個文件名爲myid的文件，文件中的內容只有一行，爲本主機對應的id值，也就是上圖中server.id中的id。例如：在服務器1中的myid的內容應該寫入1。
vim myid
6)遠程複製到slave1,slave2相同的目錄下
scp -r zookeeper-3.4.8 cms@slave1:/home/cms/
scp -r zookeeper-3.4.8 cms@slave1:/home/cms/
7)修改slave1,slave2機器上的myid的值分別爲2和3
啓動ZooKeeper集羣
在ZooKeeper集羣的每個結點上，執行啓動ZooKeeper服務的腳本，如下所示：

其中，QuorumPeerMain是zookeeper進程，啓動正常。
如上依次啓動了所有機器上的Zookeeper之後可以通過ZooKeeper的腳本來查看啓動狀態，包括集羣中各個結點的角色（或是Leader，或是Follower），如下所示，是在ZooKeeper集羣中的每個結點上查詢的結果

二、搭建kafka集羣

1.下載
下載官網：http://kafka.apache.org/downloads
下載版本：與自己安裝的Scala版本對應的版本，個人習慣是下載最新版本的前一版
kafka_2.11-0.10.0.1.tgz
2.安裝
tar -xzf kafka_2.11-0.10.0.1.tgz
cp kafka_2.11-0.10.0.1.tgz /home/cms/kafka
3.配置環境變量
即path、classpath,意義不大，可不配置
4.修改配置文件kafka/config/server.properties

5.在kafka的目錄下，建立kafka存儲數據的目錄
mkdir kafkalogs
6.其他節點配置
將kafka文件複製到其他節點

broker.id=1 #整個集羣內唯一id號，整數，一般從0開始
listeners=PLAINTEXT://192.168.31.132:9092 #協議、當前broker機器ip、端口
port=9092 #broker端口
host.name=192.168.31.132 #broker 機器ip

7.每個節點下啓動zookerper
8.啓動kafka進程，在每個節點的kafka/bin目錄下

--zookeeper : zookeeper集羣列表，用英文逗號分隔。可以不用指定zookeeper整個集羣內的節點列表，只指定某個或某幾個zookeeper節點列表也是你可以的
replication-factor ：複製數目，提供failover機制；1代表只在一個broker上有數據記錄，一般值都大於1，代表一份數據會自動同步到其他的多個broker，防止某個broker宕機後數據丟失。
partitions ：一個topic可以被切分成多個partitions，一個消費者可以消費多個partitions，但一個partitions只能被一個消費者消費，所以增加partitions可以增加消費者的吞吐量。kafka只保證一個partitions內的消息是有序的，多個一個partitions之間的數據是無序的。

9.啓動生產者和消費者
生產者：kafka-console-producer.sh --broker-list 192.168.31.131:9092 --topic test5
--broker-list : 值可以爲broker集羣中的一個或多個節點
消費者：
kafka-console-consumer.sh --zookeeper 192.168.31.131:2181,192.168.31.132:2181,192.168.31.133:2181 --topic test5 --from-beginning
--zookeeper : 值可以爲zookeeper集羣中的一個或多個節點
--from-beginning 表示從開始第一個消息開始接收

10.查看topic
kafka-topics.sh --list --zookeeper 192.168.31.131:2181,192.168.31.132:2181,192.168.31.133:2181
11.查看topic詳情
kafka-topics.sh --describe --zookeeper 192.168.31.131:2181,192.168.31.132:2181,192.168.31.133:2181 --topic test5

狀態說明：test有三個分區分別爲1、2、3，分區0的leader是3（broker.id），分區0有三個副本，並且狀態都爲lsr（ln-sync，表示可以參加選舉成爲leader）。

12.創建分區爲3、備份爲3的topic
bin/kafka-topics.sh --create --zookeeper 192.168.31.131:2181,192.168.31.132:2182,192.168.31.133:2183 --replication-factor 3 --partitions 3 --topic test5

13.刪除topic
在config/server.properties中加入delete.topic.enable=true並重啓服務，在執行如下命令

kafka-topics.sh --delete --zookeeper 192.168.31.131:2181,192.168.31.132:2181,192.168.31.133:2181 --topic test5

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

kafka&zookeeper

HTTP URL 詳解

mysql忘記密碼該怎麼辦？

RAID詳解[RAID0/RAID1/RAID10/RAID5]

mysql分庫分表備份

kafka&zookeeper

apache的工作模式

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結