分佈式消息系統 Kafka 簡介

Kafka是分佈式發佈-訂閱消息系統。它最初由LinkedIn公司開發,之後成爲Apache項目的一部分。Kafka是一個分佈式的,可劃分的,冗餘備份的持久性的日誌服務。它主要用於處理活躍的流式數據。

在 大數據系統中,常常會碰到一個問題,整個大數據是由各個子系統組成,數據需要在各個子系統中高性能,低延遲的不停流轉。傳統的企業消息系統並不是非常適合 大規模的數據處理。爲了已在同時搞定在線應用(消息)和離線應用(數據文件,日誌)Kafka就出現了。Kafka可以起到兩個作用:

  1. 降低系統組網複雜度。
  2. 降低編程複雜度,各個子系統不在是相互協商接口,各個子系統類似插口插在插座上,Kafka承擔高速數據總線的作用。

1、Kafka主要特點:

  1. 同時爲發佈和訂閱提供高吞吐量。據瞭解,Kafka每秒可以生產約25萬消息(50 MB),每秒處理55萬消息(110 MB)。
  2. 可進行持久化操作。將消息持久化到磁盤,因此可用於批量消費,例如ETL,以及實時應用程序。通過將數據持久化到硬盤以及replication防止數據丟失。
  3. 分佈式系統,易於向外擴展。所有的producer、broker和consumer都會有多個,均爲分佈式的。無需停機即可擴展機器。
  4. 消息被處理的狀態是在consumer端維護,而不是由server端維護。當失敗時能自動平衡。
  5. 支持online和offline的場景。

2、Kafka的架構:

Kafka 的整體架構非常簡單,是顯式分佈式架構,producer、broker(kafka)和consumer都可以有多個。 Producer,consumer實現Kafka註冊的接口,數據從producer發送到broker,broker承擔一箇中間緩存和分發的作用。 broker分發註冊到系統中的consumer。broker的作用類似於緩存,即活躍的數據和離線處理系統之間的緩存。客戶端和服務器端的通信,是基 於簡單,高性能,且與編程語言無關的TCP協議。

3、幾個基本概念:

  1. Topic:特指Kafka處理的消息源(feeds of messages)的不同分類。
  2. Partition:Topic物理上的分組,一個topic可以分爲多個partition,每個partition是一個有序的隊列。partition中的每條消息都會被分配一個有序的id(offset)。
  3. Message:消息,是通信的基本單位,每個producer可以向一個topic(主題)發佈一些消息。
  4. Producers:消息和數據生產者,向Kafka的一個topic發佈消息的過程叫做producers。
  5. Consumers:消息和數據消費者,訂閱topics並處理其發佈的消息的過程叫做consumers。
  6. Broker:緩存代理,Kafa集羣中的一臺或多臺服務器統稱爲broker。

4、消息發送的流程:

分佈式消息系統 Kafka 簡介

  1. Producer根據指定的partition方法(round-robin、hash等),將消息發佈到指定topic的partition裏面
  2. kafka集羣接收到Producer發過來的消息後,將其持久化到硬盤,並保留消息指定時長(可配置),而不關注消息是否被消費。
  3. Consumer從kafka集羣pull數據,並控制獲取消息的offset

5、Kafka的設計:


5.1 吞吐量

高吞吐是kafka需要實現的核心目標之一,爲此kafka做了以下一些設計:

  1. 數據磁盤持久化:消息不在內存中cache,直接寫入到磁盤,充分利用磁盤的順序讀寫性能
  2. zero-copy:減少IO操作步驟
  3. 數據批量發送
  4. 數據壓縮
  5. Topic劃分爲多個partition,提高parallelism


5.2 負載均衡

  1. producer根據用戶指定的算法,將消息發送到指定的partition
  2. 存在多個partiiton,每個partition有自己的replica,每個replica分佈在不同的Broker節點上
  3. 多個partition需要選取出lead partition,lead partition負責讀寫,並由zookeeper負責fail over
  4. 通過zookeeper管理broker與consumer的動態加入與離開


5.3 拉取系統

由於kafka broker會持久化數據,broker沒有內存壓力,因此,consumer非常適合採取pull的方式消費數據,具有以下幾點好處:

  1. 簡化kafka設計
  2. consumer根據消費能力自主控制消息拉取速度
  3. consumer根據自身情況自主選擇消費模式,例如批量,重複消費,從尾端開始消費等


5.4 可擴展性

當需要增加broker結點時,新增的broker會向zookeeper註冊,而producer及consumer會根據註冊在zookeeper上的watcher感知這些變化,並及時作出調整。



5.5 消息刪除策略

kafka 和JMS實現(activeMQ)不同的是:即使消息被消費,消息仍然不會被立即刪除.日誌文件將會根據broker中的配置要求,保留一定的時間之後刪 除;比如log文件保留2天,那麼兩天後,文件會被清除,無論其中的消息是否被消費.kafka通過這種簡單的手段,來釋放磁盤空間.此外,kafka的 性能並不會因爲日誌文件的太多而低下,所以即使保留較多的log文件,也不不會有問題.

kafka 中consumer負責維護消息的消費記錄,而broker則不關心這些,這種設計不僅提高了consumer端的靈活性,也適度的減輕了broker端 設計的複雜度;這是和衆多JMS prodiver的區別.此外,kafka中消息ACK的設計也和JMS有很大不同,kafka中的消息時批量(通常以消息的條數或者chunk的尺寸爲 單位)發送給consumer,當消息消費成功後,向zookeeper提交消息的offset,而不會向broker交付ACK.或許你已經意識到,這 種"寬鬆"的設計,將會有"丟失"消息/"消息重發"的危險.

6、Kafka的應用場景:



6.1 消息隊列

比 起大多數的消息系統來說,Kafka有更好的吞吐量,內置的分區,冗餘及容錯性,這讓Kafka成爲了一個很好的大規模消息處理應用的解決方案。消息系統 一般吞吐量相對較低,但是需要更小的端到端延時,並嚐嚐依賴於Kafka提供的強大的持久性保障。在這個領域,Kafka足以媲美傳統消息系統,如ActiveMRRabbitMQ



6.2 行爲跟蹤

Kafka的另一個應用場景是跟蹤用戶瀏覽頁面、搜索及其他行爲,以發佈-訂閱的模式實時記錄到對應的topic裏。那麼這些結果被訂閱者拿到後,就可以做進一步的實時處理,或實時監控,或放到hadoop/離線數據倉庫裏處理。



6.3 元信息監控

作爲操作記錄的監控模塊來使用,即彙集記錄一些操作信息,可以理解爲運維性質的數據監控吧。



6.4 日誌收集

日 志收集方面,其實開源產品有很多,包括Scribe、Apache Flume。很多人使用Kafka代替日誌聚合(log aggregation)。日誌聚合一般來說是從服務器上收集日誌文件,然後放到一個集中的位置(文件服務器或HDFS)進行處理。然而Kafka忽略掉 文件的細節,將其更清晰地抽象成一個個日誌或事件的消息流。這就讓Kafka處理過程延遲更低,更容易支持多數據源和分佈式數據處理。比起以日誌爲中心的 系統比如Scribe或者Flume來說,Kafka提供同樣高效的性能和因爲複製導致的更高的耐用性保證,以及更低的端到端延遲。



6.5 流處理

這 個場景可能比較多,也很好理解。保存收集流數據,以提供之後對接的Storm或其他流式計算框架進行處理。很多用戶會將那些從原始topic來的數據進行 階段性處理,彙總,擴充或者以其他的方式轉換到新的topic下再繼續後面的處理。例如一個文章推薦的處理流程,可能是先從RSS數據源中抓取文章的內 容,然後將其丟入一個叫做“文章”的topic中;後續操作可能是需要對這個內容進行清理,比如回覆正常數據或者刪除重複數據,最後再將內容匹配的結果返 還給用戶。這就在一個獨立的topic之外,產生了一系列的實時數據處理的流程。StromSamza是非常著名的實現這種類型數據轉換的框架。



6.6 事件源

事件源是一種應用程序設計的方式,該方式的狀態轉移被記錄爲按時間順序排序的記錄序列。Kafka可以存儲大量的日誌數據,這使得它成爲一個對這種方式的應用來說絕佳的後臺。比如動態彙總(News feed)。

6.7 持久性日誌(commit log)

Kafka可以爲一種外部的持久性日誌的分佈式系統提供服務。這種日誌可以在節點間備份數據,併爲故障節點數據回覆提供一種重新同步的機制。Kafka中日誌壓縮功能爲這種用法提供了條件。在這種用法中,Kafka類似於Apache BookKeeper項目。

7、Kafka的設計要點:



7.1 直接使用linux 文件系統的cache,來高效緩存數據。



7.2 採用linux Zero-Copy提高發送性能。

傳 統的數據發送需要發送4次上下文切換,採用sendfile系統調用之後,數據直接在內核態交換,系統上下文切換減少爲2次。根據測試結果,可以提高 60%的數據發送性能。Zero-Copy詳細的技術細節可以參考:https://www.ibm.com/developerworks/linux /library/j-zerocopy/



7.3 數據在磁盤上存取代價爲O(1)。

kafka 以topic來進行消息管理,每個topic包含多個part(ition),每個part對應一個邏輯log,有多個segment組成。每個 segment中存儲多條消息(見下圖),消息id由其邏輯位置決定,即從消息id可直接定位到消息的存儲位置,避免id到位置的額外映射。每個part 在內存中對應一個index,記錄每個segment中的第一條消息偏移。發佈者發到某個topic的消息會被均勻的分佈到多個part上(隨機或根據用 戶指定的回調函數進行分佈),broker收到發佈消息往對應part的最後一個segment上添加該消息,當某個segment上的消息條數達到配置 值或消息發佈時間超過閾值時,segment上的消息會被flush到磁盤,只有flush到磁盤上的消息訂閱者才能訂閱到,segment達到一定的大 小後將不會再往該segment寫數據,broker會創建新的segment。



7.4 顯式分佈式。

即 所有的producer、broker和consumer都會有多個,均爲分佈式的。Producer和broker之間沒有負載均衡機制。broker 和consumer之間利用zookeeper進行負載均衡。所有broker和consumer都會在zookeeper中進行註冊,且 zookeeper會保存他們的一些元數據信息。如果某個broker和consumer發生了變化,所有其他的broker和consumer都會得到 通知。

8、參考資料

[1] Kafka的一些特點  http://blog.segmentfault.com/mongo/1190000000385620

[2] Apache kafka原理與特性(0.8V)  http://shift-alt-ctrl.iteye.com/blog/1930345


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章