分佈式開放消息系統(RocketMQ)的原理與實踐

備註：
1.如果您此前未接觸過RocketMQ，請先閱讀附錄部分，以便了解RocketMQ的整體架構和相關術語
2.文中的MQServer與Broker表示同一概念

分佈式消息系統作爲實現分佈式系統可擴展、可伸縮性的關鍵組件，需要具有高吞吐量、高可用等特點。而談到消息系統的設計，就回避不了兩個問題：

消息的順序問題

消息的重複問題

RocketMQ作爲阿里開源的一款高性能、高吞吐量的消息中間件，它是怎樣來解決這兩個問題的？RocketMQ 有哪些關鍵特性？其實現原理是怎樣的？

關鍵特性以及其實現原理

一、順序消息

消息有序指的是一類消息消費時，能按照發送的順序來消費。例如：一個訂單產生了 3 條消息，分別是訂單創建、訂單付款、訂單完成。消費時，要按照這個順序消費纔有意義。但同時訂單之間又是可以並行消費的。

假如生產者產生了2條消息：M1、M2，要保證這兩條消息的順序，應該怎樣做？你腦中想到的可能是這樣：

你可能會採用這種方式保證消息順序

M1發送到S1後，M2發送到S2，如果要保證M1先於M2被消費，那麼需要M1到達消費端後，通知S2，然後S2再將M2發送到消費端。

這個模型存在的問題是，如果M1和M2分別發送到兩臺Server上，就不能保證M1先達到，也就不能保證M1被先消費，那麼就需要在MQ Server集羣維護消息的順序。那麼如何解決？一種簡單的方式就是將M1、M2發送到同一個Server上：

保證消息順序，你改進後的方法

這樣可以保證M1先於M2到達MQServer（客戶端等待M1成功後再發送M2），根據先達到先被消費的原則，M1會先於M2被消費，這樣就保證了消息的順序。

這個模型，理論上可以保證消息的順序，但在實際運用中你應該會遇到下面的問題：

網絡延遲問題

只要將消息從一臺服務器發往另一臺服務器，就會存在網絡延遲問題。如上圖所示，如果發送M1耗時大於發送M2的耗時，那麼M2就先被消費，仍然不能保證消息的順序。即使M1和M2同時到達消費端，由於不清楚消費端1和消費端2的負載情況，仍然有可能出現M2先於M1被消費。如何解決這個問題？將M1和M2發往同一個消費者即可，且發送M1後，需要消費端響應成功後才能發送M2。

但又會引入另外一個問題，如果發送M1後，消費端1沒有響應，那是繼續發送M2呢，還是重新發送M1？一般爲了保證消息一定被消費，肯定會選擇重發M1到另外一個消費端2，就如下圖所示。

保證消息順序的正確姿勢

這樣的模型就嚴格保證消息的順序，細心的你仍然會發現問題，消費端1沒有響應Server時有兩種情況，一種是M1確實沒有到達，另外一種情況是消費端1已經響應，但是Server端沒有收到。如果是第二種情況，重發M1，就會造成M1被重複消費。也就是我們後面要說的第二個問題，消息重複問題。

回過頭來看消息順序問題，嚴格的順序消息非常容易理解，而且處理問題也比較容易，要實現嚴格的順序消息，簡單且可行的辦法就是：

保證生產者 - MQServer - 消費者是一對一對一的關係

但是這樣設計，並行度就成爲了消息系統的瓶頸（吞吐量不夠），也會導致更多的異常處理，比如：只要消費端出現問題，就會導致整個處理流程阻塞，我們不得不花費更多的精力來解決阻塞的問題。

但我們的最終目標是要集羣的高容錯性和高吞吐量。這似乎是一對不可調和的矛盾，那麼阿里是如何解決的？

世界上解決一個計算機問題最簡單的方法：“恰好”不需要解決它！—— 沈詢

有些問題，看起來很重要，但實際上我們可以通過合理的設計或者將問題分解來規避。如果硬要把時間花在解決它們身上，實際上是浪費的，效率低下的。從這個角度來看消息的順序問題，我們可以得出兩個結論：

1、不關注亂序的應用實際大量存在
2、隊列無序並不意味着消息無序

最後我們從源碼角度分析RocketMQ怎麼實現發送順序消息。

一般消息是通過輪詢所有隊列來發送的（負載均衡策略），順序消息可以根據業務，比如說訂單號相同的消息發送到同一個隊列。下面的示例中，OrderId相同的消息，會發送到同一個隊列：

// RocketMQ默認提供了兩種MessageQueueSelector實現：隨機/Hash
SendResult sendResult = producer.send(msg, new MessageQueueSelector() {
    @Override
    public MessageQueue select(List<MessageQueue> mqs, Message msg, Object arg) {
        Integer id = (Integer) arg;
        int index = id % mqs.size();
        return mqs.get(index);
    }
}, orderId);

在獲取到路由信息以後，會根據MessageQueueSelector實現的算法來選擇一個隊列，同一個OrderId獲取到的隊列是同一個隊列。

private SendResult send()  {
    // 獲取topic路由信息
    TopicPublishInfo topicPublishInfo = this.tryToFindTopicPublishInfo(msg.getTopic());
    if (topicPublishInfo != null && topicPublishInfo.ok()) {
        MessageQueue mq = null;
        // 根據我們的算法，選擇一個發送隊列
        // 這裏的arg = orderId
        mq = selector.select(topicPublishInfo.getMessageQueueList(), msg, arg);
        if (mq != null) {
            return this.sendKernelImpl(msg, mq, communicationMode, sendCallback, timeout);
        }
    }
}

二、消息重複

上面在解決消息順序問題時，引入了一個新的問題，就是消息重複。那麼RocketMQ是怎樣解決消息重複的問題呢？還是“恰好”不解決。

造成消息的重複的根本原因是：網絡不可達。只要通過網絡交換數據，就無法避免這個問題。所以解決這個問題的辦法就是不解決，轉而繞過這個問題。那麼問題就變成了：如果消費端收到兩條一樣的消息，應該怎樣處理？

1、消費端處理消息的業務邏輯保持冪等性
2、保證每條消息都有唯一編號且保證消息處理成功與去重表的日誌同時出現

第1條很好理解，只要保持冪等性，不管來多少條重複消息，最後處理的結果都一樣。第2條原理就是利用一張日誌表來記錄已經處理成功的消息的ID，如果新到的消息ID已經在日誌表中，那麼就不再處理這條消息。

我們可以看到第1條的解決方式，很明顯應該在消費端實現，不屬於消息系統要實現的功能。第2條可以消息系統實現，也可以業務端實現。正常情況下出現重複消息的概率不一定大，且由消息系統實現的話，肯定會對消息系統的吞吐量和高可用有影響，所以最好還是由業務端自己處理消息重複的問題，這也是RocketMQ不解決消息重複的問題的原因。

RocketMQ不保證消息不重複，如果你的業務需要保證嚴格的不重複消息，需要你自己在業務端去重。

三、事務消息

RocketMQ除了支持普通消息，順序消息，另外還支持事務消息。首先討論一下什麼是事務消息以及支持事務消息的必要性。我們以一個轉帳的場景爲例來說明這個問題：Bob向Smith轉賬100塊。

在單機環境下，執行事務的情況，大概是下面這個樣子：

單機環境下轉賬事務示意圖

當用戶增長到一定程度，Bob和Smith的賬戶及餘額信息已經不在同一臺服務器上了，那麼上面的流程就變成了這樣：

集羣環境下轉賬事務示意圖

這時候你會發現，同樣是一個轉賬的業務，在集羣環境下，耗時居然成倍的增長，這顯然是不能夠接受的。那我們如何來規避這個問題？

大事務 = 小事務 + 異步

將大事務拆分成多個小事務異步執行。這樣基本上能夠將跨機事務的執行效率優化到與單機一致。轉賬的事務就可以分解成如下兩個小事務：

小事務+異步消息

圖中執行本地事務（Bob賬戶扣款）和發送異步消息應該保持同時成功或者失敗中，也就是扣款成功了，發送消息一定要成功，如果扣款失敗了，就不能再發送消息。那問題是：我們是先扣款還是先發送消息呢？

首先我們看下，先發送消息，大致的示意圖如下：

事務消息：先發送消息

存在的問題是：如果消息發送成功，但是扣款失敗，消費端就會消費此消息，進而向Smith賬戶加錢。

先發消息不行，那我們就先扣款唄，大致的示意圖如下：

事務消息-先扣款

存在的問題跟上面類似：如果扣款成功，發送消息失敗，就會出現Bob扣錢了，但是Smith賬戶未加錢。

可能大家會有很多的方法來解決這個問題，比如：直接將發消息放到Bob扣款的事務中去，如果發送失敗，拋出異常，事務回滾。這樣的處理方式也符合“恰好”不需要解決的原則。RocketMQ支持事務消息，下面我們來看看RocketMQ是怎樣來實現的。

RocketMQ實現發送事務消息

RocketMQ第一階段發送Prepared消息時，會拿到消息的地址，第二階段執行本地事物，第三階段通過第一階段拿到的地址去訪問消息，並修改狀態。細心的你可能又發現問題了，如果確認消息發送失敗了怎麼辦？RocketMQ會定期掃描消息集羣中的事物消息，這時候發現了Prepared消息，它會向消息發送者確認，Bob的錢到底是減了還是沒減呢？如果減了是回滾還是繼續發送確認消息呢？RocketMQ會根據發送端設置的策略來決定是回滾還是繼續發送確認消息。這樣就保證了消息發送與本地事務同時成功或同時失敗。

那我們來看下RocketMQ源碼，是不是這樣來處理事務消息的。客戶端發送事務消息的部分（完整代碼請查看：rocketmq-example工程下的com.alibaba.rocketmq.example.transaction.TransactionProducer）：

// 未決事務，MQ服務器回查客戶端
// 也就是上文所說的，當RocketMQ發現`Prepared消息`時，會根據這個Listener實現的策略來決斷事務
TransactionCheckListener transactionCheckListener = new TransactionCheckListenerImpl();
// 構造事務消息的生產者
TransactionMQProducer producer = new TransactionMQProducer("groupName");
// 設置事務決斷處理類
producer.setTransactionCheckListener(transactionCheckListener);
// 本地事務的處理邏輯，相當於示例中檢查Bob賬戶並扣錢的邏輯
TransactionExecuterImpl tranExecuter = new TransactionExecuterImpl();
producer.start()
// 構造MSG，省略構造參數
Message msg = new Message(......);
// 發送消息
SendResult sendResult = producer.sendMessageInTransaction(msg, tranExecuter, null);
producer.shutdown();

接着查看sendMessageInTransaction方法的源碼，總共分爲3個階段：發送Prepared消息、執行本地事務、發送確認消息。

public TransactionSendResult sendMessageInTransaction(.....)  {
    // 邏輯代碼，非實際代碼
    // 1.發送消息
    sendResult = this.send(msg);
    // sendResult.getSendStatus() == SEND_OK
    // 2.如果消息發送成功，處理與消息關聯的本地事務單元
    LocalTransactionState localTransactionState = tranExecuter.executeLocalTransactionBranch(msg, arg);
    // 3.結束事務
    this.endTransaction(sendResult, localTransactionState, localException);
}

endTransaction方法會將請求發往broker(mq server)去更新事物消息的最終狀態：

根據sendResult找到Prepared消息
根據localTransaction更新消息的最終狀態

如果endTransaction方法執行失敗，導致數據沒有發送到broker，broker會有回查線程定時（默認1分鐘）掃描每個存儲事務狀態的表格文件，如果是已經提交或者回滾的消息直接跳過，如果是prepared狀態則會向Producer發起CheckTransaction請求，Producer會調用DefaultMQProducerImpl.checkTransactionState()方法來處理broker的定時回調請求，而checkTransactionState會調用我們的事務設置的決斷方法，最後調用endTransactionOneway讓broker來更新消息的最終狀態。

再回到轉賬的例子，如果Bob的賬戶的餘額已經減少，且消息已經發送成功，Smith端開始消費這條消息，這個時候就會出現消費失敗和消費超時兩個問題？解決超時問題的思路就是一直重試，直到消費端消費消息成功，整個過程中有可能會出現消息重複的問題，按照前面的思路解決即可。

消費事務消息

這樣基本上可以解決超時問題，但是如果消費失敗怎麼辦？阿里提供給我們的解決方法是：人工解決。大家可以考慮一下，按照事務的流程，因爲某種原因Smith加款失敗，需要回滾整個流程。如果消息系統要實現這個回滾流程的話，系統複雜度將大大提升，且很容易出現Bug，估計出現Bug的概率會比消費失敗的概率大很多。我們需要衡量是否值得花這麼大的代價來解決這樣一個出現概率非常小的問題，這也是大家在解決疑難問題時需要多多思考的地方。

20160321補充：在3.2.6版本中移除了事務消息的實現，所以此版本不支持事務消息，具體情況請參考rocketmq的issues：
https://github.com/alibaba/RocketMQ/issues/65
https://github.com/alibaba/RocketMQ/issues/138
https://github.com/alibaba/RocketMQ/issues/156

四、Producer如何發送消息

Producer輪詢某topic下的所有隊列的方式來實現發送方的負載均衡，如下圖所示：

producer發送消息負載均衡

首先分析一下RocketMQ的客戶端發送消息的源碼：

// 構造Producer
DefaultMQProducer producer = new DefaultMQProducer("ProducerGroupName");
// 初始化Producer，整個應用生命週期內，只需要初始化1次
producer.start();
// 構造Message
Message msg = new Message("TopicTest1",// topic
                        "TagA",// tag：給消息打標籤,用於區分一類消息，可爲null
                        "OrderID188",// key：自定義Key，可以用於去重，可爲null
                        ("Hello MetaQ").getBytes());// body：消息內容
// 發送消息並返回結果
SendResult sendResult = producer.send(msg);
// 清理資源，關閉網絡連接，註銷自己
producer.shutdown();

在整個應用生命週期內，生產者需要調用一次start方法來初始化，初始化主要完成的任務有：

如果沒有指定namesrv地址，將會自動尋址

啓動定時任務：更新namesrv地址、從namsrv更新topic路由信息、清理已經掛掉的broker、向所有broker發送心跳...

啓動負載均衡的服務

初始化完成後，開始發送消息，發送消息的主要代碼如下：

private SendResult sendDefaultImpl(Message msg,......) {
    // 檢查Producer的狀態是否是RUNNING
    this.makeSureStateOK();
    // 檢查msg是否合法：是否爲null、topic,body是否爲空、body是否超長
    Validators.checkMessage(msg, this.defaultMQProducer);
    // 獲取topic路由信息
    TopicPublishInfo topicPublishInfo = this.tryToFindTopicPublishInfo(msg.getTopic());
    // 從路由信息中選擇一個消息隊列
    MessageQueue mq = topicPublishInfo.selectOneMessageQueue(lastBrokerName);
    // 將消息發送到該隊列上去
    sendResult = this.sendKernelImpl(msg, mq, communicationMode, sendCallback, timeout);
}

代碼中需要關注的兩個方法tryToFindTopicPublishInfo和selectOneMessageQueue。前面說過在producer初始化時，會啓動定時任務獲取路由信息並更新到本地緩存，所以tryToFindTopicPublishInfo會首先從緩存中獲取topic路由信息，如果沒有獲取到，則會自己去namesrv獲取路由信息。selectOneMessageQueue方法通過輪詢的方式，返回一個隊列，以達到負載均衡的目的。

如果Producer發送消息失敗，會自動重試，重試的策略：

重試次數 < retryTimesWhenSendFailed（可配置）
總的耗時（包含重試n次的耗時） < sendMsgTimeout（發送消息時傳入的參數）
同時滿足上面兩個條件後，Producer會選擇另外一個隊列發送消息

五、消息存儲

RocketMQ的消息存儲是由consume queue和commit log配合完成的。

1、Consume Queue

consume queue是消息的邏輯隊列，相當於字典的目錄，用來指定消息在物理文件commit log上的位置。

我們可以在配置中指定consumequeue與commitlog存儲的目錄
每個topic下的每個queue都有一個對應的consumequeue文件，比如：

${rocketmq.home}/store/consumequeue/${topicName}/${queueId}/${fileName}

Consume Queue文件組織，如圖所示：

Consume Queue文件組織示意圖

根據topic和queueId來組織文件，圖中TopicA有兩個隊列0,1，那麼TopicA和QueueId=0組成一個ConsumeQueue，TopicA和QueueId=1組成另一個ConsumeQueue。
按照消費端的GroupName來分組重試隊列，如果消費端消費失敗，消息將被髮往重試隊列中，比如圖中的%RETRY%ConsumerGroupA。
按照消費端的GroupName來分組死信隊列，如果消費端消費失敗，並重試指定次數後，仍然失敗，則發往死信隊列，比如圖中的%DLQ%ConsumerGroupA。

死信隊列（Dead Letter Queue）一般用於存放由於某種原因無法傳遞的消息，比如處理失敗或者已經過期的消息。

Consume Queue中存儲單元是一個20字節定長的二進制數據，順序寫順序讀，如下圖所示：

consumequeue文件存儲單元格式

CommitLog Offset是指這條消息在Commit Log文件中的實際偏移量
Size存儲中消息的大小
Message Tag HashCode存儲消息的Tag的哈希值：主要用於訂閱時消息過濾（訂閱時如果指定了Tag，會根據HashCode來快速查找到訂閱的消息）

2、Commit Log

CommitLog：消息存放的物理文件，每臺broker上的commitlog被本機所有的queue共享，不做任何區分。
文件的默認位置如下，仍然可通過配置文件修改：

${user.home} \store\${commitlog}\${fileName}

CommitLog的消息存儲單元長度不固定，文件順序寫，隨機讀。消息的存儲結構如下表所示，按照編號順序以及編號對應的內容依次存儲。

Commit Log存儲單元結構圖

3、消息存儲實現

消息存儲實現，比較複雜，也值得大家深入瞭解，後面會單獨成文來分析，這小節只以代碼說明一下具體的流程。

// Set the storage time
msg.setStoreTimestamp(System.currentTimeMillis());
// Set the message body BODY CRC (consider the most appropriate setting
msg.setBodyCRC(UtilAll.crc32(msg.getBody()));
StoreStatsService storeStatsService = this.defaultMessageStore.getStoreStatsService();
synchronized (this) {
    long beginLockTimestamp = this.defaultMessageStore.getSystemClock().now();
    // Here settings are stored timestamp, in order to ensure an orderly global
    msg.setStoreTimestamp(beginLockTimestamp);
    // MapedFile：操作物理文件在內存中的映射以及將內存數據持久化到物理文件中
    MapedFile mapedFile = this.mapedFileQueue.getLastMapedFile();
    // 將Message追加到文件commitlog
    result = mapedFile.appendMessage(msg, this.appendMessageCallback);
    switch (result.getStatus()) {
    case PUT_OK:break;
    case END_OF_FILE:
         // Create a new file, re-write the message
         mapedFile = this.mapedFileQueue.getLastMapedFile();
         result = mapedFile.appendMessage(msg, this.appendMessageCallback);
     break;
     DispatchRequest dispatchRequest = new DispatchRequest(
                topic,// 1
                queueId,// 2
                result.getWroteOffset(),// 3
                result.getWroteBytes(),// 4
                tagsCode,// 5
                msg.getStoreTimestamp(),// 6
                result.getLogicsOffset(),// 7
                msg.getKeys(),// 8
                /**
                 * Transaction
                 */
                msg.getSysFlag(),// 9
                msg.getPreparedTransactionOffset());// 10
    // 1.分發消息位置到ConsumeQueue
    // 2.分發到IndexService建立索引
    this.defaultMessageStore.putDispatchRequest(dispatchRequest);
}

4、消息的索引文件

如果一個消息包含key值的話，會使用IndexFile存儲消息索引，文件的內容結構如圖：

消息索引

索引文件主要用於根據key來查詢消息的，流程主要是：

根據查詢的 key 的 hashcode%slotNum 得到具體的槽的位置(slotNum 是一個索引文件裏面包含的最大槽的數目，例如圖中所示 slotNum=5000000)
根據 slotValue(slot 位置對應的值)查找到索引項列表的最後一項(倒序排列,slotValue 總是指向最新的一個索引項)
遍歷索引項列表返回查詢時間範圍內的結果集(默認一次最大返回的 32 條記錄)

六、消息訂閱

RocketMQ消息訂閱有兩種模式，一種是Push模式，即MQServer主動向消費端推送；另外一種是Pull模式，即消費端在需要時，主動到MQServer拉取。但在具體實現時，Push和Pull模式都是採用消費端主動拉取的方式。

首先看下消費端的負載均衡：

消費端負載均衡

消費端會通過RebalanceService線程，10秒鐘做一次基於topic下的所有隊列負載：

遍歷Consumer下的所有topic，然後根據topic訂閱所有的消息
獲取同一topic和Consumer Group下的所有Consumer
然後根據具體的分配策略來分配消費隊列，分配的策略包含：平均分配、消費端配置等

如同上圖所示：如果有 5 個隊列，2 個 consumer，那麼第一個 Consumer 消費 3 個隊列，第二 consumer 消費 2 個隊列。這裏採用的就是平均分配策略，它類似於我們的分頁，TOPIC下面的所有queue就是記錄，Consumer的個數就相當於總的頁數，那麼每頁有多少條記錄，就類似於某個Consumer會消費哪些隊列。

通過這樣的策略來達到大體上的平均消費，這樣的設計也可以很方面的水平擴展Consumer來提高消費能力。

消費端的Push模式是通過長輪詢的模式來實現的，就如同下圖：

Push模式示意圖

Consumer端每隔一段時間主動向broker發送拉消息請求，broker在收到Pull請求後，如果有消息就立即返回數據，Consumer端收到返回的消息後，再回調消費者設置的Listener方法。如果broker在收到Pull請求時，消息隊列裏沒有數據，broker端會阻塞請求直到有數據傳遞或超時才返回。

當然，Consumer端是通過一個線程將阻塞隊列LinkedBlockingQueue<PullRequest>中的PullRequest發送到broker拉取消息，以防止Consumer一致被阻塞。而Broker端，在接收到Consumer的PullRequest時，如果發現沒有消息，就會把PullRequest扔到ConcurrentHashMap中緩存起來。broker在啓動時，會啓動一個線程不停的從ConcurrentHashMap取出PullRequest檢查，直到有數據返回。

七、RocketMQ的其他特性

前面的6個特性都是基本上都是點到爲止，想要深入瞭解，還需要大家多多查看源碼，多多在實際中運用。當然除了已經提到的特性外，RocketMQ還支持：

定時消息
消息的刷盤策略
主動同步策略：同步雙寫、異步複製
海量消息堆積能力
高效通信
.......

其中涉及到的很多設計思路和解決方法都值得我們深入研究：

消息的存儲設計：既要滿足海量消息的堆積能力，又要滿足極快的查詢效率，還要保證寫入的效率。
高效的通信組件設計：高吞吐量，毫秒級的消息投遞能力都離不開高效的通信。
.......

RocketMQ最佳實踐

一、Producer最佳實踐

1、一個應用儘可能用一個 Topic，消息子類型用 tags 來標識，tags 可以由應用自由設置。只有發送消息設置了tags，消費方在訂閱消息時，纔可以利用 tags 在 broker 做消息過濾。
2、每個消息在業務層面的唯一標識碼，要設置到 keys 字段，方便將來定位消息丟失問題。由於是哈希索引，請務必保證 key 儘可能唯一，這樣可以避免潛在的哈希衝突。
3、消息發送成功或者失敗，要打印消息日誌，務必要打印 sendresult 和 key 字段。
4、對於消息不可丟失應用，務必要有消息重發機制。例如：消息發送失敗，存儲到數據庫，能有定時程序嘗試重發或者人工觸發重發。
5、某些應用如果不關注消息是否發送成功，請直接使用sendOneWay方法發送消息。

二、Consumer最佳實踐

1、消費過程要做到冪等（即消費端去重）
2、儘量使用批量方式消費方式，可以很大程度上提高消費吞吐量。
3、優化每條消息消費過程

三、其他配置

線上應該關閉autoCreateTopicEnable，即在配置文件中將其設置爲false。

RocketMQ在發送消息時，會首先獲取路由信息。如果是新的消息，由於MQServer上面還沒有創建對應的Topic，這個時候，如果上面的配置打開的話，會返回默認TOPIC的（RocketMQ會在每臺broker上面創建名爲TBW102的TOPIC）路由信息，然後Producer會選擇一臺Broker發送消息，選中的broker在存儲消息時，發現消息的topic還沒有創建，就會自動創建topic。後果就是：以後所有該TOPIC的消息，都將發送到這臺broker上，達不到負載均衡的目的。

所以基於目前RocketMQ的設計，建議關閉自動創建TOPIC的功能，然後根據消息量的大小，手動創建TOPIC。

RocketMQ設計相關

RocketMQ的設計假定：

每臺PC機器都可能宕機不可服務
任意集羣都有可能處理能力不足
最壞的情況一定會發生
內網環境需要低延遲來提供最佳用戶體驗

RocketMQ的關鍵設計：

分佈式集羣化
強數據安全
海量數據堆積
毫秒級投遞延遲（推拉模式）

這是RocketMQ在設計時的假定前提以及需要到達的效果。我想這些假定適用於所有的系統設計。隨着我們系統的服務的增多，每位開發者都要注意自己的程序是否存在單點故障，如果掛了應該怎麼恢復、能不能很好的水平擴展、對外的接口是否足夠高效、自己管理的數據是否足夠安全...... 多多規範自己的設計，才能開發出高效健壯的程序。

附錄：RocketMQ涉及到的幾個專業術語和整體架構介紹

一、RocketMQ中的專業術語

Topic
topic表示消息的第一級類型，比如一個電商系統的消息可以分爲：交易消息、物流消息...... 一條消息必須有一個Topic。

Tag
Tag表示消息的第二級類型，比如交易消息又可以分爲：交易創建消息，交易完成消息..... 一條消息可以沒有Tag。RocketMQ提供2級消息分類，方便大家靈活控制。

Queue
一個topic下，我們可以設置多個queue(消息隊列)。當我們發送消息時，需要要指定該消息的topic。RocketMQ會輪詢該topic下的所有隊列，將消息發送出去。

Producer 與 Producer Group
Producer表示消息隊列的生產者。消息隊列的本質就是實現了publish-subscribe模式，生產者生產消息，消費者消費消息。所以這裏的Producer就是用來生產和發送消息的，一般指業務系統。

Producer Group是一類Producer的集合名稱，這類Producer通常發送一類消息，且發送邏輯一致。

Consumer 與 Consumer Group
消息消費者，一般由後臺系統異步消費消息。

Push Consumer
Consumer 的一種，應用通常向 Consumer 對象註冊一個 Listener 接口，一旦收到消息，Consumer 對象立刻回調 Listener 接口方法。
Pull Consumer
Consumer 的一種，應用通常主動調用 Consumer 的拉消息方法從 Broker 拉消息，主動權由應用控制。

Consumer Group是一類Consumer的集合名稱，這類Consumer通常消費一類消息，且消費邏輯一致。

Broker
消息的中轉者，負責存儲和轉發消息。可以理解爲消息隊列服務器，提供了消息的接收、存儲、拉取和轉發服務。broker是RocketMQ的核心，它不不能掛的，所以需要保證broker的高可用。

廣播消費
一條消息被多個Consumer消費，即使這些Consumer屬於同一個Consumer Group，消息也會被Consumer Group中的每個Consumer都消費一次。在廣播消費中的Consumer Group概念可以認爲在消息劃分方面無意義。

集羣消費
一個Consumer Group中的Consumer實例平均分攤消費消息。例如某個Topic有 9 條消息，其中一個Consumer Group有 3 個實例(可能是 3 個進程,或者 3 臺機器)，那麼每個實例只消費其中的 3 條消息。

NameServer
NameServer即名稱服務，兩個功能：

接收broker的請求，註冊broker的路由信息
接口client的請求，根據某個topic獲取其到broker的路由信息
NameServer沒有狀態，可以橫向擴展。每個broker在啓動的時候會到NameServer註冊；Producer在發送消息前會根據topic到NameServer獲取路由(到broker)信息；Consumer也會定時獲取topic路由信息。

二、RocketMQ Overview

rocketmq overview

Producer向一些隊列輪流發送消息，隊列集合稱爲Topic，Consumer如果做廣播消費，則一個consumer實例消費這個Topic對應的所有隊列；如果做集羣消費，則多個Consumer實例平均消費這個Topic對應的隊列集合。

再看下RocketMQ物理部署結構圖：

RocketMQ網絡部署圖

RocketMQ網絡部署特點：

Name Server 是一個幾乎無狀態節點，可集羣部署，節點之間無任何信息同步。
Broker部署相對複雜，Broker分爲Master與Slave，一個Master可以對應多個Slave，但是一個Slave只能對應一個Master，Master與Slave的對應關係通過指定相同的BrokerName，不同的BrokerId來定義，BrokerId=0表示Master，非0表示Slave。Master也可以部署多個。每個Broker與Name Server集羣中的所有節點建立長連接，定時註冊Topic信息到所有Name Server。
Producer與Name Server集羣中的其中一個節點（隨機選擇）建立長連接，定期從Name Server取Topic路由信息，並向提供Topic 服務的Master建立長連接，且定時向Master發送心跳。Producer 完全無狀態，可集羣部署。
Consumer與Name Server集羣中的其中一個節點（隨機選擇）建立長連接，定期從Name Server取Topic 路由信息，並向提供Topic服務的Master、Slave建立長連接，且定時向Master、Slave發送心跳。Consumer既可以從Master訂閱消息，也可以從Slave訂閱消息，訂閱規則由Broker配置決定。

三、其他參考資料

文／CHEN川（簡書作者）
原文鏈接：http://www.jianshu.com/p/453c6e7ff81c
著作權歸作者所有，轉載請聯繫作者獲得授權，並標註“簡書作者”。