ZooKeeper架構設計及其應用要點：

ZooKeeper的數據模型是什麼？
ZooKeeper應用有哪些陷阱？
每個節點（ZNode）中存儲的是什麼？
一個ZNode維護了一個狀態結構都包含了什麼？
ZNode組成結構是什麼？
Watches的機制是什麼？
ZooKeeper內置了哪4種方式實現ACL？

前言

ZooKeeper是一個開源的分佈式服務框架，它是ApacheHadoop項目的一個子項目，主要用來解決分佈式應用場景中存在的一些問題，如：統一命名服務、狀態同步服務、集羣管理、分佈式應用配置管理等，它支持Standalone模式和分佈式模式，在分佈式模式下，能夠爲分佈式應用提供高性能和可靠地協調服務，而且使用ZooKeeper可以大大簡化分佈式協調服務的實現，爲開發分佈式應用極大地降低了成本。

總體架構

ZooKeeper分佈式協調服務框架的總體架構，如圖所示：

ZooKeeper集羣由一組Server節點組成，這一組Server節點中存在一個角色爲Leader的節點，其他節點都爲Follower。當客戶端Client連接到ZooKeeper集羣，並且執行寫請求時，這些請求會被髮送到Leader節點上，然後Leader節點上數據變更會同步到集羣中其他的Follower節點。
Leader節點在接收到數據變更請求後，首先將變更寫入本地磁盤，以作恢復之用。當所有的寫請求持久化到磁盤以後，纔會將變更應用到內存中。
ZooKeeper使用了一種自定義的原子消息協議，在消息層的這種原子特性，保證了整個協調系統中的節點數據或狀態的一致性。Follower基於這種消息協議能夠保證本地的ZooKeeper數據與Leader節點同步，然後基於本地的存儲來獨立地對外提供服務。
當一個Leader節點發生故障失效時，失敗故障是快速響應的，消息層負責重新選擇一個Leader，繼續作爲協調服務集羣的中心，處理客戶端寫請求，並將ZooKeeper協調系統的數據變更同步（廣播）到其他的Follower節點。

設計要點

ZooKeeper是基於如下4個目標來進行權衡和設計的，我們從設計及其特性的角度來詳細說明：

簡單

分佈式應用中的各個進程可以通過ZooKeeper的命名空間（Namespace）來進行協調，這個命名空間是共享的、具有層次結構的，更重要的是它的結構足夠簡單，像我們平時接觸到的文件系統的目錄結構一樣容易理解，如圖所示：

在ZooKeeper中每個命名空間（Namespace）被稱爲ZNode，你可以這樣理解，每個ZNode包含一個路徑和與之相關的元數據，以及繼承自該節點的孩子列表。與傳統文件系統不同的是，ZooKeeper中的數據保存在內存中，實現了分佈式同步服務的高吞吐和低延遲。
在上圖示例的ZooKeeper的數據模型中，有如下要點：
每個節點（ZNode）中存儲的是同步相關的數據（這是ZooKeeper設計的初衷，數據量很小，大概B到KB量級），例如狀態信息、配置內容、位置信息等。
一個ZNode維護了一個狀態結構，該結構包括：版本號、ACL變更、時間戳。每次ZNode數據發生變化，版本號都會遞增，這樣客戶端的讀請求可以基於版本號來檢索狀態相關數據。
每個ZNode都有一個ACL，用來限制是否可以訪問該ZNode。
在一個命名空間中，對ZNode上存儲的數據執行讀和寫請求操作都是原子的。
客戶端可以在一個ZNode上設置一個監視器（Watch），如果該ZNode數據發生變更，ZooKeeper會通知客戶端，從而觸發監視器中實現的邏輯的執行。
每個客戶端與ZooKeeper連接，便建立了一次會話（Session），會話過程中，可能發生CONNECTING、CONNECTED和CLOSED三種狀態。
ZooKeeper支持臨時節點（EphemeralNodes）的概念，它是與ZooKeeper中的會話（Session）相關的，如果連接斷開，則該節點被刪除。

冗餘

ZooKeeper被設計爲複製集羣架構，每個節點的數據都可以在集羣中複製傳播，使集羣中的每個節點數據同步一致，從而達到服務的可靠性和可用性。前面說到，ZooKeeper將數據放在內存中來提高性能，爲了避免發生單點故障（SPOF），支持數據的複製來達到冗餘存儲，這是必不可少的。

有序

ZooKeeper使用時間戳來記錄導致狀態變更的事務性操作，也就是說，一組事務通過時間戳來保證有序性。基於這一特性。ZooKeeper可以實現更加高級的抽象操作，如同步等。

快速

ZooKeeper包括讀寫兩種操作，基於ZooKeeper的分佈式應用，如果是讀多寫少的應用場景（讀寫比例大約是10:1），那麼讀性能更能夠體現出高效。

數據模型

ZooKeeper有一個分層的命名空間，結構類似文件系統的目錄結構，非常簡單而直觀。其中，ZNode是最重要的概念，前面我們已經描述過。另外，有ZNode有關的還包括Watches、ACL、臨時節點、序列節點（Sequence Node）。

ZNode結構

ZooKeeper中使用Zxid（ZooKeeperTransaction Id）來表示每次節點數據變更，一個Zxid與一個時間戳對應，所以多個不同的變更對應的事務是有序的。下面是ZNode的組成結構，引用文檔如下所示：
czxid – The zxid of the change that causedthis znode to be created.
mzxid – The zxid of the change that lastmodified this znode.
ctime – The time in milliseconds from epochwhen this znode was created.
mtime – The time in milliseconds from epochwhen this znode was last modified.
version – The number of changes to the dataof this znode.
cversion – The number of changes to thechildren of this znode.
aversion – The number of changes to the ACLof this znode.
ephemeralOwner – The session id of theowner of this znode if the znode is an ephemeral node. If it is not anephemeral node, it will be zero.
dataLength – The length of the data fieldof this znode.
numChildren – The number of children ofthis znode.

Watches（監視）

ZooKeeper中的Watch是隻能觸發一次。也就是說，如果客戶端在指定的ZNode設置了Watch，如果該ZNode數據發生變更，ZooKeeper會發送一個變更通知給客戶端，同時觸發設置的Watch事件。如果ZNode數據又發生了變更，客戶端在收到第一次通知後沒有重新設置該ZNode的Watch，則ZooKeeper就不會發送一個變更通知給客戶端。
ZooKeeper異步通知設置Watch的客戶端。但是ZooKeeper能夠保證在ZNode的變更生效之後纔會異步地通知客戶端，然後客戶端才能夠看到ZNode的數據變更。由於網絡延遲，多個客戶端可能會在不同的時間看到ZNode數據的變更，但是看到變更的順序是能夠保證有序一致的。
ZNode可以設置兩類Watch，一個是DataWatches（該ZNode的數據變更導致觸發Watch事件），另一個是Child Watches（該ZNode的孩子節點發生變更導致觸發Watch事件）。調用getData()和exists() 方法可以設置Data Watches，調用getChildren()方法可以設置Child Watches。調用setData()方法觸發在該ZNode的註冊的Data Watches。調用create()方法創建一個ZNode，將觸發該ZNode的Data Watches；調用create()方法創建ZNode的孩子節點，則觸發ZNode的Child Watches。調用delete()方法刪除ZNode，則同時觸發Data Watches和Child Watches，如果該被刪除的ZNode還有父節點，則父節點觸發一個Child Watches。
另外，如果客戶端與ZooKeeper Server斷開連接，客戶端就無法觸發Watches，除非再次與ZooKeeper Server建立連接。

Sequence Nodes（序列節點）

在創建ZNode的時候，可以請求ZooKeeper生成序列，以路徑名爲前綴，計數器緊接在路徑名後面，例如，會生成類似如下形式序列
qn-0000000001, qn-0000000002,qn-0000000003, qn-0000000004, qn-0000000005, qn-0000000006, qn-0000000007
對於ZNode的父節點來說，序列中的每個計數器字符串都是唯一的，最大值爲2147483647。

ACLs（訪問控制列表）

ACL可以控制訪問ZooKeeper的節點，只能應用於特定的ZNode上，而不能應用於該ZNode的所有孩子節點上。它主要有如下五種權限：

CREATE 允許創建Child Nodes
READ 允許獲取ZNode的數據，以及該節點的孩子列表
WRITE 可以修改ZNode的數據
DELETE 可以刪除一個孩子節點
ADMIN 可以設置權限

ZooKeeper內置了4種方式實現ACL：

world 一個單獨的ID，表示任何人都可以訪問
auth 不使用ID，只有認證的用戶可以訪問
digest 使用username:password生成MD5哈希值作爲認證ID
ip 使用客戶端主機IP地址來進行認證

ZooKeeper Session
當客戶端連接到ZooKeeper集羣時，建立了會話。會話過程中的狀態變遷，如圖所示：

建立連接過程中，會話狀態爲CONNECTING；當連接建立成功後，會話狀態變爲CONNECTED。會話過程中，如果正常的話，會話的狀態只能是CONNECTING和CONNECTED二者之一。如果在會話過程中連接斷開，則變爲CLOSED狀態。

應用陷阱

並非任何分佈式應用都適合使用ZooKeeper來構建協調服務，我們根據ZooKeeper提供的文檔，給出哪些情況下使用會出現問題，又是如何應對這種問題的。總結如下：

丟失ZNode上的變更通知

客戶端連接到ZooKeeper Server以後，會維護一個TCP連接。在CONNECTED狀態下，客戶端設置了某個ZNode的Watch監聽器，可以收到來自該節點變更的通知（後續會觸發一定的邏輯執行流程）。但是，如果由於網絡異常，客戶端斷開了與ZooKeeper Server的連接，在斷開的過程中，是無法收到ZooKeeper在ZNode上發送的節點數據變更通知的。
所以，如果使用ZooKeeper的Watch，必須要尋找保持CONNECTED的Watch，才能保證不會丟失該Watch監控的ZNode上的數據變更通知。

無效ZooKeeper集羣節點列表

與ZooKeeper集羣交互時，一般情況下客戶端會持有一個ZooKeeper集羣節點的列表，或者列表的子集，那麼會存在如下兩種情況：
一種情況是，如果客戶端持有的列表或者列表子集，其中節點都處於Active狀態，能夠提供協調服務，那麼客戶端訪問ZooKeeper集羣沒有任何問題。
另一種情況，客戶端持有ZooKeeper集羣節點列表或列表子集，如果列表中的某些節點因爲故障退出了集羣，如果客戶端再次連接這一類失效的節點，就無法獲取服務。
所以，我們在應用中使用ZooKeeper集羣時，一定要明確這一點，或者跳過無效的節點，或者重新尋找有效的節點繼續業務處理，或者檢查ZooKeeper集羣，使整個集羣恢復正常。

配置導致的性能問題

如果設置Java堆內存（Heap）不合理，會導致ZooKeeper內存不足，會在內存與文件系統之間進行數據交換，導致ZooKeeper的性能極大地下降，從而可能會影響應用程序。
爲了避免Swapping問題的出現，主要考慮設置足夠的Java堆內存，同時減少被操作系統和Cache使用的內存，儘量避免在內存與文件系統之間發生數據交換，或者可以將交換限制在一定的範圍之內。

事務日誌存儲設備性能

ZooKeeper會同步事務到存儲設備，如果存儲設備不是專用的，而是和其他I/O密集型應用共享同一磁盤，會導致ZooKeeper的效率。因爲客戶端請求ZNode數據變更而發生的事務，ZooKeeper會在響應之前將事務日誌寫入存儲設備，如果存儲設備是專用的，那麼整個服務以至外部應用都會獲得極大地性能提升。

ZNode存儲大量數據導致性能問題

ZooKeeper的設計初衷是，每個ZNode只存放少量的同步數據，如果存儲了大量數據，導致ZooKeeper每次節點發生變更時需要將事務寫入存儲設備，同時還要在集羣內部複製傳播，這將導致不可避免的延遲和性能問題。
所以，如果需要與大量的數據相關，可以將大量數據存儲在其他設備中，而只是在ZooKeeper中存儲一個簡單的映射，如指針、引用等等。

本文轉載於http://www.aboutyun.com/thread-7731-1-1.html。

（五）、ZooKeeper體系架構

ZooKeeper架構設計及其應用要點：

前言

總體架構

設計要點

簡單

冗餘

有序

快速

數據模型

ZNode結構

Watches（監視）

Sequence Nodes（序列節點）

ACLs（訪問控制列表）

ZooKeeper內置了4種方式實現ACL：

應用陷阱

丟失ZNode上的變更通知

無效ZooKeeper集羣節點列表

配置導致的性能問題

事務日誌存儲設備性能

ZNode存儲大量數據導致性能問題

Golang爬蟲代理接入的技術與實踐

（十三）、ZooKeeper 選主流程

JavaScript分享新浪微博、QQ空間、騰訊微博

強勢團隊的五大特性

Jenkins部署新項目

圖片延遲加載

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

（五）、ZooKeeper體系架構

ZooKeeper架構設計及其應用要點 ：

前言

總體架構

設計要點

簡單

冗餘

有序

快速

數據模型

ZNode結構

Watches（監視）

Sequence Nodes（序列節點）

ACLs（訪問控制列表）

ZooKeeper內置了4種方式實現ACL：

應用陷阱

丟失ZNode上的變更通知

無效ZooKeeper集羣節點列表

配置導致的性能問題

事務日誌存儲設備性能

ZNode存儲大量數據導致性能問題

ZooKeeper架構設計及其應用要點：