關於分佈式事務、兩階段提交、一階段提交、Best Efforts 1PC模式和事務補償機制的研究 ...

1.XA

 

XA是由X/Open組織提出的分佈式事務的規範。XA規範主要定義了(全局)事務管理器(Transaction Manager)和(局部)資源管理器(Resource Manager)之間的接口。XA接口是雙向的系統接口,在事務管理器(Transaction Manager)以及一個或多個資源管理器(Resource Manager)之間形成通信橋樑。XA之所以需要引入事務管理器是因爲,在分佈式系統中,從理論上講(參考Fischer等的論文),兩臺機器理論上無法達到一致的狀態,需要引入一個單點進行協調。事務管理器控制着全局事務,管理事務生命週期,並協調資源。資源管理器負責控制和管理實際資源(如數據庫或JMS隊列)。下圖說明了事務管理器、資源管理器,與應用程序之間的關係:

 

圖1.XA規範下的分佈式事務各類參與者之間的關係

 

2.JTA


作爲java平臺上事務規範JTA(Java Transaction API)也定義了對XA事務的支持,實際上,JTA是基於XA架構上建模的,在JTA 中,事務管理器抽象爲javax.transaction.TransactionManager接口,並通過底層事務服務(即JTS)實現。像很多其他的java規範一樣,JTA僅僅定義了接口,具體的實現則是由供應商(如J2EE廠商)負責提供,目前JTA的實現主要由以下幾種:


1.J2EE容器所提供的JTA實現(JBoss)
2.獨立的JTA實現:如JOTM,Atomikos.這些實現可以應用在那些不使用J2EE應用服務器的環境裏用以提供分佈事事務保證。如Tomcat,Jetty以及普通的java應用。

 

3.兩階段提交


所有關於分佈式事務的介紹中都必然會講到兩階段提交,因爲它是實現XA分佈式事務的關鍵(確切地說:兩階段提交主要保證了分佈式事務的原子性:即所有結點要麼全做要麼全不做)。所謂的兩個階段是指:第一階段:準備階段和第二階段:提交階段。

 

圖2.兩階段提交示意圖(摘自info發佈的《java事務設計策略》一文)



1.準備階段:事務協調者(事務管理器)給每個參與者(資源管理器)發送Prepare消息,每個參與者要麼直接返回失敗(如權限驗證失敗),要麼在本地執行事務,寫本地的redo和undo日誌,但不提交,到達一種“萬事俱備,只欠東風”的狀態。(關於每一個參與者在準備階段具體做了什麼目前我還沒有參考到確切的資料,但是有一點非常確定:參與者在準備階段完成了幾乎所有正式提交的動作,有的材料上說是進行了“試探性的提交”,只保留了最後一步耗時非常短暫的正式提交操作給第二階段執行。)

2.提交階段:如果協調者收到了參與者的失敗消息或者超時,直接給每個參與者發送回滾(Rollback)消息;否則,發送提交(Commit)消息;參與者根據協調者的指令執行提交或者回滾操作,釋放所有事務處理過程中使用的鎖資源。(注意:必須在最後階段釋放鎖資源)

將提交分成兩階段進行的目的很明確,就是儘可能晚地提交事務,讓事務在提交前儘可能地完成所有能完成的工作,這樣,最後的提交階段將是一個耗時極短的微小操作,這種操作在一個分佈式系統中失敗的概率是非常小的,也就是所謂的“網絡通訊危險期”非常的短暫,這是兩階段提交確保分佈式事務原子性的關鍵所在。(唯一理論上兩階段提交出現問題的情況是當協調者發出提交指令後當機並出現磁盤故障等永久性錯誤,導致事務不可追蹤和恢復)

從兩階段提交的工作方式來看,很顯然,在提交事務的過程中需要在多個節點之間進行協調,而各節點對鎖資源的釋放必須等到事務最終提交時,這樣,比起一階段提交,兩階段提交在執行同樣的事務時會消耗更多時間。事務執行時間的延長意味着鎖資源發生衝突的概率增加,當事務的併發量達到一定數量的時候,就會出現大量事務積壓甚至出現死鎖,系統性能就會嚴重下滑。這就是使用XA事務

4.一階段提交(Best Efforts 1PC模式)

不像兩階段提交那樣複雜,一階段提交非常直白,就是從應用程序向數據庫發出提交請求到數據庫完成提交或回滾之後將結果返回給應用程序的過程。一階段提交不需要“協調者”角色,各結點之間不存在協調操作,因此其事務執行時間比兩階段提交要短,但是提交的“危險期”是每一個事務的實際提交時間,相比於兩階段提交,一階段提交出現在“不一致”的概率就變大了。但是我們必須注意到:只有當基礎設施出現問題的時候(如網絡中斷,當機等),一階段提交纔可能會出現“不一致”的情況,相比它的性能優勢,很多團隊都會選擇這一方案。關於在spring環境下如何實現一階段提交,有一篇非常優秀的文章值得參考:http://www.javaworld.com/javaworld/jw-01-2009/jw-01-spring-transactions.html?page=5

5.事務補償機制


像best efforts 1PC這種模式,前提是應用程序能獲取所有的數據源,然後使用同一個事務管理器(這裏指是的spring的事務管理器)管理事務。這種模式最典型的應用場景非數據庫sharding莫屬。但是對於那些基於web service/rpc/jms等構建的高度自治(autonomy)的分佈式系統接口,best efforts 1PC模式是無能爲力的,此類場景下,還有最後一種方法可以幫助我們實現“最終一致性”,那就是事務補償機制。關於事務補償機制是一個大話題,本文只簡單提及,以後會作專門的研究和介紹。

 

6.在基於兩階段提交的標準分佈式事務和Best Efforts 1PC兩者之間如何選擇

一般而言,需要交互的子系統數量較少,並且整個系統在未來不會或很少引入新的子系統且負載長期保持穩定,即無伸縮要求的話,考慮到開發複雜度和工作量,可以選擇使用分佈式事務。對於時間需求不是很緊,對性能要求很高的系統,應考慮使用Best Efforts 1PC或事務補償機制。對於那些需要進行sharding改造的系統,基本上不應再考慮分佈式事務,因爲sharding打開了數據庫水平伸縮的窗口,使用分佈式事務看起來好像是爲新打開的窗口又加上了一把枷鎖。

補充:關於網絡通訊的危險期

由於網絡通訊故障隨時可能發生,任何發出請求後等待迴應的程序都會有失去聯繫的危險。這種危險發生在發出請求之後,服務器返回應答之前,如果在這個期間網 絡通訊發生故障,發出請求一方無法收到迴應,於是無法判斷服務器是否已經成功地處理請求,因爲收不到迴應可能是請求沒有成功地發送到服務器,也可能是服務 器處理完成後的迴應無法傳回請求方。這段時間稱爲網絡通訊的危險期(In-doubt Time)。很顯然,網絡通訊的危險期是分佈式系統除單點可靠性之外需要考慮的另一個可靠性問題。

參考資料:

1.百度百科
2.http://en.wikipedia.org/wiki/Java_Transaction_API
3.http://www.nosqlnotes.net/archives/62#more-62
4.http://hi.baidu.com/javaopensource/blog/item/0a2b764ec501b10cb3de05ba.html

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章