redis做分佈式鎖可能不那麼簡單


一、爲什麼需要分佈式鎖

        隨着互聯網的興起,現代軟件發生了翻天覆地的變化,以前單機的程序,已經支撐不了現代的業務。無論是在抗壓,還是在高可用等方面都需要多臺計算機協同工作來解決問題。現代的互聯網系統都是分佈式部署的,分佈式部署確實能帶來性能和效率上的提升,但爲此,我們就需要多解決一個分佈式環境下,數據一致性的問題。

        當某個資源在多系統之間共享的時候,爲了保證大家訪問這個資源數據是一致的,那麼就必須要求在同一時刻只能被一個客戶端處理,不能併發的執行,否者就會出現同一時刻有人寫有人讀,大家訪問到的數據就不一致了。

        在分佈式系統的時代,傳統線程之間的鎖機制,就沒作用了,系統會有多份並且部署在不同的機器上,這些資源已經不是在線程之間共享了,而是屬於進程(服務器)之間共享的資源。

        因此,爲了解決這個問題,我們就必須引入「分佈式鎖」。分佈式鎖,是指在分佈式的部署環境下,通過鎖機制來讓多客戶端互斥的對共享資源進行訪問。分佈式鎖的特點如下:

1、互斥性

和我們本地鎖一樣互斥性是最基本,但是分佈式鎖需要保證在不同節點的不同線程的互斥。

2、可重入性

同一個節點上的同一個線程如果獲取了鎖之後那麼也可以再次獲取這個鎖。

3、鎖超時

和本地鎖一樣支持鎖超時,防止死鎖。

4、高效,高可用

加鎖和解鎖需要高效,同時也需要保證高可用防止分佈式鎖失效,可以增加降級。

5、支持阻塞和非阻塞

和 ReentrantLock 一樣支持 lock 和 trylock 以及 tryLock(long timeOut)。

二、基於redis分佈式鎖

        如果你通過網絡搜索分佈式鎖,最多的就是基於redis的了。基於redis的分佈式鎖得益於redis的單線程執行機制,單線程在執行上就保證了指令的順序化,所以很大程度上降低了開發人員的思考設計成本。但是,基於redis做分佈式鎖難道真的這麼容易嗎?

1、原子操作

基於redis的分佈式鎖常用命令是

SETNX key value

        只在鍵 key 不存在的情況下,將鍵 key的值設置爲value 。若鍵key 已經存在, 則SETNX 命令不做任何動作。SETNX 是『SET if Not eXists』(如果不存在,則 SET)的簡寫。代碼示例:

redis> SETNX redislock "redislock"    # redislock 設置成功(integer) 1redis> SETNX redislock "redislock2"   # 嘗試覆蓋 redislock ,失敗(integer) 0redis> GET redislock                   # 沒有被覆蓋"redislock"

        成功獲取到鎖之後,然後設置一個過期時間(這裏避免了客戶端down掉,鎖得不到釋放的問題)

redis> expire redislock 5

成功拿到鎖的客戶端順利進行自己的業務,業務代碼執行完,然後再刪除該key

redis> DEL redislock

        如果一切都想想象的那麼順利,程序員TMD就不用996了。假如客戶端拿到鎖之後,執行設置超時指令之前down掉了(現實總是那麼悲劇),那這個鎖就永遠都釋放不了.也許你會想到用 Redis 事務來解決。但是這裏不行,因爲 expire 是依賴於 setnx 的執行結果的,如果 setnx 沒搶到鎖,expire 是不應該執行的。事務裏沒有 if-else 分支邏輯,事務的特點是一口氣執行,要麼全部執行要麼一個都不執行。公司幾個億的業務又被你耽誤了...

        以上情況的出現是因爲兩個命令並非一個原子性操作,所以在redis 2.8 版本之後出現了新的命令

SETEX key seconds value

所以現在可以利用一條原子性操作的命令來獲取鎖

redis> SETEX redislock 60 redislockOKredis> GET redislock  # 值"redislock"redis> TTL redislock  # 剩餘生存時間(integer) 49

2、超時問題

        在正常的業務當中,當一個線程獲取到鎖並且設置了鎖的過期時間之後,會出現由於業務代碼執行時間過長,鎖由於到達超時時間自動釋放的情況。自動釋放之後,其他的線程就會獲取到分佈式鎖,導致業務代碼不會串行執行。如果業務上允許這樣的情況偶爾發生,那程序員就開幹吧,最後頂多人工干預一下,update 一下數據庫。

        爲了避免這類情況發生,在使用redis分佈式鎖的時候,業務方應儘量避免長時間執行的代碼任務。

        如果設置鎖的超時時間比較長,在一定程度上可以緩解業務代碼執行時間長鎖自動到期的問題,但是一旦業務代碼down掉,其他等待鎖的線程等待的時間會比較長,這種情況下,確保獲取到鎖的程序不會down 成爲了主要問題。

3、獲取鎖失敗

當鎖被一個調用方獲取之後,其他調用方在獲取鎖失敗之後,是繼續輪詢還是直接業務失敗呢?如果是繼續輪詢的話,同步情況下當前線程會一直處於阻塞狀態,所以這裏輪詢的情況還是建議使用異步。

4、可重入性

        可重入性是指已經擁有鎖的客戶端再次請求加鎖,如果鎖支持同一個客戶端重複加鎖,那麼這個鎖就是可重入的。如果基於redis的分佈式鎖要想支持可重入性,需要客戶端封裝,可以使用threadlocal存儲持有鎖的信息。這個封裝過程會增加代碼的複雜度,所以菜菜不推薦這樣做。

5、redis掛了

        如果在多個客戶端獲取鎖的過程中,redis 掛了怎麼辦呢?假如一個客戶端已經獲取到了鎖,這個時候redis掛了(假如是redis集羣),其他的redis服務器會接着提供服務,這個時候其他客戶端可以在新的服務器上獲取到鎖了,這也導致了鎖意義的丟失。有興趣的同學可以去看看RedLock,這種方案以犧牲性能的代價解決了這個問題。

6、時鐘跳躍問題

        在某些時候,redis的服務器時間發生的跳躍,由於鎖的過期時間依賴於服務器時間,所以也會出現兩個客戶端同時獲取到鎖的情況發生。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章