[Java多線程 四]---線程安全與鎖優化

轉載自:
http://blog.csdn.net/sinat_33087001/article/details/73607625

面向對象與面向過程

  • 程序員把數據和過程分別作爲獨立的部分來考慮數據代表問題空間中的客體,程序代碼則用於處理這些數據,這種思維方式直接站在計算機的角度去抽象問題和解決問題,稱爲面向過程的編程思想

  • 面向對象的編程思想是站在現實世界的角度去抽象和解決問題,它把數據和行爲都看做是對象的一部分

線程安全概述

定義

當多個線程訪問一個對象時,如果不考慮這些線程在執行時環境下的調度和交替執行,也不需要進行額外的同步,或者在調用方進行任何其他的協調操作,調用這個對象的行爲都可以獲得正確的結果,那麼這個對象是線程安全的。

java中的線程安全

我們這裏討論的線程安全,就限定於多個線程之間存在共享數據訪問這個前提,因爲如果一段代碼根本不會與其他線程共享數據,那麼從線程安全的角度來看,程序是串行執行還是多線程執行對它來說是完全沒有區別的。

我們可以將Java語言中各種操作共享的數據分爲以下5類:不可變、絕對線程安全、相對線程安全、線程兼容和線程對立

不可變

在Java語言中不可變的對象一定是線程安全的,無論是對象的方法實現還是方的調用者,都不需要再採用任何的線程安全保障措施。如final關鍵字,只要一個不可變對象被正確構建出來(沒有發生this引用逃逸,即對象還未構造完成this引用就被髮布出去了),那其外部的可見狀態永遠不會發生改變,永遠不會看到它在多個線程之中處於不一致的狀態。

例如java.lang.String類的對象,它是一個典型的不可變對象,我們調用它substring()、replace()和concat()這些方法都不會影響它原來的值,只會返回一個新構造的字符串對象

String,枚舉類型,以及java.lang.Number的部分子類,如Long和Double等數值包裝類型,BigInteger和BigDecimal等大數據類型基本都是不可變的API;但同爲Number的子類型的原子類AtomicInteger和AtomicLong則並非不可變的

絕對線程安全

不管運行時環境如何,調用者都不需要任何額外的同步措施。

如java.util.Vector是一個線程安全的容器,它的get,add,size等方法都是被synchronized修飾的,效率很低 ,但確實是安全的。但並不意味着調用時永遠不需要同步手段,如多線程中一個線程在錯誤的時間裏對元素進行了刪除,就會導致邊界異常。此時對刪除需要進入同步塊處理。

相對線程安全

相對的線程安全就是我們通常意義上所講的線程安全

要保證對這個對象單獨的操作是線程安全的,調用時不需要做額外的保障措施,但對一些特定的順序的連續調用,就可能需要在調用端使用額外的同步手段來保證調用的正確性

Java中大部分都屬於這類,如Vector,HashTable,Collections的synchronizedCollection()方法包裝的集合等。

線程兼容

線程兼容是指對象本身並不是線程安全的,但是可以通過在調用端正確地使用同步手段來保證對象在併發環境中可以安全地使用,我們平常說一個類不是線程安全的,絕大多數時候指的是這一種情況。Java API中大部分的類都是屬於線程兼容的,如與前面的Vector和HashTable相對應的集合類ArrayList和HashMap等

線程對立

線程對立是指無論調用端是否採取了同步措施,都無法在多線程環境中併發使用的代
碼。由於Java語言天生就具備多線程特性,線程對立這種排斥多線程的代碼是很少出現的,而且通常都是有害的,應當儘量避免。

個線程對立的例子是Thread類的suspend()和resume()方法如果有兩個線程同時持有一個線程對象,一個嘗試去中斷線程,另一個嘗試去恢復線程,如果併發進行的話,無論調用時是否進行了同步,目標線程都是存在死鎖風險的,如suspend()中斷的線程就是即將要執行resume()的那個線程,那就肯定要產生死鎖了。也正是由於這個原因,suspend()和resume()方法已經被JDK聲明廢棄(@Deprecated)了。常見的線程對立的操作還有System.setIn()、Sytem.setOut()和System.runFinalizersOnExit()等。

線程安全的實現方法

  • 實現線程安全與代碼編寫有很大的關係
  • 虛擬機提供的同步和鎖機制也起到了非常重要的作用

互斥同步

定義

互斥同步是常見的一種併發正確性保障手段。同步是指在多線程併發訪問共享數據時,保證共享數據在同一時刻只能被一個線程使用。而互斥是實現同步的一種手段,臨界區、互斥量和信號量都是主要的互斥實現方式。互斥是因,同步是果;互斥是方法,同步是目的。

實現手段

synchronized關鍵字

synchronized關鍵字經過編譯之後,會在同步塊的前後分別形成monitorenter和monitorexit這兩個字節碼指令,這兩個字節碼都需要一個reference類型的參數來指明要鎖定和解鎖的對象。如果Java程序中的synchronized明確指定了對象參數,那就是這個對象的reference;如果沒有明確指定,那就根據synchronized修飾的是實例方法還是類方法,去取對應的對象實例或Class對象來作爲鎖對象

優點

在虛擬機規範對monitorenter和monitorexit的行爲描述中,有兩點是需要特別注意的。

  • 首先,synchronized同步塊對同一條線程來說是可重入的,不會出現自己把自己鎖死的問題。 ps:可重入:一個線程獲取到鎖之後可以無限次地進入該臨界區 (通過調用lock.lock())。當然同樣也需要等同次數的unlock操作
  • 其次,同步塊在已進入的線程執行完之前,會阻塞後面其他線程的進入

缺點

Java的線程是映射到操作系統的原生線程之上的,如果要阻塞或喚醒一個線程,都需要操作系統來幫忙完成,這就需要從用戶態轉換到核心態中,因此狀態轉換需要耗費很多的處理器時間。所以synchronized是Java語言中一個重量級的操作

優化

在通知操作系統阻塞線程之前加入一段自旋等待過程,避免頻繁地切入到核心態之中

重入鎖(ReentrantLock)

除了synchronized之外,我們還可以使用java.util.concurrent(下文稱J.U.C)包中的重入鎖(ReentrantLock)來實現同步

ReentrantLock與synchronized很相似,他們都具備一樣的線程重入特性,只是代碼寫法上有點區別,一個表現爲API層面的互斥鎖(lock()和unlock()方法配合try/finally語句塊來完成),另一個表現爲原生語法層面的互斥鎖。不過,相比synchronized,ReentrantLock增加了一些高級功能,主要有以下3項:等待可中斷、可實現公平鎖,以及鎖可以綁定多個條件

等待可中斷

等待可中斷是指**當持有鎖的線程長期不釋放鎖的時候,正在等待的線程可以選擇放棄等
待,改爲處理其他事情**,可中斷特性對處理執行時間非常長的同步塊很有幫助。

可實現公平鎖

公平鎖是指多個線程在等待同一個鎖時,必須按照申請鎖的時間順序來依次獲得鎖;而非公平鎖則不保證這一點,在鎖被釋放時,任何一個等待鎖的線程都有機會獲得鎖。synchronized中的鎖是非公平的,ReentrantLock默認情況下也是非公平的,但可以通過帶布爾值的構造函數要求使用公平鎖。

鎖可以綁定多個條件

鎖綁定多個條件是指一個ReentrantLock對象可以同時綁定多個Condition對象,而在synchronized中,鎖對象的wait()和notify()或notifyAll()方法可以實現一個隱含的條件,如果要和多於一個的條件關聯的時候,就不得不額外地添加一個鎖,而ReentrantLock則無須這樣做,只需要多次調用newCondition()方法即可。

TML

非阻塞同步

互斥同步最主要的問題就是進行線程阻塞和喚醒所帶來的性能問題,因此這種同步也稱爲阻塞同步。從處理問題的方式上說,互斥同步屬於一種悲觀的併發策略,總是認爲只要不去做正確的同步措施(例如加鎖),那就肯定會出現問題,無論共享數據是否真的會出現競爭,它都要進行加鎖(這裏討論的是概念模型,實際上虛擬機會優化掉很大一部分不必要的加鎖)、用戶態核心態轉換維護鎖計數器和檢查是否有被阻塞的線程需要喚醒等操作。

定義

我們有了另外一個選擇:基於衝突檢測的樂觀併發策略,通俗地說,就是先進行操作,如果沒有其他線程爭用共享數據,那操作就成功了;如果共享數據有爭用,產生了衝突,那就再採取其他的補償措施(最常見的補償措施就是不斷地重試,直到成功爲止),這種樂觀的併發策略的許多實現都不需要把線程掛起,因此這種同步操作稱爲非阻塞同步(Non-Blocking Synchronization)

樂觀併發策略需要“硬件指令集的發展”才能進行。因爲需要操作和衝突檢測這兩個步驟具備原子性,只能靠硬件來保證,硬件保證一個從語義上看來需要多次操作的行爲只通過一條處理器指令就能完成,這類指令常用的有:

  • 測試並設置(Test-and-Set)。
  • 獲取並增加(Fetch-and-Increment)。
  • 交換(Swap)。
  • 比較並交換(Compare-and-Swap,下文稱CAS)。
  • 加載鏈接/條件存儲(Load-Linked/Store-Conditional,下文稱LL/SC)。

CAS指令

定義

CAS指令需要有3個操作數,分別是內存位置(在Java中可以簡單理解爲變量的內存地址,用V表示)、舊的預期值(用A表示)和新值(用B表示)。CAS指令執行時,當且僅當V符合舊預期值A時,處理器用新值B更新V的值,否則它就不執行更新,但是無論是否更新了V的值,都會返回V的舊值,上述的處理過程是一個原子操作

ABA問題

這種操作無法涵蓋互斥同步的所有使用場景,漏洞在於:如果一個V初次讀取的時候是A,且在準備賦值的時候還是A,我們能說它的值沒有被其他線程改變過麼?如果在這期間曾改爲B,又改回A,那CAS就會誤認爲它從來沒有被改變過。這個漏洞就是CAS操作的ABA問題。

優化方案

J.U.C包提供一個帶有標記的原子引用類AtomicStanmpedReference,可以通過控制變量值的版本來保證CAS的正確性。但大部分情況下,ABA問題都不會影響程序的併發性,需要解決的話,改用傳統的互斥同步可能會比原子類更高效。

TML

無同步方案

要保證線程安全,並不是一定就要進行同步,兩者沒有因果關係。同步只是保證共享數據爭用時的正確性的手段,如果一個方法本來就不涉及共享數據,那它自然就無須任何同步措施去保證正確性,因此會有一些代碼天生就是線程安全的。下面是兩種無同步方案。

可重入代碼(Reentrant Code)

定義

這種代碼也叫做純代碼(Pure Code),可以在代碼執行的任何時刻中斷它,轉而去執行另外一段代碼(包括遞歸調用它本身),而在控制權返回後,原來的程序不會出現任何錯誤。相對線程安全來說,可重入性是更基本的特性,它可以保證線程安全,即所有的可重入的代碼都是線程安全的,但是並非所有的線程安全的代碼都是可重入的

基本特性

可重入代碼有一些共同的特徵

  • 不依賴存儲在堆上的數據和公用的系統資源
  • 用到的狀態量都由參數中傳入
  • 不調用非可重入的方法等

我們可以通過一個簡單的原則來判斷代碼是否具備可重入性:如果一個方法,它的返回結果是可以預測的,只要輸入了相同的數據,就都能返回相同的結果,那它就滿足可重入性的要求,當然也就是線程安全的。

線程本地存儲(Thread Local Storage)

如果一段代碼中所需要的數據必須與其他代碼共享,那就看看這些共享數據的代碼是否能保證在同一個線程中執行?如果能保證,我們就可以把共享數據的可見範圍限制在同一個線程之內,這樣,無須同步也能保證線程之間不出現數據爭用的問題。

可以通過java.lang.ThreadLocal類來實現線程本地存儲的功能。每一個線程的Thread對象中都有一個ThreadLocalMap對象,這個對象存儲了一組以ThreadLocal.threadLocalHashCode爲鍵,以本地線程變量爲值的K-V值對,ThreadLocal對象就是當前線程的ThreadLocalMap的訪問入口,每一個ThreadLocal對象都包含了一個獨一無二的threadLocalHashCode值,使用這個值就可以在線程K-V值對中找回對應的本地線程變量。

鎖優化

高效併發是從JDK 1.5到JDK 1.6的一個重要改進,HotSpot虛擬機開發團隊在這個版本上花費了大量的精力去實現各種鎖優化技術,如適應性自旋(Adaptive Spinning)、鎖消除(Lock Elimination)、鎖粗化(Lock Coarsening)、輕量級鎖(Lightweight Locking)和偏向鎖(Biased Locking)

自旋鎖與自適應自旋

如果物理機器有一個以上的處理器,能讓兩個或以上的線程同時並行執行,我們就可以讓後面請求鎖的那個線程“稍等一下”,但不放棄處理器的執行時間,看看持有鎖的線程是否很快就會釋放鎖。爲了讓線程等待,我們只需讓線程執行一個忙循環(自旋),這項技術就是所謂的自旋鎖。

優點

自旋等待本身可以避免線程切換的開銷

缺點

自旋等待不能代替阻塞,且先不說對處理器數量的要求,自旋等待本身雖然避免了線程切換的開銷,但它是要佔用處理器時間

應用場景

如果鎖被佔用的時間很短,自旋等待的效果就會非常好,反之,如果鎖被佔用的時間很長,那麼自旋的線程只會白白消耗處理器資源,而不會做任何有用的工作,反而會帶來性能上的浪費。

如果自旋超過了限定的次數仍然沒有成功獲得鎖,就應當使用傳統的方式去掛起線程了。自旋次數的默認值是10次

優化—自適應自旋

在JDK 1.6中引入了自適應的自旋鎖。自適應意味着自旋的時間不再固定了,而是由前
一次在同一個鎖上的自旋時間及鎖的擁有者的狀態來決定。

  • 如果在同一個鎖對象上,自旋等待剛剛成功獲得過鎖,並且持有鎖的線程正在運行中,那麼虛擬機就會認爲這次自旋也很有可能再次成功,進而它將允許自旋等待持續相對更長時間,比如100個循環。

  • 如果對於某個鎖,自旋很少成功獲得過,那在以後要獲取這個鎖時將可能省略掉自旋過程,以避免浪費處理器資源

鎖消除

鎖消除是指虛擬機即時編譯器在運行時,對一些代碼上要求同步,但是被檢測到不可能存在共享數據競爭的鎖進行消除

鎖消除的主要判定依據來源於逃逸分析的數據支持(第11章已經講解過逃逸分析技術),如果判斷在一段代碼中,堆上的所有數據都不會逃逸出去從而被其他線程訪問到,那就可以把它們當做棧上數據對待,認爲它們是線程私有的,同步加鎖自然就無須進行。

這裏寫圖片描述

每個StringBuffer.append()方法中都有一個同步塊,鎖就是sb對象。虛擬機觀察變量sb,很快就會發現它的動態作用域被限制在concatString()方法內部。也就是說,sb的所有引用永遠不會“逃逸”到concatString()方法之外,其他線程無法訪問到它因此,雖然這裏有鎖,但是可以被安全地消除掉,在即時編譯之後,這段代碼就會忽略掉所有的同步而直接執行了。

鎖粗化

原則上,我們在編寫代碼的時候,總是推薦將同步塊的作用範圍限制得儘量小——只在共享數據的實際作用域中才進行同步,這樣是爲了使得需要同步的操作數量儘可能變小,如果存在鎖競爭,那等待鎖的線程也能儘快拿到鎖。

大部分情況下,上面的原則都是正確的,但是如果一系列的連續操作都對同一個對象反覆加鎖和解鎖,甚至加鎖操作是出現在循環體中的,那即使沒有線程競爭,頻繁地進行互斥同步操作也會導致不必要的性能損耗。

這裏寫圖片描述

上述代碼中連續的append()方法就屬於這類情況。如果虛擬機探測到有這樣一串零碎的操作都對同一個對象加鎖,將會把加鎖同步的範圍擴展(粗化)到整個操作序列的外部,上述代碼中,擴展到第一個append()操作之前直至最後一個append()操作之後,這樣只需要加鎖一次就可以了。

輕量級鎖

定義:輕量級鎖是在無競爭的情況下使用CAS操作去消除同步使用的互斥量

首先需要強調一點的是,輕量級鎖並不是用來代替重量級鎖的,它的本意是在沒有多線程競爭的前提下,減少傳統的重量級鎖使用操作系統互斥量產生的性能消耗。

這裏寫圖片描述

加鎖

代碼進入同步塊的時候,如果此同步對象沒有被鎖定(鎖標誌位爲“01”狀態),虛擬機首先將在當前線程的棧幀中建立一個名爲鎖記錄(Lock Record)的空間,用於存儲鎖對象目前的MarkWord的拷貝(官方把這份拷貝加了一個Displaced前綴,即Displaced Mark Word),這時候線程堆棧與對象頭的狀態如圖所示

這裏寫圖片描述

然後,虛擬機將使用CAS操作嘗試將對象的Mark Word更新爲指向Lock Record的指針。如果這個更新動作成功了,那麼這個線程就擁有了該對象的鎖,並且對象Mark Word的鎖標誌位(Mark Word的最後2bit)將轉變爲“00”,即表示此對象處於輕量級鎖定狀態,這時候線程堆棧與對象頭的狀態如圖所示

這裏寫圖片描述

如果這個更新操作失敗了,虛擬機首先會檢查對象的Mark Word是否指向當前線程的棧幀,如果是說明當前線程已經擁有了這個對象的鎖,那就可以直接進入同步塊繼續執行,否則說明這個鎖對象已經被其他線程搶佔了。

如果有兩條以上的線程爭用同一個鎖,那輕量級鎖就不再有效,要膨脹爲重量級鎖,鎖標誌的狀態值變爲“10”,Mark Word中存儲的就是指向重量級鎖(互斥量)的指針,後面等待鎖的線程也要進入阻塞狀態。

解鎖

它的解鎖過程也是通過CAS操作來進行的,如果對象的Mark Word仍然指向着線程的鎖記錄,那就用CAS操作把對象當前的Mark Word和線程中複製的Displaced Mark Word替換回來,如果替換成功,整個同步過程就完成了。如果替換失敗,說明有其他線程嘗試過獲取該鎖,那就要在釋放鎖的同時,喚醒被掛起的線程。

偏向鎖

它的目的是消除數據在無競爭情況下的同步原語,進一步提高程序的運行性能。如果說輕量級鎖是在無競爭的情況下使用CAS操作去消除同步使用的互斥量,那偏向鎖就是在無競爭的情況下把整個同步都消除掉,連CAS操作都不做了。

這個鎖會偏向於第一個獲得它的線程,如果在接下來的執行過程中,該鎖沒有被其他的線程獲取,則持有偏向鎖的線程將永遠不需要再進行同步。

工作原理

當鎖對象第一次被線程獲取的時候,虛擬機將會把對象頭中的標誌位設爲“01”,即偏向模式。同時使用CAS操作把獲取到這個鎖的線程的ID記錄在對象的Mark Word之中,如果CAS操作成功,持有偏向鎖的線程以後每次進入這個鎖相關的同步塊時,虛擬機都可以不再進行任何同步操作(例如Locking、Unlocking及對Mark Word的Update等)。

當有另外一個線程去嘗試獲取這個鎖時,偏向模式就宣告結束。根據鎖對象目前是否處於被鎖定的狀態,撤銷偏向(Revoke Bias)後恢復到未鎖定(標誌位爲“01”)或輕量級鎖定(標誌位爲“00”)的狀態

這裏寫圖片描述

應用場景

偏向鎖可以提高帶有同步但無競爭的程序性能。它同樣是一個帶有效益權衡(TradeOff)性質的優化,也就是說,它並不一定總是對程序運行有利,如果程序中大多數的鎖總是被多個不同的線程訪問,那偏向模式就是多餘的

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章