併發中的volatile 原 薦

1. 概述

由於線程有本地內存的存在, 一個線程修改的共享變量不會及時的刷新到主內存中, 使得另一個線程讀取共享變量時讀取到的仍舊是舊值, 就導致了內存可見性問題. 現在volatile就可以解決這個問題, 爲什麼能解決內存可見性問題呢? 本文就來揭開volatile的神祕面紗.

2. volatile的特性

理解volatile特性的一個好方法就是把對volatile單個變量的讀/寫, 看成是使用同一個鎖對單個變量的讀/寫做了同步.

鎖的happens-before規則保證釋放鎖和獲取鎖的兩個線程之間的內存可見性, 這意味着對一個volatile變量的讀, 總是能看到(任意線程)對這個volatile變量最後的寫入.

鎖的語義決定了臨界區代碼的執行具有原子性. 這意味着, 即使是64位的long型和double型變量, 只要它是volatile變量, 對該變量的讀/寫就具有原子性. 如果是多個volatile操作或類似於volatile++這種複合操作, 這些操作整體上不具有原子性.

簡言之, volatile變量自身具有以下特性.

  • 可見性: 對一個volatile變量的讀, 總是能看到任意線程對這個volatile變量最後的寫入.
  • 原子性: 對任意單個volatile變量的讀/寫具有原子性, volatile變量的複合操作不具有原子性.

3. volatile寫-讀的內存語義

volatile寫的內存語義

當寫一個volatile變量時, JMM會把該線程對應的本地內存中的共享變量值刷新到主內存中.

volatile讀的內存語義

當讀一個volatile變量時, JMM會把線程對應的本地內存中的共享變量值置爲無效, 線程接下來將從主內存中讀取共享變量.

volatile內存語義總結

  • 線程A寫一個volatile變量, 實質上是線程A向接下來將要讀這個volatile變量的某個線程發出了(其對共享變量所做修改的)消息.
  • 線程B讀一個volatile變量, 實質上是線程B接收了之前某個線程發出的(在寫這個volatile變量之前對共享變量所做修改的)消息.
  • 線程A寫一個volatile變量, 隨後線程B讀這個volatile變量, 這個過程實質上是線程A通過主內存向線程B發送消息.

4. volatile內存語義的實現

前面提到過重排序分爲編譯器重排序和處理器重排序. 爲了實現volatile語義, JMM會分別限制這兩種類型的重排序類型.

JMM針對編譯器制定的volatile重排序規則表

從圖中可以看出:

  • 當第二個操作是volatile寫時, 不管第一個操作是什麼, 都不能重排序. 這個規則確保volatile寫之前的操作不會被編譯器重排序到volatile寫之後.
  • 當第一個操作是volatile讀時, 不管第二個操作是什麼, 都不能重排序. 這個規則確保volatile讀之後的操作不會被編譯器重排序到volatile讀之前.
  • 當第一個操作是volatile寫, 第二個操作是volatile讀時, 不能重排序.

爲了實現volatile的內存語義, 編譯器在生成字節碼時, 會在指令序列中插入內存屏障來禁止特定類型的處理器重排序. 對於編譯器來說, 發現一個最優佈置來最小化插入屏障的總數幾乎不可能. 爲此, JMM採取保守策略. 下面是基於保守策略的JMM內存屏障插入策略.

  • 在每個volatile寫操作的前面插入一個StoreStore屏障.
  • 在每個volatile寫操作的後面插入一個StoreLoad屏障.
  • 在每個volatile讀操作的後面插入一個LoadLoad屏障.
  • 在每個volatile讀操作的後面插入一個LoadStore屏障.

上述內存屏障插入策略非常保守, 但它可以保證在任意處理器平臺, 任意的程序中都能得到正確的volatile內存語義.

在實際執行時, 只要不改變volatile寫-讀的內存語義, 編譯器可以根據具體情況省略不必要的屏障. 舉個例子.

有如下代碼:

public class Demo {
    int a;
    volatile int v1 = 1;
    volatile int v2 = 2;
    void readAndWrite() {
      int i = v1; // 第一個volatile讀
      int j = v2; // 第二個volatile讀
      a = i + j; // 普通寫
      v1 = i + 1; // 第一個volatile寫
      v2 = j * 2; // 第二個 volatile寫
    }
}

針對readAndWrite()方法, 理論上生成字節碼時會如下:

int i = v1; // volatile讀後面插入LoadLoad和LoadStore屏障
LoadLoad; // 確保v1的裝載先於後續裝載指令
LoadStore; // 確保v1的加載先於後續存儲指令

int j = v2; // volatile讀後面插入LoadLoad和LoadStore屏障
LoadLoad; // 確保v2的裝載先於後續裝載指令
LoadStore; // 確保v2的加載先於後續存儲指令

a = i + j; // 普通讀寫無屏障

StoreStore; // 確保之前的存儲指令要先於v1的存儲
v1 = i + 1; // volatile寫前加StoreStore屏障, 後加StoreLoad屏障
StoreLoad; // 確保v1的存儲要先於後續的裝載指令

StoreStore;  // 確保之前的存儲指令要先於v1的存儲
v2 = j + 1; // volatile寫前加StoreStore屏障, 後加StoreLoad屏障
StoreLoad; // 確保v1的存儲要先於後續的裝載指令

由於不同的處理器有不同的"鬆緊度"的處理器內存模型, 內存屏障的插入還可以根據具體的處理器內存模型繼續優化, 以X86處理器爲例, 處理最後的StoreLoad屏障外, 其它的屏障都會被省略. X86處理器僅會對寫-讀操作做重排序, 不會對讀-讀, 讀-寫和寫-寫操作做重排序. 因此X86處理器會省略掉這3中操作類型對應的內存屏障. 所以在X86處理器中, JMM僅需在volatile寫後面插入一個StoreLoad屏障即可實現volatile寫-讀的內存語義.歡迎工作一到五年的Java工程師朋友們加入Java架構交流圈:874811168 圈內提供免費的Java架構學習資料(裏面有高可用、高併發、高性能及分佈式、Jvm性能調優、Spring源碼,MyBatis,Netty,Redis,Kafka,Mysql,Zookeeper,Tomcat,Docker,Dubbo,Nginx等多個知識點的架構資料)合理利用自己每一分每一秒的時間來學習提升自己,不要再用"沒有時間“來掩飾自己思想上的懶惰!趁年輕,使勁拼,給未來的自己一個交代!

下面是X86處理器優化之後的內存屏障

int i = v1; // volatile讀後面插入LoadLoad和LoadStore屏障
// LoadLoad; // 確保v1的裝載先於後續裝載指令
// LoadStore; // 確保v1的加載先於後續存儲指令

int j = v2; // volatile讀後面插入LoadLoad和LoadStore屏障
// LoadLoad; // 確保v2的裝載先於後續裝載指令
// LoadStore; // 確保v2的加載先於後續存儲指令

a = i + j; // 普通讀寫無屏障

// StoreStore; // 確保之前的存儲指令要先於v1的存儲
v1 = i + 1; // volatile寫前加StoreStore屏障, 後加StoreLoad屏障
StoreLoad; // 確保v1的存儲要先於後續的裝載指令

// StoreStore;  // 確保之前的存儲指令要先於v1的存儲
v2 = j + 1; // volatile寫前加StoreStore屏障, 後加StoreLoad屏障
StoreLoad; // 確保v1的存儲要先於後續的裝載指令

5. JSR-133爲什麼要增強volatile的內存語義

JSR-133也就是在JDK1.5中加入的.

在JSR-133之前的舊Java內存模型中, 雖然不允許volatile變量之間重排序, 但舊的Java內存模型允許volatile變量與普通變量重排序.

在舊的內存模型中, 當1和2之間沒有數據依賴關係時, 1和2之間就可能被重排序(3和4類似). 其結果就是: 讀線程B執行4時, 不一定能看到寫線程A在執行1時對共享變量的修改.

因此, 在舊的內存模型中, volatile的寫-讀沒有鎖的釋放-獲所具有的內存語義. 爲了提供一種比鎖更輕量級的線程之間通信的機制, JSR-133專家組決定增強volatile的內存語義: 嚴格限制編譯器和處理器對volatile變量與普通變量的重排序, 確保volatile的寫-讀和鎖的釋放-獲取具有相同的內存語義. 從編譯器重排序規則和處理器內存屏障插入策略來看, 只要volatile變量與普通變量之間的重排序可能會破壞volatile的內存語義, 這種重排序就會被編譯器重排序規則和處理器內存屏障插入策略禁止.

6. 總結

volatile能保證內存可見性正是通過內存屏障來實現的, 並且不同的編譯器對內存屏障的支持不同, 但是由於大多數處理器都使用了寫緩衝區, 所以大多數處理器都支持StoreLoad屏障.

-------------------------------------------
不要因爲知識簡單就忽略, 不積跬步無以至千里.

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章