70%的Java程序員不知道爲啥 ConcurrentHashMap 讀操作不需要加鎖？

作者：上帝愛吃蘋果

ConcurrentHashMap的簡介

1.get操作源碼

2.volatile登場

3.是加在數組上的volatile嗎?

4.用volatile修飾的Node

5.總結

我們知道，ConcurrentHashmap(1.8)這個併發集合框架是線程安全的，當你看到源碼的get操作時，會發現get操作全程是沒有加任何鎖的，這也是這篇博文討論的問題——爲什麼它不需要加鎖呢？

ConcurrentHashMap的簡介

我想有基礎的同學知道在jdk1.7中是採用Segment + HashEntry + ReentrantLock的方式進行實現的，而1.8中放棄了Segment臃腫的設計，取而代之的是採用Node + CAS + Synchronized來保證併發安全進行實現。

JDK1.8的實現降低鎖的粒度，JDK1.7版本鎖的粒度是基於Segment的，包含多個HashEntry，而JDK1.8鎖的粒度就是HashEntry（首節點）

JDK1.8版本的數據結構變得更加簡單，使得操作也更加清晰流暢，因爲已經使用synchronized來進行同步，所以不需要分段鎖的概念，也就不需要Segment這種數據結構了，由於粒度的降低，實現的複雜度也增加了

JDK1.8使用紅黑樹來優化鏈表，基於長度很長的鏈表的遍歷是一個很漫長的過程，而紅黑樹的遍歷效率是很快的，代替一定閾值的鏈表，這樣形成一個最佳拍檔

get操作源碼

首先計算hash值，定位到該table索引位置，如果是首節點符合就返回

如果遇到擴容的時候，會調用標誌正在擴容節點ForwardingNode的find方法，查找該節點，匹配就返回

以上都不符合的話，就往下遍歷節點，匹配就返回，否則最後就返回null

//會發現源碼中沒有一處加了鎖

public V get(Object key) {

Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;

int h = spread(key.hashCode()); //計算hash

if ((tab = table) != null && (n = tab.length) > 0 &&

(e = tabAt(tab, (n - 1) & h)) != null) {//讀取首節點的Node元素

if ((eh = e.hash) == h) { //如果該節點就是首節點就返回

if ((ek = e.key) == key || (ek != null && key.equals(ek)))

return e.val;

}

//hash值爲負值表示正在擴容，這個時候查的是ForwardingNode的find方法來定位到nextTable來

//eh=-1，說明該節點是一個ForwardingNode，正在遷移，此時調用ForwardingNode的find方法去nextTable裏找。

//eh=-2，說明該節點是一個TreeBin，此時調用TreeBin的find方法遍歷紅黑樹，由於紅黑樹有可能正在旋轉變色，所以find裏會有讀寫鎖。

//eh>=0，說明該節點下掛的是一個鏈表，直接遍歷該鏈表即可。

else if (eh < 0)

return (p = e.find(h, key)) != null ? p.val : null;

while ((e = e.next) != null) {//既不是首節點也不是ForwardingNode，那就往下遍歷

if (e.hash == h &&

((ek = e.key) == key || (ek != null && key.equals(ek))))

return e.val;

}

return null;

}

get沒有加鎖的話，ConcurrentHashMap是如何保證讀到的數據不是髒數據的呢？

volatile登場

對於可見性，Java提供了volatile關鍵字來保證可見性、有序性。但不保證原子性。

普通的共享變量不能保證可見性，因爲普通共享變量被修改之後，什麼時候被寫入主存是不確定的，當其他線程去讀取時，此時內存中可能還是原來的舊值，因此無法保證可見性。

volatile關鍵字對於基本類型的修改可以在隨後對多個線程的讀保持一致，但是對於引用類型如數組，實體bean，僅僅保證引用的可見性，但並不保證引用內容的可見性。。

禁止進行指令重排序。

背景：爲了提高處理速度，處理器不直接和內存進行通信，而是先將系統內存的數據讀到內部緩存（L1，L2或其他）後再進行操作，但操作完不知道何時會寫到內存。

如果對聲明瞭volatile的變量進行寫操作，JVM就會向處理器發送一條指令，將這個變量所在緩存行的數據寫回到系統內存。但是，就算寫回到內存，如果其他處理器緩存的值還是舊的，再執行計算操作就會有問題。

在多處理器下，爲了保證各個處理器的緩存是一致的，就會實現緩存一致性協議，當某個CPU在寫數據時，如果發現操作的變量是共享變量，則會通知其他CPU告知該變量的緩存行是無效的，因此其他CPU在讀取該變量時，發現其無效會重新從主存中加載數據。

總結下來：

第一：使用volatile關鍵字會強制將修改的值立即寫入主存；

第二：使用volatile關鍵字的話，當線程2進行修改時，會導致線程1的工作內存中緩存變量的緩存行無效（反映到硬件層的話，就是CPU的L1或者L2緩存中對應的緩存行無效）；

第三：由於線程1的工作內存中緩存變量的緩存行無效，所以線程1再次讀取變量的值時會去主存讀取。

是加在數組上的volatile嗎?

我們知道volatile可以修飾數組的，只是意思和它表面上看起來的樣子不同。舉個栗子，volatile int array[10]是指array的地址是volatile的而不是數組元素的值是volatile的.

用volatile修飾的Node

get操作可以無鎖是由於Node的元素val和指針next是用volatile修飾的，在多線程環境下線程A修改結點的val或者新增節點的時候是對線程B可見的。

既然volatile修飾數組對get操作沒有效果那加在數組上的volatile的目的是什麼呢？

其實就是爲了使得Node數組在擴容的時候對其他線程具有可見性而加的volatile

總結

在1.8中ConcurrentHashMap的get操作全程不需要加鎖，這也是它比其他併發集合比如hashtable、用Collections.synchronizedMap()包裝的hashmap;安全效率高的原因之一。

get操作全程不需要加鎖是因爲Node的成員val是用volatile修飾的和數組用volatile修飾沒有關係。

數組用volatile修飾主要是保證在數組擴容的時候保證可見性。

歡迎大家一起交流，喜歡文章記得關注我點個喜歡喲，感謝支持！

70%的Java程序員不知道爲啥 ConcurrentHashMap 讀操作不需要加鎖？

一篇文章看清楚JDK13的特性！

8種經常被忽視的SQL錯誤用法，你有沒有踩過坑？

搞清楚Spring Cloud架構原理的這4個點，輕鬆應對面試官

11條MySQL規範，你知道的有幾個？

還不懂MySQL索引？這1次徹底搞懂B+樹和B-樹

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結