本篇博客主要針對 Java 虛擬機的晚期編譯優化,Java 內存模型與線程,線程安全與鎖優化進行總結,其餘部分總結請點擊 Java 虛擬總結上篇 ,Java 虛擬機總結中篇。
一. 晚期運行期優化
即時編譯器 JIT
即時編譯器 JIT 的作用就是熱點代碼轉換爲平臺相關的機器碼,並進行優化,它並不是一個虛擬機所必須的部分,只能說有它是錦上添花。
熱點代碼
熱點代碼分類
- 被多次調用的方法
- 被多次調用的循環體
熱點探測判定方法
- 基於採樣的熱點探測,虛擬機週期性地檢查棧頂,發現某個方法經常出現在棧頂,那麼這個方法就是熱點方法,簡單高效但不精確
- 基於計數器熱點探測,爲每個方法建立計數器來統計執行次數,超過閾值就是熱點方法,Hotpot 就是採用這種方法。分爲方法計數器(統計方法),回邊計數器(統計循環)
編譯過程(Client Complier)
- 第一階段
- 將字節碼構造成高級中間代碼表示(HIR)
- 第二階段
- 將 HIR 變爲 LIR
- 第三階段
- 使用線性掃描算法,在 LIR 上分配寄存器,產生機器代碼
優化方法
公共子表達式優化
當一個表達式 A 的結果已經計算過了,且 A 中的所有變量都沒有發生過變化,那麼下一次要用到 A 時就不用計算了,而是直接取之前 A 的結果。
數組邊界檢查消除
方法內聯
逃逸分析
逃逸的定義:一個在方法裏定義的變量,作爲參數傳遞給其他方法(方法逃逸),或者賦值給類變量(線程逃逸)。
優化方法:
- 棧上分配:不會逃逸的對象就不在堆上分配了,就在棧上分配,那麼對象所佔的空間就可以隨棧幀的出棧而銷燬,減少垃圾收集系統的壓力。
- 同步消除:如果一個變量肯定不會逃逸出線程,那麼關於這個變量的同步措施就可以去掉。
二. Java 內存模型與線程
內存模型
說了這麼多的內存模型,到底什麼是內存模型呢?
特定的操作協議下,對特定的內存或高速緩存進行讀寫訪問的過程抽象。
它的作用是定義程序中各個共享的變量的訪問規則,即如何將變量寫入內存和從內存中取出變量。Java 內存模型有主內存與工作內存之分,所有變量存在主內存中,線程則是擁有自己的工作內存,它是主內存的副本拷貝,線程只能讀寫工作內存。
8 種原子操作
- lock(鎖定):作用於主內存的變量,它把一個變量標識爲一條線程獨佔的狀態。
- unlock(解鎖):作用於主內存的變量,它把一個處於鎖定狀態的變量釋放出來,釋放後的變量纔可以被其他線程鎖定。
- read(讀取):作用於主內存的變量,它把一個變量的值從主內存傳輸到線程的工作內存中,以便隨後的 load 動作使用。
- load(載入):作用於工作內存的變量,它把 read 操作從主內存中得到的變量值放入工作內存的變量副本中。
- use(使用):作用於工作內存的變量,它把工作內存中一個變量的值傳遞給執行引擎,每當虛擬機遇到一個需要使用到變量的值的字節碼指令時將會執行這個操作。
- assign(賦值):作用於工作內存的變量,它把一個從執行引擎接收到的值賦給工作內存的變量,每當虛擬機遇到一個給變量賦值的字節碼指令時執行這個操作。
- store(存儲):作用於工作內存的變量,它把工作內存中一個變量的值傳送到主內存中,以便隨後的 write 操作使用。
- write(寫入):作用於主內存的變量,它把 store 操作從工作內存中得到的變量的值放入主內存的變量中。
volatile 變量的特殊規則
volatile 的特性是保證此變量對所有線程的可見性,即當變量的值修改後,其他線程可以立即知道發生的變化。普通變量則是修改完值後,需要寫回主內存,然後其他線程再從主內存讀取該數據。volatile 還可以通過內存屏障來禁止指令的重排序。綜合來講它的讀操作和普通變量差不多,寫操作慢一點。
long 和 double 變量的特殊規則
8 種操作一般都是原子性的,但是對於 64 位的數據,內存模型允許將沒有被 volatile 修飾的 64 位數據的讀寫操作劃分爲兩次 32 位的操作進行—-> 非原子協定但一般我們不需要將 long 和 double 聲明爲 volatile。
先行發生原則
- 程序次序規則
- 管程鎖定規則
- volatile 變量規則
- 線程啓動規則
- 線程終止規則
- 線程中斷規則
- 對象終結規則
- 傳遞性
Java 與線程
Java 的 Thread 類大多 API 都是 Native 方法,是與平臺相關的。
實現線程的三種方式
- 使用內核線程實現:內核線程即直接由操作系統內核支持的線程,由內核來完成線程切換,程序使用輕量級進程接口與內核線程一對一的關係,內核線程再經由線程調度器分派給 CPU。
- 使用用戶線程實現:用戶線程的建立同步銷燬調度完全在用戶態中完成,不需切換到內核態,一對多的關係。
- 用戶線程 + 輕量級進程:多對多的關係。
線程的調度
- 協同式調度
- 線程的執行時間由線程自己控制,執行完後再主動通知系統切換線程,可能會導致一個線程長時間地阻塞
- 搶佔式調度
- 由系統分配時間,線程可以主動讓出時間但是不能主動獲得時間,通過設置優先級確定順序
線程的狀態
- 新建:剛剛創建還未啓動
- 運行:正在執行或者等待分配時間
- 無限等待:不會被 CPU 分配時間,需要其他線程顯式喚醒
- 有限等待:在一段時間後由系統自動喚醒
- 阻塞:等待一個排他鎖
- 結束
三. 線程安全與鎖優化
線程安全的程度,依次減弱
- 不可變,將對象中帶狀態的變量都置爲 final
- 絕對線程安全,完全符合線程安全定義
- 相對線程安全,對這個對象的單獨的操作是線程安全的,如 Vector,HashTable 等
- 線程兼容,對象本身不是線程安全的,但是可以在調用端正確地使用同步手段才能保證在併發環境下正常使用。
- 線程對立,無論調用端如何努力,都不可能實現線程安全
線程安全的實現方法
互斥同步
synchronized 關鍵字會在代碼塊的前後分別形成 monitorenter 和 monitorexit 指令,這兩個指令需要一個 reference 對象參數,該鎖有一個計數器以實現同步,進入時將計數器 + 1,退出時 - 1,本線程可重入,其他線程需阻塞等待。synchronized 的缺點是由於 Java 線程是映射到操作系統的,所以喚醒阻塞一個線程都需要系統幫忙,需要從用戶態轉到內核態,耗費很多處理器時間。
ReentrantLock 對 synchronized 的優勢:
- 等待可中斷
- 公平鎖:必須按照申請鎖的時間順序來一次獲得鎖
- 鎖綁定多個條件
非阻塞同步
爲了解決線程阻塞和喚醒所帶來的性能問題,先對共享數據進行操作,如果沒有競爭就成功了,否則就補償(不斷重試直到成功)
無同步方案
- 可重入代碼
- 線程本地存儲,把共享數據的範圍限制到線程內,ThreadLocalMap 以 ThreadLocalHashMap 爲鍵, 以本地線程變量爲值的 K-V 對
鎖優化
鎖優化的方案有以下幾種:
- 自旋鎖:爲了減少線程阻塞與喚醒的消耗,線程在被阻塞時可以執行一個忙循環(自旋)
- 鎖消除:對不存在共享數據競爭的鎖進行消除
- 鎖粗化:在一個代碼塊內對一個對象連續的地加鎖解鎖,就對整個代碼塊一次性加鎖減少性能損耗
- 輕量級鎖:無競爭地情況下使用 CAS 操作去消除同步使用地互斥量
- 偏向鎖:鎖會偏向於第一個獲得它地線程