問:如何定位是哪個服務進程導致CPU過載,哪個線程導致CPU過載,哪段代碼導致CPU過載?
步驟一、找到最耗CPU的進程
工具:top
方法:
- 執行top -c ,顯示進程運行信息列表
- 鍵入P (大寫p),進程按照CPU使用率排序
圖示:
如上圖,最耗CPU的進程PID爲10765
步驟二:找到最耗CPU的線程
工具:top
方法:
-
top -Hp 10765 ,顯示一個進程的線程運行信息列表
-
鍵入P (大寫p),線程按照CPU使用率排序
圖示:
如上圖,進程10765內,最耗CPU的線程PID爲10804
步驟三:將線程PID轉化爲16進制
工具:printf
方法:printf “%x” 10804
0804對應的16進制是0x2a34,當然,這一步可以用計算器。之所以要轉化爲16進制,是因爲堆棧裏,線程id是用16進製表示的。
步驟四:查看堆棧,找到線程在幹嘛,我們知道jdk提供了對線程的監控命令jstack
工具:pstack/jstack/grep
- jstack:適用於java進程,可以取到所以線程的堆棧dump
- pstack:適用於所有linux進程,是對gdb的功能封裝
方法:jstack 10765 | grep ‘0x2a34’ -C5 --color
- 打印進程堆棧
- 通過線程id,過濾得到線程堆棧
圖示:
如上圖,找到了耗CPU高的線程對應的線程名稱“AsyncLogger-1”,以及看到了該線程正在執行代碼的堆棧。
jstack會將進程下所有線程信息打印出來,上圖只是截取了部分線程信息。根據線程號,可以找到對應的線程棧。通過線程棧,找到對應的java代碼