突然有一天部署在服務器的一個應用掛掉了,沒辦法只能進入服務器打開
【事件查看器】查看下,好不容易找到了打開後一臉懵逼
事件查看器查到的內容根本對我們排障沒有任何作用。
在這個時候如果有對應的dump文件就能派上用場了,
只要有dump文件就能查到應用掛掉那刻的一手情報,可能有人認爲分析dump文件是非常難的事情,
但是最近不斷有新的dump分析工具出來,例如用vs2017就能夠很簡單的分析dump文件。
接下來我們用幾個實際的例子來看看如何用vs2017來分析dump文件吧
dump文件的收集
應用掛是一瞬間的事情,掛了之後就沒辦法生成dump文件了。所以首先要設置一下自動生成dump文件。
打開註冊表HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\Windows Error Reporting
在Windows Error Reporting下新建一個 LocalDumps文件夾
然後在這項裏面新增 DumpCount DumpFolder DumpType 這三項
演示stackoverflow錯誤導致的crash
我們有創建一個簡單的console程序
class Program
{
static void HogeHoge(string s)
{
HogeHoge(s);
}
static void Main(string[] args)
{
HogeHoge("hoge-");
}
}
編譯成exe 後運行 毫無疑問會出現如下錯誤
查看下dump文件果然生成了
那我們分析下這個dump文件,用VS2017打開它,會出現它的概要信息
你會發現異常信息處寫了 【該線程已用完其堆棧】就可以很明顯看出來是stackoverflow。
而且看右側【操作】處 有[使用 僅限託管 進行調試] 和 [使用 混合 進行調試] 和 [使用 僅限本機 進行調試]
這裏牽扯出3個名詞
託管 ======> 適用於在公共語言運行時下運行的代碼 所謂託管是指內存管理由系統而不是由程序員管理 大家都知道c#有關內存都是CLR來管理的
混合 ======>對託管代碼和非託管代碼都調用調試器
本機 ======>適用於非託管代碼
如果你的代碼裏面沒有調用非託管代碼的話 點擊 前面2個按鈕都可以的
點擊後會直接進入
這樣錯誤源碼級別看的非常清楚了。因爲是我們本機創建的工程 pdb 和 源碼都有。所以才能直接定位到。但是實際上crash都是發生在服務器上,把服務器上的dump文件打開的話還會是這樣嗎
下面我們來做一個模擬
用Relase編譯 然後把 Program.cs文件也給刪除掉。然後重新執行crash生成dump文件
然後用同樣的步驟vs打開點擊調試就會提示找不到 Program.cs
這樣一來可供我們排障的情報就少了很多。在這種情況下 我們可以利用vs 提供的幾個窗口來觀察
分別是以下三個
第一個窗口:線程窗口
實際的程序往往有很多線程在運行,每個線程的切換等重要信息可以在這個窗口進行觀察。
第二個窗口:調用堆棧窗口
調用堆棧窗口是和線程窗口聯動的。
第三個窗口也是最重要的窗口:並行堆棧
如圖所示,每個線程和它的堆棧內容展示的很清楚。只不過本例子是比較簡單的,即使不看這個看前2個窗口就能知道原因了。
但是實際的應用若超過運行上百個線程的話,將這些線程用圖形可視化出來對於我們排查複雜問題是非常有用的!
CPU100和死鎖導致的crash解析
由於系統可以配置crash自動生成dump文件。但是有些情況比如部署在iis上web服務cpu飆到100%下不來導致爲web停止服務。這個時候就需要我們手動提取dump文件了。
下面我們來模擬一下這種場景:
新建一個asp.net mvc程序
public class HomeController : Controller { async Task<string> GetAsync() { var str = await new HttpClient().GetStringAsync("http://www.baidu.com/"); return str; } public ActionResult Index() { var s = GetAsync().Result; return View(); } }
以上代碼 async/await會造成死鎖
我們用iis來啓動這個web應用後頁面圈圈一直在轉網頁空白一片
打開Windows任務管理器找到w3wp
用vs打開這個dump文件 點擊調試後後
打開並行堆棧這個窗口
大家看會有很多分支,該從哪個開始分析呢,教大家一個小技巧,不知道如何下手的時候就選分支越長的!
從HomeController.Index進來,停止在ManualResetEventSlim.Wait
死鎖原因:
總結:
說到dump大家立馬可能想到的是windbg
但是windbg的各種命令對於新手們還是比較困難的,Vs工具也能幫助我們分析dump,能夠解決的問題也有很多