dump解析入門-用VS解析dump文件進行排障

突然有一天部署在服務器的一個應用掛掉了,沒辦法只能進入服務器打開

 

 

【事件查看器】查看下,好不容易找到了打開後一臉懵逼

 

 

 

事件查看器查到的內容根本對我們排障沒有任何作用。

在這個時候如果有對應的dump文件就能派上用場了,

只要有dump文件就能查到應用掛掉那刻的一手情報,可能有人認爲分析dump文件是非常難的事情,

但是最近不斷有新的dump分析工具出來,例如用vs2017就能夠很簡單的分析dump文件。

接下來我們用幾個實際的例子來看看如何用vs2017來分析dump文件吧

 

dump文件的收集

應用掛是一瞬間的事情,掛了之後就沒辦法生成dump文件了。所以首先要設置一下自動生成dump文件。

打開註冊表HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\Windows Error Reporting

 

 

 

在Windows Error Reporting下新建一個 LocalDumps文件夾

然後在這項裏面新增 DumpCount DumpFolder DumpType 這三項

 

 

 

演示stackoverflow錯誤導致的crash

我們有創建一個簡單的console程序

class Program

    {

        static void HogeHoge(string s)

        {

            HogeHoge(s);

        }

        static void Main(string[] args)

        {

            HogeHoge("hoge-");

        }

 }

 

編譯成exe 後運行 毫無疑問會出現如下錯誤

 

 

查看下dump文件果然生成了

 

 

那我們分析下這個dump文件,用VS2017打開它,會出現它的概要信息

 

 

你會發現異常信息處寫了 【該線程已用完其堆棧】就可以很明顯看出來是stackoverflow。

而且看右側【操作】處 有[使用 僅限託管 進行調試] 和 [使用 混合 進行調試] 和 [使用 僅限本機 進行調試]

這裏牽扯出3個名詞

託管  ======> 適用於在公共語言運行時下運行的代碼 所謂託管是指內存管理由系統而不是由程序員管理  大家都知道c#有關內存都是CLR來管理的

混合  ======>對託管代碼和非託管代碼都調用調試器

本機  ======>適用於非託管代碼

如果你的代碼裏面沒有調用非託管代碼的話 點擊 前面2個按鈕都可以的

 

點擊後會直接進入

 

 

這樣錯誤源碼級別看的非常清楚了。因爲是我們本機創建的工程 pdb 和 源碼都有。所以才能直接定位到。但是實際上crash都是發生在服務器上,把服務器上的dump文件打開的話還會是這樣嗎

下面我們來做一個模擬

用Relase編譯 然後把 Program.cs文件也給刪除掉。然後重新執行crash生成dump文件

然後用同樣的步驟vs打開點擊調試就會提示找不到 Program.cs

 

 

這樣一來可供我們排障的情報就少了很多。在這種情況下 我們可以利用vs 提供的幾個窗口來觀察

分別是以下三個

 

 

第一個窗口:線程窗口

 

 

實際的程序往往有很多線程在運行,每個線程的切換等重要信息可以在這個窗口進行觀察。

 

第二個窗口:調用堆棧窗口

 

 

調用堆棧窗口是和線程窗口聯動的。

 

第三個窗口也是最重要的窗口:並行堆棧

 

 

如圖所示,每個線程和它的堆棧內容展示的很清楚。只不過本例子是比較簡單的,即使不看這個看前2個窗口就能知道原因了。

但是實際的應用若超過運行上百個線程的話,將這些線程用圖形可視化出來對於我們排查複雜問題是非常有用的!

 

CPU100和死鎖導致的crash解析

由於系統可以配置crash自動生成dump文件。但是有些情況比如部署在iis上web服務cpu飆到100%下不來導致爲web停止服務。這個時候就需要我們手動提取dump文件了。

下面我們來模擬一下這種場景:

新建一個asp.net mvc程序

複製代碼

public class HomeController : Controller
{
    async Task<string> GetAsync()
    {
        var str = await new HttpClient().GetStringAsync("http://www.baidu.com/");
        return str;
    }

    public ActionResult Index()
    {
        var s = GetAsync().Result;
        return View();
    }
}

複製代碼

 

 

以上代碼 async/await會造成死鎖

我們用iis來啓動這個web應用後頁面圈圈一直在轉網頁空白一片

打開Windows任務管理器找到w3wp

 

 

 

 

 

用vs打開這個dump文件 點擊調試後後

打開並行堆棧這個窗口

 

 

大家看會有很多分支,該從哪個開始分析呢,教大家一個小技巧,不知道如何下手的時候就選分支越長的!

 

 

從HomeController.Index進來,停止在ManualResetEventSlim.Wait

死鎖原因:

 

 

 

總結:

說到dump大家立馬可能想到的是windbg

但是windbg的各種命令對於新手們還是比較困難的,Vs工具也能幫助我們分析dump,能夠解決的問題也有很多

發佈了80 篇原創文章 · 獲贊 30 · 訪問量 24萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章