Windows 2003自帶性能監控工具的使用


http://blog.itpub.net/4555/viewspace-712952


幾天有一臺備庫在累積了多日的REDO後,進行REDO APPLY時,整個系統變得異常緩慢,通過Windows 2003性能監控工具發現是硬盤IO出現瓶頸。下面列出收集的Windows 2003自帶性能監控工具的指標說明。

工具的執行方式:管理 -> 性能

相關性能指標:

1) Memory -> Page Reads/sec過高,持續大於5。
過多的頁交換要使用大量的硬盤空間,很容易將導致將頁交換內存不足與導致頁交換的磁盤瓶徑混淆。這就需要我們在研究內存不足不太明顯的頁交換的原因時,必須跟蹤如下的磁盤使用情況計數器和內存計數器:
Physical Disk -> % Disk Time
Physical Disk -> Avg.Disk Queue Length
Memory -> Page Reads/sec
含義:
Page Reads/sec 是讀取磁盤以解析硬頁面錯誤的次數。它顯示讀取操作的數量,它並不考慮每個操作的頁面數量。當一個進程引用一個虛擬內存的頁面,而此虛擬內存位於工作集以 外或物理內存的其他位置,並且此頁面必須從磁盤檢索時,就會發生硬頁面錯誤。此計數器是引起系統範圍內延遲的主要指示器。它包含讀取操作以滿足文件系統緩 存(通常由應用程序請求)和非緩存映射內存文件的錯誤。比較內存的值\\PagesReads/sec 與內存的值\\PagesInput/sec 來決定每個操作取讀的平均頁面數量。
通俗含義:
頁的硬故障,Page/sec的子集,是爲了解決硬錯誤,從硬盤讀取的次數。
分析:
閾值爲>5,越低越好。大數值表示磁盤讀而不是緩存讀。持續大於5的值,表明內存的讀請求發生了較多的缺頁中斷(page fault)。
說明進程的Working Set已經不夠,使用硬盤來虛擬內存。此處爲讀得次數,不關心讀取得頁數,比較大的值表明內存出現了瓶頸。
a) 如果Memory -> Page Reads/sec比較低,但Physical Disk -> % Disk Time 和 Physical Disk -> Avg. Disk Queue Length計數器很高,表明磁盤有瓶頸。
b) 如果隨着Physical Disk -> Avg. Disk Queue Length的增加,而Memory -> Page Reads/sec並沒有減少,表明有內存的瓶頸。
2) 硬盤的相關性能指標
Avg.Disk sec/Transfer計數器反映磁盤完成請求所用的時間。較高的值表明磁盤控制器由於失敗而不斷重試該磁盤。這些故障會增加平均磁盤傳送時間。對於大多數磁盤,較高的磁盤平均傳送時間是大於 0.3 秒。
Avg.Disk Bytes/Transfer值大於 20 KB 表示該磁盤驅動器通常運行良好;如果應用程序正在訪問磁盤,則會產生較低的值。例如,隨機訪問磁盤的應用程序會增加平均 Disk sec/Transfer 時間,因爲隨機傳送需要增加搜索時間。
Disk Transfer/sec一般來說,定義該值小於15ms最爲優異,介於15-30ms之間爲良好,30-60ms之間爲可以接受,超過60ms則需要考慮更換硬盤或硬盤的RAID方式了。
如果以下幾個計數器之一的值有大於20毫秒的話,磁盤就是超負荷了:Avg.Disk sec/Read,avg.Disk sec / Write,Avg.Disk sec/Transfer。
如果在Physical Disk 計數器中,只有%Disk Time 比較大,其他值都比較適中,硬盤可能會是瓶頸。若幾個值都比較大,且數值持續超過80%,則可能是內存泄漏。
3) 決定工作負載的平衡
要 平衡網絡服務器上的負載,需要了解服務器磁盤驅動器的繁忙程度。使用 Physical Disk -> % Disk Time 計數器,該計數器顯示驅動器活動時間的百分比。如果 % Disk Time 較高(超過 90%),請檢查 Physical Disk -> Current Disk Queue Length 計數器以查看正在等待磁盤訪問的系統請求數量。等待 I/O 請求的數量應當保持在不大於組成物理磁盤的主軸數的 1.5 到 2 倍。大多數磁盤只有一個軸,但獨立磁盤冗餘陣列 (RAID) 設備通常有多個軸。硬件 RAID 設備在系統監視器中顯示爲一個物理磁盤。通過軟件創建的多個 RAID 設備在系統監視器中顯示爲多個實例。
可以使用 Current Disk Queue Length 和 % Disk Time 計數器的值檢測磁盤子系統中的瓶頸。如果 Current Disk Queue Length 和 % Disk Time 計數器的值一直很高,則考慮下列事項:
   使用速度更快的磁盤驅動器。
   將某些文件移至其他磁盤或服務器。
   如果正在使用一個 RAID 陣列,則在該陣列中添加磁盤。
如 果使用 RAID 設備,% Disk Time 計數器會指示大於 100% 的值(出現這種現象的原因是處理器允許操作系統使用重疊的I/O,磁盤性能計數器使用一個100納秒精度的計數器來度量磁盤時間,再按照採樣頻率顯示出 來。採樣後的時間可能會超過100%,比如:在2毫秒內有10個請求,採樣時間爲10毫秒。如果是raid磁盤,因爲操作系統可以讀寫到多到磁盤上,從而 產生重疊 I/O,這會使%disk time大於100%。)。如果出現這種情況,則使用 PhysicalDisk: Avg.Disk Queue Length 計數器來確定等待進行磁盤訪問的平均系統請求數量。
I/O 依賴的應用程序或系統可能會使磁盤持續處於活動狀態。
監視 Memory: Page Faults/sec 計數器可以確保磁盤活動不是由分頁導致的。在 Windows 中,換頁的原因包括:
   配置進程佔用了過多內存。
   文件系統活動。
如 果在同一硬盤上有多個邏輯分區,請使用 Logical Disk 計數器而非 Physical Disk 計數器。查看邏輯磁盤計數器有助於確定哪些文件被頻繁訪問。當發現磁盤有大量讀/寫活動時,請查看讀寫專用計數器以確定導致每個邏輯卷負荷增加的磁盤活動 類型,例如,Logical Disk: Disk Write Bytes/sec。
使用技巧:

1)可以開啓日誌跟蹤的功能,將各參數的變化情況記錄到日誌文件,供以後分析。
2)如果開啓的指標太多,看不清楚,可以自定義計數器增加計數指標;線條的顏色、比率、粗細等,以從中分辨出自己最關注的曲線。

 


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章