vsphere 性能優化及最佳實踐

轉載  http://www.360doc.com/content/16/0225/11/22078350_537242602.shtml

使用esxtop命令可以顯示針對虛擬化的各類信息,包括cpu、內存、網卡、存儲等各類數據的統計。

esxtop有以下8種方式來度量虛擬工作環境性能:

     c:CPU面板顯示服務器統計數據以及個人領域、資源池和虛擬機CPU的統計數據;

      m:內存面板顯示服務器和分組內存使用的統計數據,與CPU面板相似;

      n:網絡面板顯示服務器網絡使用統計數據;

      i:中斷面板顯示中斷向量的統計信息;

      d:存儲適配器面板默認彙總每個存儲適配器;

      u:存儲設備面板顯示服務器存儲利用的統計數據;

      V:虛擬機存儲面板顯示以虛擬機爲中心的存儲統計數據;

      p:電源面板顯示CPU電源利用統計數;

esxtop其他功能:

      f:增加或者刪除設置;

      V:在CPU面板和內存面板之間切換View All和View VM Only視圖,View VM Only視圖會清除不是虛擬機的所有進程;

      2:高亮顯示一行,向下滾動;
      8:高亮顯示一行,向上滾動;

      S2:兩秒刷新一次;

二、    主要功能介紹

1.      CPU

輸入esxtop命令,一般默認是顯示和CPU相關的界面,如果沒顯示,可按“c”進行CPU界面展示

22078350_2016022511163703185S8MGDNB9PX7Q

1)       CPU load average

CPU1分鐘、5分鐘和15分鐘內的負載計算,基於6個範本作爲計算對象。

2)    number of worlds

ESXi服務器的worlds數量;

3)    PCPU UTIL(%)

每顆PCPUunhalted CPU cycles的百分比,它平均分佈在所有PCPU上。

如果PCPU UTIL(%)的值過高意味着什麼呢?這就意味着物理資源被大量佔用。如果所有的PCPUs的使用率都逼近100%,則就意味着CPU資源使用的過載。此時,就需要去檢查system groupsRDY%值以便驗證是否真的是CPU資源使用過載;其次,如果某些PCPUsPCPU UTIL(%)接近100%,但是有一些卻不是這樣,則此時就意味着資源調度的不均衡了。此時就需要注意了,最好去監控在過去一段時間裏是否這些PCPUs的使用率接近100%,如果是這樣,請檢查是否爲虛擬機配置了CPU親和性規則,如果有,可嘗試接觸掉這種親和性規則的關聯指定;

4)    PCPU USED(%) 

這個參數是每顆PCPU的使用百分比,它會平均分佈在所有PCPUs上。

PCPU UTIL(%)表示在過去的恆定時間裏PCPU多長時間PCPU處於busyunhalted)狀態,PCPU USED(%)則表示則表示在過去恆定的時間裏PCPU的有效工作工作狀態。PCPU USED(%)這個支持能夠更加準確的闡述當下的PCPU資源利用率,因爲它綜合了各種硬件輔助狀態,例如超線程和智能電源管理等模塊;

5)    CORE UTIL(%)

這個選項只有在開啓了超線程時出現。這個參數記錄每COREPCPUs上處unhalted狀態時的CPU cycles百分比,它會平均分佈到所有的COREs上。當PCPUs裏的CORE都處於halted狀態時,它會取與“CORE IDLE”狀態相反的百分比值,並提取這個值作爲CPU cycles的百分比;
batch mode下,會顯示每顆PCPU對應的“CORE UTIL(%)”,因此,PCPU 0 PCPU 1會有相同的“CORE UTIL(%)”數目,例如Core 0 “CORE UTIL(%)”PCPU UTIL(%)COREUTIL(%)的差異到底在哪裏?當PCPUs裏的CORE被使用時,則CORE一定是出於Utilized狀態,CORE的使用率百分比不一定等於PCPUs的使用率百分比的總和。CORE0的使用率大於等於任意一顆PCPU的使用率,同時又小於等於PCPU0PCPU1的使用率。

6)    %USED

CPU核心循環使用,這個值是物理CPU對應到World的時間百分比。

系統服務所消耗的World的計數也在其中,它的計數單位有%SYS這個服務,通常情況下,這個服務的開銷時間會被計算進去。否則,將會計入%OVRLP用作World的補充。

%USED的計算公式爲:%USED = %RUN+ %SYS - %OVRLP的值

VM%USED的值較高時,意味着VM開銷了大量的CPU資源,此時,可以打開worlds的下拉菜單去查看到底什麼業務導致了這樣的高CPU資源開銷;

7)    %SYS

這個是系統服務消耗world時間的百分比。它可能包含和系統服務相關的一些指令、系統worlds等底層業務開銷;

  閥值

閥值爲20%,當大於20%時,可能是由於VMI/O過高導致;

8)    %VMWAIT

虛擬機等待一些VMkernel活動(比如I/O)完成後纔可以繼續工作,包括% SWPWT“blocked”,但不是空閒時間(類似%WAIT)

如果此值過高達到100%則可能是由於存儲性能問題或者虛擬機的某個設備延遲造成,比如USB設備、串行通信設備。

9)    %SWPWT

計數器顯示一個VM等待交換頁面從磁盤讀取需要多久的時間。

  閥值

閥值爲5,高於此值則可能是內存過載;

10)        %MLMTD

統計VCPU準備運行的時間百分比,

  閥值

閥值爲1,此值一般都爲0,如果大於可能是由於設置了CPU limit,刪除此限制以獲得更好的性能;

11)        %CSTP

如果虛擬機使用了VSMP,顯示了虛擬機在co-deschedule狀態下準備運行的時間百分比。

  閥值

閥值爲3,造成此的原因可能是vSMP過多,需要減少此虛擬機的vCPU數量。

12)        %RDY

VM等待被調度時間的百分比。通常情況下world等待被CPU調度機制調度到PCPU時,就會產生%RDY值,它的全稱是CPU Ready Time。因此它通常情況下都是小於100%的,爲什麼呢?因爲物理的CPU的資源是有限度的;

  參考信息:

%RDY就是一個重要的標尺,當系統產生了%RDY值後,理論上都意味着CPU資源的不足導致了爭用。但是,這不是絕對的,因爲如果管理員有針對虛擬機的vCPU設定Limit時,此時,虛擬機可以調度的CPU資源量將會被侷限在手動設定Limits範圍內,此時,即使有足夠的PCPU資源,依然會在VM上產生%RDY。那麼,如何鑑別這個問題呢?此時,就涉及到我們接着要說的另一個參數“%MLMTD”。注意,%RDY值會包含%MLMTD的。例如,當CPU發生爭用情況時,我們可以使用 “%RDY - %MLMTD” 來鑑別真實的情況,如果 “%RDY - %MLMTD”的值較高,例如大於20%時,即可定性爲CPU資源不足導致了CPU爭用情況的出現。反之,如果這個 “%RDY - %MLMTD” 的值較小,例如5%,則意味着此時不一定會有物理CPU的資源不足情況,也就不存在CPU資源爭用的情況,所以20%爲一個臨界值;

  閥值

 閥值爲10%,可能是由於虛擬機的VCPUSVMP過多導致,或者是vCPU做了限制(請檢查%MLMTD)。

13)        %RUN

這個是world已調度運行的總計時間百分比;

VM%RUN值過高時,就意味着VM使用大量的CPU資源,當然這並不意味着虛擬機的資源不足了,如果要確認是否虛擬機的CPU資源不足,則還需要去看看%RDY值,因爲%RDY值纔是評判CPU資源緊缺的參考依據;

2.      內存22078350_201602251116370365USUXYL0SVKJIK

1)    MCTLSZ

22078350_2016022511163704129RSI6TQJRF8X1

程序回收物理機內存的總量;

 Amount of
guest physical memory (MB) the ESXi Host is reclaiming by balloon driver

  閥值

閥值爲1,如果此值大於零,則說明內存負載過大,此時主機會強制虛擬機回收過量的內存

2)    SWCUR

22078350_201602251116370427HGSI7HHJTAXIW

已經被VMKernel進行交換的內存。

  閥值

閥值爲1,如果大於零,可能是內存過載。

3)    SWR/s,

22078350_201602251116370427HGSI7HHJTAXIW

主機讀取交換內存的速度

 閥值

閥值爲1,如果大於零,說明esxi主機積極讀取交換內存,可能的原因是內存過量使用

4)    SWW/s

22078350_201602251116370427HGSI7HHJTAXIW

物理主機寫入交換內存的速度

  閥值

閥值爲1,如果大於零,說明esxi主機積極寫入交換內存,可能的原因是內存過量使用;

5)    Memory Status:

22078350_201602251116370443XBQU1OMZLFG02

  high

有足夠的空餘內存

  Soft

空閒內存小於4%:物理機回收內存。

  hard

空閒內存小於2%:主機開始交換,此時主機性能會降低;

  low

空閒內存小於1%esxi主機會停止給虛擬機分配更多的內存;

6)    ZIP/SUNZIP/S

22078350_201602251116370443XBQU1OMZLFG02

  ZIP/S

值大於零表明主機正在積極的壓縮內存

  閥值

閥值爲0,如果大於零,說明主機在積極的壓縮內存,造成此的原因可能是內存負載過大。

  UNZIP/S

Values larger 0
indicate that the host is accessing compressed memory.

  閥值

閥值爲0,表明主機內存之前過量使用

3.      網絡

1)    %DRPTX, %DRPRX, %DRPTX

數據包傳輸下降,丟包率

  閥值

閥值大於1表示網絡利用率較高

  %DRPRX

數據包接受率下降

  閥值

閥值大於1表示網絡利用率較高

22078350_201602251116370459EQQT20EAN0HMY

2)    Used-by/Team-PNIC:

22078350_201602251116370505KP5EYJ7Q3UUBS

可以看出目前虛擬機所使用的網卡是vmnic2還是vmnic3

4.      磁盤

1)   GAVG

DAVG + KAVG

  閥值:

閥值25

2)    DAVG

22078350_201602251116370521SEPDBX3RMPWMK

  閥值

閥值爲25,由於數據造成磁盤延遲;

3)    KAVG

VMKernel造成的延遲

22078350_201602251116370521SEPDBX3RMPWMK

  閥值

閥值爲3,當值過高時意味着有排隊情況的發生

4)    ABRTS/s

22078350_201602251116370537H94QNEP21UE2T

  閥值

閥值爲1,不管任何原因造成的路徑訪問失敗或者數據無法接受I/O信息,因爲存儲沒有響應而終止虛擬機的發佈,默認windows虛擬機爲60秒鐘。

5)    RESETS/s

22078350_201602251116370552P5MPPRGHGPGQM

每秒鐘命令重置的數量

  閥值

閥值爲1

6)    DISK

22078350_201602251116370552P5MPPRGHGPGQM


SCSI
Reservation Conflicts per second. If many SCSI Reservation Conflicts occur
performance could be degraded due to the lock on the VMFS.

  閥值

閥值爲20


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章