服務器硬件監控之OMSA

本文轉載:http://nolinux.blog.51cto.com/4824967/1664664 

 在對服務器的硬件監控上,目前業界主要基於如下兩種:

       1、服務器自帶的工具,比如HP的hpacucli,DELL的OMSA等

       2、智能平臺管理接口 (IPMI,全稱Intelligent Platform Management Interface)

       基於以上兩種,通過nagios、zabbix或自研運維平臺進行預警操作。

       由於博主公司使用的服務器全部爲DELL PowerEdge系列的,因此博主這裏將以如何對DELL PowerEdge系列服務器硬件進行監控這一實際案例爲主。


一、OMSA 介紹

       DELL OMSA的全稱爲Dell Openmanage Server Administrator,它是戴爾公司基於自主研發力量開發的IT系統管理解決方案,通過與業內領先的系統管理解決方案供應商密切配合,在深入瞭解用戶對系統管理需求的基礎上,OMSA系統管理方案可以全面解決系統管理人員最關心的系統部署、系統監控和系統變更三大系統管理問題。它通過提供以下兩種方式來對本地和遠程的服務器進行管理和監控。

       1、基於Web瀏覽器的集成圖形用戶界面(GUI)

       2、操作系統的命令行界面(CLI)工具

大家可能對DELL的IDRAC更熟悉一點,OMSA其實就是 IDRAC企業版的開源社區版。這裏列出IDRAC和OMSA的web界面,兩者看着非常相似,功能上也是非常相似。

IDRAC:

wKioL1WWcYKQu5GMAAJYFb-z_f0498.jpg

OMSA:

wKiom1WWb9zwqX58AAIhvgZiS_M512.jpg

二、OMSA 部署

       下面介紹如何安裝使用OMSA。由於我們公司主要使用的是紅帽系列的產品,因此這裏列舉RHEL6和CentOS6部署方式。

RHEL 6.X 平臺安裝 OMSA:

       在RHEL6上部署OMSA,由於DELL售後那邊發給我過資料,這裏我就不在重複寫了,貼上DELL售後的資料,非常的詳盡。

       最新版本的OMSA 8.1下載鏈接:http://downloads.dell.com/FOLDER02876154M/1/OM-SrvAdmin-Dell-Web-LX-8.1.0-1518.RHEL6.x86_64_A00.tar.gz 

       安裝鏈接:http://zh.community.dell.com/techcenter/systems-management/w/wiki/561.omsalinux 

CentOS 6.X 平臺安裝 OMSA

       CentOS 6.x系列的,其實也可以使用和RHEL6一樣的方式安裝,只不過需要修改腳本里面的一些東西。我們可以使用dell官方提供的yum源,直接使用yum來在CentOS上安裝OMSA。

下面附上安裝步驟:

1、安裝dell的yum源

# wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi | bash

2、安裝必要的2個包

# yum -y install OpenIPMI srvadmin-all

3、啓動服務

# /opt/dell/srvadmin/sbin/srvadmin-services.sh start

4、設置開機自啓動

# /opt/dell/srvadmin/sbin/srvadmin-services.sh enable
racsvc          0:off   1:off   2:on    3:on    4:on    5:on    6:off
dataeng         0:off   1:off   2:on    3:on    4:on    5:on    6:off
dsm_om_shrsvc   0:off   1:off   2:on    3:on    4:on    5:on    6:off
dsm_om_connsvc  0:off   1:off   2:off   3:on    4:off   5:on    6:off
ipmi            0:off   1:off   2:on    3:on    4:on    5:on    6:off

5、通過web訪問OMSA界面

使用瀏覽器訪問https://ip_address:1311打開OMSA的web頁面。一定要使用https去訪問,否則頁面會打不開。

wKioL1WWclrAqGzOAADXIlgNVkc900.jpg

注意 : 這裏的用戶名和密碼使用的是系統的用戶名密碼,這地方和IDRAC是不一樣的。

這樣子,OMSA就安裝好了,web管理頁面也可以使用了。


精簡OMSA組件:

       雖然 OMSA 的web端功能很強大,但是在工作當中,我們的主要目的並非是使用它的web端,更多時間只是想使用它提供的一些命令行工具來獲取服務器主要組件的相關信息,比如CPU、內存、硬盤、陳列和主板溫度之類的健康狀況。因此,我們沒有必要安裝OMSA的web端。

下面就是卸載OMSA的web端相關的包:

# yum remove -y srvadmin-tomcat srvadmin-jre srvadmin-smweb

刪除相關的無用內容:

# rm -rf /opt/dell/srvadmin/lib64/openmanage/apache-tomcat

上述操作執行完畢之後,OMSA的web端也就基本清理乾淨了,這裏列出系統中安裝的和OMSA相關的包:

[root@kvm-phy04-jz ~]# rpm -qa|grep srvadmin
srvadmin-omcommon-8.1.0-4.92.1.el6.x86_64
srvadmin-xmlsup-8.1.0-4.91.1.el6.x86_64
srvadmin-storelib-8.1.0-4.139.1.el6.x86_64
srvadmin-storage-cli-8.1.0-4.138.2.el6.x86_64
srvadmin-racdrsc-8.1.0-4.4.7.el6.x86_64
srvadmin-storage-snmp-8.1.0-4.138.2.el6.x86_64
srvadmin-storageservices-cli-8.1.0-4.3.1.el6.x86_64
srvadmin-oslog-8.1.0-4.85.1.el6.x86_64
srvadmin-isvc-snmp-8.1.0-4.38.1.el6.x86_64
srvadmin-rac4-8.1.0-4.1.127.el6.x86_64
srvadmin-server-cli-8.1.0-4.3.1.el6.x86_64
srvadmin-omilcore-8.1.0-4.85.1.el6.x86_64
srvadmin-racadm4-8.1.0-4.1.127.el6.x86_64
srvadmin-deng-8.1.0-4.8.1.el6.x86_64
srvadmin-hapi-8.1.0-4.10.2.el6.x86_64
srvadmin-ominst-8.1.0-4.94.3.el6.x86_64
srvadmin-omacore-8.1.0-4.94.3.el6.x86_64
srvadmin-storelib-sysfs-8.1.0-4.1.1.el6.x86_64
srvadmin-nvme-8.1.0-4.139.1.el6.x86_64
srvadmin-storage-8.1.0-4.138.2.el6.x86_64
srvadmin-sysfsutils-8.1.0-4.1.1.el6.x86_64
srvadmin-deng-snmp-8.1.0-4.8.1.el6.x86_64
srvadmin-racadm5-8.1.0-4.1.128.el6.x86_64
srvadmin-idracadm-8.1.0-4.4.7.el6.x86_64
srvadmin-racsvc-8.1.0-4.1.127.el6.x86_64
srvadmin-idrac-ivmcli-8.1.0-4.6.3.el6.x86_64
srvadmin-idrac-8.1.0-4.4.7.el6.x86_64
srvadmin-storageservices-snmp-8.1.0-4.3.1.el6.x86_64
srvadmin-rac4-populator-8.1.0-4.1.127.el6.x86_64
srvadmin-cm-8.1.0-4.1.249.el6.x86_64
srvadmin-server-snmp-8.1.0-4.3.1.el6.x86_64
srvadmin-itunnelprovider-8.1.0-4.27.1.el6.x86_64
srvadmin-omacs-8.1.0-4.92.1.el6.x86_64
srvadmin-isvc-8.1.0-4.38.1.el6.x86_64
srvadmin-smcommon-8.1.0-4.138.2.el6.x86_64
srvadmin-realssd-8.1.0-4.139.1.el6.x86_64
srvadmin-rac-components-8.1.0-4.4.7.el6.x86_64
srvadmin-argtable2-8.1.0-4.5.1.el6.x86_64
srvadmin-rac5-8.1.0-4.1.128.el6.x86_64
srvadmin-idrac-snmp-8.1.0-4.4.7.el6.x86_64
srvadmin-idrac-vmcli-8.1.0-4.5.1.el6.x86_64
srvadmin-storageservices-8.1.0-4.3.1.el6.x86_64
srvadmin-base-8.1.0-4.3.1.el6.x86_64
srvadmin-standardAgent-8.1.0-4.3.1.el6.x86_64

三、OMSA 使用指南

       由於 OMSA 的 web 端已經被我們卸載掉了。因此我們目前想要看到服務器的相關硬件信息就需要使用命令行的方式獲取了。那麼,這裏就介紹如何使用命令獲取服務器硬件信息。

       OMSA自帶了一些工具來提供給我們命令行的查詢和設置接口,這裏主要介紹兩個,一個是omreport,另一個是omconfig。omreport是用來查詢服務器各種硬件狀態,omconfig是用來設置硬件的一些屬性的。

       我在這裏僅列出這兩個命令的常用幾個命令,更多的命令詳情大家可以去如下兩個網站查詢:

  1、http://www.sxszjzx.com/~t096/manual/sc/Dosa/CLI/report.htm
       2、http://topics-cdn.dell.com/pdf/dell-opnmang-srvr-admin-v8.1_User's%20Guide_en-us.pdf

命令指南:

/opt/dell/srvadmin/bin/omreport chassis                     # 顯示所有主要組件的常規狀態 
/opt/dell/srvadmin/bin/omreport chassis memory              # 顯示內存信息
/opt/dell/srvadmin/sbin/omreport  chassis temps             # 顯示系統主要組件的溫度
/opt/dell/srvadmin/bin/omreport storage adisk controller=0  # 查看磁盤陳列中的硬盤狀態
/opt/dell/srvadmin/bin/omreport storage pdisk controller=0  # 查看物理磁盤信息
/opt/dell/srvadmin/bin/omreport storage vdisk controller=0  # 查看虛擬硬盤的狀態
/opt/dell/srvadmin/bin/omreport storage controller          # 查看控制器(即RAID卡)的屬性
/opt/dell/srvadmin/bin/omreport storage channel controller=0    # 查看通道的屬性
/opt/dell/srvadmin/bin/omreport storage enclosure controller=0  # 查看enclosure的屬性
/opt/dell/srvadmin/bin/omreport storage battery                 # 查看電池屬性
/opt/dell/srvadmin/bin/omconfig storage controller action=setrebuildrate controller=0 rate=100            # 調整rebuild的速度
/opt/dell/srvadmin/bin/omconfig  storage vdisk  action=changepolicy controller=0 vdisk=0 readpolicy=ara   # 修改raid的讀策略
/opt/dell/srvadmin/bin/omconfig  storage vdisk  action=changepolicy controller=0 vdisk=0 writepolicy=fwb  # 修改raid的寫策略

命令範例:

1、查看系統主要組件的溫度

[root@kvm-phy04-jz ~]# /opt/dell/srvadmin/bin/omreport chassis temps
Temperature Probes Information
 
------------------------------------
Main System Chassis Temperatures: Ok
------------------------------------
 
Index                     : 0
Status                    : Ok
Probe Name                : System Board Inlet Temp
Reading                   : 26.0 C
Minimum Warning Threshold : 3.0 C
Maximum Warning Threshold : 42.0 C
Minimum Failure Threshold : -7.0 C
Maximum Failure Threshold : 47.0 C
 
Index                     : 1
Status                    : Ok
Probe Name                : System Board Exhaust Temp
Reading                   : 31.0 C
Minimum Warning Threshold : 8.0 C
Maximum Warning Threshold : 70.0 C
Minimum Failure Threshold : 3.0 C
Maximum Failure Threshold : 75.0 C
 
Index                     : 2
Status                    : Ok
Probe Name                : CPU1 Temp
Reading                   : 36.0 C
Minimum Warning Threshold : 8.0 C
Maximum Warning Threshold : 79.0 C
Minimum Failure Threshold : 3.0 C
Maximum Failure Threshold : 84.0 C
 
Index                     : 3
Status                    : Ok
Probe Name                : CPU2 Temp
Reading                   : 30.0 C
Minimum Warning Threshold : 8.0 C
Maximum Warning Threshold : 79.0 C
Minimum Failure Threshold : 3.0 C
Maximum Failure Threshold : 84.0 C

2、查看虛擬硬盤的狀態

[root@kvm-phy04-jz ~]# /opt/dell/srvadmin/bin/omreport storage vdisk controller=0 
List of Virtual Disks on Controller PERC H310 Mini (Embedded)
 
Controller PERC H310 Mini (Embedded)
ID                                : 0
Status                            : Ok
Name                              : cislunar_space
State                             : Ready
Hot Spare Policy violated         : Not Assigned
Encrypted                         : Not Applicable
Layout                            : RAID-10
Size                              : 836.63 GB (898319253504 bytes)
T10 Protection Information Status : No
Associated Fluid Cache State      : Not Applicable
Device Name                       : /dev/sda
Bus Protocol                      : SAS
Media                             : HDD
Read Policy                       : No Read Ahead
Write Policy                      : Write Through
Cache Policy                      : Not Applicable
Stripe Element Size               : 64 KB
Disk Cache Policy                 : Disabled

3、查看控制器(即RAID卡)的屬性

[root@kvm-phy04-jz ~]# /opt/dell/srvadmin/bin/omreport storage controller  
 Controller  PERC H310 Mini(Embedded)
 
Controller
ID                                            : 0
Status                                        : Non-Critical
Name                                          : PERC H310 Mini
Slot ID                                       : Embedded
State                                         : Degraded
Firmware Version                              : 20.12.1-0002
Minimum Required Firmware Version             : 20.13.1-0001
Driver Version                                : 06.700.06.00-rh1
Minimum Required Driver Version               : Not Applicable
Storport Driver Version                       : Not Applicable
Minimum Required Storport Driver Version      : Not Applicable
Number of Connectors                          : 2
Rebuild Rate                                  : 30%
BGI Rate                                      : 30%
Check Consistency Rate                        : 30%
Reconstruct Rate                              : 30%
Alarm State                                   : Not Applicable
Cluster Mode                                  : Not Applicable
SCSI Initiator ID                             : Not Applicable
Cache Memory Size                             : 0 MB
Patrol Read Mode                              : Auto
Patrol Read State                             : Stopped
Patrol Read Rate                              : 30%
Patrol Read Iterations                        : 0
Abort Check Consistency on Error              : Disabled
Allow Revertible Hot Spare and Replace Member : Enabled
Load Balance                                  : Not Applicable
Auto Replace Member on Predictive Failure     : Disabled
Redundant Path view                           : Not Applicable
CacheCade Capable                             : Not Applicable
Persistent Hot Spare                          : Disabled
Encryption Capable                            : Not Applicable
Encryption Key Present                        : Not Applicable
Encryption Mode                               : Not Applicable
Preserved Cache                               : Not Applicable
Spin Down Unconfigured Drives                 : Disabled
Spin Down Hot Spares                          : Disabled
Spin Down Configured Drives                   : Not Applicable
Automatic Disk Power Saving (Idle C)          : Not Applicable
T10 Protection Information Capable            : No

劇透:除了OMSA自帶的工具,還有一個便捷查詢的第三方工具 check_openmanage。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章