Solaris 系統維護常用命令

一、系統概況

1. 操作系統基本信息:uname -a將依次顯示 操作系統名稱,hostname,操作系統大版本信息,操作系統小版本信息,硬件類型,cpu類型,平臺信息。 

2. 內核信息:修改/etc/system文件更改缺省的內核參數,modinfo顯示模塊信息,sysdef顯示驅動和內核參數信息。

3. CPU信息:/usr/sbin/psrinfo -v顯示cpu狀態,數量,cpu類型和主頻。

4. 內存信息:prtconf | grep "Memory size"顯示內存大小。

5. 硬盤/光驅信息:iostat -En顯示硬盤和光驅的硬件地址,各種狀態信息,型號及硬盤大小。可以通過該命令檢查是否出現過各類錯誤。

6. 網卡信息:ifconfig -a ,顯示網卡名稱,狀態,最大傳輸單元mtu,ip地址,子網掩碼,廣播地址。

7. HA信息:

8. 網絡信息:netstat -rn顯示靜態路由和缺省路由。

9. 包pkg信息 :pkginfo -l pkgname。通過它判定某個pkg是否安裝,相關的還有pkgadd,pkgrm,pkgchk。

10. 補丁patch信息:showrev -p。安裝某些軟件需要特定的patch,通過它判斷。

11. 文件系統信息:df -k監測capacity判斷是否出現空間不足。

12. 用戶信息:who顯示當前在線用戶。whodo顯示當前用戶進行的操作。 通過useradd,groupadd或admintool進行用戶的管理。id顯示當前用戶的login name,login id, group name group name。 

5.1.2系統監控

1. cpu性能監控:vmstat /mpstat和sar,vmstat和sar在SMP系統中顯示彙總信息,而mpstat可以顯示每顆CPU的負載。vmstat監控procs下的r和b數目,它反映目前處於運行和阻滯狀態的進程數目,如果r數目長期大於cpu數目同時cpu下的us+sy >80,表示cpu處理能力不足。

2. 內存監控:vmstat,監控memory下的free和page下的pi/po,pi/po反映每秒鐘以k爲單位換進/換出的數量。如果free的數目很小同時pi/po數目長時間大於0,則表示內存不足。

3. 硬盤監控:iostat -d 和sar -d,可以看到每塊硬盤及硬盤的每個分區的工作情況

4. 交換區監控:swap -l和swap -s,應儘量將交換區的放置在負載較輕的硬盤上。同時交換區的使用百分比不應過高。

5. HA系統監控:

6. 網絡監控:netstat -in顯示每塊網卡的工作負載情況。Ipkts/Opkts發送包和接受包的情況。Ierrs/oerrs,collis表示發生的錯誤和衝突。

Ierrs/Ipkts或Oerrs/Opkts >2%,表示網絡衝突嚴重。

7. 端口監控:監控某個服務是否啓動或正常運行,

netstat -an |grep portnum或tcpdump |grep portnum。

8. 硬件故障診斷:/usr/platform/`uname -m`/sbin/prtdiag -v通過輸出結果判定有無硬件故障。

9. syslogd日誌監控,,syslogd後臺進程將系統運行中的信息寫入/var/adm/messages文件中,通過它來監控有無異常的軟硬件錯誤信息的出現。

較早一點的信息存在同一目錄下的messages.0,message.1文件中。

10. mail監控:某些用戶通過crontab定時執行任務,任務完成後,cron進程會給用戶發mail,通過察看mail判斷任務是否完成。在系統出異常的情況下,syslogd會發給root用戶mail。因此root用戶的mail需要特別注意。

11. 進程監控:通過ps,prstat命令或/usr/dt/bin/sdtprocess工具監控特別消耗資源的進程。sdtprocess是圖形工具,可以按照cpu和mem的使用及執行時間排序。prstat統計系統的活動進程並按需要的順序排序。

12. 系統運行時間監控:uptime衡量一個機器開時長及系統負載的命令。uptime顯示的時間越大,說明機器越穩定。

13. 系統運行級別監控:who -r顯示當前機器的運行級

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章