- #!/bin/bash
- #提取本服務器的IP地址信息
- IP=`ifconfig eth0 | grep "inet addr" | cut -f 2 -d ":" | cut -f 1 -d " "`
- #提取本服務器CPU數量
- cpu_num=`grep -c 'model name' /proc/cpuinfo`
- count_uptime=`uptime |wc -w`
- #當前系統15分鐘的平均負載值
- load_15=`uptime | awk '{print $'$count_uptime'}'`
- #獲取當前系統單個核心15分鐘的平均負載值,結果小於1.0時前面個位數補0
- average_load=`echo "scale=2;a=$load_15/$cpu_num;if(length(a)==scale(a)) print 0;print a" | bc`
- #取上面平均負載值的個位整數
- average_int=`echo $average_load | cut -f 1 -d "."`
- #獲取執行shell輸入的警告值(0-100以內)
- warn_input=$1
- if [[ ! $warn_input =~ ^[0-100]+$ ]]
- then
- exit 0
- else
- if [[ "$warn_input" -lt 0 || "$warn_input" -gt 100 ]]
- then
- exit 0
- else
- load_warn=$(($warn_input/100))
- fi
- fi
- if [ $average_int -gt 0 ]
- then
- echo "$IP服務器單個核心15分鐘的平均負載爲$average_load,超過警戒值1.0,請立即處理!!!$(date +'%Y-%m-%d %H:%M:%S')"
- else
- load_now=`expr $average_load \> $load_warn`
- if [ $load_now -eq 1 ]
- then
- echo "$IP服務器單個核心15分鐘的平均負載爲$average_load,超過警戒值0.7,請立即處理!!!$(date +'%Y-%m-%d %H:%M:%S')"
- else
- echo "$IP服務器單個核心15分鐘的平均負載值爲$average_load,cpu核心數爲$cpu_num,系統15分鐘的平均負載爲$load_15 負載正常 $(date +'%Y-%m-%d %H:%M:%S')"
- fi
- fi
執行方法 sh 腳本 閥值(0-100整數)