歡迎您光臨本站 註冊首頁

系統自動監控報警

←手機掃碼閱讀     火星人 @ 2014-03-03 , reply:0

系統自動監控報警

 

目前伺服器比較多,經常出問題,領導要求寫個腳本,進行自動監控並郵件報警
由於本人對腳本不是很懂,請各位大俠幫忙忙,寫個腳本

需求:
監控項目:
1.CPU
2.內存
3.硬碟
設置鍵值,超出設定鍵值郵件報警
3.進程:進程是否正常運行,如果進程異常,發送郵件報警並自動重啟
4.文件變更(監控每天是否生產文件,如果沒有生成文件,郵件報警)
5.判定log日誌是否有error如果有error郵件報警,目前日誌輪迴7天,每天判定一次

各位大俠跪求。
《解決方案》

回復 1# gzhgyzhh


    直接nagios
《解決方案》

腳本沒什麼複雜的.

簡單的說, 腳本就是命令的集合. 如果你每個命令都知道, 簡單的寫在一起就算是腳本了. 當然, 中間要加上適當的輸出, 轉存, 判斷之類的.

建議先從簡單的功能入手, 一個個功能加進去.

另外, 不建議 nagios, 一個看上去很美的東西, 卻掩蓋了很多細節, 而且, 本身越做越複雜了. 等你對你的系統有一點的了解, 再考慮吧.
《解決方案》

如果新手安裝配置nagios確實有點難度,不過現在一鍵全自動安裝的,非常適合新手使用,你可以參考
http://bbs.chinaunix.net/thread-4046303-1-1.html
《解決方案》

感謝各位提的建議,我會考慮的,不過有哪位大俠有現成的監控腳本,貼出了,小生不勝感激。
《解決方案》

nagios吧,監控功能還是很強大的。nagios前3項之都能滿足,後面3項需要自己在寫監控腳本了。
《解決方案》

cacti 也可以做到你的前3個,後面的也需要自己寫了
《解決方案》

哥們還是用nagios,我花了兩個周的時間剛配置好,至於你要現成的腳本,我覺得不好,他們寫好的腳本肯定和你的環境不一樣,你改腳本的時間也把nagios配好了
《解決方案》


判定CPU和內存,哪位哥們有也共享下:

echo "TIME CPU     %user     %nice   %system   %iowait    %steal     %idle " >> $ANSWER
sar | grep 'Average:'  >> $ANSWER
cpuused=`sar | grep 'Average:' | awk '{print$3}'` if [ $cpuused -gt $CPUUSEDERR ] then
   echo "NOW CPU USERD $cpuused > 15% ,NG"  >> $ANSWER
   FLAG=NG
else
  echo "NOW CPU USERD $cpuused < 15% ,OK" >> $ANSWER fi cpuidle=`sar | grep 'Average:' | awk '{print$8}'` if [ $cpuidle -lt 80 ] then
   echo "NOW CPU idle $cpuidle < 80% ,NG" >> $ANSWER
   FLAG=NG
else
   echo "NOW CPU idle $cpuidle > 80% ,OK" >> $ANSWER fi #sar >> $ANSWER echo >> $ANSWER echo "NOW  ATLAS HDD used is:" >> $ANSWER
echo "Filesystem           1K-blocks      Used Available Use% Mounted on" >> $ANSWER
《解決方案》

強烈推薦 nagios

[火星人 ] 系統自動監控報警已經有395次圍觀

http://coctec.com/docs/service/show-post-320.html