伺服器硬體監控方式
伺服器硬體監控使用方式比較好?監控內存條是否壞了,CPU是否有問題了等等。
《解決方案》
我的伺服器是惠普的,利用ipmitool工具調用ilo介面監控伺服器硬體,在linux下寫成shell腳本定時監控報警。監控CPU,電源,內存,風扇,網卡……都可以
《解決方案》
太高檔了,我就用lm_sensors 監控一下cpu主板溫度啥的。
《解決方案》
一般伺服器好像自帶的有監控工具吧
《解決方案》
高級貨,硬體管理里配置一下就可以
《解決方案》
有現成的,也可以自己寫.
1,HP伺服器
安裝HP的PSP包,有hpasmcli可以對主板的各種信息進行提取,hpacucli可以對RAID卡的各種信息進行提取,如果你使用nagios監控,也以安裝check_hpasm插件,功能極完善.
2,DELL伺服器
安裝DELL官方的openmanage軟體包,可以使用check_openmanage插件.
《解決方案》
openmanage需要額外安裝嗎
dell上的esxi的監控有人做過嗎
《解決方案》
回復 2# GangLin_Lan
求ipmitool的使用方法和腳本,謝謝!
《解決方案》
想要發現硬體是否有壞可以用ipmitool 找 system log:
ipmitool -H 172.16.2.229 -U root -P xxxx sel elist
將會得到以下信息:
8 | 10/18/2012 | 14:38:24 | Memory Mem ECC Warning | Transition to Non-critical from OK
9 | 10/25/2012 | 17:33:22 | Memory Mem ECC Warning | Transition to Critical from less severe
這其實已經表明內存有壞了!
《解決方案》
回復 6# dgvri
nagios看來還是比較主流的{:3_188:}