Nagios飛信報警不正常
我的nagios報警方式為飛信 現在的問題是有時候能報警,有時候就沒有任何反應 麻煩路過的指點一二 謝謝了
《解決方案》
呵呵,這問題提的好,我相信沒誰能分析出來原因 :)
《解決方案》
回復 2# chenl
久聞石頭兄大名,之前在劉宇博客中看到過你的名字,而且也去過你的BBS 呵呵
我開始以為是版本的問題 但是換了版本后還是這樣
commands.cfg添加的內容如下
# 'notify-host-by-fei' command definition
define command {
command_name host-notify-by-fetion
command_line /usr/local/fetion/fetion --mobile=13511111111 --pwd=luwenju0518 --
to=$CONTACTPAGER$ --msg-utf8="Host $HOSTSTATE$ alert for $HOSTNAME$! on '$LONGDATETIME$'" $CONTACTPAGER
$
}
# 'notify-service-by-fei' command definition
define command {
command_name service-notify-by-fetion
command_line /usr/local/fetion/fetion --mobile=13511111111 --pwd=luwenju0518 --to=
$CONTACTPAGER$ --msg-utf8="$HOSTADDRESS$ $HOSTALIAS$/$SERVICEDESC$ is $SERVICESTATE$ on $LONGDATETIME$"
$CONTACTPAGER$
}
contacts.cfg聯繫人設置的如下
define contact{
contact_name nagiosadmin
use generic-contact
alias Nagios Admin
host_notification_period 24x7
service_notification_period 24x7
host_notification_options d,r
service_notification_options c,w,r
service_notification_commands service-notify-by-fetion
host_notification_commands host-notify-by-fetion
pager 1351111111111
}
監控的主機的配置文件如下
define host {
use linux-server
host_name win2003
alias win2003
check_command check-host-alive
address 192.168.0.13
}
define hostgroup {
hostgroup_name win2003
alias win2003
members win2003
}
define service {
use generic-service
host_name win2003
service_description PING
check_command check_ping!100.0,20%!500.0,60%
}
麻煩石頭兄指點一下
《解決方案》
回復 3# luwenju
過獎了,沒什麼大名 :)
沒有任何反應的時候,檢測可以從以下三個方面入手:
1)確認nagios的notification是否正常發出,nagios的log中可以查到相關的記錄;
2)最好把你的fetion相關的腳本加上debug選項,調試的時候把日誌打開,可以確認fetion介面是否正常調用,是否正常發送;
3)如果以上兩個步驟都正常,那就看看fetion那邊是否有問題。
《解決方案》
我想,如果nagios可以正常出發告警(比如先用郵件或其他程序代替飛信),那麼就要檢查飛信是否有問題了
個人覺得可能飛信的問題大一點
p.s. 目前公司使用簡訊網關,但是我有點傾向於直接觸發GSM Modem,因為這樣幾乎沒有閃失(除非通信運營商數據掛了,但這種可能很小,個人也只經歷過一次)
《解決方案》
原來也用過libfetion,感覺簡訊丟失率沒這麼高吧,應該在95%左右吧,延遲也還好,一般10秒內基本能收到(移動簡訊隊列不堵的時候),不知道現在飛信的丟失率咋樣了,不過據說飛信1各月只能發5000條吧,至於每天是否有限制就不清楚了