歡迎您光臨本站 註冊首頁

Nagios飛信報警不正常

←手機掃碼閱讀     火星人 @ 2014-03-03 , reply:0

Nagios飛信報警不正常

我的nagios報警方式為飛信     現在的問題是有時候能報警,有時候就沒有任何反應       麻煩路過的指點一二   謝謝了
《解決方案》

呵呵,這問題提的好,我相信沒誰能分析出來原因 :)
《解決方案》

回復 2# chenl


久聞石頭兄大名,之前在劉宇博客中看到過你的名字,而且也去過你的BBS   呵呵
我開始以為是版本的問題  但是換了版本后還是這樣



commands.cfg添加的內容如下   
# 'notify-host-by-fei' command definition
define command {
             command_name            host-notify-by-fetion
             command_line            /usr/local/fetion/fetion --mobile=13511111111 --pwd=luwenju0518 --
to=$CONTACTPAGER$ --msg-utf8="Host $HOSTSTATE$ alert for $HOSTNAME$! on '$LONGDATETIME$'" $CONTACTPAGER
$
             }
# 'notify-service-by-fei' command definition
define command {
             command_name         service-notify-by-fetion
             command_line         /usr/local/fetion/fetion --mobile=13511111111 --pwd=luwenju0518 --to=
$CONTACTPAGER$ --msg-utf8="$HOSTADDRESS$ $HOSTALIAS$/$SERVICEDESC$ is $SERVICESTATE$ on $LONGDATETIME$"
$CONTACTPAGER$
             }


contacts.cfg聯繫人設置的如下
define contact{
        contact_name              nagiosadmin
        use                             generic-contact
        alias                           Nagios Admin
       host_notification_period        24x7
       service_notification_period     24x7
       host_notification_options       d,r
       service_notification_options    c,w,r
         service_notification_commands   service-notify-by-fetion
        host_notification_commands      host-notify-by-fetion
        pager                           1351111111111
        }


監控的主機的配置文件如下
define host {
use linux-server
host_name win2003
alias win2003
check_command check-host-alive
address 192.168.0.13
                  }

define hostgroup {
hostgroup_name win2003
alias win2003
members win2003
                  }

define service {
use generic-service
host_name win2003
service_description PING
check_command check_ping!100.0,20%!500.0,60%
                      }






麻煩石頭兄指點一下
《解決方案》

回復 3# luwenju

過獎了,沒什麼大名 :)

沒有任何反應的時候,檢測可以從以下三個方面入手:

1)確認nagios的notification是否正常發出,nagios的log中可以查到相關的記錄;
2)最好把你的fetion相關的腳本加上debug選項,調試的時候把日誌打開,可以確認fetion介面是否正常調用,是否正常發送;
3)如果以上兩個步驟都正常,那就看看fetion那邊是否有問題。
《解決方案》

我想,如果nagios可以正常出發告警(比如先用郵件或其他程序代替飛信),那麼就要檢查飛信是否有問題了

個人覺得可能飛信的問題大一點

p.s. 目前公司使用簡訊網關,但是我有點傾向於直接觸發GSM Modem,因為這樣幾乎沒有閃失(除非通信運營商數據掛了,但這種可能很小,個人也只經歷過一次)
《解決方案》

原來也用過libfetion,感覺簡訊丟失率沒這麼高吧,應該在95%左右吧,延遲也還好,一般10秒內基本能收到(移動簡訊隊列不堵的時候),不知道現在飛信的丟失率咋樣了,不過據說飛信1各月只能發5000條吧,至於每天是否有限制就不清楚了

[火星人 ] Nagios飛信報警不正常已經有466次圍觀

http://coctec.com/docs/service/show-post-2743.html