歡迎您光臨本站 註冊首頁

RHCS反覆重新啟動。

←手機掃碼閱讀     火星人 @ 2014-03-04 , reply:0

RHCS反覆重新啟動。

2台Dell 1950伺服器,RHEL5.4 64位系統,使用了iscsi存儲,sdb1,Mount至/mnt/ps5000-1 。Fencing設備為Dell DRAC。
                              eth0                   eth1(iscsi)        drac
伺服器1: RHCS1 192.168.1.81     10.10.0.81      192.168.1.222  
伺服器2: RHCS2  192.168.1.82     10.10.0.82     192.168.1.224
虛擬IP:192.168.1.83

配置完成後,使用clustat查看,現在狀態一直在嘗試啟動中:
# clustat
Cluster Status for rhcsha @ Wed Jun 22 15:42:23 2011
Member Status: Quorate

Member Name                             ID   Status
------ ----                             ---- ------
rhcs1                                       1 Online, rgmanager
rhcs2                                       2 Online, Local, rgmanager

Service Name                   Owner (Last)                   State         
------- ----                   ----- ------                   -----         
service:rhcs-service           rhcs1                          starting      
#

附上cluster.conf和message文件供參考。
《解決方案》

回復 1# qinershi


    看你的配置文件中沒有配置腳本,你日誌里怎麼有?
Jun 22 15:27:34 rhcs2 clurgmgrd: : <err> script:rhcs-script: start of /etc/rc.d/init.d/httpd failed (returned 1)
Jun 22 15:27:34 rhcs2 clurgmgrd: <notice> start on script "rhcs-script" returned 1 (generic error)
Jun 22 15:27:34 rhcs2 clurgmgrd: <warning> #68: Failed to start service:rhcs-service; return value: 1
《解決方案》

回復 2# tanyangxf

第一次配置時加了Httpd腳本,但沒有配置apache,就開始測試HA功能,因此就把腳本給取消了,資源里只有共享存儲和IP。我晚上再嘗試配置好Apache后測試一次。
《解決方案》

回復 3# qinershi


    看了下,那是你最後的日誌啊,去掉腳本之後cman重啟過沒?
《解決方案》

又重新看了下配置,貌似沒有保存成功。現在狀態正常了。
# clustat
Cluster Status for rhcsha @ Wed Jun 22 21:26:23 2011
Member Status: Quorate

Member Name                             ID   Status
------ ----                             ---- ------
rhcs1                                       1 Online, Local, rgmanager
rhcs2                                       2 Online, rgmanager

Service Name                   Owner (Last)                   State         
------- ----                   ----- ------                   -----         
service:rhcs-service           rhcs1                          started      

在RHCS1重啟時,可以切換至RHCS2了,使用PING命令檢測,大約丟了4個包。
但重啟RHCS2時,Owner不會轉移到RHCS1,觀察了10分鐘,虛擬IP仍舊無法PING通。
《解決方案》

繼續分析,分現RHCS1上的Rgmanager服務沒有自動啟動,導致無法自動切換。再次測試,目前正常了。
《解決方案》

回復 6# qinershi


    改了配置之後,必須重啟cman服務,一切正常之後在啟動rgmanager服務,如果資源沒起來,看日誌,出了什麼問題,一個一個資源去掉,看能不能啟動。直到找到那個不能啟動的資源為止,然後找原因:mrgreen:
《解決方案》

回復 7# tanyangxf


    多謝指點。繼續研究ing
《解決方案》

回復  qinershi


    改了配置之後,必須重啟cman服務,一切正常之後在啟動rgmanager服務,如果資源沒 ...
tanyangxf 發表於 2011-06-22 23:05 http://bbs.chinaunix.net/images/common/back.gif


    總結的給力,幫頂!
《解決方案》

  總結的給力,幫頂!

[火星人 ] RHCS反覆重新啟動。已經有530次圍觀

http://coctec.com/docs/service/show-post-4424.html