RHCS產生錯誤,哪位大神幫個忙

火星人 @ 2014-03-04 , reply:0


RHCS產生錯誤,哪位大神幫個忙

RHCS配置http高可用性:有節點1和節點2,倆個節點,在luci添加集群資源后,發現http服務未在群集中,且發現節點2重起后,未能重新回到集群中,產生情況如下圖
哪位大神有什麼RHCS的詳細配置:不要光命令
《解決方案》

我最近也在弄這玩意兒、  兄弟那兒有什麼好的參考資料嗎? 有的話給我整點兒唄
《解決方案》

你的系統是什麼版本的?
用system-config-cluster去配置會比較清晰點。
《解決方案》

回復 3# jessikey


    回復 3# jessikey


    回復 3# jessikey


    我用的是centos6.3 64位的系統,
兩個node是在這個系統里用KVM做的 、  manager和存儲是另一台centos6.2 32位的系統

目前卡在fence這塊兒、 我模擬node1網卡故障,在node2端總是無法成功fence掉node1
現在試了幾個fence類型:
        Name                Fence Type                       Nodes Using        Hostname
        kvm_fence        APC Power Device                        0                192.168.198.201
        fence_virt_m        xvm Virtual Machine Fencing        0       
        wti-fence                WTI Power Device                        2                192.168.198.201
都不能成功fence掉故障node。
在node2的日誌:
Apr 11 17:41:38 kvm02 corosync:    A processor failed, forming new configuration.
Apr 11 17:41:40 kvm02 corosync:    Members: 2
Apr 11 17:41:40 kvm02 corosync:    A processor joined or left the membership and a new membership was formed.
Apr 11 17:41:40 kvm02 corosync:    chosen downlist: sender r(0) ip(192.168.198.212) ; members(old:2 left:1)
Apr 11 17:41:40 kvm02 corosync:    Completed service synchronization, ready to provide service.
Apr 11 17:41:40 kvm02 kernel: dlm: closing connection to node 1
Apr 11 17:41:40 kvm02 fenced: fencing node kvm01
Apr 11 17:41:40 kvm02 rgmanager: State change: kvm01 DOWN
Apr 11 17:41:44 kvm02 fenced: fence kvm01 dev 0.0 agent fence_wti result: error from agent
Apr 11 17:41:44 kvm02 fenced: fence kvm01 failed
Apr 11 17:41:47 kvm02 fenced: fencing node kvm01
Apr 11 17:41:50 kvm02 fenced: fence kvm01 dev 0.0 agent fence_wti result: error from agent
Apr 11 17:41:50 kvm02 fenced: fence kvm01 failed
Apr 11 17:41:53 kvm02 fenced: fencing node kvm01
Apr 11 17:41:56 kvm02 fenced: fence kvm01 dev 0.0 agent fence_wti result: error from agent
Apr 11 17:41:56 kvm02 fenced: fence kvm01 failed
Apr 11 17:42:49 kvm02 ntpd: synchronized to 218.75.4.130, stratum 2
Apr 11 17:44:07 kvm02 kernel: INFO: task rgmanager:8682 blocked for more than 120 seconds.
Apr 11 17:44:07 kvm02 kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.


目前還在迷茫中,不知道兄台你在fence設備上是怎麼處理的?是什麼環境,添加的是什麼類型的fence設備 ...
希望兄台多多指教! 感謝!感謝!
《解決方案》

這是因為虛擬設備沒有fence卡造成的,
出現故障后,節點1想fence掉另一個有問題的節點2,可是fence不掉對方
fence卡原理:fence掉有問題的節點后,fence卡會返回一個值
由於沒有fence設備,所以節點1得不到返回的值,所以無法接管服務
《解決方案》

一般搭建思路是先配置好fence,手動fence沒問題了,再建立ha集群。
《解決方案》

額 RHCS 好久沒弄過的東西了 關注啊....
《解決方案》

fence_vmware 是需要登錄到vm的管理伺服器上去fence 節點的

kvm—fence 應該也是這個原理




[火星人 via ] RHCS產生錯誤,哪位大神幫個忙已經有196次圍觀

http://www.coctec.com/docs/service/show-post-4113.html