歡迎您光臨本站 註冊首頁

rhel 6 雙機 fence時兩台主機執行關機

←手機掃碼閱讀     火星人 @ 2014-03-04 , reply:0

rhel 6 雙機 fence時兩台主機執行關機

rhel6 安完雙機后,拔掉心跳后,兩台主機發生fence,fence結果是兩台主機都關機,是什麼原因導致?
《解決方案》

當心跳失效的時候,就發生了split-brain。正常情況下,節點A和節點B通過心跳檢測對方是否活著,當檢測不到對方時,就接管相應的資源。如果節點A和節點B的心跳斷開,而實際上節點A和節點B都是active,兩個節點同時都要去接管資源,這時就發生了split-brain現象。
《解決方案》

sinxadmin 發表於 2012-10-31 21:31 static/image/common/back.gif
當心跳失效的時候,就發生了split-brain。正常情況下,節點A和節點B通過心跳檢測對方是否活著,當檢測不到對 ...

這個我知道,以前做過都是一方發生重啟,另一方接管資源,但現在做完是兩台機器都進行了關機操作,是關機,而不是重啟呃。。。。
《解決方案》

手動可以重啟嗎?有時候伺服器在啟動的時候需要按個任意鍵才能繼續啟動。另外使用什麼fence設備。
《解決方案》

sinxadmin 發表於 2012-11-01 17:17 static/image/common/back.gif
手動可以重啟嗎?有時候伺服器在啟動的時候需要按個任意鍵才能繼續啟動。另外使用什麼fence設備。

手動是可以的,而且伺服器是關機了,不是開機時按任意鍵的問題,使用IPMI做的fence
《解決方案》

配置是怎樣的?
《解決方案》

配置quoram disk 看看吧
《解決方案》

只有一條心跳線?

還是做bonding兩條都拔了?

《解決方案》

回復 1# gutou888


你心跳和FENCE的網路拓撲是怎樣對?一般fence信號是從心跳口發出去對,拔掉了心跳的網線應該有一邊對fence發不出去,兩邊都關機不太正常。
《解決方案》

你是在集群正常的情況下拔的心跳線么?
出現你說的現象, 有點象是兩台機器都是 slave, 沒有 primary時的情況. 這個時候如果心跳斷了, 兩台機器都認為對方down機了, 都要去接管資源, 所以, 會fence掉對方.

另外, 你的fence要看一下, 一般應該是配置成 reboot, 而不是 shutdown 才對.

很久不玩HA了, 不知道是不是有新變化. 說錯了請忽略.

[火星人 ] rhel 6 雙機 fence時兩台主機執行關機已經有255次圍觀

http://coctec.com/docs/service/show-post-4303.html