cluster故障檢測時間如何更改?
請教,
cluster進行IP投票的時間間隔默認是幾秒?投幾次票才會將故障節點隔離。
該 如何修改默認的值,謝謝各位大師!!
<?xml version="1.0" ?>
<cluster config_version="2" name="gfs_cluster">
<quorumd interval="1" label="qdisk_gfs" min_score="3" tko="10" votes="3">
<heuristic interval="2" program="ping 192.168.1.1" score="1"/>
</quorumd>
<fence_daemon post_fail_delay="0" post_join_delay="3"/>
<clusternodes>
<clusternode name="rhela" nodeid="1" votes="1">
<fence>
<method name="1">
<device name="fence1" nodename="rhela"/>
</method>
</fence>
</clusternode>
<clusternode name="rhelb" nodeid="2" votes="1">
<fence>
<method name="1">
<device name="fence2" nodename="rhelb"/>
</method>
</fence>
</clusternode>
</clusternodes>
<cman/>
<fencedevices>
<fencedevice agent="fence_manual" name="fence1"/>
<fencedevice agent="fence_manual" name="fence2"/>
</fencedevices>
<rm>
<failoverdomains>
<failoverdomain name="gfs_domain" ordered="0" restricted="0"/>
</failoverdomains>
<resources/>
</rm>
</cluster>
《解決方案》
man cman
另外,你這個cluster.conf的qdisk配的有問題,qdisk的票數不足,肯定起不來。heuristic程序寫得也有問題。
《解決方案》
高人啊。qdisk確實不行。
<quorumd interval="3" label="qdisk_gfs" min_score="3" tko="10" votes="1">
<heuristic interval="2" program="ping -c 3 -t 2 192.168.1.1" score="1"/>
</quorumd>
才兩個節點應該給一個權重就夠了吧,(1+1+1)/2 +1>=2 集群還是能正常運作的了。heuristic這樣改一樣應該就可以了吧!這裡面qdisk的故障投票時間為:3X10=30s
下面這一句應該就是100秒之後,fence節點? 但好像沒有次數?
在這種存在qdisk 的環境里,qdisk的投票時間和IP投票投票時間哪個為大好一些?
<cman deadnode_timeout="100" expected_nodes="3"/>
謝謝!!
《解決方案》
這個qdisk的設置還是不行,min_score應該不大於score。否則你的qdisk還是起不來。
另外,兩個點,就別要qdisk了。沒必要,而且麻煩多多。我看你的參數,應該用的是RHEL4的不知哪個版本。
《解決方案》
deadnode_timeout="100"
這是rhel4參數,鬱悶,我用的是rhel5的。那就是用不了了。
這個是做測試用的,不是為應用上的,所以就測了個qdisk來玩玩。
謝謝上的高人。
《解決方案》
RHEL5叫做totem token,去查cman吧。反正兩個點別用qdisk吧。。。。
《解決方案》
謝謝樓上的大師,等會兒再去把qdisk的測試做完。謝謝!!