cluster故障檢測時間如何更改?

火星人 @ 2014-03-04 , reply:0


cluster故障檢測時間如何更改?

請教,
cluster進行IP投票的時間間隔默認是幾秒?投幾次票才會將故障節點隔離。
該 如何修改默認的值,謝謝各位大師!!

<?xml version="1.0" ?>
<cluster config_version="2" name="gfs_cluster">
        <quorumd interval="1" label="qdisk_gfs" min_score="3" tko="10" votes="3">
                <heuristic interval="2" program="ping 192.168.1.1" score="1"/>
        </quorumd>
        <fence_daemon post_fail_delay="0" post_join_delay="3"/>
        <clusternodes>
                <clusternode name="rhela" nodeid="1" votes="1">
                        <fence>
                                <method name="1">
                                        <device name="fence1" nodename="rhela"/>
                                </method>
                        </fence>
                </clusternode>
                <clusternode name="rhelb" nodeid="2" votes="1">
                        <fence>
                                <method name="1">
                                        <device name="fence2" nodename="rhelb"/>
                                </method>
                        </fence>
                </clusternode>
        </clusternodes>
        <cman/>
        <fencedevices>
                <fencedevice agent="fence_manual" name="fence1"/>
                <fencedevice agent="fence_manual" name="fence2"/>
        </fencedevices>
        <rm>
                <failoverdomains>
                        <failoverdomain name="gfs_domain" ordered="0" restricted="0"/>
                </failoverdomains>
                <resources/>
        </rm>
</cluster>
《解決方案》

man cman

另外,你這個cluster.conf的qdisk配的有問題,qdisk的票數不足,肯定起不來。heuristic程序寫得也有問題。
《解決方案》

高人啊。qdisk確實不行。
        <quorumd interval="3" label="qdisk_gfs" min_score="3" tko="10" votes="1">
                <heuristic interval="2" program="ping -c 3 -t 2 192.168.1.1" score="1"/>
        </quorumd>

才兩個節點應該給一個權重就夠了吧,(1+1+1)/2  +1>=2 集群還是能正常運作的了。heuristic這樣改一樣應該就可以了吧!這裡面qdisk的故障投票時間為:3X10=30s

下面這一句應該就是100秒之後,fence節點?  但好像沒有次數?
在這種存在qdisk 的環境里,qdisk的投票時間和IP投票投票時間哪個為大好一些?
<cman deadnode_timeout="100" expected_nodes="3"/>

謝謝!!
《解決方案》

這個qdisk的設置還是不行,min_score應該不大於score。否則你的qdisk還是起不來。
另外,兩個點,就別要qdisk了。沒必要,而且麻煩多多。我看你的參數,應該用的是RHEL4的不知哪個版本。
《解決方案》

deadnode_timeout="100"
這是rhel4參數,鬱悶,我用的是rhel5的。那就是用不了了。
這個是做測試用的,不是為應用上的,所以就測了個qdisk來玩玩。
謝謝上的高人。
《解決方案》

RHEL5叫做totem token,去查cman吧。反正兩個點別用qdisk吧。。。。
《解決方案》

謝謝樓上的大師,等會兒再去把qdisk的測試做完。謝謝!!



[火星人 via ] cluster故障檢測時間如何更改?已經有203次圍觀

http://www.coctec.com/docs/service/show-post-5701.html