rhcs 5.1 集群問題 急

火星人 @ 2014-03-04 , reply:0
←手機掃碼閱讀

rhcs 5.1 集群問題 急

:em02: 各位老大:
   
      下面是我的步驟:
      1、配置/etc/hosts文件
       # Do not remove the following line, or various programs
           # that require network functionality will fail.
          127.0.0.1          localhost.localdomain  localhost
          172.168.168.171    node_o.localdomain     node_o(第一個節點)
          172.168.168.172    node_t.localdomain     node_t(第二個節點)
          172.168.168.173    server.localdomain     server(gfs文件伺服器)
          172.168.168.175    ha.localdomain         ha (對外所見的ip)
~
          2、配置cluster。conf
         <?xml version="1.0"?>
        <cluster config_version="1" name="cluster_test">
         <fence_daemon post_fail_delay="0" post_join_delay="3"/>
        <clusternodes>
         <clusternode name="node_o" nodeid="1" votes="1">
           <fence>
             <method name="1">
              <device name="F-Man" nodename="node_o" ipaddr="192.168.168.171"/>
              </method>
            </fence>
         </clusternode>
         <clusternode name="node_t"  nodeid="2" votes="1">
            <fence>
              <method name="1">
                <device name="F-Man" nodename="node_t" ipaddr="192.168.168.172"/>
               </method>
             </fence>
         </clusternode>
        </clusternodes>
        <cman expected_votes="1" two_node="1"/>
        <fencedevices>
                <fencedevice agent="fence_manual" name="F-Man"/>
        </fencedevices>
        <rm>
             <failoverdomains>
                 <failoverdomain name="web_failover" ordered="0" restricted="0">
                    <failoverdomainnode name="node_o" priority="1"/>
                    <failoverdomainnode name="node_t" priority="1"/>
                  </failoverdomain>
             </failoverdomains>
             <resources>
                 <ip address="192.168.168.175" monitor_link="1"/>
                 <clusterfs device="/dev/gnbd/gfs" force_unmount="0" fstype="gfs" mountpoint="/gfs" name="web_content" options="-t gfs"/>
             </resources>
             <service autostart="1" domain="web_failover" name="web" recovery="relocate">
                <ip ref="192.168.168.175"/>
                <script file="/etc/init.d/httpd" name="httpd"/>
                <clusterfs ref="web_content"/>
              </service>
        </rm>
</cluster>
              3、沒有導入和導出gfs,直接運行
                   service ccsd start
                   service cman start
    問題就出現了,啟動cman 時提示:
         Starting cluster:
              Loading modules... done
              Mounting configfs... done
              Starting ccsd... done
              Starting cman... failed
              cman not started: Can't find local node name in cluster.conf /usr/sbin/cman_tool: aisexec daemon didn't start
               各位老大,請問誰知道是什麼原因啊,謝謝大家了!
《解決方案》

自己頂一下

請問是不是先要配置gfs文件的原因呢,但是我的得兩個機子互聯測試的話,應該不需要文件系統啊,謝謝了
《解決方案》

再頂

我覺得關鍵是 local node name 的問題,但是我反反覆複檢查,名字沒有錯誤的啊,鬱悶
《解決方案》

弄了半天,結果可能是主機名的問題  
我現在兩台機器互ping ip都能成功   但是一把ip換成主機名就不行了 我的/etc/hosts  /etc/sysconfig/network  兩個文件都改了主機名  ping 的時候也能把主機名解析成ip地址 單就是ping主機名有發包沒有回包
但是一直想不通為什麼~~~~~~~~~~~~
《解決方案》

暈死 找到原因了

原因找到了,我要暈死了,犯了個低級錯誤,hosts文件里的ip和cluster.conf裡面的ip不一樣  暈死  徹底暈死
《解決方案》

感謝分享,呵呵   !
《解決方案》

:lol: :lol: :lol: :lol: :lol:




[火星人 via ] rhcs 5.1 集群問題 急已經有141次圍觀

http://www.coctec.com/docs/service/show-post-7528.html