VMware Workstation 6.0 中Cluster配置指南
目錄
一、群集介紹... 3
二、群集專業(yè)術(shù)語(yǔ)... 3
三、實(shí)驗(yàn)環(huán)境介紹及要求... 4
1、拓?fù)鋱D... 4
2、軟件配置說明... 4
(1) DC軟件配置信息... 4
(2) Cluster Node A軟件配置信息... 4
(3) Cluster Node B軟件配置信息... 5
3、硬件配置要求... 5
(1) 網(wǎng)卡... 5
(2) 共享磁盤... 5
四、安裝群集前的準(zhǔn)備工作... 6
1、創(chuàng)建共享磁盤... 6
(1) 創(chuàng)建用來保存共享磁盤的目錄... 6
(2) 創(chuàng)建仲裁磁盤... 6
(3) 創(chuàng)建數(shù)據(jù)共享磁盤... 7
(4) 驗(yàn)證共享磁盤是否成功創(chuàng)建... 7
(5) 附加共享磁盤... 8
2、網(wǎng)絡(luò)及系統(tǒng)配置... 10
(1) 創(chuàng)建群集服務(wù)帳戶... 10
(2) 添加群集A記錄... 12
(3) ClusterNodeA上的共享磁盤配置... 12
(4) 網(wǎng)絡(luò)配置... 16
(5) ClusterNodeB上的共享磁盤配置... 21
五、安裝群集服務(wù)... 24
1、在A節(jié)點(diǎn)上新建一個(gè)群集... 24
2、將B節(jié)點(diǎn)加入現(xiàn)有群集... 29
六、配置群集服務(wù)... 35
1、群集網(wǎng)絡(luò)配置... 35
2、心跳適配器優(yōu)先化... 37
3、仲裁磁盤配置... 38
4、創(chuàng)建一個(gè)啟動(dòng)延遲(此操作非必需)... 39
5、測(cè)試群集安裝... 40
七、故障轉(zhuǎn)移測(cè)試... 42
1、初級(jí)測(cè)試... 42
2、高級(jí)測(cè)試... 44
(1) 手工模擬故障1次... 44
(2) 手工連續(xù)模擬故障4次... 45
(3) 停止群集服務(wù)測(cè)試... 47
(4) 模擬意外斷電時(shí)故障轉(zhuǎn)移... 49
八、結(jié)束語(yǔ)... 50
一、群集介紹
服務(wù)器群集是一組協(xié)同工作并運(yùn)行Microsoft群集服務(wù)(Microsoft Cluster Service,MSCS)的獨(dú)立服務(wù)器。它為資源和應(yīng)用程序提供高可用性、故障恢復(fù)、可伸縮性和可管理性。它允許客戶端在出現(xiàn)故障和計(jì)劃中的暫停時(shí),依然能夠訪問應(yīng)用程序和資源。如果群集中的某一臺(tái)服務(wù)器由于故障或維護(hù)需要而無法使用,資源和應(yīng)用程序?qū)⑥D(zhuǎn)移到可用的群集節(jié)點(diǎn)上。
(說明:本文檔編寫的目的是為了幫助大家實(shí)現(xiàn)所關(guān)心的如何在VMWare Workstation中完成典型群集的配置步驟,不會(huì)具體的涉及到如何安裝群集應(yīng)用程序,如Exchange群集等)
二、群集專業(yè)術(shù)語(yǔ)
節(jié) 點(diǎn): 構(gòu)建群集的物理計(jì)算機(jī)
群集服務(wù): 運(yùn)行群集管理器或運(yùn)行群集必須啟動(dòng)的服務(wù)
資 源: IP地址、磁盤、服務(wù)器應(yīng)用程序等都可以叫做資源
共享磁盤: 群集節(jié)點(diǎn)之間通過光纖 SCSI 電纜等共同連接的磁盤柜或存儲(chǔ)
仲裁資源: 構(gòu)建群集時(shí),有一塊磁盤會(huì)用來仲裁信息,其中包括當(dāng)前的服務(wù)狀態(tài)各個(gè)節(jié)點(diǎn)的狀態(tài)以及群集轉(zhuǎn)移時(shí)的一些日志
資源狀態(tài): 主要指資源目前是處于聯(lián)機(jī)狀態(tài)還是脫機(jī)狀態(tài)
資源依賴: 資源之間的依存關(guān)系
組 : 故障轉(zhuǎn)移的最小單位
虛擬服務(wù)器: 提供一組服務(wù)--如數(shù)據(jù)庫(kù) 文件和打印共享等
故障轉(zhuǎn)移: 應(yīng)用從宕機(jī)的節(jié)點(diǎn)切換到正常聯(lián)機(jī)的節(jié)點(diǎn)
故障回復(fù): 某節(jié)點(diǎn)從宕機(jī)狀態(tài)轉(zhuǎn)為聯(lián)機(jī)狀態(tài)后,仍然繼續(xù)宕機(jī)前的工作,為其他節(jié)點(diǎn)分流
三、實(shí)驗(yàn)環(huán)境介紹及要求 1、拓?fù)鋱D
![clip_image002[4]](http://image4.360doc.com/DownloadImg/2009/6/28/163747_4066035_1.jpg)
2、軟件配置說明
(1) DC軟件配置信息
OS:Windows Server 2003 X86 SP1 中文企業(yè)版
Role: Active Directory域控制器
Domain:test.com
ServerName:DC.test.com
IP:192.168.0.254 (以“橋接”方式連接)
Netmask:255.255.255.0
Gateway:192.168.0.254
(2) Cluster Node A軟件配置信息
OS: Windows Server 2003 X86 SP1 中文企業(yè)版
Role: Member Server
ServerName:ClusterNodeA.test.com
IP1:192.168.0.1 (以“橋接”方式連接)
Netmask1:255.255.255.0
Gateway1:192.168.0.1
Dns1:192.168.0.254
IP2:10.0.0.1 (以“VMnet2”方式連接)
Netmask2:255.0.0.0
Gateway2:None
DNS2:None
(3) Cluster Node B軟件配置信息
OS: Windows Server 2003 X86 SP1 中文企業(yè)版
Role: Member Server
ServerName:ClusterNodeB.test.com
IP1:192.168.0.2
Netmask1:255.255.255.0
Gateway1:192.168.0.1 (以“橋接”方式連接)
Dns1:192.168.0.254
IP2:10.0.0.2 (以“VMnet2”方式連接)
Netmask2:255.0.0.0
Gateway2:None
DNS2:None
3、硬件配置要求
(1) 網(wǎng)卡
1) 群集中的每個(gè)節(jié)點(diǎn)需要有兩個(gè)網(wǎng)卡。一個(gè)用來連接您的公共網(wǎng)絡(luò),一個(gè)用來進(jìn)行群集節(jié)點(diǎn)間的通訊,俗稱“心跳連接”。
2) 心跳線必須通過交叉線直接連接群集節(jié)點(diǎn),不能通過任何路由設(shè)備。因?yàn)槿杭奶鴶?shù)據(jù)包的生存時(shí)間TTL值為1。我們知道,數(shù)據(jù)包在每經(jīng)過一個(gè)路由節(jié)點(diǎn)時(shí),TTL值都會(huì)減一。
(2) 共享磁盤
1) 除操作系統(tǒng)所在磁盤外,還需要兩個(gè)額外的SCSI磁盤。一個(gè)用來做仲裁磁盤,另一個(gè)用來充當(dāng)數(shù)據(jù)共享磁盤。
2) 共享磁盤必須位于系統(tǒng)驅(qū)動(dòng)器所用的控制器以外的另一個(gè)控制器上。不要和操作系統(tǒng)所在磁盤使用同一個(gè)總線。
3) 所有共享磁盤,包括仲裁磁盤,必須在物理上附加到一個(gè)共享總線。
4) 仲裁磁盤空間大小最小50 MB。為了得到最佳的NTFS文件系統(tǒng)性能,建議采用最小500 MB的磁盤分區(qū)。
5) 所有共享磁盤必須配置為基本磁盤,而不能為動(dòng)態(tài)磁盤。
6) 共享磁盤不支持軟件容錯(cuò),不要再試圖對(duì)共享磁盤做軟RAID。
7) 如果您使用的是64位版本的Windows Server 2003的系統(tǒng),需要注意的是,所有共享磁盤必須配置為主引導(dǎo)記錄(MBR),也就是建立主分區(qū)。也不要試圖配置為GPT磁盤,因?yàn)樗荒茏鳛槿杭疟P得到支持。
8) 群集磁盤上的所有分區(qū)必須格式化為NTFS。
9) 群集節(jié)點(diǎn)的操作系統(tǒng)必須采用同架構(gòu)的版本,不能節(jié)點(diǎn)A采用32位系統(tǒng),而節(jié)點(diǎn)B卻使用64位系統(tǒng)。
(說明:在本次實(shí)驗(yàn)中,模擬的SCSI共享磁盤柜均是通過VMware Workstation自帶的相關(guān)工具來創(chuàng)建)
四、安裝群集前的準(zhǔn)備工作 1、創(chuàng)建共享磁盤
(1) 創(chuàng)建用來保存共享磁盤的目錄
在本實(shí)驗(yàn)中,我在D:\Virtual Machines目錄下新建了一個(gè)ShareDisks文件夾,用來保存后面兩個(gè)操作建立的虛擬仲裁磁盤文件和數(shù)據(jù)磁盤文件。
(2) 創(chuàng)建仲裁磁盤
進(jìn)入VMware Workstation軟件安裝目錄,在命令提示符窗口敲入如下命令:
vmware-vdiskmanager.exe -c -s 600Mb -a lsilogic -t 2 “D:\Virtual Machines\ShareDisks”\Quorum.vmdk
![clip_image004[4]](http://image4.360doc.com/DownloadImg/2009/6/28/163747_4066035_2.jpg)
(3) 創(chuàng)建數(shù)據(jù)共享磁盤
進(jìn)入VMware Workstation軟件安裝目錄,在命令提示符窗口敲入如下命令:
vmware-vdiskmanager.exe -c -s 2Gb -a lsilogic -t 2 “D:\Virtual Machines\ShareDisks”\ShareDisk.vmdk
![clip_image006[4]](http://image4.360doc.com/DownloadImg/2009/6/28/163747_4066035_3.jpg)
(4) 驗(yàn)證共享磁盤是否成功創(chuàng)建
進(jìn)入D:\Virtual Machines\ShareDisks中,可以看到步驟2、3創(chuàng)建的4個(gè)虛擬磁盤文件。
![clip_image008[4]](http://image4.360doc.com/DownloadImg/2009/6/28/163747_4066035_4.jpg)
(5) 附加共享磁盤
通過前面的操作,我們已經(jīng)成功的創(chuàng)建了群集所需要的共享磁盤。接下來將虛擬磁盤文件附加到ClusterNodeA和ClusterNodeB上。
1) 進(jìn)入ClusterNodeA所對(duì)應(yīng)的虛擬系統(tǒng)目錄(不是虛擬機(jī)軟件安裝目錄),找到.vmx(VMware配置文件),用記事本打開,添加如下記錄:
disk.locking = "false"
diskLib.dataCacheMaxSize = "0"
scsi1.present = "TRUE"
scsi1.virtualDev = "lsilogic"
scsi1:5.present = "TRUE"
scsi1:5.fileName = "D:\Virtual Machines\ShareDisks\Quorum.vmdk"
scsi1:6.present = "TRUE"
scsi1:6.fileName = "D:\Virtual Machines\ShareDisks\ShareDisk.vmdk"
![clip_image010[4]](http://image4.360doc.com/DownloadImg/2009/6/28/163747_4066035_5.jpg)
2) 在ClusterNodeB上重復(fù)前一個(gè)操作,并做相應(yīng)的修改。
3) 關(guān)閉VMware Workstation軟件后再次打開,會(huì)發(fā)現(xiàn)先前創(chuàng)建的共享磁盤均附加到ClusterNodeA和ClusterNodeB上了。
![clip_image012[4]](http://image4.360doc.com/DownloadImg/2009/6/28/163747_4066035_6.jpg)
![clip_image014[4]](http://image4.360doc.com/DownloadImg/2009/6/28/163747_4066035_7.jpg)
從上兩個(gè)圖中可以看出:
1) 共享磁盤屬于SCSI通道1,和系統(tǒng)盤SCSI通道0不在一個(gè)共享總線上,符合集群需求
2) 共享磁盤的仲裁磁盤和數(shù)據(jù)磁盤均位于SCSI通道1上,亦符合集群需求
2、網(wǎng)絡(luò)及系統(tǒng)配置
(1) 創(chuàng)建群集服務(wù)帳戶
1) 群集服務(wù)需要一個(gè)屬于可運(yùn)行群集服務(wù)的每個(gè)節(jié)點(diǎn)上的本地管理員組成員的域用戶帳戶。因?yàn)榘惭b群集服務(wù)時(shí)需要用到這個(gè)用戶名和密碼,所以該用戶帳戶必須在配置群集服務(wù)前予以創(chuàng)建。該用戶帳戶只能專門用于運(yùn)行群集服務(wù),而不能屬于個(gè)人。建議該賬戶是普通域賬戶,而不是域管理員賬戶。
![clip_image016[4]](http://image4.360doc.com/DownloadImg/2009/6/28/163747_4066035_8.jpg)
2) 如下圖所示,必須勾選“密碼永不過期”,建議同時(shí)將“用戶不能更改密碼”勾選。當(dāng)然,如果您希望每次密碼到期前都手工重設(shè)密碼,以便在您的工作周報(bào)中多一個(gè)已完成的工作記錄,我不反對(duì)。
![clip_image018[4]](http://image4.360doc.com/DownloadImg/2009/6/28/163747_4066035_9.jpg)
3) 創(chuàng)建完畢后,再將其添加到各個(gè)節(jié)點(diǎn)的本地管理員組中即可。
![clip_image020[4]](http://image4.360doc.com/DownloadImg/2009/6/28/163747_4066035_10.jpg)
(2) 添加群集A記錄
如果您需要將運(yùn)行在群集服務(wù)上的應(yīng)用程序服務(wù)(該服務(wù)器即為虛擬服務(wù)器)以域名的形式對(duì)內(nèi)或?qū)ν獍l(fā)布,您可能需要在域控制器的DNS管理器中添加群集名的A記錄。例如,本次試驗(yàn)中,我給節(jié)點(diǎn)A和節(jié)點(diǎn)B通過群集虛擬出來的地址192.168.0.10分配一個(gè)對(duì)應(yīng)的A記錄名:ClusterTest.test.com
![clip_image022[4]](http://pubimage.360doc.com/wz/default.gif)
(3) ClusterNodeA上的共享磁盤配置
1) 啟動(dòng)ClusterNodeA(不要開啟ClusterNodeB,使其保持關(guān)閉狀態(tài)。這樣有助于保證附加到共享總線的磁盤上的數(shù)據(jù)不會(huì)丟失或遭到破壞。)
2) 打開ClusterNodeA 的“磁盤管理”,系統(tǒng)會(huì)自動(dòng)找到先前創(chuàng)建的兩個(gè)共享磁盤。進(jìn)入 “磁盤初始化和轉(zhuǎn)化向?qū)?#8221;
![clip_image024[4]](http://pubimage.360doc.com/wz/default.gif)
![clip_image026[4]](http://pubimage.360doc.com/wz/default.gif)
![clip_image028[4]](http://pubimage.360doc.com/wz/default.gif)
3) “新建磁盤分區(qū)”![clip_image030[4]](http://pubimage.360doc.com/wz/default.gif)
4) 選擇建立“主磁盤分區(qū)”。
![clip_image032[4]](http://pubimage.360doc.com/wz/default.gif)
5) 給仲裁磁盤分配一個(gè)約定成俗的驅(qū)動(dòng)器號(hào)Q。
![clip_image034[4]](http://pubimage.360doc.com/wz/default.gif)
6) 一定要格式化成為NTFS,同時(shí)把卷標(biāo)改成“Quorum”。![clip_image036[4]](http://pubimage.360doc.com/wz/default.gif)
7) 以上是對(duì)仲裁磁盤進(jìn)行操作,按照同樣的方法,對(duì)共享數(shù)據(jù)磁盤進(jìn)行操作。分配驅(qū)動(dòng)器號(hào)為R,卷標(biāo)名為Data。(具體過程略)。另外,需要補(bǔ)充一點(diǎn)的是,通常,驅(qū)動(dòng)器盤符“Q”用于仲裁磁盤,而“R”、“S”等字母則常用于數(shù)據(jù)磁盤。盡管您可以按照個(gè)人喜好隨意更改,但是建議采用約定成俗的規(guī)定。
8) 對(duì)共享磁盤的操作完成后,建議驗(yàn)證一下磁盤是否可讀寫。方法是新建一些文件后再刪除,看看是否都正常。
(4) 網(wǎng)絡(luò)配置
1) 為了接下來的實(shí)驗(yàn)更加直觀,建議把兩塊網(wǎng)卡進(jìn)行重命名操作。生產(chǎn)環(huán)境也推薦這樣操作。
![clip_image038[4]](http://pubimage.360doc.com/wz/default.gif)
2) Hearbeat Connection網(wǎng)卡(以下改稱為心跳網(wǎng)卡)的TCP/IP屬性如下。不要對(duì)心跳網(wǎng)卡設(shè)置默認(rèn)網(wǎng)關(guān)和DNS地址。
![clip_image040[4]](http://pubimage.360doc.com/wz/default.gif)
3) 按照下圖修改心跳網(wǎng)卡的高級(jí)TCP/IP屬性,目的是禁止心跳網(wǎng)卡的DNS和NetBios查詢。這樣能夠消除可能出現(xiàn)的通信問題,也有利于減少不必要的網(wǎng)絡(luò)流量。因?yàn)榉?wù)器群集節(jié)點(diǎn)間的通信對(duì)于群集的順暢運(yùn)轉(zhuǎn)至關(guān)重要。
![clip_image042[4]](http://pubimage.360doc.com/wz/default.gif)
![clip_image044[4]](http://pubimage.360doc.com/wz/default.gif)
4) 按照微軟官方推薦的做法,如果您擁有一個(gè)能夠以不同速度進(jìn)行傳輸?shù)木W(wǎng)卡,那么您應(yīng)該手動(dòng)指定同一個(gè)速度及雙工模式。不要對(duì)傳輸速度應(yīng)用自動(dòng)選擇設(shè)置,因?yàn)槟承┻m配器在確定速度時(shí)可能丟掉一些數(shù)據(jù)包。這直接影響到群集節(jié)點(diǎn)之間的通訊質(zhì)量。Microsoft建議您將同一路徑上的所有設(shè)備設(shè)定為“10 M”和“半雙工”。同時(shí),如果您的網(wǎng)卡支持Teaming冗余,而您又無法確保該特性和群集之間的兼容性時(shí),建議取消該特性。由于虛擬機(jī)無法對(duì)網(wǎng)卡的物理屬性進(jìn)行該類設(shè)置,如下圖所示。
![clip_image046[4]](http://pubimage.360doc.com/wz/default.gif)
故特意從生產(chǎn)環(huán)境HP服務(wù)器上截取了如下兩張圖來說明。
![clip_image047[4]](http://pubimage.360doc.com/wz/default.gif)
![clip_image048[4]](http://pubimage.360doc.com/wz/default.gif)
5) 至此,有關(guān)ClusterNodeA的前期網(wǎng)絡(luò)和系統(tǒng)的相關(guān)配置已結(jié)束。接下來按照類似的方法對(duì)ClusterNodeB進(jìn)行配置。
(5) ClusterNodeB上的共享磁盤配置
1) 關(guān)閉ClusterNodeA,開啟ClusterNodeB。在此期間,請(qǐng)保持ClusterNodeA處于關(guān)閉狀態(tài)。原因前面已經(jīng)說明,不再贅述。(請(qǐng)盡量按照下圖的方式關(guān)閉ClusterNodeA,而不只是簡(jiǎn)單的關(guān)閉系統(tǒng))
![clip_image050[4]](http://pubimage.360doc.com/wz/default.gif)
2) 打開ClusterNodeB的磁盤管理器,可以看到之前創(chuàng)建的共享磁盤同樣被系統(tǒng)發(fā)現(xiàn)了。只是由于Windows Server 2003系統(tǒng)的設(shè)計(jì)使然,沒有自動(dòng)為其分配驅(qū)動(dòng)器號(hào)。我們需要手工對(duì)它分配和ClusterNodeA相同的驅(qū)動(dòng)器號(hào)。
![clip_image052[4]](http://pubimage.360doc.com/wz/default.gif)
![clip_image053[4]](http://pubimage.360doc.com/wz/default.gif)
![clip_image055[4]](http://pubimage.360doc.com/wz/default.gif)
3) 為了實(shí)驗(yàn)的直觀性,建議將卷標(biāo)也進(jìn)行修改。卷標(biāo)名建議和ClusterNodeA上的保持一致。
![clip_image057[4]](http://pubimage.360doc.com/wz/default.gif)
4) 同樣,建議用同樣的方法驗(yàn)證一下磁盤是否可正常讀寫。
5) 至此,我們已完成兩個(gè)節(jié)點(diǎn)的網(wǎng)絡(luò)和系統(tǒng)相關(guān)配置。下面,我們開始進(jìn)入真正的群集服務(wù)安裝環(huán)節(jié)。
五、安裝群集服務(wù) 1、在A節(jié)點(diǎn)上新建一個(gè)群集
(1) 開啟ClusterNodeA,同時(shí)保持ClusterNodeB處于關(guān)閉狀態(tài)。展開ClusterNodeA的“開始”菜單,定位到“程序”à“管理工具”,打開“群集管理器”。
![clip_image059[4]](http://pubimage.360doc.com/wz/default.gif)
(2) 選擇“創(chuàng)建新群集”。
![clip_image061[4]](http://pubimage.360doc.com/wz/default.gif)
(3) 輸入您公司的域名和事先準(zhǔn)備好的群集名。如果有需要,在DNS中對(duì)該群集名建立對(duì)應(yīng)的A記錄。
![clip_image063[4]](http://pubimage.360doc.com/wz/default.gif)
(4) 輸入新群集中的第一個(gè)節(jié)點(diǎn)的計(jì)算機(jī)名,這里我們選擇ClusterNodeA
![clip_image065[5]](http://pubimage.360doc.com/wz/default.gif)
(5) 這時(shí)會(huì)對(duì)群集配置進(jìn)行一個(gè)完全分析。如果有任何一項(xiàng)無法通過檢測(cè),務(wù)必檢查原因、排除問題。故障排除后,不需要重新再來,只需點(diǎn)一下“重新分析”按鈕就行。
![clip_image067[5]](http://pubimage.360doc.com/wz/default.gif)
(6) 輸入群集的IP地址,該地址是ClusterNodeA和ClusterNodeB共同虛擬出來的群集IP。
其FQDN地址對(duì)應(yīng)于前面的ClusterTest.test.com.
![clip_image069[4]](http://pubimage.360doc.com/wz/default.gif)
(7) 輸入前面創(chuàng)建的群集服務(wù)賬號(hào)。該賬號(hào)可以不是域管理員,但是必須是各節(jié)點(diǎn)的本地管理員。
![clip_image071[4]](http://pubimage.360doc.com/wz/default.gif)
(8) 下圖是配置信息匯總。如果發(fā)現(xiàn)配置有錯(cuò)誤,可以點(diǎn)擊“上一步”進(jìn)行更改。否則點(diǎn)擊“下一步”,開始群集創(chuàng)建。
![clip_image073[4]](http://pubimage.360doc.com/wz/default.gif)
(9) 可以查看創(chuàng)建過程是否順利。一般來說,只要前面群集前的分析沒有問題,創(chuàng)建過程一般都不會(huì)有問題的。
![clip_image075[4]](http://pubimage.360doc.com/wz/default.gif)
(10) 完成新建服務(wù)器群集向?qū)?。至此,我們已?jīng)成功的在ClusterNodeA上配置了群集服務(wù)。
![clip_image077[4]](http://pubimage.360doc.com/wz/default.gif)
(11) 打開群集管理器,驗(yàn)證ClusterNodeA上的群集服務(wù)已成功安裝。資源所有者均為ClusterNodeA,并均處于聯(lián)機(jī)狀態(tài)。
![clip_image079[4]](http://pubimage.360doc.com/wz/default.gif)
2、將B節(jié)點(diǎn)加入現(xiàn)有群集
(1) 開啟ClusterNodeB節(jié)點(diǎn),同時(shí)不要關(guān)閉ClusterNodeA,否則無法加入現(xiàn)有群集。打開群集管理器,選擇“添加節(jié)點(diǎn)到群集”,“瀏覽”,找到之前創(chuàng)建的群集名ClusterTest。點(diǎn)擊“確定”。
![clip_image081[5]](http://pubimage.360doc.com/wz/default.gif)
(2) 進(jìn)入添加節(jié)點(diǎn)向?qū)А?/p>
![clip_image083[5]](http://pubimage.360doc.com/wz/default.gif)
(3) 選擇您要添加到現(xiàn)有群集的節(jié)點(diǎn)。我這里選擇ClusterNodeB。
![clip_image085[5]](http://pubimage.360doc.com/wz/default.gif)
(4) 同樣,節(jié)點(diǎn)加入前會(huì)進(jìn)行群集配置分析。如果分析結(jié)果中有任何問題,請(qǐng)著手解決后再往下繼續(xù)。
![clip_image087[5]](http://pubimage.360doc.com/wz/default.gif)
(5) 輸入群集服務(wù)賬號(hào)。
![clip_image089[7]](http://pubimage.360doc.com/wz/default.gif)
(6) 群集配置信息匯總,返回修改請(qǐng)點(diǎn)擊“上一步”,繼續(xù)請(qǐng)點(diǎn)擊“下一步”。
![clip_image091[12]](http://pubimage.360doc.com/wz/default.gif)
(7) 開始“添加節(jié)點(diǎn)到群集”的配置操作。
![clip_image093[9]](http://pubimage.360doc.com/wz/default.gif)
(8) 完成節(jié)點(diǎn)添加工作。
![clip_image095[5]](http://pubimage.360doc.com/wz/default.gif)
(9) 從下圖可以看出,ClusterNodeB已成功加入現(xiàn)有群集,目前處于運(yùn)行狀態(tài)。
![clip_image097[5]](http://pubimage.360doc.com/wz/default.gif)
(10) 至此,我們成功的在ClusterNodeA上新建了一個(gè)名為ClusterTest的群集,并成功將ClusterNodeB加入該群集中。
(11) 細(xì)心的您在ClusterNodeB加入到現(xiàn)有群集后,可能會(huì)發(fā)現(xiàn)無法在ClusterNodeB上訪問原有的共享磁盤。如下圖所示。不要奇怪,只是正?,F(xiàn)象。因?yàn)樵谌杭?wù)中,同一時(shí)刻只能有一個(gè)節(jié)點(diǎn)對(duì)資源擁有所有權(quán)。在我這個(gè)例子中,此刻仲裁磁盤的所有者是ClusterNodeA,所以ClusterNodeB無法訪問。反過來,如果所有者是ClusterNodeB,則會(huì)變成ClusterNodeA無法訪問共享磁盤。
![clip_image099[5]](http://pubimage.360doc.com/wz/default.gif)
六、配置群集服務(wù) 1、群集網(wǎng)絡(luò)配置
(1) 進(jìn)行專用網(wǎng)絡(luò)配置。打開群集管理器,單擊“群集配置”,單擊“網(wǎng)絡(luò)”,右鍵選擇Heartbeat的屬性。![clip_image100[5]](http://pubimage.360doc.com/wz/default.gif)
(2) 選擇“為群集使用啟用這個(gè)網(wǎng)絡(luò)”和“只用于內(nèi)部群集通訊(專用網(wǎng)絡(luò))”。
![clip_image102[5]](http://pubimage.360doc.com/wz/default.gif)
對(duì)上圖中的幾個(gè)選項(xiàng),我稍微做一下解釋:
為群集使用啟用這個(gè)網(wǎng)絡(luò): 如果選定了該復(fù)選框,群集服務(wù)將使用該網(wǎng)絡(luò)。默認(rèn)對(duì)所有網(wǎng)絡(luò)選定該復(fù)選框。
只用于客戶端訪問(公用網(wǎng)絡(luò)):如果您想讓群集服務(wù)僅使用該網(wǎng)絡(luò)適配器與其它客戶端進(jìn)行外部通信,那么選擇該選項(xiàng)。該網(wǎng)絡(luò)適配器將不進(jìn)行節(jié)點(diǎn)對(duì)節(jié)點(diǎn)通信。
只用于內(nèi)部群集通信(專用網(wǎng)絡(luò)):如果您想讓群集僅使用該網(wǎng)絡(luò)進(jìn)行節(jié)點(diǎn)對(duì)節(jié)點(diǎn)通信,那么選擇該選項(xiàng)。
所有通信(混合網(wǎng)絡(luò)):如果您想讓群集服務(wù)使用該網(wǎng)絡(luò)適配器進(jìn)行節(jié)點(diǎn)對(duì)節(jié)點(diǎn)通信和外部客戶端通信,那么選擇該選項(xiàng)。默認(rèn)對(duì)所有網(wǎng)絡(luò)選定該復(fù)選框。
在本次實(shí)驗(yàn)中,我們僅使用到了兩個(gè)網(wǎng)絡(luò):Public Connection和Heartbeat Connection。基于最常見的配置,我們將這兩個(gè)網(wǎng)絡(luò)分別作為混合網(wǎng)絡(luò)和專用網(wǎng)絡(luò)。
(3) 同樣,進(jìn)行公用網(wǎng)絡(luò)配置
![clip_image104[5]](http://pubimage.360doc.com/wz/default.gif)
2、心跳適配器優(yōu)先化
(1) 由于群集服務(wù)總是嘗試使用列于首位的網(wǎng)絡(luò)適配器進(jìn)行節(jié)點(diǎn)間的遠(yuǎn)程過程調(diào)用(RPC)通信。只有當(dāng)群集服務(wù)無法使用第一個(gè)網(wǎng)絡(luò)適配器進(jìn)行通信時(shí),才會(huì)使用列表上的下一個(gè)網(wǎng)絡(luò)適配器。所以我們需要調(diào)整一下心跳適配器的優(yōu)先級(jí)。
(2) 啟動(dòng)群集管理器。右擊群集名稱,然后單擊“屬性”,在彈出的對(duì)話框中單擊“網(wǎng)絡(luò)優(yōu)先級(jí)”選項(xiàng)卡。將Heartbeat Connection 上移至頂部。
![clip_image106[5]](http://pubimage.360doc.com/wz/default.gif)
3、仲裁磁盤配置
啟動(dòng)“群集管理器”。右擊左上角的群集名稱,然后單擊“屬性”。單擊“仲裁”選項(xiàng)卡。在“仲裁資源”列表框中,選擇“磁盤Q”。
![clip_image108[5]](http://pubimage.360doc.com/wz/default.gif)
4、創(chuàng)建一個(gè)啟動(dòng)延遲(此操作非必需)
當(dāng)出現(xiàn)所有的群集節(jié)點(diǎn)均同時(shí)啟動(dòng)并嘗試附加到仲裁資源的情況時(shí),群集服務(wù)可能無法啟動(dòng)。例如:在發(fā)生電源故障后,同時(shí)對(duì)所有節(jié)點(diǎn)恢復(fù)電力時(shí),可能出現(xiàn)這種情況。(盡管可能性比較低,但是還是有可能發(fā)生的。)要避免這種情況,可以編輯boot.ini文件。將Timeout設(shè)置不同的值,以避免兩個(gè)節(jié)點(diǎn)同時(shí)啟動(dòng)。
(1) 打開ClusterNodeA上系統(tǒng)盤根目錄下的boot.ini文件,按下圖修改。
![clip_image110[5]](http://pubimage.360doc.com/wz/default.gif)
也許您會(huì)問,為什么要添加一行同樣的記錄。這是因?yàn)槿绻菃尾僮飨到y(tǒng),無論你如何設(shè)置timeout的值都是沒有用的。只有多系統(tǒng)才會(huì)讀取這個(gè)值。所以我們復(fù)制同樣的記錄來實(shí)現(xiàn)啟動(dòng)延遲的目的。
(2) 同樣的方法,將ClusterNodeB上的boot.ini文件的timeout值設(shè)置為其他數(shù)值。如果您想在恢復(fù)電力時(shí),ClusterNodeA能夠優(yōu)先啟動(dòng),就把ClusterNodeB上的timeout值大于10。以錯(cuò)開同時(shí)啟動(dòng)。
5、測(cè)試群集安裝
前面我們?cè)贑luterNodeA和CluterNodeB新建和加入現(xiàn)有群集結(jié)束后,都分別給出了一張截圖用來驗(yàn)證群集安裝的正確性。如果您覺得驗(yàn)證不周全,還可以采用如下幾個(gè)方法來驗(yàn)證。
(1) 最簡(jiǎn)單的驗(yàn)證就是通過群集管理器。打開群集管理器,查看是否能夠打開到群集的連接。
![clip_image112[5]](http://pubimage.360doc.com/wz/default.gif)
(2) 查看群集服務(wù)是否啟動(dòng)
![clip_image114[5]](http://pubimage.360doc.com/wz/default.gif)
(3) 相關(guān)事件日志
![clip_image116[5]](http://pubimage.360doc.com/wz/default.gif)
(4) 相關(guān)注冊(cè)表鍵值
![clip_image118[5]](http://pubimage.360doc.com/wz/default.gif)
七、故障轉(zhuǎn)移測(cè)試
前面說了這么多,終于等到最激動(dòng)人心的時(shí)刻了。在這一環(huán)節(jié)中,我準(zhǔn)備將測(cè)試分為初級(jí)測(cè)試和高級(jí)測(cè)試兩塊來驗(yàn)證群集的故障轉(zhuǎn)移功能。
1、初級(jí)測(cè)試
(1) 打開群集管理器,從圖中我們可以看出,目前數(shù)據(jù)共享磁盤的所有者是ClusterNodeA,狀態(tài)為聯(lián)機(jī)。
![clip_image120[5]](http://pubimage.360doc.com/wz/default.gif)
(2) 右鍵選擇組0的“屬性”,再選擇“移動(dòng)組”。
![clip_image122[5]](http://pubimage.360doc.com/wz/default.gif)
(3) 可以看到此時(shí)的狀態(tài)為“脫機(jī)掛起”。
![clip_image124[5]](http://pubimage.360doc.com/wz/default.gif)
(4) 從圖中可以得知,共享數(shù)據(jù)磁盤R的所有者已經(jīng)轉(zhuǎn)移到ClusterNodeB上了,狀態(tài)為聯(lián)機(jī)。
![clip_image126[5]](http://pubimage.360doc.com/wz/default.gif)
(5) 此實(shí)驗(yàn)說明,在群集服務(wù)中,資源能夠從一個(gè)節(jié)點(diǎn)手動(dòng)轉(zhuǎn)移到另一個(gè)節(jié)點(diǎn)。(當(dāng)然也能夠自動(dòng)轉(zhuǎn)移,后面的實(shí)驗(yàn)均屬于自動(dòng)轉(zhuǎn)移)
2、高級(jí)測(cè)試
(1) 手工模擬故障1次
(1) 打開群集管理器,對(duì)磁盤Q進(jìn)行一次“初始故障”操作。此時(shí)磁盤Q的所有者為ClusterNodeA。
![clip_image128[5]](http://pubimage.360doc.com/wz/default.gif)
(2) 可以看到磁盤Q已經(jīng)聯(lián)機(jī)掛起了。
![clip_image130[5]](http://pubimage.360doc.com/wz/default.gif)
(3) 經(jīng)過很短的時(shí)間后,磁盤Q又自動(dòng)聯(lián)機(jī)了,所有者還是ClusterNodeA。
![clip_image132[5]](http://pubimage.360doc.com/wz/default.gif)
(4) 此實(shí)驗(yàn)說明,群集節(jié)點(diǎn)的資源,在遇到初始故障后,能夠自我修復(fù),重新回到聯(lián)機(jī)狀態(tài)。雖然在這個(gè)實(shí)驗(yàn)中沒有體現(xiàn)出能夠初始故障多少次,但是我可以告訴大家,是3次。如果初始故障次數(shù)超過3次,就不會(huì)自我修復(fù)了,而是會(huì)進(jìn)行故障轉(zhuǎn)移。下面的實(shí)驗(yàn)會(huì)證明這一點(diǎn)。
(2) 手工連續(xù)模擬故障4次
(1) 打開群集管理器,對(duì)磁盤R進(jìn)行“初始故障”操作,重復(fù)4次。此時(shí)磁盤R的所有者還屬于ClusterNodeA。
![clip_image134[5]](http://pubimage.360doc.com/wz/default.gif)
(2) 4次模擬故障后,定位到“資源”,在右邊窗口中可以看到,所有資源已自動(dòng)遷移到ClusterNodeB上,處于聯(lián)機(jī)狀態(tài)。
![clip_image136[5]](http://pubimage.360doc.com/wz/default.gif)
(3) 由于心跳偵測(cè)機(jī)制的作用(心跳信息大約每1.2秒一次),群集服務(wù)會(huì)發(fā)現(xiàn)ClusterNodeA并不是真正的宕機(jī),所以ClusterNodeA會(huì)自動(dòng)嘗試聯(lián)機(jī)。
![clip_image138[5]](http://pubimage.360doc.com/wz/default.gif)
(4) 節(jié)點(diǎn)ClusterNodeA已恢復(fù)正常。
![clip_image140[5]](http://pubimage.360doc.com/wz/default.gif)
(5) 此實(shí)驗(yàn)說明,在群集服務(wù)中,當(dāng)某個(gè)節(jié)點(diǎn)故障超過3次后,則不會(huì)自動(dòng)恢復(fù),而是進(jìn)行故障轉(zhuǎn)移。同時(shí)也說明,當(dāng)群集服務(wù)檢測(cè)到原節(jié)點(diǎn)可用時(shí),原節(jié)點(diǎn)會(huì)再次自動(dòng)回到群集中。此過程的專業(yè)術(shù)語(yǔ)叫“故障回復(fù)”
(3) 停止群集服務(wù)測(cè)試
1) 在停止ClusterNodeB上的群集服務(wù)前,先打卡群集管理器,可以察看到,目前資源的所有者是ClusterNodeB。
![clip_image142[5]](http://pubimage.360doc.com/wz/default.gif)
2) 停止ClusterNodeB的群集服務(wù)。
![clip_image144[5]](http://pubimage.360doc.com/wz/default.gif)
3) 再次回到群集管理器,發(fā)現(xiàn)資源的所有者已經(jīng)切換到ClusterNodeA上。因?yàn)镃lusterNodeB上的服務(wù)已停止,不可能自動(dòng)恢復(fù)過來。仍舊通過心跳偵測(cè)機(jī)制,當(dāng)丟失4次心跳信息后,(大約5秒),則會(huì)宣告該節(jié)點(diǎn)失敗。所以圖中顯示紅叉,表示ClusterNodeB這個(gè)節(jié)點(diǎn)目前不可用。![clip_image146[5]](http://pubimage.360doc.com/wz/default.gif)
4) 此實(shí)驗(yàn)說明,當(dāng)某個(gè)節(jié)點(diǎn)上的群集服務(wù)停止后,運(yùn)行在該問題節(jié)點(diǎn)上的資源會(huì)自動(dòng)轉(zhuǎn)移到其他正常節(jié)點(diǎn)。
(4) 模擬意外斷電時(shí)故障轉(zhuǎn)移
1) 測(cè)試前按照老規(guī)矩,打開集群管理器,可以看到資源的所有者是ClusterNodeB。
![clip_image148[11]](http://pubimage.360doc.com/wz/default.gif)
2) 直接關(guān)閉虛擬機(jī)后,打開ClusterNodeA上的集群管理器,發(fā)現(xiàn)資源已經(jīng)為脫機(jī)狀態(tài),且群集組已顯示不正常。
![clip_image150[5]](http://pubimage.360doc.com/wz/default.gif)
3) 群集服務(wù)試圖將資源所有者切換到ClusterNodeA上。
![clip_image152[5]](http://pubimage.360doc.com/wz/default.gif)
4) 資源已全部遷移到ClusterNodeA上,且顯示ClusterNodeB不正常。
![clip_image154[5]](http://pubimage.360doc.com/wz/default.gif)
5)此實(shí)驗(yàn)說明,當(dāng)群集中的節(jié)點(diǎn)遇到突發(fā)性的意外事件(如意外斷電等。)后,資源會(huì)自動(dòng)從問題節(jié)點(diǎn)轉(zhuǎn)移到正常節(jié)點(diǎn)。
八、結(jié)束語(yǔ)
如果您完成了本指南全部的實(shí)驗(yàn)環(huán)節(jié),那么恭喜您!您已經(jīng)完成了所有節(jié)點(diǎn)上的群集服務(wù)配置。服務(wù)器群集已經(jīng)完成可以運(yùn)作了。您現(xiàn)在可以準(zhǔn)備安裝群集資源,比如:文件共享、打印機(jī)共享、諸如分布式的事務(wù)協(xié)調(diào)器、DHCP、WINS等群集識(shí)別服務(wù)、或者諸如Exchange Server或SQL Server等群集識(shí)別程序。