|
硬件配置:
兩臺HP服務(wù)器,3G CPU ,2G內(nèi)存, C盤20G ,D盤50g,雙網(wǎng)卡,共享存儲為msa1000系列,容量為820g。
軟件配置:
Windows server 2003 企業(yè)版,32位系統(tǒng)。(集群中所有機器安裝)
Oracle ofs3.3.4 (集群中所有機器安裝)
Oracle9i (集群中所有機器安裝)
注意:操作系統(tǒng)必須為2003企業(yè)版或2003 datacentre版。
系統(tǒng)配置參數(shù):
|
|
節(jié)點1(主節(jié)點)
|
節(jié)點2(備節(jié)點)
|
|
主機名
|
qhltdb2
|
qhlt-1mc
|
|
Public ip
|
10.251.8.55/24
|
10.251.8.56/24
|
|
Private ip
|
11.11.11.1/24
|
11.11.11.2/24
|
|
集群名
|
cluster
|
|
集群IP
|
10.251.8.144/24
|
|
Oracle集群名
|
mycluster
|
|
Oracle集群IP
|
10.251.8.60/24
|
系統(tǒng)結(jié)構(gòu):
具體安裝步驟:
1, 安裝2003企業(yè)版操作系統(tǒng),兩機均使用administrator用戶登陸,密碼也保持一致。
2, 配置windows MSCS。
在配置windows群集之前,需配置好網(wǎng)絡(luò),共享磁盤,以及windows域。
網(wǎng)絡(luò)配置:
為了方便配置,我們將公用網(wǎng)卡重命名為public,私有網(wǎng)卡重命名為private
并將IP配好。私有網(wǎng)卡之間用交叉線相連。且關(guān)閉私有網(wǎng)卡的tcpip的netbios設(shè)置。
配置網(wǎng)絡(luò)的時候,微軟推薦把共享存儲關(guān)閉,但不是必須。
域設(shè)置:
群集中的所有節(jié)點必須是同一個域的成員,并可以訪問域控制器和DNS服務(wù)器??梢酝ㄟ^兩種方式解決:
1, 雙節(jié)點中,兩節(jié)點均為域控制器,主節(jié)點為主域控制器及DNS服務(wù)器,備節(jié)點為額外域控制器,備節(jié)點的DNS服務(wù)器指向主域控制器。
2, 兩節(jié)點均為同一域中的成員服務(wù)器。
我們選擇的第一種方式,域名自選。此例為qhlt.com
將主節(jié)點配置為域控制器,使用配置您的服務(wù)器向?qū)?,根?jù)步驟 一步一步繼續(xù),在DNS轉(zhuǎn)發(fā)一項選擇否。還要注意不要配置VPN防火墻!這個過程大概需要15分鐘。配置完重啟計算機。
然后配置備份節(jié)點為額外域控制器,在備機的cmd下輸入dcpromo,根據(jù)步驟繼續(xù),選擇配置為額外域控制器,其他繼續(xù),這個過程大概要10分鐘。完后重啟機器。
確定兩臺計算機重啟后 是以域用戶administrator 登陸操作系統(tǒng)。
共享磁盤配置:
1, 啟動主節(jié)點,關(guān)閉備節(jié)點,開啟共享磁盤
2, 在主節(jié)點上配置共享磁盤。
3, 打開我的電腦-管理-磁盤管理
4, 右擊“未分配的磁盤空間”。
5, 單擊“新分區(qū)”。
6, 將啟動“新建分區(qū)向?qū)?#8221;,單擊“下一步”。
7, 選擇“主分區(qū)”的分區(qū)類型,單擊“下一步”。
8, 默認將分區(qū)設(shè)為最小。單擊“下一步”。(建議采用多個邏輯磁盤,而不是在一個磁盤上采用多個分區(qū)。)
使用下拉框更改驅(qū)動器盤符。使用在字母表上比默認列舉的字母更靠后的驅(qū)動器盤符。通常,驅(qū)動器盤符“Q”可以用于仲裁磁盤,而“R”、“S”等字母則用于數(shù)據(jù)磁盤。
9, 使用NTFS格式化分區(qū)。在“卷標”方框中,鍵入該磁盤的名稱。例如:“仲裁”如下方圖8所示。關(guān)鍵是要對共享磁盤分配驅(qū)動器標簽,因為在還原磁盤時這會大大減少故障排除時間。微軟推薦仲裁盤為物理上的單獨磁盤,但不是必須。
根據(jù)以上步驟 繼續(xù)配置共享 分區(qū),例如S:\,微軟推薦共享邏輯驅(qū)動器至少為兩個。
1. 啟動“Windows Explorer”。
2. 右擊一個共享磁盤(比如:“驅(qū)動器Q:\”),單擊“新建”,然后單擊“文本文檔”。
3. 確認您可以順利寫入磁盤,并創(chuàng)建了文件。
4. 選擇所創(chuàng)建的文件,然后按“Del”鍵,將其從群集磁盤刪除。
5. 對所有群集磁盤重復(fù)步驟1至4,確認可以從第一個節(jié)點正確地訪問它們。
6, 關(guān)閉第一個節(jié)點,開啟第二個節(jié)點,并重復(fù)步驟1至4,驗證磁盤訪問和功能。如果不能訪問,在備節(jié)點上重新執(zhí)行共享磁盤配置步驟。具體步驟要和在主節(jié)點上執(zhí)行步驟一致,包括各種參數(shù)等。
配置集群:
關(guān)閉除主節(jié)點以外的所有節(jié)點,開啟共享盤陣。主節(jié)點以域用戶登陸。
在主節(jié)點上配置群集:
1. 依次單擊“開始”、“所有程序”和“管理工具”,然后單擊“群集管理器”。
2. 當出現(xiàn)“打開群集連接向?qū)?#8221;提示時,在“執(zhí)行”下拉列表中,單擊“創(chuàng)建新群集”,如下方圖9所示。
3. 確認您具有配置群集所必需的前提條件,如下方圖10所示。單擊“下一步”。
4. 鍵入群集的唯一NetBIOS名稱(最多15個字符),即域名,qhlt.com,然后單擊“下一步”。(在下方圖11所示的例子中,群集被命名為 “Cluster”。
5. 如果您在本地登錄一個不屬于“具有本地管理特權(quán)的域帳戶”的帳戶,向?qū)⑻崾灸付ㄒ粋€帳戶。群集服務(wù)不會使用該帳戶進行啟動。即adminisrator,密碼 :
注意:如果您擁有正確的憑證,步驟5所提到的提示,如圖12所示,可能不會出現(xiàn)。
6. 由于可能對群集進行遠程配置,因此您必須確認或鍵入將要作為第一個節(jié)點創(chuàng)建群集的服務(wù)器的名稱,如下方圖13所示。單擊“下一步”。
為群集中第一個節(jié)點的計算機名稱。
7. 下方圖 14顯示“安裝”程序現(xiàn)在將分析節(jié)點,查找可能導(dǎo)致安裝出現(xiàn)問題的硬件或軟件問題。檢查所有警告或錯誤信息。您還可以單擊“詳細信息”按鈕,了解有關(guān)每個警告或提示的詳細信息。
圖 14. “安裝”程序分析節(jié)點,查找可能存在的硬件或軟件問題。
8. 鍵入唯一的群集IP地址(本例為:10.251.8.144)該地址需要與計算機公網(wǎng)IP處于一個網(wǎng)段,然后單擊“下一步”。
9. 鍵入在預(yù)安裝時創(chuàng)建的群集服務(wù)帳戶的“用戶名”和“密碼”。(在下方圖16的例子中,用戶名為:“Cluster(群集)”)在“域”下拉列表中選擇域名,然后單擊“下一步”。
這時,“群集配置向?qū)?#8221;將驗證用戶帳戶和密碼。
因為當時我做的時候并沒有設(shè)置群集用戶,用的是域的管理用戶,所以如果出現(xiàn)這一步,也使用該administrator帳戶。
. 向?qū)崾灸峁┰陬A(yù)安裝時所創(chuàng)建的帳戶。
10. 檢查“摘要”頁面,如下方圖17所示,確認所有將用于創(chuàng)建群集的信息均準確無誤。如果需要,您可以使用仲裁按鈕,更改由默認自動選擇的磁盤指派的仲裁磁盤。
本屏幕上所顯示的摘要信息可用于在出現(xiàn)災(zāi)難恢復(fù)狀況時,重新配置群集。建議您保存并打印一份硬拷貝,與服務(wù)器上的更改管理日志保持一致。
圖 17. 建議采用的“群集配置”頁面。
11. 檢查所有在群集創(chuàng)建過程中遇到的警告或錯誤。具體操作是單擊加號查看更多信息,然后單擊“下一步”。出現(xiàn)在“創(chuàng)建群集”頁面的警告和錯誤如圖18所示。
圖 18. 出現(xiàn)在“創(chuàng)建群集”頁面上的警告和錯誤。
12. 單擊“完成”,結(jié)束安裝。下方圖19顯示最終的步驟。
圖 19. 設(shè)置一個新的服務(wù)器群集的最終步驟。
配置第二個節(jié)點
在另一個節(jié)點上安裝群集服務(wù)所需的時間要比花在第一個節(jié)點上的時間少。“安裝”程序基于第一個節(jié)點的配置,在第二個節(jié)點上配置群集服務(wù)網(wǎng)絡(luò)設(shè)置。與此同時,您還可以通過遠程操作為群集添加多個節(jié)點。
注意:對于本部分,開啟節(jié)點1和所有的共享磁盤,然后開啟所有其它節(jié)點。這時,群集服務(wù)將控制對于共享磁盤的訪問,以便杜絕任何可能破壞卷的機會。
1. 在節(jié)點1上打開“群集管理器”。
2. 單擊“文件”,單擊“新建”,然后單擊“節(jié)點”。
3. 將啟動“添加群集計算機向?qū)?#8221;,單擊“下一步”。
4. 如果您沒有通過正確的憑證進行登錄,將要求您指定一個對群集中所有節(jié)點具有管理權(quán)利的域帳戶。
5. 輸入您要將其添加到群集的節(jié)點的機器名稱,單擊“添加”。重復(fù)該步驟,如下方圖21所示,添加您想要的其它節(jié)點。當您添加完了所有的節(jié)點,單擊“下一步”.
6. “安裝”向?qū)λ泄?jié)點執(zhí)行分析,以便確認它們得到了正確的配置。
7. 鍵入用于啟動群集服務(wù)的帳戶密碼。(administrator)
8. 檢查所顯示的用于確認的摘要信息。摘要信息將用于在其它節(jié)點加入群集時對其進行配置。
9. 檢查群集創(chuàng)建過程中遇到的所有警告或錯誤,然后單擊“下一步”。
10. 單擊“完成”,結(jié)束安裝。
測試:
測試:啟動“群集管理器”,右擊一個資源,然后單擊“啟動故障”。該資源將進入故障狀態(tài),然后將重新啟動并在同一節(jié)點上回到聯(lián)機狀態(tài)。
預(yù)期結(jié)果:資源將在相同的節(jié)點上返回聯(lián)機狀態(tài)
測試:在相同的資源上,再執(zhí)行上方“啟動故障”測試三次。在第四次故障時,資源將對群集中的另一個節(jié)點執(zhí)行故障轉(zhuǎn)移。
預(yù)期結(jié)果:資源將針對群集中的另一個節(jié)點實施故障轉(zhuǎn)移
測試:將所有資源轉(zhuǎn)移到一個節(jié)點上。啟動“計算機管理”,然后單擊“服務(wù)與應(yīng)用程序”下方的“服務(wù)”,停止群集服務(wù)。在另一個節(jié)點上啟動“群集管理器”,確認所有資源均在該節(jié)點上正確地執(zhí)行了故障轉(zhuǎn)移并返回聯(lián)機狀態(tài)。
如果測試共享卷組等群集組的切換沒有問題,則繼續(xù)下一步。
安裝ORACLE軟件
1, 打開兩臺機器,共享磁盤在主節(jié)點上可見。(也可能在備節(jié)點,但只能在一個節(jié)點上可見)
2, 在主服務(wù)器上安裝Oracle,選擇自定義安裝,安裝過程不創(chuàng)建數(shù)據(jù)庫,安裝結(jié)束重新啟動主服務(wù)器;
3, 在從服務(wù)器上安裝Oracle,選擇自定義安裝,安裝過程不創(chuàng)建數(shù)據(jù)庫,安裝結(jié)束重新啟動從服務(wù)器。
4, 如果安裝的是oracle9201,建議升級數(shù)據(jù)庫先。9204或9206均可。
創(chuàng)建數(shù)據(jù)庫
在主服務(wù)器上創(chuàng)建要添加到集群中的數(shù)據(jù)庫。注意 Control 文件、redo log files 和 data files 必須創(chuàng)建在磁盤柜的共享分區(qū)上;初始化參數(shù)文件也要放在磁盤柜上。即將init.ora放在共享磁盤,只是將該文件內(nèi)容修改為:spfile=S:\oradata\spfile{SID}.ora。
創(chuàng)建數(shù)據(jù)庫的具體過程
1,在a機上創(chuàng)建數(shù)據(jù)庫,數(shù)據(jù)文件 控制文件 ,redo日志文件,初始化參數(shù)文件,spfile等均放在共享磁盤上,例如S:\oradata。建完后,測試a機上啟動數(shù)據(jù)庫成功。
2,關(guān)a機,講共享磁盤切換到b機,將在a機上建庫的所有數(shù)據(jù)文件所在目錄改名(或刪除),例如改為S:\oradata1,然后在b機上按相同參數(shù)建庫,同時將所有文件放在共享磁陣上。然后在b機啟動數(shù)據(jù)庫。
3,關(guān)b機,切換磁盤到a機,啟動數(shù)據(jù)庫,啟動過程可能會報密碼文件損壞,將b機的密碼文件cp到a機,再次啟動,確認數(shù)據(jù)庫可正常啟動。
4,關(guān)a機,切換到b機,再次確認可正常啟動數(shù)據(jù)庫。然后將磁盤切換到a機。
5,將a,b兩機器上的oracleserviceSID,oraclelistener服務(wù)設(shè)置為手動啟動。因為這兩個服務(wù)是由ofs來控制的。
6,建庫過程中不要配置lisner和tns等網(wǎng)絡(luò)參數(shù)。
安裝OSF
安裝Failsafe要在登陸域(不能以本機登陸)的方式,不然在驗證數(shù)據(jù)庫時會出錯。
Failsafe的版本要對應(yīng),否則在驗證單機數(shù)據(jù)庫時無法通過。
在主服務(wù)器上安裝FailSafe3.3,安裝完重新啟動主服務(wù)器;
再在從服務(wù)器上安裝FailSafe3.3,安裝完重新啟動從服務(wù)器。
在安裝過程中需要輸入 域名/用戶;密碼接受驗證。用戶為administrator。
注:在安裝完 fail safe 后,Windows 2000 中的群集管理器中 群集配置 –〉 資源類型 –〉 下會出現(xiàn)兩個資源類型:Oracle Database 和 Oracle TNS Listener,兩者使用的資源 DLL 都是 FsResOdbs.dll 。
如果沒有,啟動Oracle Services for MSCS服務(wù),或進行verify cluster后將會出現(xiàn)。
在兩臺機器上修改HOSTS文件
在目錄c:\winnt\system32\drivers\etc\hosts 內(nèi)容如下:兩臺機器上相同
10.251.8.55 qhltdb2
10.251.8.56 qhlt-1mc
10.251.8.144 cluster
10.251.8.60 mycluster
然后在兩臺機器上分別ping以上地址或主機名,確保解析正確。
集群配置
1、 在主節(jié)點上打開 Oracle Fail Safe Manager
Start -> Programs -> OraHome91> -> Oracle Fail Safe Manager
打開后出現(xiàn) Add Cluster to Tree 對話框,在該對話框里輸入 CLUSTER 名稱,會提示輸入在域里有管理權(quán)限的用戶名和密碼;輸入后會出現(xiàn) Verify Cluster 對話框,對該集群各項資源進行有效性驗證;
2、 在每臺節(jié)點機上檢查是否有服務(wù) OracleMSCSServices,并啟動該服務(wù),該服務(wù)為手動。
3、 在每臺節(jié)點機上啟動集群管理器(啟動 -> 程序 -> 管理工具 -> 集群管理器),在 Cluster Group 檢查是否有 Oracle Services for MSCS 這一項;并檢查 Resource Types 中是否有 Oracle Database 和 Oracle TNS Listener。
以下步驟只需在主節(jié)點執(zhí)行:
4、 在 Oracle Fail Safe Manager 中的Groups 菜單里選擇 Create;打開 Create Group Wizard 后可以設(shè)置 failover 和 failback 策略,并自動打開 Add Resource to Group Wizard 可以向組添加virtual address(選擇Resources,然后Add to Group)。
首先選擇菜單:
出現(xiàn)界面,輸入組名:
點擊下一步,選擇是否failback,建議不選擇failback,此選項將允許回切;選擇prevent將使用默認的failback模式。
點擊下一步,選擇優(yōu)先級別:
按完成結(jié)束組的創(chuàng)建。
向組里添加虛擬地址
5、 在 Troubleshooting 菜單上選擇 Verify Standalone Database 驗證 Oracle數(shù)據(jù)庫以及 Oracle Net 配置,該命令確認 Oracle Fail Safe 可以訪問數(shù)據(jù)庫,并且 standlone 數(shù)據(jù)庫位于共享分區(qū)上;此步驟可能會提示 你 是否需要刪除 備份節(jié)點上的duplicate 庫,選擇是 刪除duplicate庫。此步驟主要是用來發(fā)現(xiàn)驗證配置,提示你修改錯誤。
另外:由于9i以后是以spfile啟動,所以下圖中的Parameter 的值可以輸入共享陣列上spfile文件,或者修改陣列上init.ora文件內(nèi)容為spfile=/S:\oradata\spfile{SID}.ora,當然在配置完ofs后,還可以通過ofs管理工具修改,但未測試過。
選擇是,刪除duplicate庫。
6、 在 Resources 菜單上選擇 Add to Group,然后選擇 Oracle Database打開 Add Resource to Group Wizard,該向?qū)в脕韺?/span> single-instance Oracle database server 配置為基于 MSCS 的高可用性數(shù)據(jù)庫服務(wù)器;
選擇菜單:
出現(xiàn)界面,選擇OracleDatabase:
出現(xiàn)配置集群界面:
安裝成功后,出現(xiàn)如下圖提示,則安裝成功完成。
安裝成功后,關(guān)于數(shù)據(jù)庫在注冊表中的配置,從服務(wù)器上的注冊表將會自動和主服務(wù)器同步。
注:在 FailSafe 里添加組mycluster并將數(shù)據(jù)庫群集添加后,在群集管理器里也增加了該組,組包含的內(nèi)容有:
3.10測試
1) 手工切換主從機
從主機切換到從機,切換時間為50秒,應(yīng)用程序略有停滯感,切換成功后應(yīng)用恢復(fù)正常。
2) 非正常關(guān)機
非正常關(guān)掉主服務(wù)器,可以正常切換,切換時間為57秒,應(yīng)用程序略有停滯,切換成功后應(yīng)用恢復(fù)正常。
3) 拔掉主機應(yīng)用網(wǎng)線
拔掉主機應(yīng)用網(wǎng)線之后,可以正常切換,切換時間為50秒,應(yīng)用程序略有停滯感,切換成功后應(yīng)用恢復(fù)正常。
4) 在主機上正常shutdown immediate 數(shù)據(jù)庫,但卻不能關(guān)閉,數(shù)據(jù)庫會自動重啟動
如果出現(xiàn)不斷在主機上重新啟動數(shù)據(jù)庫的情況,那需要在ofs中修改mycluster組中數(shù)據(jù)庫的restart策略屬性。
在安裝中可能出現(xiàn)的問題:
1, 如何卸載ofs?
卸載ofs使用安裝程序所帶的oui執(zhí)行卸載產(chǎn)品就可以。
2, 如何刪除ofs在MSCS中創(chuàng)建的組?
先卸載ofs產(chǎn)品,然后將組中的所有資源刪除,之后就可以刪除組了。再在cmd下運行
sc delete 服務(wù)名 刪除由ofs創(chuàng)建的oralce群集服務(wù)oraclelisnerfsmycluster。至此,ofs在計算機上基本上刪除,資源類型里面的兩個選項可以不用理會,在重新裝好ofs后,還可以繼續(xù)使用。
3,除了clusterservice 服務(wù)為自動啟動,oralceservice{sid} ,oraclelisner ,oracleMSCSservice,oraclelisnerfsmycluster 服務(wù)均為手動啟動,這些服務(wù)由ofs控制!
|