|
在傳統(tǒng)的終端/主機的網絡模式時代,終端功能簡單,無需維護工作,在主機一端進行專門的管理與維護,具有資源共享、便于管理的特點。但是,主機造價昂貴,終端沒有處理能力,限制了網絡的規(guī)模化發(fā)展。之后的客戶機/服務器模式推進了計算產業(yè)的標準化和開發(fā)化的發(fā)展,為系統(tǒng)提供了相當大的靈活性,但是隨著分布系統(tǒng)規(guī)模的規(guī)模擴大,系統(tǒng)的維護和管理帶來了巨大的開銷。
面向Internet的服務型應用,需要高性能的硬件平臺作為支持,將并行技術應用在服務器領域中,是計算機發(fā)展的必然趨勢。并行處理技術在高性能計算領域中,高可用和高性能是集群服務器系統(tǒng)發(fā)展的兩個重要方向。
集群的概念
集群英文名稱是CLUSTER,是一組相互獨立的、通過高速網絡互聯(lián)的計算機,它們構 成了一個組,并以單一系統(tǒng)的模式加以管理。一個客戶與集群相互作用時,集群像是一個獨立的服務器。集群配置是用于提高可用性和可縮放性。
和傳統(tǒng)的高性能計算機技術相比,集群技術可以利用各檔次的服務器作為節(jié)點,系統(tǒng)造價低,可以實現很高的運算速度,完成大運算量的計算,具有較高的響應能力,能夠滿足當今日益增長的信息服務的需求。
集群技術應用的需求
Internet用戶數量呈幾何級數增長和科學計算的復雜性要求計算機有更高的處理能力,而CPU的發(fā)展無法跟上不斷增長的需求,于是我們面臨以下問題:
●大規(guī)模計算如基因數據的分析、氣象預報、石油勘探需要極高的計算性能。
●應用規(guī)模的發(fā)展使單個服務器難以承擔負載。
●不斷增長的需求需要硬件有靈活的可擴展性。
●關鍵性的業(yè)務需要可靠的容錯機制。
IA集群系統(tǒng)(CLUSTER)的特點
●由若干完整的計算機互聯(lián)組成一個統(tǒng)一的計算機系統(tǒng);
●可以采用現成的通用硬件設備或特殊應用的硬件設備,例如專用的通訊設備;
●需要特殊軟件支持,例如支持集群技術的操作系統(tǒng)或數據庫等等;
●可實現單一系統(tǒng)映像,即操作控制、IP登錄點、文件結構、存儲空間、I/O空間、作業(yè)管理系統(tǒng)等等的單一化;
●在集群系統(tǒng)中可以動態(tài)地加入新的服務器和刪除需要淘汰的服務器,從而能夠最大限度地擴展系統(tǒng)以滿足不斷增長的應用的需要;
●可用性是集群系統(tǒng)應用中最重要的因素,是評價和衡量系統(tǒng)的一個重要指標;
●能夠為用戶提供不間斷的服務,由于系統(tǒng)中包括了多個結點,當一個結點出現故障的時候,整個系統(tǒng)仍然能夠繼續(xù)為用戶提供服務;
●具有極高的性能價格比,和傳統(tǒng)的大型主機相比,具有很大的價格優(yōu)勢;
●資源可充分利用,集群系統(tǒng)的每個結點都是相對獨立的機器,當這些機器不提供服務或者不需要使用的時候,仍然能夠被充分利用。而大型主機上更新下來的配件就難以被重新利用了。
實現服務器集群的硬件配置 ●網絡服務器 兩臺 ●服務器操作系統(tǒng)硬盤 兩塊 ●ULTRA 160 LVD SCSI磁盤陣列 一個 ●18G SCSI硬盤 三塊 ●網絡服務網卡 四塊 服務器集群的實踐步驟
●在安裝機群服務之前的準備:
1、 三塊18G SCSI硬盤組成磁盤陣列,做RAID5。 2、 兩臺服務器要求都配置雙網卡,分別安裝Microsoft Windows 2000 Advance Server操作系統(tǒng),并配置網絡。 3、 所有磁盤必須設置成基本盤,陣列磁盤分區(qū)必須大于2個。 4、 每臺服務器都要加入域當中,成為域成員,并且在每臺服務器上都要有管理員權限。 ●安裝配置服務器網絡要點 1、在這一部分,每個服務器需要兩個網絡適配器,一個連接公眾網,一個連接內部網(它只包含了群集節(jié)點)。 內部網適配器建立點對點的通信、群集狀態(tài)信號和群集管理。每個節(jié)點的公眾網適配器連接該群集到公眾網上,并在此駐留客戶。 2、安裝Microsoft Windows 2000 Adwance Server 操作系統(tǒng)后,開始配置每臺服務器的網絡。在網絡連接中我們給連接公眾網的命名為"外網",連接內部網的命名為"內網"并分別指定IP地址為: 節(jié)點1:內網:ip:10.10.10.11 外網ip:192.168.0.192 子網掩碼:255.255.255.0 網關:192.168.0.191(主域控制器ip) 節(jié)點2:內網:ip:10.10.10.12 外網 ip:192.168.0.193 子網掩碼:255.255.255.0 網關:192.168.0.191
●安裝配置陣列
1、對陣列做可校驗的RAID5。并劃分分區(qū)。創(chuàng)建一個小分區(qū)(至少50兆)用來存儲群集 配置數據庫的檢測點和日志文件。這是集群中一個重要的關鍵分區(qū),一但他出現故障,將導 致整個集群的失敗。這里我們分配給他1G的空間,并命名為X盤符。 2、其他的分區(qū)根據用戶的需求可以自行設定。我們?yōu)榱朔奖阒环至艘粋€Y區(qū)。 3、注意:在集群中所有的磁盤都必須是基本盤并且都要采用NTFS格式。
●安裝集群服務軟件
【配置首節(jié)點】
1、所有的設備都先關閉(兩臺服務器、一臺磁盤陣列)。 2、先開啟磁盤陣列(在任何時候都要先開啟磁盤陣列,以免造成磁盤混亂)。 3、開啟節(jié)點1,用有管理員權限的用戶名登陸到域,用添加刪除程序來添加組件-集群服 務。在安裝過程中選擇這是集群的首節(jié)點。創(chuàng)建集群名稱。我們給命名為Mycluster。 5、 配置群集磁盤。由于我們只有一個共享的磁盤陣列,所以我們將這個陣列中的兩個分區(qū) 都配置成群集磁盤。 6、配置群集網絡。首先我們配置外網,網絡名稱選擇外網。IP地址保持和外網的IP地址一致。選中該網絡可用于集群服務。選中所有的通信(混合網絡)選項。進行下一步。接下來配置內網,確保網絡名稱和IP地址跟內網的一致,選中該網絡可用于集群服務。選中只用于內部群集通信選項。 7、 點擊下一步按鈕,屏幕出現使用網絡的順序。我們調整為表里的第一個連接是內網。這是因為:在正常的操作中,該連接將用于群集通信。如果內部網絡連接失效,群集服務將自動切換到表里的下一個網絡。 8、執(zhí)行下一步將出現集群的IP和掩碼選項。這里輸入唯一的集群IP,我們設定為192.168.0.195 掩碼當然還是:255.255.255.0。 9、單擊完成,完成首節(jié)點的群集配置。
【配置第二個節(jié)點】
1、保持陣列和第一個節(jié)點的開機和可用。給第二個節(jié)點上電開機。 2、象在首節(jié)點上安裝群集服務一樣,對第二個節(jié)點開始進行安裝。 3、過程跟在首節(jié)點上在安裝群集服務大體相同,只有下列的不同之處: 在創(chuàng)建或添加群集對話框中,在群集中選擇第二個或下一個節(jié)點,并單擊下一步。 輸入前面所創(chuàng)建的群集名稱(在本例中,是MyCluster),并單擊下一步。 將連接到群集設為未選中。群集服務配置向導將自動提供,在安裝首節(jié)點時選定 的用戶賬號名稱。 輸入該賬號的口令(如果有的話),并單擊下一步。 在下一個對話框中,單擊完成,結束配置。 將啟動群集服務。單擊確定。 關閉添加/刪除程序 如果要安裝額外的節(jié)點,重復這些步驟,以便在其它節(jié)點上安裝群集服務。 檢驗安裝 單擊開始,單擊程序,單擊管理工具,并單擊群集管理器。顯示的兩個節(jié)點表明,存在群集,而且它在運行。 效能評測 ●容錯能力的檢驗 對于他的容錯能力我們做了以下幾個實驗: 1、在兩臺節(jié)點和集群服務同時運行的情況下,斷掉其中一個節(jié)點的外網連接或是當掉一臺節(jié)點,此時運行在這個節(jié)點上的集群服務被迫斷開并轉移到另外一個連接正常的節(jié)點上,此過程大概要4秒鐘(視集群上運行的服務數量而定,在安裝了SQL Server 2000服務之后這個過程延長到了9-15秒)。 2、在兩臺節(jié)點和集群服務同時運行的情況下,我們更改了一臺節(jié)點的時間,在經過大約10分鐘時間被修改的時間自動調整成同另一臺節(jié)點相同的設置。 3、我們在集群服務上開啟了web服務,并設置了下載項目。在客戶端正在下載過程中斷掉集群中的一個節(jié)點,客戶端并沒有明顯的感覺出有變化。 由以上實驗可見用Windows 2000 Advance Server所做的集群在容錯方面具有良好的效能,他幾乎是瞬間就能把出錯的節(jié)點上的服務接管過來,相對于客戶端幾乎感覺不到有任何變化。同時他在周期時間內所有節(jié)點進行同步,以保證其一致性。 ●負載均衡能力的檢驗 1、 Windows 2000 Advance Server 所做的集群是基于TCP/IP構建的,他為共同工作且使用兩個或兩個以上主機群集的Web服務器提供了高度可用性和可伸縮性。因特網客戶使用單一的IP地址訪問群集??蛻舨荒軐我环掌鲝娜杭袇^(qū)分開來。服務器程序不能識別它們正運行于一個群集中。但是,由于網絡負載均衡群集即使在群集主機發(fā)生故障的情況下仍能提供了不間斷的服務,故而,它與運行單一服務器程序的單一主機大相徑庭。與單一主機相比,群集還能對客戶需求做出更迅捷的反應。 注意要點 我們在做集群實驗的過程當中遇到了一些問題,雖然最后都順利的解決了,但我想還是要在這里提出來讓大家注意,避免在今后的工作中出現不必要的重復的錯誤。 1、共享磁盤之中X盤的重要性。在實驗的過程中我們也知道X盤相當重要,為了驗證他的重要地位,我們做了如下實驗:我們首先看到在X盤下面只有一個MSDN的文件夾,其中有兩個文件*.tmp和*.log,這就是上文所說的群集配置數據庫的檢測點和日志文件。我們試著刪除這兩個文件,結果*.tmp可以刪除,*.log文件正在使用而無法刪除。刪除了*.tmp文件之后我們重新啟動兩臺節(jié)點和集群。一切正常,進入X盤看他的文件,發(fā)現被刪除的*.tmp文件又重新回到了里面,只是名字稍有些改變。這表明*.tmp文件是每次集群啟動時自動生成的一個文件,而集群啟動以后,這個文件就不在被使用。接著我們進行了一個后來被證明 是毀滅性的實驗,我們在我的電腦管理里面的調整了磁盤管理,把X盤刪除了。結果可怕的事情發(fā)生了,在不到10秒鐘的時間內兩臺節(jié)點相繼報告機群服務發(fā)生錯誤將不能運行且終止服務。我們嘗試再次進入磁盤管理,發(fā)現陣列的磁盤已經變成了不可讀取。無奈之下我們重新啟動所有設備,期望能發(fā)生超乎設想的好的結果,但是事實讓我們不得不失望。集群服務無法啟動,陣列磁盤不可讀取。在沒有任何辦法的情況下我們不得不重新配置集群。
|