|
SMP
SMP(Symmetrical Multi-Processor)就是對(duì)稱式多處理器。在對(duì)稱式結(jié)構(gòu)中,機(jī)器里每一位處理器的地位都是一樣的,它們連接在一起,共享一個(gè)存儲(chǔ)器。存儲(chǔ)器里有一個(gè)操作系統(tǒng),每個(gè)計(jì)算機(jī)都能運(yùn)行這個(gè)操作系統(tǒng),都能響應(yīng)外部設(shè)備的要求,即每個(gè)存儲(chǔ)器的地位是平等的、對(duì)稱的。在國(guó)內(nèi)市場(chǎng)上這類機(jī)型的處理器一般以4個(gè)或8個(gè)為主,有少數(shù)是16個(gè)處理器。但是一般來講,SMP結(jié)構(gòu)的機(jī)器可擴(kuò)展性較差,很難做到100個(gè)以上多處理器,常規(guī)的一般是8個(gè)到16個(gè),不過這對(duì)于多數(shù)的用戶來說已經(jīng)夠用了。這種機(jī)器的好處在于它的使用方式和微機(jī)或工作站的區(qū)別不大,編程的變化相對(duì)來說比較小,原來用微機(jī)工作站編寫的程序如果要移植到SMP機(jī)器上使用,改動(dòng)起來也相對(duì)比較容易。SMP結(jié)構(gòu)的機(jī)型可用性比較差。因?yàn)?個(gè)或8個(gè)處理器共享一個(gè)操作系統(tǒng)和一個(gè)存儲(chǔ)器,一旦操作系統(tǒng)出現(xiàn)了問題,整個(gè)機(jī)器就完全癱瘓掉了。而且由于這個(gè)機(jī)器的可擴(kuò)展性較差,不容易保護(hù)用戶的投資。但是這類機(jī)型技術(shù)比較成熟,相應(yīng)的軟件也比較多,因此現(xiàn)在國(guó)內(nèi)市場(chǎng)上推出的并行機(jī)大量都是這一種。
集群技術(shù)
通俗地說,集群是這樣一種技術(shù):它至少將兩個(gè)系統(tǒng)連接到一起,使兩臺(tái)服務(wù)器能夠像一臺(tái)機(jī)器那樣工作或者看起來好像一臺(tái)機(jī)器。采用集群系統(tǒng)通常是為了提高系統(tǒng)的穩(wěn)定性和網(wǎng)絡(luò)中心的數(shù)據(jù)處理能力及服務(wù)能力。自80年代初以來,各種形式的集群技術(shù)紛紛涌現(xiàn)。因?yàn)榧耗軌蛱峁└呖捎眯院涂缮炜s性,所以,它迅速成為企業(yè)和ISP計(jì)算的支柱。
常見集群技術(shù)
1.服務(wù)器鏡像技術(shù)
服務(wù)器鏡像技術(shù)是將建立在同一個(gè)局域網(wǎng)之上的兩臺(tái)服務(wù)器通過軟件或其他特殊的網(wǎng)絡(luò)設(shè)備(比如鏡像卡)將兩臺(tái)服務(wù)器的硬盤做鏡像。其中,一臺(tái)服務(wù)器被指定為主服務(wù)器,另一臺(tái)為從服務(wù)器??蛻糁荒軐?duì)主服務(wù)器上的鏡像的卷進(jìn)行讀寫,即只有主服務(wù)器通過網(wǎng)絡(luò)向用戶提供服務(wù),從服務(wù)器上相應(yīng)的卷被鎖定以防對(duì)數(shù)據(jù)的存取。主/從服務(wù)器分別通過心跳監(jiān)測(cè)線路互相監(jiān)測(cè)對(duì)方的運(yùn)行狀態(tài),當(dāng)主服務(wù)器因故障宕機(jī)時(shí),從服務(wù)器將在很短的時(shí)間內(nèi)接管主服務(wù)器的應(yīng)用。
服務(wù)器鏡像技術(shù)的特點(diǎn)是成本較低,提高了系統(tǒng)的可用性,保證了在一臺(tái)服務(wù)器宕機(jī)的情況下系統(tǒng)仍然可用,但是這種技術(shù)僅限于兩臺(tái)服務(wù)器的集群,系統(tǒng)不具有可擴(kuò)展性。
2. 應(yīng)用程序錯(cuò)誤接管集群技術(shù)
錯(cuò)誤接管集群技術(shù)是將建立在同一個(gè)網(wǎng)絡(luò)里的兩臺(tái)或多臺(tái)服務(wù)器通過集群技術(shù)連接起來,集群節(jié)點(diǎn)中的每臺(tái)服務(wù)器各自運(yùn)行不同的應(yīng)用,具有自己的廣播地址,對(duì)前端用戶提供服務(wù),同時(shí)每臺(tái)服務(wù)器又監(jiān)測(cè)其他服務(wù)器的運(yùn)行狀態(tài),為指定服務(wù)器提供熱備份作用。當(dāng)某一節(jié)點(diǎn)因故障宕機(jī)時(shí),集群系統(tǒng)中指定的服務(wù)器會(huì)在很短的時(shí)間內(nèi)接管故障機(jī)的數(shù)據(jù)和應(yīng)用,繼續(xù)為前端用戶提供服務(wù)。
\錯(cuò)誤接管集群技術(shù)通常需要共享外部存儲(chǔ)設(shè)備—磁盤陣列柜,兩臺(tái)或多臺(tái)服務(wù)器通過SCSI電纜或光纖與磁盤陣列柜相連,數(shù)據(jù)都存放在磁盤陣列柜上。這種集群系統(tǒng)中通常是兩個(gè)節(jié)點(diǎn)互為備份的,而不是幾臺(tái)服務(wù)器同時(shí)為一臺(tái)服務(wù)器備份,集群系統(tǒng)中的節(jié)點(diǎn)通過串口、共享磁盤分區(qū)或內(nèi)部網(wǎng)絡(luò)來互相監(jiān)測(cè)對(duì)方的心跳。
錯(cuò)誤接管集群技術(shù)經(jīng)常用在數(shù)據(jù)庫服務(wù)器、MAIL服務(wù)器等的集群中。這種集群技術(shù)由于采用共享存儲(chǔ)設(shè)備,所以增加了外設(shè)費(fèi)用。它最多可以實(shí)現(xiàn)32臺(tái)機(jī)器的集群,極大地提高了系統(tǒng)的可用性及可擴(kuò)展性。
3.容錯(cuò)集群技術(shù)
容錯(cuò)集群技術(shù)的一個(gè)典型的應(yīng)用即容錯(cuò)機(jī),在容錯(cuò)機(jī)中,每一個(gè)部件都具有冗余設(shè)計(jì)。在容錯(cuò)集群技術(shù)中集群系統(tǒng)的每個(gè)節(jié)點(diǎn)都與其他節(jié)點(diǎn)緊密地聯(lián)系在一起,它們經(jīng)常需要共享內(nèi)存、硬盤、CPU和I/O等重要的子系統(tǒng),容錯(cuò)集群系統(tǒng)中各個(gè)節(jié)點(diǎn)被共同映像成為一個(gè)獨(dú)立的系統(tǒng),并且所有節(jié)點(diǎn)都是這個(gè)映像系統(tǒng)的一部分。在容錯(cuò)集群系統(tǒng)中,各種應(yīng)用在不同節(jié)點(diǎn)之間的切換可以很平滑地完成,不需切換時(shí)間。
容錯(cuò)集群技術(shù)的實(shí)現(xiàn)往往需要特殊的軟硬件設(shè)計(jì),因此成本很高,但是容錯(cuò)系統(tǒng)最大限度地提高了系統(tǒng)的可用性,是財(cái)政、金融和安全部門的最佳選擇。
目前在提高系統(tǒng)的可用性方面用得比較廣泛的是應(yīng)用程序錯(cuò)誤接管技術(shù),即我們通常所采用的雙機(jī)通過SCSI電纜共享磁盤陣列的集群技術(shù),這種技術(shù)目前被各家集群軟件廠商和操作系統(tǒng)軟件廠商進(jìn)一步擴(kuò)充,形成了市面上形形色色的集群系統(tǒng)。
基于IA架構(gòu)高性能集群系統(tǒng)技術(shù)
利用最新的4、8路IA服務(wù)器架構(gòu)的高性能服務(wù)器集群系統(tǒng), 采用了領(lǐng)先的VI(Visual Interface)技術(shù),有效地消除了系統(tǒng)中節(jié)點(diǎn)之間通訊的瓶頸;同時(shí),系統(tǒng)采用的負(fù)載均衡技術(shù)使用戶設(shè)備可以充分得到利用,并且達(dá)到了4個(gè)9的可靠性,具有極高的產(chǎn)品性價(jià)比,為Internet的應(yīng)用提供了一個(gè)強(qiáng)有力的數(shù)據(jù)庫服務(wù)器平臺(tái)。
1.系統(tǒng)概述
數(shù)據(jù)中心領(lǐng)域一直是高端RISC服務(wù)器的天下,多年來人們只有選擇AS400 、E10000、HP9000等這樣的小型機(jī),價(jià)格昂貴,維護(hù)成本高。而IA 架構(gòu)服務(wù)器價(jià)格低廉,易于使用和維護(hù),通過Cluster技術(shù)可以構(gòu)造超級(jí)計(jì)算機(jī),其超強(qiáng)的處理能力可以取代價(jià)格昂貴的中大型機(jī),為行業(yè)的高端應(yīng)用開辟新的方向。
對(duì)于成長(zhǎng)中的大型用戶來講,數(shù)據(jù)中心或數(shù)據(jù)倉庫中所保存的企業(yè)經(jīng)營(yíng)、管理數(shù)據(jù)的增長(zhǎng)是十分驚人的,而這些數(shù)據(jù)對(duì)大型用戶的作用又是非常重要的。發(fā)展若干年中積累下的數(shù)據(jù)是一筆寶貴的財(cái)富,通過對(duì)這些浩若煙海的數(shù)據(jù)進(jìn)行分析,經(jīng)營(yíng)者們能夠得出直觀的經(jīng)營(yíng)圖表、曲線,能夠?yàn)橐院蟠笮陀脩舻陌l(fā)展提供有力的決策支持。但是由于這樣的數(shù)據(jù)隨著時(shí)間的流逝不斷膨脹,給大型用戶的IT系統(tǒng)管理人員帶來了巨大的壓力。
用戶到底需要什么樣的服務(wù)器才能滿足目前和未來發(fā)展的需要?
首先要有超強(qiáng)的計(jì)算能力,可以承受長(zhǎng)時(shí)間、大用戶量的并發(fā)訪問。
其次,服務(wù)器系統(tǒng)的高可用性、易用易管理對(duì)于用戶也是極為重要的,如果系統(tǒng)出現(xiàn)故障,造成服務(wù)的中斷,或者重要資料的丟失,會(huì)給用戶造成挽回的損失。所以,用戶在選擇服務(wù)器系統(tǒng)時(shí)一定要考慮高可用的系統(tǒng)方案。
第三,隨著數(shù)據(jù)的不斷堆積,對(duì)數(shù)據(jù)的查詢和統(tǒng)計(jì)將使系統(tǒng)變得越來越慢,硬件設(shè)備的更新?lián)Q代可以說是一個(gè)發(fā)展中的大型用戶必不可少的工作。
利用最新的4、8路IA服務(wù)器架構(gòu)的高性能服務(wù)器集群系統(tǒng)[1], 采用了領(lǐng)先的VI(Visual Interface)技術(shù),有效地消除了系統(tǒng)中節(jié)點(diǎn)之間通訊的瓶頸;同時(shí),系統(tǒng)采用的負(fù)載均衡技術(shù)使用戶設(shè)備可以充分得到利用,并且達(dá)到了4個(gè)9的可靠性,具有極高的產(chǎn)品性價(jià)比,1999年推出以來引起了用戶的廣泛關(guān)注,為國(guó)內(nèi)廣大用戶提供了一個(gè)強(qiáng)有力的數(shù)據(jù)庫服務(wù)器平臺(tái)。
2.系統(tǒng)原理
高性能服務(wù)器集群系統(tǒng)是基于2節(jié)點(diǎn)或4節(jié)點(diǎn)的集群,最多可達(dá)32個(gè)CPU,內(nèi)存最大支持32GB。4節(jié)點(diǎn)構(gòu)成一個(gè)工作單元,最多可級(jí)聯(lián)16個(gè)工作單元。
各節(jié)點(diǎn)為IA服務(wù)器,它支持4路或8路Pentium III Xeon CPU并行處理。每臺(tái)服務(wù)器上插一塊千兆網(wǎng)卡或vi結(jié)構(gòu)的高速交換卡,連接至一臺(tái)高速交換機(jī)(可以是千兆以太網(wǎng)卡交換機(jī)或某些特殊的高速交換機(jī),例如vi結(jié)構(gòu)的高速交換機(jī))做為服務(wù)器彼此之間的數(shù)據(jù)交換用,稱之為SAN(Server Area Network)交換機(jī)。
每臺(tái)服務(wù)器插有一塊百兆或千兆以太網(wǎng)卡,連接到局域網(wǎng)用的交換機(jī)或集線器上,為客戶端的訪問提供連接服務(wù)。
四臺(tái)服務(wù)器共享一臺(tái)光纖通道磁盤陣列柜。每臺(tái)服務(wù)器有兩塊光纖通道卡,分別連接到兩個(gè)光纖通道的集線器上,每個(gè)集線器分別連接到光纖通道磁盤陣列柜的兩個(gè)控制器上。對(duì)于光纖通道磁盤陣列柜,只要有一個(gè)控制器能正常工作,整個(gè)陣列柜就能正常工作,因此這種配置方案是冗余的,防止單點(diǎn)失效。對(duì)于最重要的存放在磁盤陣列柜中的數(shù)據(jù),還可采取將集群系統(tǒng)與磁盤陣列柜分別存放的方式來確保數(shù)據(jù)安全,光纖通道允許集群系統(tǒng)與磁盤陣列柜之間最長(zhǎng)10公里的距離。
每臺(tái)服務(wù)器有一個(gè)硬盤區(qū)域,用于安裝本機(jī)的引導(dǎo)系統(tǒng)和數(shù)據(jù)庫系統(tǒng)的管理部分。用戶數(shù)據(jù)存儲(chǔ)在共享的磁盤陣列柜中。
在局域網(wǎng)中,有一臺(tái)客戶機(jī)做為管理控制臺(tái),在其上安裝有數(shù)據(jù)庫的管理控制臺(tái),用于管理并行數(shù)據(jù)庫,可以同時(shí)監(jiān)控四個(gè)節(jié)點(diǎn)上的數(shù)據(jù)庫實(shí)例,實(shí)現(xiàn)啟動(dòng)、停止、監(jiān)控運(yùn)行性能等功能。
另外在這臺(tái)客戶機(jī)上安裝有網(wǎng)管系統(tǒng),SAN的管理控制臺(tái),磁盤柜的管理控制臺(tái),UPS管理控制臺(tái)等,實(shí)現(xiàn)集群系統(tǒng)的統(tǒng)一管理。有的管理功能實(shí)現(xiàn)時(shí)只需要安裝TCP/IP協(xié)議,有的則還需要安裝SNMP協(xié)議才能正常工作。
一個(gè)良好的集群系統(tǒng)除了優(yōu)秀的性能指標(biāo)之外,還需要有相應(yīng)的操作系統(tǒng)和數(shù)據(jù)庫的支持,我們目前的集群系統(tǒng)支持WINDOWS NT 4.0 及WINDOWS 2000操作系統(tǒng)[2],在數(shù)據(jù)庫方面支持ORACLE和DB2。它不運(yùn)行在單機(jī)上,只有在多個(gè)節(jié)點(diǎn)同時(shí)工作時(shí),才能夠顯示出它的性能,并使得系統(tǒng)能夠真正做到負(fù)載均衡(Load Balance)。
2.1 兩節(jié)點(diǎn)集群系統(tǒng)
從方案的配置上來說,用戶可以根據(jù)需要做不同的選擇,可以使用兩臺(tái)高端服務(wù)器實(shí)現(xiàn)一個(gè)虛擬主機(jī)。這時(shí),采用vi結(jié)構(gòu)的高速交換設(shè)備更具有優(yōu)越性,不需要使用vi 交換機(jī),可以用每臺(tái)服務(wù)器上的vi結(jié)構(gòu)的高速交換卡直連實(shí)現(xiàn)服務(wù)器之間的高速數(shù)據(jù)交換。如果使用千兆以太網(wǎng)卡,還需要千兆交換機(jī),成本較高。
|