| 在最近舉行的IDF大會(huì)(Intel Intel Developer Forum)上,Intel公布了下一代處理器架構(gòu)Nehalem的不少技術(shù)細(xì)節(jié)。Intel計(jì)劃在明年第三季度下旬到第四季度上旬正式推出基于Nehalem架構(gòu)的處理器,包括采用Beckton CPU的Stoutland多處理器平臺(tái)、采用Gainestown CPU的Thurley雙處理器平臺(tái)、采用Bloomfield CPU的Thurley單路處理器平臺(tái)、采用Havendale/Lynfield CPU的Fowhollow單處理器平臺(tái)。 
 圖1:Intel推出Nhalem架構(gòu)的時(shí)間表 Gainestown/Bloomfield是四核處理器,共享8MB的L2 Cache,集成的內(nèi)存控制器擁有3條DDR3 800/1066/1333通道,都是用LGA 1366插座。即將推出的Penryn會(huì)采用SSE4.1指令集,而Gainestown/Bloomfield采用擴(kuò)展后的SSE4.2指令集。在設(shè)計(jì)熱功耗(TDP)方面,Gainestown按頻率高低分為130W/80W/60W三檔,而Bloomfield分為130W/80W兩檔。TDP的再度升高說明45nm制程到Nhalem架構(gòu)將接近極限,此后Intel會(huì)將工藝提升到32nm。 
 圖2:Intel擴(kuò)展指令集的發(fā)展沿革 Nhalem架構(gòu)最大的改造在前端總線(FSB)上,傳統(tǒng)的并行傳輸方式被徹底廢棄,轉(zhuǎn)而采用基于PCI Express串行點(diǎn)對(duì)點(diǎn)傳輸技術(shù)的通用系統(tǒng)接口(CSI),被Intel稱為QuickPath。QuickPath的傳輸速率為***Gbps,這樣一條32bit的QuickPath帶寬就能達(dá)到25.6GB/sec。QuickPath的傳輸速率是FSB 1333MHz的5倍,前者雖然數(shù)據(jù)位寬較窄,但傳輸帶寬仍然是后者的2.5倍。由于分別用于雙處理器和單處理平臺(tái),Gainestown有兩條QuickPath,而Bloomfield僅有一條。不難看出,在AMD推出HyperTransport高速串行總線,并逐漸在高性能運(yùn)算領(lǐng)域建立優(yōu)勢(shì)之后,Intel也開始步其后塵并迎頭趕上。若干年前,關(guān)于串行傳輸將一統(tǒng)天下的預(yù)言已經(jīng)變成了現(xiàn)實(shí),我們所要等待的是串行內(nèi)存何時(shí)重返市場(chǎng)。 
 圖3:Gainestown/Bloomfield四核處理器基本架構(gòu) 
 圖4:Core架構(gòu)到Nehalem架構(gòu)的變遷 由于FSB發(fā)生了革命性的變化,因此芯片組需要對(duì)此進(jìn)行適應(yīng)。Intel為NNehalem架構(gòu)處理器配備的服務(wù)器和工作站芯片組是Tylersburg。因?yàn)閮?nèi)存控制器被集成到了處理器內(nèi)部,Tylersburg的北橋不再成為MCH,而是改稱為IOH。Tylersburg也能同時(shí)用于雙處理器和單處理器平臺(tái),分別被稱為Thurley DP和Thurley UP平臺(tái)。按照QuickPath和PCI Express通道數(shù)量的不同,Tylersburg被分為了四個(gè)型號(hào): 型號(hào)        QuickPath  PCI Express 
 Gainestown的兩條QuickPath,一條用于處理器之間的互聯(lián),另一條用于連接芯片組,Tylersburg-36D的兩條QuickPath則正好連接兩塊處理器。 
 圖6:Nehalem架構(gòu)更為彈性 Intel的QuickPath和AMD的HT 3.0一樣,都能使整個(gè)系統(tǒng)平臺(tái)更為靈活彈性。如果由兩塊Gainestown處理器和兩塊Tylersburg-36D芯片組來組建系統(tǒng)(2 CPU+2 IOH),不僅處理器本身可以直接互向通信,也可以通過芯片組來互相訪問。2 CPU+1 IOH的方式允許Tylersburg-36D/24D兩種芯片組,以便于靈活配置和降低成本。單處理器系統(tǒng)也可以使用兩塊芯片組,來增加PCI Express的通道數(shù)。Nehalem架構(gòu)要組建多處理器系統(tǒng)也非常容易,只要增加QuickPath通道和IOH北橋數(shù)量即可。Nehalem基本上仍是IA-32架構(gòu),但其IA-64的Tukwila架構(gòu)也將采用Nehalem的系統(tǒng)拓?fù)浣Y(jié)構(gòu)   圖7:Nehalem架構(gòu)組建多處理器系統(tǒng) Nehalem之后是什么?相信這是許多人關(guān)心的問題。AMD在收購(gòu)ATI之后,已經(jīng)在CPU和GPU整合方面占據(jù)了先機(jī),Intel當(dāng)然不甘落后,特別是nVidia的威脅正不斷增大。事實(shí)上,Nehalem為Intel整合CPU和GPU奠定了關(guān)鍵基礎(chǔ):由于QuickPath的存在,圖形單元集成在芯片組中,還是集成在處理器中沒有本質(zhì)區(qū)別;而且處理器中也同時(shí)集成了內(nèi)存控制器,圖形單元訪問和調(diào)用系統(tǒng)內(nèi)存會(huì)非常方便。 
 圖8:Nehalem之后 | 
|  |