出品 | 搜狐科技 作者 | 梁昌均 市值超2萬億美元的英偉達(dá)剛剛舉辦了一年一度的GTC大會。黃仁勛依舊身著皮衣,以“見證AI的變革時刻”為主題發(fā)表了兩個小時的演講。 黃仁勛首先回復(fù)了英偉達(dá)發(fā)展史,又提到了將首臺DGX -1送給OpenAI的故事。DGX -1是英偉達(dá)打造了世界上第一臺AI超級計算機(jī),2016年捐贈給了OpenAI,一定程度上推動了后來的大模型的爆發(fā)。 “2023年生成式AI的出現(xiàn),代表一個新的產(chǎn)業(yè)開始,我們現(xiàn)在正在使用計算機(jī)來生產(chǎn)以前從未出現(xiàn)過的軟件?!秉S仁勛表示,生成式AI將是未來,這需要新的加速計算。 他認(rèn)為,加速計算已經(jīng)達(dá)到臨界點(diǎn),傳統(tǒng)的通用計算已經(jīng)過時?!拔覀冃枰硪环N計算方式,以便我們能夠繼續(xù)擴(kuò)展,從而繼續(xù)降低計算成本,從而使得我們繼續(xù)進(jìn)行越來越多的計算。” 展開剩余89% 大型語言模型從計算規(guī)模的快速增長中受益匪淺,正如黃仁勛提到,Transformer發(fā)明之后,大語言模型快速擴(kuò)展,每六個月就能有效地翻一番。 “當(dāng)看到ChatGPT的奇跡出現(xiàn)在我們面前時,我們意識到還有很長的路要走?!秉S仁勛表示,未來仍然需要更大的模型,以及使用多模態(tài)數(shù)據(jù)來訓(xùn)練,讓其學(xué)到物理世界的知識。 他認(rèn)為,為了訓(xùn)練越來越大的模型,需要更強(qiáng)的算力,所以需要更大的GPUs,這需要建造芯片、系統(tǒng)、網(wǎng)絡(luò)以及所有必要的軟件來實(shí)現(xiàn)。在此次GTC大會演講中,黃仁勛正式發(fā)布新一代架構(gòu)芯片,并公布機(jī)器人等多個領(lǐng)域的布局。 最強(qiáng)AI芯片2080億晶體管,能支持27萬億參數(shù)大模型 黃仁勛發(fā)布了新一代的名為Blackwell的GPU架構(gòu),其命名是向美國數(shù)學(xué)家、概率學(xué)家、博弈論專家大衛(wèi)·布萊克韋威爾(David Blackwell)致敬。 ![]() 以Blackwell架構(gòu)打造的新芯片B200 GPU,總計包含2080億晶體管,所有這些晶體管幾乎同時訪問與芯片連接的內(nèi)存,內(nèi)部傳輸速度達(dá)每秒10TB,沒有內(nèi)存和緩存的問題。同時,Blackwell芯片可以兼容Hopper。 ? “這是一個巨大的芯片,所以當(dāng)我們被告知Blackwell的野心超出了物理學(xué)的限制時,工程師說那又怎樣?”黃仁勛說到,需要大量的新功能才能超越物理極限。 黃仁勛還稱,Blackwell架構(gòu)采用了第二代Transformer引擎,可以提供FP6和FP4精度支持,采用了第五代NVLink高速互聯(lián)技術(shù)。此外,它還安裝了可靠性引擎,可以進(jìn)行自我系統(tǒng)測試?!斑@是我們第一次這樣做,這是安全的AI,使得代碼不會丟失,也不會被污染?!?/p> 因此它能夠?qū)崿F(xiàn)對數(shù)據(jù)的加密,包括靜態(tài)數(shù)據(jù),也包括傳輸中的數(shù)據(jù),當(dāng)在計算時全部加密,使得計算處于可信的的環(huán)境中。此外,它還安裝了高速壓縮引擎,有效地將數(shù)據(jù)以20倍的速度移入和移出計算機(jī)。 ? 英偉達(dá)還將組合的能力發(fā)揮到了極致。通過兩個B200 Blackwell GPU與一個基于Arm的Grace CPU結(jié)合,打造出GB200超級芯片,兩個超級芯片裝到主板上,成為一個Blackwell計算節(jié)點(diǎn),18個計算節(jié)點(diǎn)共有36CPU+72GPU,組成更大的計算集群。 這也帶來更強(qiáng)大的性能和更低的成本。黃仁勛舉例稱,如果訓(xùn)練1.8萬億參數(shù)量的GPT模型,需要8000張Hopper GPU,跑上90天,消耗15兆瓦的電力。但使用Blackwell GPU,只需要2000張,同樣跑90天只會消耗四分之一的電力,而且生成Token的成本也會隨之降低。 ? ![]() ![]() ![]() “這就是我們的目標(biāo),不斷降低成本和消耗的能量,以便我們能夠繼續(xù)擴(kuò)展和擴(kuò)大所必須的計算去訓(xùn)練下一代模型。”黃仁勛表示。 他認(rèn)為,推理生成對大語言模型非常困難,但也非常重要,吞吐量將會決定提供服務(wù)的成本和服務(wù)質(zhì)量。Blackwell的推理能力非常出色,其單GPU每秒Token吞吐量相較Hopper翻了30倍,黃仁勛稱其是為萬億參數(shù)的生成式AI而設(shè)計的系統(tǒng)。 在多項(xiàng)技術(shù)支持下,超級芯片打造的新一代計算單元GB200 NVL72,在FP8(8位浮點(diǎn)格式)精度下,訓(xùn)練算力高達(dá)720PFlops,具備1.4EFlops的AI推理算力和30TB高速內(nèi)存,最高支持27萬億參數(shù)的模型。與72個H100相比,GB200 NVL72對于大模型推理性能提升高達(dá)30倍,成本和能耗降低高達(dá)25倍。 ? 在黃仁勛看來,生成式AI是一個全新的行業(yè),英偉達(dá)的計算是為生成式AI時代而創(chuàng)建。“這需要大量的計算,token生成增加5倍,Hopper推理能力增加5倍似乎已經(jīng)足夠,但實(shí)際上還不夠,所以需要更大的GPU,因此必須擴(kuò)大它規(guī)模。” 黃仁勛提到,英偉達(dá)過去八年計算量增加了1000倍,而在摩爾定律的舊時代是每五年10倍,這很重要的原因在于英偉達(dá)打造了DGX計算集群?!熬驮诹昵?,它還很重,但我還是能夠把它舉起來,我將第一臺DGX-1交付給了OpenAI的研究人員?!?/p> ? 隨著新架構(gòu)和新芯片的推出,新一代計算集群DGX GB200 SuperPod也正式推出,其通過采用新型高效液冷機(jī)架規(guī)模架構(gòu),標(biāo)準(zhǔn)配置可在FP4精度下提供11.5 Exaflops算力和240TB高速內(nèi)存。在額外的機(jī)架擴(kuò)展之后,最終可以成為包含32000 GPU的分布式超算集群。 在黃仁勛看來,英偉達(dá)DGX AI超級計算機(jī),就是AI工業(yè)革命的工廠。“未來數(shù)據(jù)中心將被視為AI工廠,而對于生成式AI來說,Blackwell將會是一個了不起的系統(tǒng),這種能力超級重要。”微軟、AWS、谷歌、甲骨文等科技巨頭將成為Blackwell架構(gòu)芯片的首批用戶。 推出新的AI推理服務(wù),入局機(jī)器人大模型 黃仁勛還公布了數(shù)字孿生Omniverse和生成式AI的最近應(yīng)用進(jìn)展,包括在生物醫(yī)藥、物流制造、氣候變化、智能汽車等領(lǐng)域的應(yīng)用,同時發(fā)布了NVIDIA DGX云中的多項(xiàng)更新。 AI推理服務(wù)器NIM(NVIDIA INFERENCE MICROSERVICE)可用于開發(fā)和部署企業(yè)級生成式AI應(yīng)用,提供了最快、性能最高的AI生產(chǎn)容器?!拔磥砣绾伍_發(fā)軟件?與現(xiàn)在寫一行行代碼不同,未來可能就要靠一堆NIMs,用與AI聊天的形式調(diào)動一堆NIMS來完成訓(xùn)練、應(yīng)用的部署?!秉S仁勛說。 目前,NIM微服務(wù)可以用于部署NVIDIA、A121、Adept、Cohere、Getty Images和Shutterstock的模型,以及谷歌、微軟、Meta、Hugging Face、Mistral AI和Stability AI的開放模型。 ? 黃仁勛表示,英偉達(dá)的愿景是成為AI軟件的晶圓廠。這也將在多個領(lǐng)域落地應(yīng)用,比如醫(yī)藥公司可以利用來篩選藥物、蛋白質(zhì)結(jié)構(gòu)預(yù)測、疾病檢測等。目前,全球有接近50家應(yīng)用程序提供商正在使用英偉達(dá)的醫(yī)療微服務(wù)。 黃仁勛現(xiàn)場還宣布,現(xiàn)在支持將Omniverse云推流至蘋果Vision Pro。在英偉達(dá)播放的日產(chǎn)汽車如何將Omiverse Cloud應(yīng)用在工作流中的視頻中,工作人員可以戴上Vision Pro參與工作流程的管理。 ![]() ![]() ![]() ![]() 英偉達(dá)發(fā)布了全新的DRIVE Thor車載計算平臺,集成了專為Transformer、LLM和生成式AI工作負(fù)載而設(shè)計的全新NVIDIA Blackwell架構(gòu)。 黃仁勛提到,比亞迪將采用英偉達(dá)新一代智能汽車芯片Thor,并將使用英偉達(dá)基礎(chǔ)設(shè)施進(jìn)行自動駕駛模型訓(xùn)練,以及英偉達(dá)Isaac來設(shè)計/模擬智能工廠機(jī)器人。 ? 在氣候變化領(lǐng)域,英偉達(dá)推出Earth-2,其可以幫助用戶迅速提供警告和更新預(yù)報,且所生成的氣候圖像,分辨率高12.5倍,速度快1000倍,提高了準(zhǔn)確性。 此外,在最近頗受的人形機(jī)器人領(lǐng)域,英偉達(dá)推出一款名為GROOT的機(jī)器人通用基礎(chǔ)大模型,旨在進(jìn)一步推動英偉達(dá)在機(jī)器人和具身智能的突破性工作。此外,英偉達(dá)還推出了適用于機(jī)器人的全新計算機(jī)Thor,在性能、功耗、尺寸都進(jìn)行了優(yōu)化。 ? “由GR00T驅(qū)動的機(jī)器人可以理解自然語言,并通過觀察人類動做出自然的模仿動作?!秉S仁勛表示,希望通過這一舉措,讓機(jī)器人擁有更聰明的大腦,提升動作的協(xié)調(diào)性、靈活性等。 ? 目前,英偉達(dá)正在為Figure AI等多家人形機(jī)器人公司構(gòu)建AI平臺?;顒幼詈?,迪士尼打造的orange和green機(jī)器人來到現(xiàn)場和黃仁勛互動,這兩款機(jī)器人用的是英偉達(dá)為機(jī)器人設(shè)計的首款A(yù)I芯片Jetson。 ? 英偉達(dá)的這次發(fā)布業(yè)內(nèi)關(guān)注到較高,其為生成式AI的未來再次打造了新的基礎(chǔ),不過資本市場表現(xiàn)平淡。最新美股交易日,該公司開盤一度漲超5%,收盤漲幅回落至0.7%,盤后則跌近2%,最新市值約2.21萬億美元。 |
|
|