小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

ChatGPT讓AI芯片創(chuàng)企身處聚光燈

 山蟹居 2023-03-06 發(fā)布于上海
文章圖片1

生成式AI(又稱AIGC)狂潮席卷,聊天機器人ChatGPT上線2月用戶就突破1億,成為消費級應(yīng)用市場上冉冉升起的新星,海內(nèi)外科技巨頭紛紛開始爭奪這場生成式AI盛宴的入場券。

資本市場聞風(fēng)而動,國內(nèi)服務(wù)器龍頭玩家浪潮信息、“計算機視覺四小龍”之一云從科技、為算法模型開發(fā)提供專業(yè)數(shù)據(jù)集的AI訓(xùn)練數(shù)據(jù)服務(wù)商海天瑞聲等眾多ChatGPT概念股暴漲。

其中,算力層玩家已經(jīng)悄然處于生成式AI產(chǎn)業(yè)發(fā)展的漩渦中心,AI訓(xùn)練芯片“一哥”英偉達股價開年至今上漲超60%。算力作為生成式AI產(chǎn)業(yè)的基礎(chǔ)設(shè)施,一直在牽動全球科技企業(yè)的神經(jīng)。

算力缺口問題一直存在,但隨著生成式AI產(chǎn)業(yè)在消費級市場鋪開,上億級別的用戶規(guī)模使得這一問題逐漸被放大。結(jié)合ChatGPT在訓(xùn)練和推理過程中對算力、網(wǎng)絡(luò)等硬件的需求,市研機構(gòu)中金研究院量化測算出在中性情景下,該應(yīng)用有望推動約65億美元(折合約446.51億人民幣)的增量市場空間。

在此背景下,國內(nèi)AI芯片創(chuàng)企已經(jīng)為大模型應(yīng)用落地下激增的算力需求提出新解法,那就是以人腦為靈感的稀疏計算。

值此生成式AI爆發(fā)的關(guān)鍵節(jié)點,主攻稀疏計算的墨芯核心競爭力在哪里?巨頭林立下,墨芯又將如何殺出重圍搶奪市場蛋糕?這一波生成式AI浪潮對于以墨芯為代表的AI芯片創(chuàng)企又意味著什么?

帶著這些問題,芯東西與墨芯創(chuàng)始人兼CEO王維進行了深入交流,從生成式AI產(chǎn)業(yè)帶來的算力需求出發(fā),探討算力層玩家在其中的角色。

文章圖片2

▲墨芯創(chuàng)始人兼CEO王維

01.

算力激增

新Bing搜索基礎(chǔ)設(shè)施砸40億美元?

作為史上用戶規(guī)模增長最快的消費級應(yīng)用,ChatGPT的影響是爆炸性、裂變式的,其展示出來的生成式AI的交互能力已經(jīng)大大超越了之前的小模型,智能性也產(chǎn)生了質(zhì)的突破,隨之而來的是對大算力的需求日益緊迫。

文章圖片3

▲ChatGPT界面

因此這也一度讓英偉達賺的盆滿缽滿。

產(chǎn)品面世之前,OpenAI可能就已經(jīng)向算力層玩家狂砸千萬、數(shù)十億美元。據(jù)外媒報道,分析師稱ChatGPT Beta版本使用了10000個英偉達GPU訓(xùn)練模型,新一代GPT-5大模型正在25000個英偉達GPU上訓(xùn)練。這背后就是數(shù)十億的基礎(chǔ)設(shè)施購買費用以及一次1200萬美元的模型訓(xùn)練成本。

ChatGPT上線后,算力開銷則只增不減。并且半導(dǎo)體產(chǎn)業(yè)分析機構(gòu)SemiAnalysis的分析師稱,當(dāng)模型進入大規(guī)模部署階段,將產(chǎn)生更高的算力成本。

摩根士丹利分析師稱,ChatGPT的一次回復(fù)成本可能在2美分。國盛證券估算,假設(shè)以這樣的穩(wěn)定狀態(tài),且忽略集群配置的請求量冗余和服務(wù)質(zhì)量冗余,那么,ChatGPT需要至少30382片英偉達A100 GPU芯片同時計算,才能支撐當(dāng)前ChatGPT的訪問量,對應(yīng)初始投入成本約為7.59億美元(折合約52億人民幣)。

集成到新Bing中的ChatGPT,則使得這一成本再次翻番。

研究機構(gòu)New Street Research發(fā)現(xiàn),集成ChatGPT的新Bing搜索引擎,可能需要8個GPU才能在不到一秒的時間內(nèi)響應(yīng)問題。按照這個速度,微軟將需要超過20000臺8-GPU服務(wù)器才能將Bing中的模型部署給每個人,這表明微軟可能需要40億美元的基礎(chǔ)設(shè)施支出。

高昂的算力成本讓“燒錢”成為了生成式AI產(chǎn)業(yè)應(yīng)用落地的代名詞。

如今,大模型規(guī)模持續(xù)增長已經(jīng)是必然趨勢,算力的需求仍然會不斷激增,其結(jié)局只能是無止盡的砸錢嗎?“并不是!”墨芯給了我們十分明確的答案。

就算不論成本,訓(xùn)練模型增大、計算量增加背后,被犧牲的訓(xùn)練時間和推理速度對消費級產(chǎn)品的擴展和規(guī)模落地影響都很大。因此,降本增效才是當(dāng)前的關(guān)鍵。

02.

單卡跑通GPT-3,企業(yè)成本降低3~5倍

這個答案的底氣要先從墨芯布局的技術(shù)路線說起。

先來看一組數(shù)據(jù),GPT-3模型是擁有1700多億參數(shù)的大模型代表,如果放在GPU上去做推理的話,需要內(nèi)存量是要幾百G,也就是需要很多張80G的GPU,且會有明顯時延;但通過稀疏化路徑,用一張墨芯S30計算卡,就可以跑通GPT-3,并且計算速度還變快了很多。

稀疏計算的靈感就來自于人腦。我們在處理不同任務(wù)時,會激活大腦皮層的相應(yīng)區(qū)域,無需調(diào)用整個神經(jīng)網(wǎng)絡(luò)。類比到芯片上,就是在不同的任務(wù)上進行稀疏激活。

隨著通用人工智能時代的到來,稀疏計算與大模型的天然適配優(yōu)勢越來越明顯。弱人工智能向通用人工智能的演進過程中,大算力爆炸時代稀疏特性越來越清晰、明顯,相比于GPGPU的稠密計算,稀疏計算在算力能效比上有1~2個數(shù)量級的提升,并且墨芯的稀疏計算解決方案可以讓企業(yè)成本降低3~5倍,王維談道。

此外,墨芯S30加速卡通過軟硬協(xié)同加速平臺對大模型進行稀疏化,可單卡支持T5大模型推理,實現(xiàn)“1卡頂8卡”的算力效果。

從更宏觀的角度來看,稀疏計算的發(fā)展也符合事物發(fā)展的第一性原理。他舉了一個例子,相比于燃油車40%的熱轉(zhuǎn)換效率,電車的電能轉(zhuǎn)化效率能達到90%,這也意味著燃油車時代向電車時代發(fā)展的必然性。

縱觀當(dāng)下生成式AI產(chǎn)業(yè)的發(fā)展,AI繪畫工具、類ChatGPT產(chǎn)品等都正在將基于大模型的AI商業(yè)化應(yīng)用落地推向高潮。

主打稀疏計算的墨芯正在突出重圍,并彰顯出無限的發(fā)展?jié)摿Α?/span>

成立4年墨芯首顆芯片Antoum一次流片成功、基于Antoum的AI計算卡S4僅5個月就實現(xiàn)量產(chǎn),S30在全球權(quán)威AI測試MLPerf推理測試v2.1中的數(shù)據(jù)中心主流模型Resnet-50和Bert分獲冠亞軍,S4、S30快速拿到商業(yè)化訂單……都在持續(xù)印證稀疏計算在AI發(fā)展歷程中存在的合理性以及墨芯堅實的技術(shù)積累。

墨芯實測顯示,運行在墨芯S30加速卡上的GPT開源模型,生成答案的速度能夠較原來提升10倍。

此外,互聯(lián)網(wǎng)、金融、運營商、制造、醫(yī)療等行業(yè)的頭部用戶也正在與墨芯接觸,其產(chǎn)品已經(jīng)可以應(yīng)用于上述行業(yè)。這些計算密集型產(chǎn)業(yè)的應(yīng)用已經(jīng)讓墨芯的產(chǎn)品得到市場驗證。

王維說,生成式AI變革的當(dāng)下對于墨芯和稀疏計算而言,是一個完美的時期?!皟扇陜?nèi),稀疏化計算應(yīng)該會在大模型推理和訓(xùn)練中擁有一定的市占率。”

從短期來看,墨芯的戰(zhàn)略布局將沿著稀疏化推理到稀疏化訓(xùn)練,再到訓(xùn)推一體。不過,一家企業(yè)的戰(zhàn)略布局與方向必然不能著眼于當(dāng)下,他補充道,墨芯的長期戰(zhàn)略目標(biāo)是搭載一個更先進的下一代計算平臺,包含訓(xùn)練、推理的AI 2.0計算平臺。

03.

創(chuàng)新路徑、頂尖人才、計算生態(tài)

成AI芯片黑馬護城河

AI產(chǎn)業(yè)的爆炸性事件,讓算力層玩家在技術(shù)發(fā)展和應(yīng)用落地上宛如搭上了快車。王維說:“過去十年,GPU一直承載著AI產(chǎn)業(yè)的發(fā)展,現(xiàn)在是新的顛覆性技術(shù)最容易切入和最快速被市場接受和認可的節(jié)點?!?/span>

不過,外部環(huán)境雖然重要,打鐵仍需自身硬。技術(shù)積累深厚、人才團隊強大的“黑馬”芯片企業(yè)的優(yōu)勢尤為顯著。

1、底層“創(chuàng)新基因”,與大廠一較高下

王維多次談到了“創(chuàng)新”,他認為這是生成式AI未來快速商業(yè)化的底層基因,也是墨芯的企業(yè)文化。

作為國內(nèi)AI芯片創(chuàng)企的代表玩家,在AI爆炸性事件出現(xiàn)時,除了擁有技術(shù)積累去支撐其算力外,還應(yīng)該肩負起更大的責(zé)任感和使命感。

大算力爆炸時代,從科技巨頭到AI創(chuàng)企都在尋找解決算力難題,但現(xiàn)實是,依靠先進制程獲得突破的道路對于國內(nèi)芯片玩家而言過于艱難,而找到一條創(chuàng)新路徑去支撐大模型的發(fā)展就尤為重要。

“這也是那些不缺資源、不缺人才的頭部科技公司最看懂的東西?!蓖蹙S說。

2、頂尖算法人才團隊,量產(chǎn)、落地、創(chuàng)新一脈相承

人才濟濟的核心骨干成員是“創(chuàng)新基因”的載體。

創(chuàng)始人王維曾任美國高通和英特爾架構(gòu)師,英特爾5-10代CPU處理器的核心成員,參與開發(fā)量產(chǎn)超50億片芯片,擁有硅谷芯片公司創(chuàng)業(yè)經(jīng)歷;首席科學(xué)家嚴(yán)恩勖擁有40多篇AI頂會成果;工程VP蘆勇曾任SK Hynix芯片設(shè)計總監(jiān)和Marvell資深芯片設(shè)計經(jīng)理;首席架構(gòu)師肖志斌曾任達摩院核心架構(gòu)師等等……

兼顧算法、架構(gòu)、芯片設(shè)計的頂尖人才,使得后續(xù)墨芯在芯片量產(chǎn)、技術(shù)創(chuàng)新、應(yīng)用落地上一脈相承,并迅速“迎接”大算力爆炸時代對于AI芯片創(chuàng)企更為嚴(yán)苛的考驗。

3、拓展稀疏計算生態(tài),加入主流生態(tài)龍蜥

不論是AI芯片產(chǎn)業(yè)化還是大模型應(yīng)用落地,都需要完備的軟硬一體生態(tài)才能讓稀疏計算真正跑起來。

因此墨芯一直在布局稀疏計算生態(tài)拓展,目前該公司已經(jīng)完成百度飛槳等AI框架、浪潮、新華三等主流服務(wù)器的適配,并加入龍蜥等國內(nèi)主流生態(tài)。

文章圖片4

王維談到,生成式AI產(chǎn)業(yè)發(fā)展對于現(xiàn)有的生態(tài)而言是一個巨大的挑戰(zhàn),需要更聰明的方式去訓(xùn)練更大更稀疏的模型。未來,隨著應(yīng)用場景、應(yīng)用數(shù)量的不斷豐富與激增,生態(tài)構(gòu)建將逐漸完備。

總的來看,生成式AI產(chǎn)業(yè)最終會落地到具體的應(yīng)用場景中,而墨芯在其中扮演的角色更像是一個“裝備庫”,支撐著大模型背后龐大的算力需求,這也正是對AI芯片創(chuàng)企背后技術(shù)積累的突擊檢查。

04.

結(jié)語:“狂飆”的ChatGPT背后

“創(chuàng)新基因”成AI芯片創(chuàng)企致勝關(guān)鍵

多年來,AI領(lǐng)域已經(jīng)鮮少有像今天ChatGPT引發(fā)的熱潮這樣,讓全球的人才、資本焦點都集中于此,也讓多個產(chǎn)業(yè)站到了聚光燈下,AI芯片創(chuàng)企就是這樣的存在。

雖然熱潮爆發(fā)往往有一定的預(yù)兆,但想要快速切入風(fēng)口、抓住機遇需要更快速的反應(yīng)和行動力。在這樣的巨大變革下,擁有強大技術(shù)團隊和對技術(shù)路線有獨到判斷的墨芯更有底氣。

盡管相比于科技巨頭,AI芯片創(chuàng)企的體量、人才、資源都無法比擬,但正如王維所言,尋找創(chuàng)新路徑是支撐未來大模型發(fā)展的關(guān)鍵。而這并不被大公司所獨有。因此,大規(guī)模算力不斷攀升的當(dāng)下,也進一步加速了AI芯片創(chuàng)企的規(guī)?;涞夭季?。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多