中新經(jīng)緯2月23日電 前Google高級資深研究員吳軍有一部著名的小說《浪潮之巔》,其中寫道,“總有一些公司很幸運(yùn)地、有意識或無意識地站在技術(shù)革命的浪尖之上,在長達(dá)十年甚至幾十年的時間里,他們代表著科技的浪潮,直到下一波浪潮的來臨。”
這樣的公司,站在了浪潮之巔。
當(dāng)眼下這波由國外ChatGPT引發(fā)的科技浪潮向中國席卷而來,人們也在“眾里”尋找,誰能做出中國的大語言模型?誰會站在新的浪潮之巔?驀然回首處發(fā)現(xiàn),百度具備這樣的綜合實力。
百度也積極地對市場關(guān)切給予了回應(yīng)。2月7日,百度確認(rèn)生成式AI產(chǎn)品命名為文心一言(ERNIE Bot),并將在3月份推出。很快,22日,百度在Q4及全年財報發(fā)布當(dāng)日宣布,計劃將多項主流業(yè)務(wù)與文心一言整合。
摘明珠的人
百度文心一言站在浪潮之巔,也在驀然回首處,對這句話的理解,要從兩方面。
作為AIGC(人工智能生成內(nèi)容)最成功的應(yīng)用,ChatGPT本身是一款自然語言處理(NLP)大模型。而NLP被稱為“人工智能皇冠上的明珠”,誰能實現(xiàn)自然語言處理技術(shù)的突破,誰就能在AI領(lǐng)域一騎絕塵。
百度已經(jīng)摘到了這顆明珠,站在了浪潮之巔。
而之所以身處驀然回首處,則是因為百度這個NLP領(lǐng)域已經(jīng)默默深耕了許多年。
早在2000年百度誕生之時,準(zhǔn)確說從百度處理用戶的第一次搜索開始,NLP技術(shù)就成為搜索技術(shù)的重要組成部分,并伴隨著百度的快速發(fā)展,同步甚至更快地發(fā)展壯大。
2010年初,百度對NLP的工作進(jìn)行了重新梳理與規(guī)劃,百度自然語言處理部正式成立,并不斷在語音、圖片等技術(shù)上布局,敲定了在知識圖譜技術(shù)上長期投入的戰(zhàn)略。
2019年3月,百度提出知識增強(qiáng)的語義理解框架ERNIE,在深度學(xué)習(xí)的基礎(chǔ)上融入知識,同時具備持續(xù)學(xué)習(xí)能力,曾一舉登頂全球權(quán)威數(shù)據(jù)集GLUE榜單,首次突破90分大關(guān),刷新榜單歷史。
也就是從2019年開始,業(yè)界進(jìn)入開放域?qū)υ挻竽P偷难芯?,這個技術(shù)讓生成式對話有了質(zhì)的提升。
2021年9月,百度發(fā)布了PLATO-XL,這是全球首個百億參數(shù)的對話大模型,一舉超過 Facebook Blender、谷歌 Meena和微軟 DialoGPT,成為全球首個百億參數(shù)中英文對話預(yù)訓(xùn)練生成模型,再次刷新了開放域?qū)υ捫Ч?,打開了對話模型的想象空間。
當(dāng)市場驚訝于百度能以如此快的速度向用戶推出文心一言時,知情者才知道百度這種底氣來自于強(qiáng)大的NLP技術(shù)實力。
你無我有,你有我強(qiáng)
除了強(qiáng)大的NLP技術(shù)實力加持,百度快速推出中國大語言模型文心一言,其他工作絕不是從零開始。
當(dāng)人類進(jìn)入人工智能時代后,IT技術(shù)的技術(shù)棧就發(fā)生了根本性的變化。過去基本分為三層:芯片層、操作系統(tǒng)層和應(yīng)用層?,F(xiàn)在可以分為四層:芯片層、框架層、模型層和應(yīng)用層。
而對于百度而言,其在芯片、框架、模型、應(yīng)用四層技術(shù)棧均有布局,又得益于這四層技術(shù)棧,大語言模型相關(guān)技術(shù),百度在中國乃至全球范圍均具有綜合優(yōu)勢。
具體的,在芯片層面,百度自研AI芯片“昆侖”已在多場景實際部署幾萬片,在百度搜索業(yè)務(wù)中也已形成較強(qiáng)工程化實踐,這讓文心一言底層算力有所保證。
在框架層,飛槳深度學(xué)習(xí)平臺下接芯片上承應(yīng)用,提供了從便捷開發(fā)、高效訓(xùn)練到滿足多端多平臺推理部署的全棧能力,大幅提升了AI深度學(xué)習(xí)模型的研發(fā)效率。
在模型層,百度的文心大模型和Open AI的GPT模型類似,并在2019年就已經(jīng)推出,迄今已經(jīng)迭代了多次,從單一的自然語言理解延申到多模態(tài),包括視覺、文檔、文圖、語音等多模態(tài)多功能,且已在行業(yè)得到普遍應(yīng)用。因此文心一言所基于的ERNIE系列模型也已經(jīng)具備較強(qiáng)泛化能力和性能,足夠為用戶提供相應(yīng)的服務(wù)。
在應(yīng)用層面,百度深度學(xué)習(xí)技術(shù)與場景融合創(chuàng)新,應(yīng)用場景日漸豐富,人工智能技術(shù)與實體經(jīng)濟(jì)也加速融合。此外,還催生了一批新業(yè)態(tài)新模式,有望深刻改變?nèi)祟惿a(chǎn)生活方式和思維模式,實現(xiàn)社會生產(chǎn)力的整體躍升。
其實不難發(fā)現(xiàn),當(dāng)科技浪潮席卷而來,百度之所以能站在浪潮之巔,很重要一個原因來自于超前布局,早期的投資奠定了百度在人工智能浪潮中的有利地位,也讓百度在市場競爭中掌握先機(jī)和主動權(quán),成為中國人工智能市場長期增長的最佳代表。最新財報顯示,2022年百度核心研發(fā)費(fèi)用達(dá)到214.16億元,占百度核心收入比例達(dá)22.4%。
看得最遠(yuǎn)的地方
雖然這股科技浪潮由ChatGPT而起,但必須理性認(rèn)識到,ChatGPT并不是革命性的技術(shù)。直接點(diǎn)說,ChatGPT并未實現(xiàn)底層模型的顯著突破,它基于人類反饋進(jìn)行強(qiáng)化訓(xùn)練,給人帶來了一種更加智能的感覺。
而百度實際上正在思考更遠(yuǎn)方的問題,即如何把技術(shù)做成人人需要的產(chǎn)品,讓人們從中受益。
百度創(chuàng)始人李彥宏曾說:“ChatGPT是AI技術(shù)發(fā)展到一定階段后的新機(jī)會。怎么把這么酷的技術(shù),變成人人需要的產(chǎn)品,讓每天有幾億人從中受益?怎么賦能千行百業(yè),讓他們的生產(chǎn)效率大幅度地提升?這一步才是最難的,也是最偉大、最能夠產(chǎn)生影響力的?!?/p>
這也就預(yù)示了,實際上也是可期待的,百度文心一言,要走比ChatGPT更遠(yuǎn)的路。
在發(fā)給百度全員的財報信中,李彥宏還重點(diǎn)介紹了將在三月份推出的生成式AI產(chǎn)品文心一言(ERNIE Bot),宣布計劃將多項主流業(yè)務(wù)與文心一言整合,包括搜索、智能云、Apollo自動駕駛、小度智能設(shè)備等。
以搜索業(yè)務(wù)為例,文心一言推出后,將與目前以“知一”“千流”為代表的搜索引擎相互協(xié)作,共同為用戶提供服務(wù)。可預(yù)見的是,與傳統(tǒng)的搜索引擎相比,接入文心一言后的百度搜索,可以提供更加智能化的答案,免去用戶從上到下依次點(diǎn)擊鏈接進(jìn)行確認(rèn)的步驟。而這一變化也有望為百度,甚至為整個互聯(lián)網(wǎng)行業(yè)帶來收入形式的革新,并擁有極大的想象空間。
此外,百度將開放文心一言大模型,支持更多企業(yè)構(gòu)建自己的模型和應(yīng)用,賦能交通、能源、制造等實體經(jīng)濟(jì)領(lǐng)域,實現(xiàn)生產(chǎn)效率的大幅提升。
在不久的未來,因為文心一言,AI市場將迎爆發(fā)式需求增長。
此外,還有一個容易忽視的細(xì)節(jié)是,文心一言所基于的文心大模型,是地地道道的本土化的AI模型,具備對中文、甚至中國文化的更深理解,這意味著文心一言會更適合中文和中國市場。
而且,隨著ERNIE Bot的公眾開放,有望建立起立真實的用戶調(diào)用和模型迭代之間的飛輪,模型將越來越聰明,給用戶帶來更加聰明的體驗。(中新經(jīng)緯APP)




