作者 | 常棣
華為云的科學(xué)家都快成工程師了。
過(guò)去幾年,華為云把一批又一批博士、專家、科學(xué)家派到客戶現(xiàn)場(chǎng),下礦井、進(jìn)車間,送到了山東能源,送到一汽車間,送到貴州直播基地,送到泰國(guó)氣象局,幫助超過(guò)1000家企業(yè)落地智能化創(chuàng)新項(xiàng)目。
在互聯(lián)網(wǎng)大廠看來(lái),這是吃力不討好的事,產(chǎn)業(yè)互聯(lián)網(wǎng)概念興起的早期,大廠們掀起了浩浩蕩蕩的“下鄉(xiāng)”運(yùn)動(dòng),目的就是為了搞懂行業(yè)Know-How,但效果卻并不好,行業(yè)壁壘強(qiáng)、人力成本高、回報(bào)周期長(zhǎng)、技術(shù)價(jià)值不明顯等等,他們大多沒找到技術(shù)和業(yè)務(wù)結(jié)合的長(zhǎng)久方法。
華為云的科學(xué)家有些不一樣。印象中的科學(xué)家總是在探索艱辛晦澀的原理,尋求解答關(guān)于世界運(yùn)作方式的根本問(wèn)題,而工程師則更加注重實(shí)際應(yīng)用和解決實(shí)際問(wèn)題,設(shè)計(jì)和制造出滿足人們需求的實(shí)際產(chǎn)品或系統(tǒng)。
經(jīng)歷過(guò)AI產(chǎn)業(yè)潮起潮落,接觸過(guò)大模型的人都知道,科學(xué)家解決“可能性”問(wèn)題,工程師解決“可行性”問(wèn)題,華為人將這兩種身份不沖突地聯(lián)系起來(lái),游走在AI技術(shù)創(chuàng)新與業(yè)務(wù)需求的交匯點(diǎn)。

在華為全聯(lián)接大會(huì)2023上,華為云盤古大模型喊出了“解難題、做難事、行致遠(yuǎn)” 的口號(hào),而這一切的前置條件,在于提出正確的問(wèn)題。
為大模型提正確的問(wèn)題
愛因斯坦曾經(jīng)說(shuō)過(guò):“提出一個(gè)問(wèn)題往往比解決一個(gè)問(wèn)題更重要。因?yàn)榻鉀Q問(wèn)題也許僅是一個(gè)數(shù)學(xué)上或?qū)嶒?yàn)上的技能而已,而提出新的問(wèn)題,卻需要有創(chuàng)造性的想象力,而且標(biāo)志著科學(xué)的真正進(jìn)步?!?/span>
大模型是先有技術(shù)創(chuàng)新,再去找尋業(yè)務(wù)場(chǎng)景,不可否認(rèn)大模型的革命性,但是,大模型看似提供了一個(gè)無(wú)所不能的工具,實(shí)際上卻沒有天然適配的生長(zhǎng)場(chǎng)景,尤其在需要可靠穩(wěn)定的企業(yè)級(jí)場(chǎng)景,大模型需要做到“人無(wú)我有,人有我優(yōu)”。
這就要求科學(xué)家和工程師提出正確的問(wèn)題,左手大模型,右手業(yè)務(wù)場(chǎng)景,把大模型嵌入到業(yè)務(wù)場(chǎng)景的深處,之后作出假設(shè)大膽論證,完成大模型的業(yè)務(wù)閉環(huán),目前最熟悉大模型的還是科學(xué)家們,華為云將寶貴的人力放到一線順理成章。
華為云科學(xué)家口中的關(guān)鍵詞自然變成——落地,落地,還是落地。
“沒有調(diào)研實(shí)踐,就沒有發(fā)言權(quán),AI落地需要腳踏實(shí)地?!比A為云AI高級(jí)研究員謝凌曦表示,他是盤古CV基礎(chǔ)大模型的主要負(fù)責(zé)人。
謝凌曦提到,“我們認(rèn)為的很多簡(jiǎn)單場(chǎng)景,其實(shí)都面臨著我們想象不到的困難。AI算法并不是萬(wàn)能的,只有算法與需求緊密結(jié)合,算法專家與行業(yè)專家密切配合,才能走出AI落地的道路來(lái)。”
憑借盤古氣象大模型登上Nature的一作作者愷峰,同樣把落地當(dāng)做追求。
“AI落地和AI科研之間的區(qū)別——科研的時(shí)候只需要在'imagenet數(shù)據(jù)集’上精度高一兩個(gè)點(diǎn)就可以了,但是落地的場(chǎng)景很碎片化,數(shù)據(jù)標(biāo)注流程和質(zhì)量要自己控制,算法調(diào)優(yōu)周期要盡可能的短,樣本數(shù)目比較少但是場(chǎng)景特別多。落地場(chǎng)景一般做起來(lái)都比較快樂(lè),對(duì)我而言,更困難的地方是寫各種文字材料,還有就是場(chǎng)景很碎片化,我更想做一些'價(jià)值更大’的問(wèn)題?!彼f(shuō)。

會(huì)上,華為常務(wù)董事、華為云CEO張平安表示,今年華為云還將派200多位博士深入客戶現(xiàn)場(chǎng),抓住AI技術(shù)創(chuàng)新與業(yè)務(wù)需求的結(jié)合點(diǎn)。盤古大模型“不做詩(shī)、只做事”,而是要“解難題,做難事,行致遠(yuǎn)”;盤古大模型為解決行業(yè)難題而生,它不僅要做難事,更要幫助千行萬(wàn)業(yè)的客戶解難題,讓每個(gè)行業(yè)、每家企業(yè)、每個(gè)人的工作更高效、更輕松。
很多采買大模型的企業(yè)和大模型企業(yè)的工程師都沒打過(guò)照面,華為云投入了如此之大的資源,不會(huì)滿足于誰(shuí)都能做的淺層場(chǎng)景,此前如GaussDB、軟件開發(fā)工具、AI云服務(wù)等,華為云都選擇了難度最大卻也回報(bào)最大的方向,“解難題、做難事”的思路也貫徹到了大模型領(lǐng)域。
瞄準(zhǔn)5%的Corner case
一個(gè)殘酷又現(xiàn)實(shí)的問(wèn)題是,幾乎沒有企業(yè)不準(zhǔn)備或已經(jīng)采用AI技術(shù),但如果說(shuō)哪個(gè)企業(yè)沒有AI技術(shù)就無(wú)法正常運(yùn)轉(zhuǎn),也幾乎沒有。這對(duì)如今大模型的啟示很明確,就是要解決產(chǎn)業(yè)中的Corner case,才有不可替代的價(jià)值。
以自動(dòng)駕駛領(lǐng)域?yàn)槔?,影響高階自動(dòng)駕駛落地的關(guān)鍵因素,不再是解決常見的一般案例,而是讓模型快速學(xué)習(xí)各類不常見但不斷出現(xiàn)的Corner Case,這類問(wèn)題只占5%甚至更少,但卻是實(shí)實(shí)在在的瓶頸。
例如??吭诼愤叺陌咨ㄜ嚕P涂赡軙?huì)識(shí)別為天上的云朵,不會(huì)觸發(fā)剎車,就會(huì)導(dǎo)致碰撞事故的發(fā)生。

大模型來(lái)了之后這些問(wèn)題就能迎刃而解嗎?當(dāng)然不是。Corner case閉環(huán)涉及數(shù)據(jù)預(yù)處理、數(shù)據(jù)標(biāo)注、模型訓(xùn)練、模型仿真等多個(gè)環(huán)節(jié),最阻礙Corner case快速閉環(huán)的,是如何快速挖掘出足夠多的樣本數(shù)據(jù)來(lái)啟動(dòng)訓(xùn)練。
每一個(gè)問(wèn)題和方向的抉擇,都意味著潛在的大量?jī)?yōu)化和經(jīng)驗(yàn)沉淀,點(diǎn)滴的進(jìn)步都鋪就在開發(fā)和工程的積累之上。華為云推出基于大模型的自動(dòng)駕駛場(chǎng)景數(shù)據(jù)生成解決方案有三大特點(diǎn):
對(duì)數(shù)據(jù)質(zhì)量更加魯棒,支持位姿偏移自動(dòng)修正,實(shí)現(xiàn)多旅程重建、并進(jìn)一步仿真和生成新行駛軌跡數(shù)據(jù);
重建精度高,開闊大場(chǎng)景精度厘米級(jí),誤差小于千分之三,從而實(shí)現(xiàn)大視角變換,支持不同車型適配和車道變換;
重建場(chǎng)景可按需編輯:支持通過(guò)環(huán)拍數(shù)據(jù)進(jìn)行3D物體重建、并將重建的交通參與者添加到原場(chǎng)景中。
基于盤古大模型的場(chǎng)景生成能力,企業(yè)可以構(gòu)造出雨天、下雪天場(chǎng)景用于模型的訓(xùn)練,不用再等待特殊的天氣出現(xiàn)才能進(jìn)行數(shù)據(jù)采集。20%的路測(cè)工作可以通過(guò)大模型的場(chǎng)景生成來(lái)實(shí)現(xiàn),縮短了里程積累的周期。大模型能夠快速的構(gòu)建出場(chǎng)景豐富的樣本,而且對(duì)樣本的數(shù)量要求也只有以前小模型的十分之一,通過(guò)應(yīng)用盤古大模型可以讓自動(dòng)駕駛的Corner Case實(shí)現(xiàn)天級(jí)的閉環(huán)。
此外,盤古大模型也展示了醫(yī)療、數(shù)字人、軟件研發(fā)、政務(wù)、礦山、氣象等方向的最新成果。

例如盤古政務(wù)大模型接入了城市數(shù)十萬(wàn)視頻源進(jìn)行聯(lián)動(dòng)分析,基于對(duì)百萬(wàn)政務(wù)知識(shí)精調(diào)、政務(wù)規(guī)則理解與執(zhí)行的能力,盤古大模型能實(shí)時(shí)精準(zhǔn)理解及分析畫面內(nèi)容存在哪些城市損壞及異常的現(xiàn)象,城市事件處理效率提升了50%以上。
大模型廠商不僅要了解科學(xué)、懂得技術(shù),更要知道行業(yè)know-how和其背后的意義,通過(guò)工程化的實(shí)踐,把構(gòu)想轉(zhuǎn)變成能力,華為云既能提出問(wèn)題,也能解決問(wèn)題,這就是華為云的不同之處,也是其為盤古大模型蹚出的道路。
百模千態(tài),吃掉算力還是被算力吃掉?
參考新技術(shù)的發(fā)展路徑,大模型大概率是由底層及上層,由硬件及軟件,待到成熟形態(tài)又會(huì)往復(fù)螺旋式的發(fā)展,目前數(shù)百個(gè)大模型、數(shù)以千計(jì)的業(yè)務(wù)形態(tài),都仰仗于算力。
在大模型的熱潮下,全球AI算力供給短缺,受外部因素影響,國(guó)內(nèi)企業(yè)獲取高端AI算力進(jìn)一步受到限制,大模型的競(jìng)爭(zhēng)也是算力的競(jìng)爭(zhēng),只有發(fā)展持續(xù)供應(yīng)、自主可控的AI算力,中國(guó)大模型才不至于是空中樓閣。
換個(gè)角度想,成本高企的AI算力也是橫亙?cè)诖竽P蜕虡I(yè)化前的難關(guān),沒有高效率、低成本、可大規(guī)模復(fù)制的算力,大模型商業(yè)閉環(huán)注定是磕磕絆絆。
如今,擺在所有廠商面前的共同難題,是吃掉算力,還是被算力吃掉?華為也給出了自己的答案。
全聯(lián)接大會(huì)首日,華為副董事長(zhǎng)、輪值董事長(zhǎng)、CFO孟晚舟提到,大模型需要大算力,算力大小決定著AI迭代與創(chuàng)新的速度,也影響著經(jīng)濟(jì)發(fā)展的速度。算力的稀缺和昂貴,已經(jīng)成為制約AI發(fā)展的核心因素。
華為致力于打造中國(guó)堅(jiān)實(shí)的算力底座,為世界構(gòu)建第二選擇,將持續(xù)提升“軟硬芯邊端云”的融合能力,做厚“黑土地”,滿足各行各業(yè)多樣性的AI算力需求。
翌日,華為云便拿出了昇騰AI云服務(wù)的解決方案,以云服務(wù)的方式提供AI算力,讓企業(yè)直接云上獲取,隨取隨用,更加高效敏捷地實(shí)現(xiàn)開發(fā)和使用大模型。

從算力布局來(lái)看,華為云提供了貴安、烏蘭察布、蕪湖3大AI云服務(wù)節(jié)點(diǎn),客戶可以就近接入,服務(wù)即開即用,數(shù)據(jù)加密傳輸,大模型訓(xùn)練和推理算力觸手可及。
從訓(xùn)練效果來(lái)看,昇騰AI云服務(wù)支持千卡預(yù)訓(xùn)練故障自動(dòng)診斷恢復(fù),增強(qiáng)智能運(yùn)維工具能力,實(shí)現(xiàn)分鐘級(jí)信息獲取、2小時(shí)定界、24小時(shí)提供解決方案;任務(wù)恢復(fù)時(shí)長(zhǎng)<30分鐘。
最重要的是兼容的深度和廣度,昇騰AI云服務(wù)支持“百模千態(tài)”,內(nèi)化優(yōu)質(zhì)開源大模型,降低大模型使用門檻,后續(xù)將支持上百個(gè)開源大模型,同時(shí)提供豐富的開發(fā)、遷移工具鏈,集成全棧的開發(fā)工具、自動(dòng)化實(shí)施工具,典型模型遷移效率低至2周,主流場(chǎng)景自助遷移。
大模型是革命性技術(shù)創(chuàng)新不假,但有了算力,才有了想象力,有了提出問(wèn)題-解決問(wèn)題的循環(huán),才有持久的商業(yè)落地模式。外界喧囂仍在,華為云低頭趕路,大模型距離真正意義上的科學(xué)進(jìn)步,漸行漸近。
The End





