互聯(lián)網(wǎng)大廠聚光燈之外,對話式AI創(chuàng)業(yè)的現(xiàn)實(shí)與未來。
“對話式AI,是這輪AIGC變革中應(yīng)用落地的核心。” 王益為(ID:王一快)是AI創(chuàng)業(yè)公司“秘塔科技”的COO。在百度“文心一言”推出的前幾周,秘塔科技就先行一步,推出了國產(chǎn)AI對話產(chǎn)品“對話寫作貓”。 
過去的幾個月,我們看到Open AI以令人眼花繚亂的速度,接連推出Chat GPT及其后續(xù)的GPT4等系列AI對話產(chǎn)品,一次次刷新人類與AI交互智能化的上限。當(dāng)自然語言成為了能夠直接與機(jī)器對話的工具,在人工智能的支持下發(fā)揮出前所未有的創(chuàng)造力,維特根斯坦的那句名言“語言的界限,就是我世界的界限”,正在被飛速更新的技術(shù)所驗(yàn)證。 正因如此,以Chat GPT為代表的對話式AI,成了AIGC落地應(yīng)用的核心,也讓這條賽道上的變化顯得格外引人矚目。不論是百度推出文心一言,還是Open AI推出的GPT4,還是Google的Brad,這些對話AI生成的每段對話,都有可能影響一個超級巨頭的股價,也不斷引發(fā)著人們的討論:大洋兩岸,對話式AI產(chǎn)品技術(shù)差距到底有多大? 除了百度的文心一言,國內(nèi)還有不少AI對話產(chǎn)品,共同組成了國產(chǎn)對話式AI的創(chuàng)業(yè)生態(tài)。類似對話寫作貓這樣的創(chuàng)新者,雖然在大廠的聚光燈之外,但同屬這個生態(tài)的一部分,同樣值得我們關(guān)注。 2023年春天,刺猬公社(ID:ciweigongshe)去了一趟秘塔科技公司位于北京的辦公室,和王一快聊了聊對話式AI創(chuàng)業(yè)的現(xiàn)實(shí)與未來。 
創(chuàng)業(yè)公司,也能做對話式AI第一批在國內(nèi)做出對話式AI產(chǎn)品的,并不是BAT級別的大公司,而是以秘塔科技為代表的中小創(chuàng)業(yè)公司。這里需要特別指出的是,他們并不是簡單調(diào)用ChatGPT的API接口的“套娃”產(chǎn)品,而是實(shí)打?qū)嵉厝プ灾餮邪l(fā)大語言模型,其原理和Open AI別無二致。 在2021年左右,秘塔科技就在研究如何用AI去生成內(nèi)容;再到2022年12月,先是拿出了AI生成文字和圖片的能力,并且在這之前,就已經(jīng)在讓機(jī)器去進(jìn)行多輪對話。為了早日拿出對話寫作貓,過去幾個月,秘塔科技的幾乎所有研發(fā)人員把全部精力都投入在了這上面,近期也在不斷進(jìn)行完善。 在對話寫作貓之前,秘塔寫作貓就是一個比較成功的文檔產(chǎn)品了,擁有近千萬用戶。“這不是我們能力的全部,我們還能做得剛好?!蓖跻豢煺f,“不是說看了人家做了,我們馬上就做,我們一直有技術(shù)積累?!?/span> 談到為什么能這么快地做出對話式AI產(chǎn)品,王一快還提到一點(diǎn),那就是不一味追求模型的大——動輒千億、萬億的參數(shù)量,和創(chuàng)業(yè)公司的能力規(guī)模也不匹配。此外,模型也不一定“大就是好”,還要看AI生成對話的質(zhì)量,以及AI是否真正理解了多輪對話的上下文,理解了對話者背后的意思。 
生成效果 目前,對話寫作貓一方面可以實(shí)現(xiàn)AI對話,一方面還可以根據(jù)用戶的指令生成文字內(nèi)容。比如當(dāng)用戶輸入“寫一個小紅書筆記”,它真的可以模仿小紅書的內(nèi)容風(fēng)格,寫一段美妝產(chǎn)品的評測。此外,還可以實(shí)現(xiàn)圖片等內(nèi)容的生成,具有相當(dāng)?shù)亩嗄B(tài)能力。從這個角度上看,對話寫作貓的AI能力其實(shí)和國內(nèi)大廠的產(chǎn)品相差不大。 相比國外同行,對話寫作貓在中文輸出方面也有一定的優(yōu)勢,比如在改寫文章、生成文章等方面,甚至比Chat GPT做得還要好。至于多輪對話能力,還是和Chat GPT有一定差距。“可以期待半年之內(nèi)達(dá)到和ChatGPT'平替’的效果?!蓖跻豢煺f。 
大模型,自研的才放心在國內(nèi)的不少對話式AI創(chuàng)業(yè)項目中,相當(dāng)多的團(tuán)隊不會“硬啃”大模型,就連小冰CEO李笛也曾斷言,“大模型在今天這個時代,還不是創(chuàng)業(yè)公司可以玩轉(zhuǎn)的”。比如,用戶體驗(yàn)還不錯的“Inspo”和“Aski”,都是基于GPT模型開發(fā)的。
但如果每個創(chuàng)業(yè)公司都是在Open AI模型的基礎(chǔ)上修修補(bǔ)補(bǔ),這種創(chuàng)新的含金量到底有多少?質(zhì)疑的聲音,同樣也沒有停止過。 對話寫作貓就沒有使用開源模型,或者調(diào)用API接口,而是走自研的路子。 這也是一條相當(dāng)考驗(yàn)技術(shù)的路子。僅僅從語料的角度看,中文語料就要比英文語料復(fù)雜很多,語料的清洗和質(zhì)量控制的難度都更大。 相比英文,中文的變化更多。比如,語言文字還會受到語氣等多種因素的影響,同樣的詞匯,在不同語境中的意思就不一樣。再加上流行梗和不斷產(chǎn)生的新詞匯,機(jī)器理解的難度就更大了。因此,如何處理好海量的工程細(xì)節(jié),是打造中文對話式AI過程中最大的難點(diǎn)。 但這也正好是愿意自研大語言模型的創(chuàng)業(yè)公司的機(jī)會。王一快告訴刺猬公社,首先,目前開源的大模型主要是以英文為語料庫進(jìn)行訓(xùn)練的,中文部分較少。為了適應(yīng)中文而去做調(diào)優(yōu),本身就有“先天不足”,比如有的時候其輸出的內(nèi)容,并不符合中國人的文字習(xí)慣。 另外,已經(jīng)開源的技術(shù)往往是上一時代的技術(shù)。一些團(tuán)隊愿意開源,是因?yàn)樗麄円呀?jīng)掌握了更先進(jìn)的技術(shù),才會把上一代技術(shù)開源出來。而其他開源技術(shù)的使用者,不論如何也沒法追趕最先進(jìn)的水平。 更重要的是,創(chuàng)業(yè)公司也要保持技術(shù)的自主性,一方面國內(nèi)在自然語言處理方面的研發(fā)能力并不差,具備相當(dāng)積累;另一方面也要避免被“卡脖子”,比如號稱“AI競賽心臟”的英偉達(dá)A100芯片停止對華出售,就是一個前車之鑒。 
大模型的未來:“黑鏡”式的商業(yè)化?
科幻劇集《黑鏡》描繪了這樣的一幅圖景:人們可以將親人生前的社交媒體資料“投喂”給AI,訓(xùn)練出一個可以模擬親人語氣和思想對話的App,可以聊天、可以打電話,甚至可以借助機(jī)器人將失去的親人帶回身邊...... 
《黑鏡:馬上回來》劇照 現(xiàn)在借助大語言模型,這個即便在前幾年仍然被認(rèn)為相當(dāng)科幻的場景,其“內(nèi)核”部分幾乎已經(jīng)成為現(xiàn)實(shí)。王一快就向我們透露了最近接觸的一個需求: 某機(jī)構(gòu)給一位已經(jīng)去世的老學(xué)者打造了一個數(shù)字人形象,讓人們可以繼續(xù)看到他的音容笑貌;在這個基礎(chǔ)上,還想把他的論文和學(xué)術(shù)觀點(diǎn)“裝”進(jìn)這個數(shù)字人的大腦,讓數(shù)字人也能繼續(xù)按照這位學(xué)者原本的思想模式,模擬出學(xué)者生前的樣子,繼續(xù)和人們進(jìn)行多輪對話。 “讓數(shù)字人有了腦子,這件事本身就有意義?!蓖跻豢煺f。他還舉了一個法律行業(yè)的例子,大語言模型可以與律師的數(shù)字人形象結(jié)合,作為一個真人咨詢之前的程序處理客戶的問題。雖然還不能取代高端的律師服務(wù),但比較初級的律師,將在知識儲備量和同時服務(wù)的能力上無法相比。 在商業(yè)化上,對話式AI的想象空間還有很大。在ChatGPT驗(yàn)證了對話式AI作為一種新的人機(jī)交互的方式之后,對話式AI很有可能作為一個統(tǒng)一的出口,把其他的AI能力都打包起來統(tǒng)一輸出,成為整個AI產(chǎn)業(yè)落地的主力。 比如對于秘塔科技的文檔產(chǎn)品——秘塔寫作貓來說,文檔的起草、修改等都可以借力AI能力做得更好。目前,秘塔寫作貓已經(jīng)有了教育、互聯(lián)網(wǎng)等行業(yè)的客戶,其中的主要付費(fèi)用戶為企業(yè)B端客戶。而對話寫作貓的落地,也有可能借助“先行”的秘塔寫作貓,抓住同樣的客戶群體。 就在2023年3月下旬,秘塔寫作貓進(jìn)行了一次更新,用戶只要輸入雙斜杠,就能呼出指令框,在文檔內(nèi)直接生成方案、周報、工作總結(jié)、提煉精華等不同形式的內(nèi)容。從這里也不難看出,對話式AI的商業(yè)化,還有相當(dāng)多的故事可講。 (本文頭圖由計算美學(xué)產(chǎn)品“畫宇宙”AI生成)
|