![]() 越是建立在“應(yīng)用大模型”基礎(chǔ)上的AI應(yīng)用,理論上就越有機(jī)會(huì)成功跑出。 作者|王藝 編輯|栗子 2025年的春節(jié)假期剛剛過(guò)去,但是DeepSeek引發(fā)的沖擊波仍然余溫未散。 通過(guò)FP8訓(xùn)練、多詞元預(yù)測(cè)、改良MOE架構(gòu)、多頭潛在注意力機(jī)制(MLA)、無(wú)SFT強(qiáng)化學(xué)習(xí)等方法,DeepSeek-V3以極低的訓(xùn)練成本實(shí)現(xiàn)了超越Qwen2.5-72B和Llama-3.1-405B等頂尖開源模型和部分閉源模型的性能,DeepSeek-R1更是表現(xiàn)出了超越OpenAI o1的推理效果。 DeepSeek系列模型的成功,為原來(lái)以算力為核心邏輯驅(qū)動(dòng)的大模型行業(yè)開辟了新的道路,讓全球的基礎(chǔ)型大模型邁上了一個(gè)嶄新的臺(tái)階。 然而,在DeepSeek等以“技術(shù)敘事”為主旋律的基礎(chǔ)型大模型之外,還有一類大模型的研發(fā)進(jìn)展值得關(guān)注,那就是圍繞核心產(chǎn)品、核心場(chǎng)景進(jìn)行AI技術(shù)創(chuàng)新的應(yīng)用型大模型。 中國(guó)一直以來(lái)就是應(yīng)用大國(guó)。 2024年,在算力供給逐漸跟上、推理價(jià)格大幅下降的大背景下,國(guó)產(chǎn)AI應(yīng)用異軍突起——無(wú)論是文生圖、文生視頻領(lǐng)域的即夢(mèng)AI、妙鴨相機(jī)、快手可靈,還是AI搜索領(lǐng)域的納米搜索(原360AI搜索)、天工AI搜索,還是AI陪伴領(lǐng)域的星野、貓箱,抑或是AI助手類的豆包、夸克、Kimi、通義等,都在2024年迎來(lái)了用戶量的爆發(fā)。 這一個(gè)個(gè)AI應(yīng)用,離不開背后模型能力的支撐。對(duì)AI應(yīng)用來(lái)說(shuō),應(yīng)用型大模型比拼的不是模型參數(shù),而是應(yīng)用效果。 例如此前Kimi之所以能夠在短時(shí)間內(nèi)獲得較高的關(guān)注度,與其背后大模型的長(zhǎng)文本讀取和解析能力密不可分;夸克的2億用戶量和7000萬(wàn)月活得益于其背后夸克大模型的“用戶友好”;可靈AI強(qiáng)大的文生視頻、圖生視頻功能則依賴可靈大模型的支持。 基礎(chǔ)型大模型的進(jìn)化還遠(yuǎn)未到盡頭,但隨著2025年越來(lái)越多的公司開始布局AI應(yīng)用,應(yīng)用型大模型的發(fā)展將會(huì)是配合AI應(yīng)用全面爆發(fā)的必要前提。 1.為什么大廠做AI應(yīng)用更有優(yōu)勢(shì)![]() 隨著大模型技術(shù)的成熟與突破、算力基礎(chǔ)設(shè)施的日漸完善、國(guó)家政策的持續(xù)加碼、Sora/Suno等殺手級(jí)應(yīng)用的不斷涌現(xiàn)、AI Agent/具身智能/AI玩具/AI眼鏡等領(lǐng)域投融資的強(qiáng)勁增長(zhǎng),2025年是AI應(yīng)用的爆發(fā)年,幾乎已經(jīng)成為科技界的廣泛共識(shí)。 并且這種共識(shí)還因DeepSeek的火爆而加速。因?yàn)镈eepSeek將行業(yè)基礎(chǔ)模型能力水位推高,給AI應(yīng)用營(yíng)造了一個(gè)更好的發(fā)展環(huán)境。 據(jù)「甲子光年」觀察,2024下半年至今,高瓴資本、經(jīng)緯創(chuàng)投、百度風(fēng)投、英諾等知名投資機(jī)構(gòu)加大了對(duì)于AI應(yīng)用的投資力度,尤其是瞄準(zhǔn)AI應(yīng)用領(lǐng)域的早期項(xiàng)目下注;有投資人表示,截至2024年末,一級(jí)市場(chǎng)真實(shí)獲得融資的AI應(yīng)用項(xiàng)目數(shù)量,比實(shí)際公布出來(lái)的項(xiàng)目數(shù)量至少多兩倍。 Sensor Tower數(shù)據(jù)也顯示,2024年,全球手機(jī)用戶在AI應(yīng)用上的支出達(dá)到了12.7億美元,AI相關(guān)的應(yīng)用在iOS和谷歌Play商店中的下載量高達(dá)170億次。 然而一個(gè)殘酷的現(xiàn)實(shí)是,AI應(yīng)用千千萬(wàn),真正能維持長(zhǎng)久運(yùn)營(yíng)的只是少數(shù),能爆火的更是寥寥無(wú)幾。 「甲子光年」就曾經(jīng)報(bào)道過(guò)一個(gè)名為“AI墓地”的網(wǎng)站,里面收錄了738個(gè)死亡或停止運(yùn)行的AI應(yīng)用,其中不乏一些曾經(jīng)的明星項(xiàng)目:比如OpenAI推出的AI語(yǔ)音識(shí)別產(chǎn)品Whisper.ai,Stable Diffusion的知名套殼網(wǎng)站FreewayML、StockAI,以及曾被視為是“谷歌競(jìng)爭(zhēng)者”的AI搜索引擎Neeva等(詳見《AI墓地,和738個(gè)死去的AI項(xiàng)目 | 甲子光年》)。 那么,究竟什么樣的AI應(yīng)用才是能夠長(zhǎng)久運(yùn)行下去的、有生命力的? 「甲子光年」認(rèn)為,一是要以模型為核心,充分發(fā)揮模型的能力;二是要有足夠強(qiáng)的用戶需求洞察能力。 微軟CEO薩提亞·納德拉曾經(jīng)在展望2025年AI行業(yè)趨勢(shì)時(shí)表示,“以AI模型為核心的應(yīng)用將在2025年重新定義各個(gè)應(yīng)用領(lǐng)域”。也就是說(shuō),那些套殼層級(jí)越少、距離模型越近、越是最大限度發(fā)揮模型能力的應(yīng)用,越能吸引用戶的使用和停留。 觀察新榜2025年1月的AI產(chǎn)品榜單不難發(fā)現(xiàn),在國(guó)內(nèi)榜單的前十名中,有8個(gè)都是直接建立在模型之上的、AI助手類的應(yīng)用。
而要對(duì)用戶需求有足夠強(qiáng)的洞察,則要依賴龐大的用戶基礎(chǔ)——只有擁有足夠多的用戶,用戶數(shù)據(jù)和標(biāo)簽才能積累得足夠多、足夠厚,企業(yè)才能從中挖掘出用戶最真實(shí)的需求痛點(diǎn)。 這兩點(diǎn)也意味著:做AI應(yīng)用,大廠更有優(yōu)勢(shì)。 大廠擁有充足的算力和人才去自研模型,可以無(wú)需進(jìn)行層層套殼,直接在自研模型之上部署AI應(yīng)用;大廠也擁有龐大的用戶基礎(chǔ)和成熟的流量入口,不僅用戶數(shù)據(jù)更為豐富、更容易挖掘需求,也為AI應(yīng)用的推廣提供了天然的優(yōu)勢(shì);此外,大廠強(qiáng)大的生態(tài)整合能力,也有助于為產(chǎn)品提供更為豐富的功能,增強(qiáng)AI應(yīng)用的用戶粘性。 前面提到的產(chǎn)品榜單也證明餓了這一點(diǎn)。前十個(gè)應(yīng)用中,有六個(gè)都出自大廠。 在此前騰訊科技對(duì)朱嘯虎最新的訪談中,朱嘯虎也表示,創(chuàng)業(yè)公司的數(shù)據(jù)壁壘沒有那么高,不適合做底層模型,而是需要在底層模型之上把“客戶”抓的更緊。這也在側(cè)面印證了大廠做AI應(yīng)用的優(yōu)勢(shì)。 從整體來(lái)看,大廠的模型和應(yīng)用也互為因果,共同構(gòu)成了增長(zhǎng)飛輪: 龐大的用戶基礎(chǔ)所提供的數(shù)據(jù)積累為模型研發(fā)提供了優(yōu)質(zhì)的預(yù)料,有助于增強(qiáng)模型能力,使之更好地適配細(xì)分場(chǎng)景和用戶需求;而模型能力的增長(zhǎng)則反哺應(yīng)用,讓應(yīng)用具備更強(qiáng)的產(chǎn)品力、吸引更多用戶。 這種有大體量用戶基礎(chǔ)的、由用戶需求帶動(dòng)研發(fā)方向的、能力表現(xiàn)在細(xì)分場(chǎng)景更佳的模型, 我們或許可以給其取一個(gè)名字叫“應(yīng)用大模型”。越是建立在“應(yīng)用大模型”基礎(chǔ)上的AI應(yīng)用,理論上就越有機(jī)會(huì)成功跑出。 例如榜單中排名僅次于DeepSeek的夸克,就是其中的典型代表。 「甲子光年」觀察到,在最近AI應(yīng)用的諸神混戰(zhàn)中,此前鮮少被提及的夸克正在默默領(lǐng)跑。易觀分析最新數(shù)據(jù)顯示,2024年底,夸克以7102萬(wàn)的月活躍用戶量位居移動(dòng)端AI應(yīng)用榜首,超過(guò)了大家熟知的豆包和Kimi。
更值得關(guān)注的是“用戶粘性”指標(biāo)。 根據(jù)第三方報(bào)告統(tǒng)計(jì),夸克的三日留存率超過(guò)40%,相比之下,同期市場(chǎng)上備受矚目的豆包和Kimi智能助手的留存約為25%;七麥數(shù)據(jù)發(fā)布的《2024年度實(shí)力AI產(chǎn)品榜單》顯示,夸克位居“年度實(shí)力AI產(chǎn)品App榜單”和“年度產(chǎn)品下載榜單”榜首,其2024年度的累計(jì)下載量超3.7億,在各類AI產(chǎn)品中一騎絕塵,實(shí)現(xiàn)了斷層式領(lǐng)先。 在榜單里的眾多AI產(chǎn)品中,夸克并不是最早推出大模型的,但卻在悄然間實(shí)現(xiàn)了訪問(wèn)量、下載量和用戶粘性的遙遙領(lǐng)先。夸克憑什么能在競(jìng)爭(zhēng)激烈的市場(chǎng)中殺出? 一切都得益于夸克“應(yīng)用為先”的產(chǎn)品和模型戰(zhàn)略。 2.應(yīng)用為先,倒推大模型場(chǎng)景化升級(jí)![]() 夸克從做搜索的第一天起就聚焦“智能化的精準(zhǔn)搜索”,不僅靠著簡(jiǎn)潔無(wú)廣告的界面和更加精準(zhǔn)的搜索結(jié)果快速在市場(chǎng)中撕開一道口子,更是基于搜索業(yè)務(wù),圍繞學(xué)生黨和上班族群體衍生出了夸克網(wǎng)盤、夸克掃描王、夸克文檔、夸克學(xué)習(xí)等垂類產(chǎn)品,場(chǎng)景逐漸向?qū)W習(xí)和工作領(lǐng)域細(xì)分。 以學(xué)習(xí)領(lǐng)域?yàn)槔?020年中,夸克推出了“拍照搜題”功能。疫情期間,針對(duì)很多學(xué)生被封鎖家中上網(wǎng)課、面臨無(wú)法有效學(xué)習(xí)的困難,夸克學(xué)習(xí)團(tuán)隊(duì)又對(duì)“拍照搜題”功能進(jìn)行了多次升級(jí)。 在辦公領(lǐng)域,夸克也從“掃描”這一垂直場(chǎng)景出發(fā),推出了提取文字、表格、去除筆跡、證件掃描、文檔格式轉(zhuǎn)換等一系列相關(guān)功能。 簡(jiǎn)約的工具底色,愈發(fā)豐富的場(chǎng)景應(yīng)用,加之初期無(wú)廣告不收費(fèi)的拉新生態(tài),讓夸克的用戶量得以暴增,從百萬(wàn)增長(zhǎng)到了千萬(wàn),累計(jì)服務(wù)用戶量過(guò)億。 2023年11月,夸克發(fā)布千億級(jí)參數(shù)大模型“夸克大模型”。 夸克大模型是夸克基于Transformer架構(gòu)、自主研發(fā)的多模態(tài)大模型,每天會(huì)對(duì)億級(jí)的圖文數(shù)據(jù)進(jìn)行訓(xùn)練和精調(diào),具有低成本、高響應(yīng)、綜合能力強(qiáng)等特點(diǎn)。面向用戶需求與夸克產(chǎn)品垂類場(chǎng)景,夸克大模型更注重實(shí)際應(yīng)用,衍生出通識(shí)、醫(yī)療、教育等垂類模型,以提供更專業(yè)、更精準(zhǔn)的技術(shù)能力。 在推出夸克大模型的同一時(shí)間,夸克升級(jí)了掃描產(chǎn)品的AI識(shí)別效果和網(wǎng)盤產(chǎn)品的AI搜索能力。 夸克大模型的第一個(gè)落地場(chǎng)景是健康和醫(yī)療。 2023年12月,夸克宣布全面升級(jí)其健康搜索功能,于2023年12月推出“夸克健康助手”AI應(yīng)用?!翱淇私】抵帧比诤狭酸t(yī)學(xué)知識(shí)圖譜和生成式對(duì)話能力,為用戶提供了更加全面和準(zhǔn)確的健康信息,還支持用戶針對(duì)健康問(wèn)題進(jìn)行多輪提問(wèn)和對(duì)話。 2024年1月,夸克又相繼推出“AI學(xué)習(xí)助手”、“AI聽記”、“AI PPT”等功能,并于2024年7月在移動(dòng)端推出了以AI搜索為中心的一站式AI服務(wù),2024年8月發(fā)布了具備“系統(tǒng)級(jí)全場(chǎng)景AI”能力的全新夸克PC端。 比如,用戶搜索“黑神話悟空取材自山西的哪些景點(diǎn)”??淇顺?jí)搜索框?qū)I回答、原始信源和歷史搜索融為一體——不僅能像其他的AI搜索一樣生成智能化的總結(jié),更是在側(cè)邊欄提供了信源展示,并在AI搜索的答案下保留了傳統(tǒng)搜索引擎條目式的網(wǎng)頁(yè)呈現(xiàn)。這提升了用戶的信息獲取效率,也增強(qiáng)了AI回答的可信度。 此外,夸克還圍繞“超級(jí)搜索框”構(gòu)建了一站式的信息服務(wù)體系,包括網(wǎng)盤、掃描、文檔處理、健康助手等智能工具,實(shí)現(xiàn)了從檢索到創(chuàng)作、總結(jié),再到編輯、存儲(chǔ)、分享的全流程服務(wù),為用戶帶來(lái)了無(wú)縫的信息服務(wù)體驗(yàn)。 和很多大廠模仿ChatGPT推出“All in One”的Chatbot類AI助手不同,夸克的策略是“AI in All”——將AI能力融入到產(chǎn)品的每個(gè)環(huán)節(jié),并落地到具體應(yīng)用場(chǎng)景。 從最初的拍照搜題,到高考報(bào)考咨詢,再到智能辦公輔助,夸克的產(chǎn)品演進(jìn)始終圍繞特定場(chǎng)景下的用戶需求展開。此后,夸克又陸續(xù)上線和更新了AI搜題、AI學(xué)術(shù)搜索、AI錦囊等功能,圍繞學(xué)習(xí)和辦公場(chǎng)景打造差異化的AI應(yīng)用。
這其中,2024年11月升級(jí)的 “AI 搜題” 功能,是最能集中體現(xiàn)夸克AI能力的典型代表。 其實(shí),早在2023年12月,夸克就推出了AI講題助手。當(dāng)時(shí)的AI講題助手更多還是依賴題庫(kù)這一“知識(shí)庫(kù)”,AI只能教會(huì)用戶做題庫(kù)里的題。升級(jí)后的AI搜題產(chǎn)品則擁有了更強(qiáng)的“智能”,不僅能解答題庫(kù)里原有的題目,面對(duì)新題、難題也不在話下。大模型“思維鏈(CoT)”的運(yùn)用讓夸克AI搜題能夠把解題思路和做題步驟依次呈現(xiàn)出來(lái),給用戶提供更詳細(xì)的內(nèi)容解析和學(xué)習(xí)引導(dǎo)。 相較于同類搜題產(chǎn)品大多依賴題庫(kù)、只能回答K12領(lǐng)域的題目,夸克的AI搜題產(chǎn)品不僅能回答K12領(lǐng)域的新題,還能回答考研、考公、各類資格證考試的專業(yè)題目。用戶只需拍照或截圖,夸克就能搜到相應(yīng)題目并分步驟給出圖文、視頻和AI回答中的專業(yè)內(nèi)容。此外,對(duì)于法律、醫(yī)學(xué)等細(xì)分領(lǐng)域的題目,夸克“AI搜題”也能給出解答。
與此同時(shí),夸克“AI搜題”還能借助AI能力對(duì)題目中的知識(shí)點(diǎn)和考點(diǎn)進(jìn)行深度講解,精準(zhǔn)定位關(guān)鍵步驟,讓用戶不僅學(xué)會(huì)這一道題,更是能“舉一反三”地學(xué)會(huì)這一類題。 夸克“AI搜題”的強(qiáng)大能力,不僅依托于夸克多年做搜索的沉淀、在學(xué)習(xí)場(chǎng)景中積累的足夠多優(yōu)質(zhì)資料和用戶需求,更是離不開夸克于同一時(shí)期推出的“靈知”學(xué)習(xí)大模型的支持。 “靈知”大模型是夸克技術(shù)團(tuán)隊(duì)在“夸克大模型”基礎(chǔ)之上,通過(guò)多年在教育領(lǐng)域深耕積累的高質(zhì)量數(shù)據(jù)訓(xùn)練而成的,不僅擁有眾多頂尖模型都具備的思維鏈能力,更是能將思考過(guò)程轉(zhuǎn)化為學(xué)生能看得懂的、更符合他們學(xué)習(xí)過(guò)程的語(yǔ)言。 換句話說(shuō),同樣都是為學(xué)生講解一道題,“靈知”大模型更知道要講解哪些知識(shí)點(diǎn)、如何構(gòu)建解題思路。 以2024年的北京高考數(shù)學(xué)真題為例,分別將其輸入DeepSeek和夸克,得到的回答如下所示:
![]()
可以看到,對(duì)比DeepSeek長(zhǎng)篇大論的思維鏈敘述和官方、事無(wú)巨細(xì)的回答,夸克給出的答案更加簡(jiǎn)潔,更像是在講解一道題。 教育行業(yè)由于大量“知識(shí)講解”和“科普”的場(chǎng)景,對(duì)模型的多模態(tài)能力提出了很高的要求。然而,現(xiàn)有的多模態(tài)模型對(duì)公式、手寫筆記等的識(shí)別比較差,尤其是對(duì)圖形的細(xì)粒度理解比較差。 為了解決這一問(wèn)題,夸克“靈知”大模型通過(guò)大規(guī)模多模態(tài)預(yù)訓(xùn)練基座,構(gòu)建了大規(guī)模的領(lǐng)域?qū)I(yè)訓(xùn)練語(yǔ)料,同時(shí)在模型結(jié)構(gòu)上,保證了更好的理解效果。 在最新評(píng)測(cè)中,夸克 “靈知”學(xué)習(xí)大模型在考研數(shù)學(xué)題上的正確率和得分率已經(jīng)可以比肩OpenAI-o1,且遠(yuǎn)超國(guó)內(nèi)其他模型。在多個(gè)國(guó)內(nèi)數(shù)學(xué)競(jìng)賽與高考等重要測(cè)試中,夸克的正確率和得分率也處于絕對(duì)領(lǐng)先地位。
與DeepSeek等公司研發(fā)純粹的基礎(chǔ)模型能力不同,夸克研發(fā)模型是以用戶需求為導(dǎo)向的。以AI寫作為例,夸克技術(shù)團(tuán)隊(duì)針對(duì)夸克年輕用戶寫報(bào)告、論文等“長(zhǎng)文寫作”的需求,運(yùn)用多階段CoT和檢索增強(qiáng)技術(shù)研發(fā)出了能生成8000字以上長(zhǎng)文的夸克文創(chuàng)模型,保證了字?jǐn)?shù)遵循效果。而即使是DeepSeek,目前也只能生成最多3000字的文章。 此外,夸克的AI寫作功能還相當(dāng)于一個(gè)“文字在線編輯器”,用戶可以對(duì)生成的文章進(jìn)行刪減、潤(rùn)色、擴(kuò)充等復(fù)雜的操作,而這背后也離不開夸克文創(chuàng)模型能力的支持。 可以說(shuō),在全球都在“卷”大模型參數(shù)的時(shí)候,夸克已經(jīng)將更多重心放到實(shí)際應(yīng)用場(chǎng)景中,基于用戶需求出發(fā)去定向升級(jí)優(yōu)化模型能力。截至目前,夸克已經(jīng)形成了系統(tǒng)級(jí)全場(chǎng)景AI能力。 ![]() 3.阿里AI To C加速![]() END. ![]() |
|
|