| DeepSeek肯定是優(yōu)秀的,在大語(yǔ)言模型領(lǐng)域在全球是極其優(yōu)秀的,但是DeepSeek和豆包在模型結(jié)構(gòu)、算力需求、推理效率等參數(shù)方面都是不同的,DeepSeek屬于大語(yǔ)言模型,豆包屬于多模態(tài)大模型,在大語(yǔ)言模型基礎(chǔ)上,融合了圖片、音頻、視頻等多種模態(tài)。 DeepSeek V3暫無(wú)多模態(tài)生成能力?!八惴▋?yōu)化—成本下降—滲透率提升—強(qiáng)化訓(xùn)推投入”正向反饋持續(xù)。算法優(yōu)化后,相同的訓(xùn)練算力投入,能進(jìn)行更多模型開(kāi)發(fā)嘗試,加速模型能力的提升,帶動(dòng)應(yīng)用爆發(fā),推理算力爆發(fā),模型廠商的ROI提升,會(huì)維持算力投入強(qiáng)度。   DeepSeek V3 671B,使用2048塊H800訓(xùn)練2個(gè)月。2048塊H800并非全部訓(xùn)練算力投入,這里不包括DeepSeek R1模型(對(duì)標(biāo)OpenAI o1)生成的高質(zhì)量數(shù)據(jù)消耗的算力,不包括模型架構(gòu)的探索調(diào)試階段消耗的算力。   如果二級(jí)市場(chǎng)看,DeepSeek應(yīng)該是周末爆炸吹類(lèi)型題材,而且DeepSeek周末的小表格很多都是瞎關(guān)聯(lián)的,這個(gè)公司都沒(méi)融資過(guò),哪來(lái)的參股受益公司。而且他也是囤卡跑出來(lái)的模型,其他的國(guó)內(nèi)公司都沒(méi)兩張卡,跑啥跑啊。 其實(shí)兩者根本沒(méi)有對(duì)比性,周末太熱了,所以講講。周末吹的太降智了,周末吹的DeepSeek感覺(jué)都問(wèn)鼎全球的,感覺(jué)吹的全球其他的AI路徑都是不如他。 這里依然看好豆包是年度級(jí)別題材,依然看好春節(jié)期間豆包熱度最好。 短期從跨春節(jié)角度,豆包依然是最優(yōu)解啊。不知道大家如何,反正一月?lián)肀Ф拱止蛇€是很舒服的。 講講年后吧,歷年春節(jié)一到兩個(gè)月在A股都是好時(shí)光。積極看多,持倉(cāng)50% 過(guò)年。明天春節(jié)前最后一個(gè)交易日,再干一天。 | 
|  | 
來(lái)自: 東泰山人 > 《科技學(xué)》