| 由Stability.ai發(fā)布的開源模型StableDiffusion可以說是目前最主流也是最重要的AI繪畫模型之一。  點擊加載圖片 基于開源的StableDiffusion,開發(fā)者社區(qū)創(chuàng)作了許多有意思的插件和模型,例如可以控制圖形形狀的ControlNet項目等,相關(guān)的開發(fā)項目超過1000個。 現(xiàn)在,這家熱衷于開源的AI公司又想搞一個大事情——發(fā)布一個類似ChatGPT的開源大語言模型。 人人都有LLM 2023年可以說是大語言模型井噴的一年,這幾個月以來,幾乎每個星期都有一個新的大語言模型面試。大模型、小模型、文本生成的、多模態(tài)的、閉源的、開源的……現(xiàn)在就是大語言模型的春天,各家百花齊放。 這份熱鬧不僅屬于微軟、Google、百度、阿里等互聯(lián)網(wǎng)大廠,也屬于所有與AI相關(guān)的科技公司。 和現(xiàn)有的大模型相比,Stability.ai發(fā)布的StableLM大語言模型有什么特別的呢? 根據(jù)Stability.ai的介紹,目前StableLM是一個開源且透明的模型,允許研究人員和開發(fā)者自由地檢查、使用和修改代碼。就像StableDiffusion一樣,用戶們都可以自由地配置StableLM,打造專為自己需求而量身定制的大語言模型。 目前StableLMAlpha版本模型的參數(shù)大小為30億和70億,未來Stability.ai還會提供150億和650億參數(shù)大小的模型版本。 盡管和GPT-3模型的1750億參數(shù)相比,StableLM的模型大小要小得多,但Stability.ai表示StableLM是基于一個比ThePile數(shù)據(jù)集還要大3倍的擴展數(shù)據(jù)集訓(xùn)練而成,在編碼和自然語言對話方面都有不錯的表現(xiàn)。 ThePile數(shù)據(jù)集本身已經(jīng)包括了大量書籍、Github知識庫、網(wǎng)頁、聊天記錄等數(shù)據(jù),還收集了醫(yī)學(xué)、物理、數(shù)學(xué)、計算機科學(xué)和哲學(xué)學(xué)科的論文,可以為通用大語言模型、跨領(lǐng)域文本生成訓(xùn)練提供很好的基準(zhǔn)。 因此在實際使用時,StableLM與GPT-3的差距并不像紙面參數(shù)數(shù)據(jù)的差異那樣明顯。  點擊加載圖片  點擊加載圖片  點擊加載圖片 Stability.ai在公告中展示了StableLM處理三個不同任務(wù)的實際表現(xiàn),包括寫郵件、寫Rap歌詞和寫代碼。 Stability.ai還把StableLM托管在了HuggingFace的社區(qū)網(wǎng)站上,想搶先體驗的朋友可以到以下地址調(diào)戲它:https:///spaces/stabilityai/stablelm-tuned-alpha-chat。  點擊加載圖片 從我們做的簡短測試來看,StableLM的中文水平還不如郭杰瑞,更不用說和ChatGPT這樣的優(yōu)等生對比,因此在對話時盡量使用選擇英語。 開源還是閉源之爭 和包括斯坦福大學(xué)的Alpaca在內(nèi)的眾多開源大語言模型一樣,StableLM給了很多開發(fā)者在本地或者服務(wù)器親手定制大語言模型的機會,不用再擔(dān)心你的數(shù)據(jù)泄露給了模型后臺。  點擊加載圖片 ChatGPT爆火后,關(guān)于AI模型的數(shù)據(jù)隱私問題層出不窮,前不久三星還被爆出有多名員工向ChatGPT泄漏機密數(shù)據(jù)的事件,以致三星的半導(dǎo)體部門決定自己開發(fā)內(nèi)部AI工具,避免類似的問題再次發(fā)生。 開源模型除了有高透明度的優(yōu)勢,開發(fā)者們也更容易利用開源模型開發(fā)出更具有創(chuàng)造力的應(yīng)用。例如你可以對StableLM做定制化的調(diào)試,讓它變成一個不會停歇的網(wǎng)文作家,或者是非常熟悉公司項目的資深程序員或文案寫手,甚至可以調(diào)試成微博上的星座運程大師。 開源模型給了開發(fā)者更大的想象力空間,但與此同時,也會給作惡者更先進的手段。  點擊加載圖片 對別有用心者來說,開源大語言模型可能就是做電信詐騙的神器,他們可以用逼真的對話把人們騙得團團轉(zhuǎn)。 開源總是會伴隨爭議,這一點Stability.ai早有預(yù)料。此前因為開源StableDiffusion,Stability.ai已經(jīng)遭到了許多涉嫌侵犯藝術(shù)家權(quán)利的法律訴訟,以及因用戶使用其工具生成色情內(nèi)容而引起的爭議。 Stability.ai的CEOEmadMostaque在此前的采訪中提到,大模型需要接受更多監(jiān)督,而不是被大公司鎖在小黑盒里,因此大模型的社區(qū)開放性也非常重要。Stability.ai堅持開源,是想把技術(shù)帶給更多的人,引發(fā)人們的思考。 StableLM是對Stability.ai的承諾的又一驗證,一個人人都有專屬語言模型的未來或許就此展開。 | 
|  |