UC頭條：這個AI繪圖神器團隊，做了一個開源版ChatGPT

絲廣里 2023-04-21 發(fā)布于湖南

展開全文

由Stability.ai發(fā)布的開源模型StableDiffusion可以說是目前最主流也是最重要的AI繪畫模型之一。

點擊加載圖片

基于開源的StableDiffusion，開發(fā)者社區(qū)創(chuàng)作了許多有意思的插件和模型，例如可以控制圖形形狀的ControlNet項目等，相關(guān)的開發(fā)項目超過1000個。

現(xiàn)在，這家熱衷于開源的AI公司又想搞一個大事情——發(fā)布一個類似ChatGPT的開源大語言模型。

人人都有LLM

2023年可以說是大語言模型井噴的一年，這幾個月以來，幾乎每個星期都有一個新的大語言模型面試。大模型、小模型、文本生成的、多模態(tài)的、閉源的、開源的……現(xiàn)在就是大語言模型的春天，各家百花齊放。

這份熱鬧不僅屬于微軟、Google、百度、阿里等互聯(lián)網(wǎng)大廠，也屬于所有與AI相關(guān)的科技公司。

和現(xiàn)有的大模型相比，Stability.ai發(fā)布的StableLM大語言模型有什么特別的呢？

根據(jù)Stability.ai的介紹，目前StableLM是一個開源且透明的模型，允許研究人員和開發(fā)者自由地檢查、使用和修改代碼。就像StableDiffusion一樣，用戶們都可以自由地配置StableLM，打造專為自己需求而量身定制的大語言模型。

目前StableLMAlpha版本模型的參數(shù)大小為30億和70億，未來Stability.ai還會提供150億和650億參數(shù)大小的模型版本。

盡管和GPT-3模型的1750億參數(shù)相比，StableLM的模型大小要小得多，但Stability.ai表示StableLM是基于一個比ThePile數(shù)據(jù)集還要大3倍的擴展數(shù)據(jù)集訓(xùn)練而成，在編碼和自然語言對話方面都有不錯的表現(xiàn)。

ThePile數(shù)據(jù)集本身已經(jīng)包括了大量書籍、Github知識庫、網(wǎng)頁、聊天記錄等數(shù)據(jù)，還收集了醫(yī)學(xué)、物理、數(shù)學(xué)、計算機科學(xué)和哲學(xué)學(xué)科的論文，可以為通用大語言模型、跨領(lǐng)域文本生成訓(xùn)練提供很好的基準(zhǔn)。

因此在實際使用時，StableLM與GPT-3的差距并不像紙面參數(shù)數(shù)據(jù)的差異那樣明顯。

點擊加載圖片

Stability.ai在公告中展示了StableLM處理三個不同任務(wù)的實際表現(xiàn)，包括寫郵件、寫Rap歌詞和寫代碼。

Stability.ai還把StableLM托管在了HuggingFace的社區(qū)網(wǎng)站上，想搶先體驗的朋友可以到以下地址調(diào)戲它：https:///spaces/stabilityai/stablelm-tuned-alpha-chat。

點擊加載圖片

從我們做的簡短測試來看，StableLM的中文水平還不如郭杰瑞，更不用說和ChatGPT這樣的優(yōu)等生對比，因此在對話時盡量使用選擇英語。

開源還是閉源之爭

和包括斯坦福大學(xué)的Alpaca在內(nèi)的眾多開源大語言模型一樣，StableLM給了很多開發(fā)者在本地或者服務(wù)器親手定制大語言模型的機會，不用再擔(dān)心你的數(shù)據(jù)泄露給了模型后臺。

點擊加載圖片

ChatGPT爆火后，關(guān)于AI模型的數(shù)據(jù)隱私問題層出不窮，前不久三星還被爆出有多名員工向ChatGPT泄漏機密數(shù)據(jù)的事件，以致三星的半導(dǎo)體部門決定自己開發(fā)內(nèi)部AI工具，避免類似的問題再次發(fā)生。

開源模型除了有高透明度的優(yōu)勢，開發(fā)者們也更容易利用開源模型開發(fā)出更具有創(chuàng)造力的應(yīng)用。例如你可以對StableLM做定制化的調(diào)試，讓它變成一個不會停歇的網(wǎng)文作家，或者是非常熟悉公司項目的資深程序員或文案寫手，甚至可以調(diào)試成微博上的星座運程大師。

開源模型給了開發(fā)者更大的想象力空間，但與此同時，也會給作惡者更先進的手段。