|
這是鉛筆道與錦秋基金的聯(lián)合專欄,發(fā)現(xiàn)新時代的獨角獸。錦秋基金,作為12 年期的 AI Fund,始終以長期主義為核心投資理念,積極尋找那些具有突破性技術(shù)和創(chuàng)新商業(yè)模式的通用人工智能初創(chuàng)企業(yè)。 在來杰的期待中,未來的世界是這樣的:頂尖科學(xué)家能驅(qū)使100個機器人助手,將數(shù)年的實驗周期壓縮到一周;五星級大廚的廚藝被數(shù)字化,家中機器人將它們做成佳肴端上餐桌。 來杰,具身智能企業(yè)“星塵智能”的創(chuàng)始人。雖然不到40歲,卻是擁有16年機器人研發(fā)經(jīng)驗的老手,他畢業(yè)于西安電子科技大學(xué),曾是百度小度機器人和騰訊Robotics X實驗室的核心初創(chuàng)成員。 2022年,看到科技潮水的方向?qū)⒁淖儯瑏斫茉谏钲趧?chuàng)辦了具身智能企業(yè)星塵智能。 星塵智能核心技術(shù)是“繩驅(qū)系統(tǒng)”。它來自一次靈光一現(xiàn)。來杰發(fā)現(xiàn),盲人雖然看不見,但憑觸覺、憑力感知能夠開門?;谶@種啟發(fā),團隊開發(fā)了一套“神經(jīng)系統(tǒng)”,讓機器人手臂完成壓、推、拉動作時,自動調(diào)節(jié)施力。而繩驅(qū)技術(shù)天然能為機器人提供力感知的反饋回路。 星塵智能的機器人產(chǎn)品通過模仿人類肌腱的傳動方式,用繩索替代傳統(tǒng)的剛性傳動方式(關(guān)節(jié)直驅(qū)、推桿傳動),當機器人在同樣體積重量下,繩驅(qū)有最高的力傳遞效率(高動態(tài)),而且能把電機后置減少末端組件的體積,從而讓機器人動作更輕快、更柔順,能夠?qū)崟r感知拉力,實現(xiàn)安全的人機交互。這種設(shè)計讓機器人在執(zhí)行任務(wù)時具備“肌肉感”,不僅能模仿人的動作方式,也能在沖擊或接觸中用繩子吸收沖擊力,確保交互安全,機器人也更抗摔。 2024年世界機器人大會上,星塵智能展示了繩驅(qū)技術(shù)的全身原型機Astribot S1,并于2025年6月實現(xiàn)量產(chǎn)。目前是全球首家能夠量產(chǎn)并出貨繩驅(qū)AI機器人的公司。 星塵智能Astribot S1 星塵智能的產(chǎn)品架構(gòu)分為三層: 底層是繩驅(qū)機器人本體,性能對標人類,運動范圍、速度和加速度均略高于人。其模塊化設(shè)計允許上、下半身分離,半身版可安裝在AGV或履帶平臺上執(zhí)行客戶所需的操作。 中間層是RUI(Robot UI),相當于機器人的圖形化界面,支持VR遙操作,讓非專業(yè)用戶也能像玩游戲一樣直觀控制機器人。星塵智能已實現(xiàn)跨城、跨國遙操作客戶任務(wù)驗證。 最上層是AI模型層,基于遙操作采集的真機數(shù)據(jù)進行訓(xùn)練,也會按需使用互聯(lián)網(wǎng)視頻數(shù)據(jù)或仿真數(shù)據(jù),結(jié)合視覺、語言與動作信息,自主研發(fā)了全身移動操作VLA模型DuoCore-WB,也開放合作,我們是頂級機器人大腦公司Physical Intelligence首個官宣的合作伙伴;和清華、通研院合作開發(fā)了ControlVLA框架,用10幾次的少量人類示范,即可讓機器人掌握倒水、疊衣等任務(wù),成功率超過75%。 除了擁有“本體-數(shù)據(jù)-模型”的全棧解決方案,來杰認為,與特斯拉、Figure等以剛性結(jié)構(gòu)為主的同行相比,星塵智能優(yōu)勢還在于柔性驅(qū)動帶來的力感知能力與成本控制。繩驅(qū)系統(tǒng)完全依托中國供應(yīng)鏈,成本約為諧波減速器的十分之一,壽命可達三到六年。團隊自研檢測與補償算法,使重復(fù)定位精度控制在正負0.03毫米以內(nèi)。 星塵智能獨特的技術(shù)方向被資本市場看好。創(chuàng)立以來,星塵智能連續(xù)完成多輪融資,總額達數(shù)億元。股東包括錦秋基金、螞蟻集團、云啟資本、道彤資本、德迅投資、經(jīng)緯創(chuàng)投、清輝投資等知名機構(gòu)。 在商業(yè)化方面,星塵智能已啟動多場景試點。與央視網(wǎng)聯(lián)合打造“小央機器人樂隊”,在深圳機場和保利劇院多次大規(guī)模展演;拿下仙工智能、領(lǐng)益智能的上千臺機器人訂單,共同開發(fā)工業(yè)物流場景;在深圳養(yǎng)老機構(gòu)測試服務(wù)型應(yīng)用;AI系統(tǒng)DuoCore在模型側(cè)支持爆米花制作、飲料售賣等全自主商業(yè)服務(wù)。 星塵智能的目標并不是要造更復(fù)雜的機器人,而是打造一個能被AI充分學(xué)習(xí)、能被人自然使用的具身智能平臺。在全球人形機器人競爭日趨激烈的當下,它提供了一條不同于剛性機械路徑的可能性——以剛?cè)狁詈系慕Y(jié)構(gòu)和產(chǎn)品化思維,推動機器人真正進入可用、可交互、可量產(chǎn)的階段。 最近,鉛筆道與多家媒體同來杰交流,以下是對話精華。 聲明:訪談對象已確認文章信息真實無誤,鉛筆道愿為其內(nèi)容做信任背書。 反共識創(chuàng)業(yè):用繩子驅(qū)動機器人問:為什么選擇繩驅(qū)這條少有人走的路? 來杰:繩驅(qū)其實是傳動和減速的一種方式。我以前在騰訊,最早做雙足機器人,后來管操作項目。我問團隊:“為什么盲人能開門,機器人不行?”過去,我們一直在視覺精度上“卷”,控制得再準,也沒用——因為現(xiàn)實問題不靠這解決。 星塵智能創(chuàng)始人來杰 我們試著模仿盲人開門:他看不見,但憑觸覺、憑力感知就能順勢轉(zhuǎn)動門把。于是我們做了個“神經(jīng)系統(tǒng)”,讓機器人在隨手壓、順勢拉的時候,自動調(diào)節(jié)施力。用諧波(減速器)不行,用多級行星(減速器)抖動補不掉,就開始做繩驅(qū)的理論研究。后來發(fā)現(xiàn),機器人運動構(gòu)型越像人,AI學(xué)得越好,而繩驅(qū)剛好能解決這兩個問題。我們創(chuàng)業(yè)從第一天就確定用繩驅(qū)。 繩驅(qū)天然能提供“力感知”的反饋回路。這種柔順性帶來安全性,比如我們機器人天天敲敲打打也沒事,因為繩子能吸收沖擊。相比之下,很多剛性電機機器人敲一下就壞了。 這就是我們“高天花板”的基礎(chǔ)——先有仿人的力控,再讓更多人通過RUI使用,采更多數(shù)據(jù),最終訓(xùn)練AI,實現(xiàn)自動化。 問:繩驅(qū)面臨哪些困難?為什么當初繩驅(qū)沒成為行業(yè)共識方案? 來杰:早期最大的擔(dān)心其實是供應(yīng)鏈,不是技術(shù)。我們從2020年底開始研究繩驅(qū),做到2022年底,從材料、大力馬、高分子、金屬繩,到拉絲精度、建模、標定都做透了。沒惶恐是因為理論扎實。繩驅(qū)沒成主流,我覺得是階段性問題。以前沒有好的平臺能把機械、控制、電驅(qū)等人湊在一起研究。像浙大有位老師研究繩十幾年了,也想聯(lián)合幾個學(xué)院系統(tǒng)解決繩驅(qū)問題,但沒機會。我們在騰訊時人齊、資源足,才能解決。惟一忐忑的就是怕繩都要進口,但后來發(fā)現(xiàn)中國供應(yīng)鏈太強,就不怕了。 我們在騰訊時用的是日本和美國的繩。后來我創(chuàng)業(yè)時就想,不能老這樣搞,得換供應(yīng)商。我在中國摸了一圈,發(fā)現(xiàn)一個驚人的事實——國外很多繩的供應(yīng)商,原始供應(yīng)商其實就在中國。航母上的繩、電梯上的繩、大吊車上的繩、汽車升降窗里的繩,占了全球市場七八成以上。我們就開始在中國發(fā)掘這些供應(yīng)商,發(fā)現(xiàn)完全能搞定,只是之前沒人提過這樣的需求。這屬于工藝技術(shù)范圍內(nèi)的事,好處是成本非常低。 問:目前繩驅(qū)本體有哪些缺點?市面上采用繩驅(qū)的公司比例大概多少? 來杰:繩驅(qū)更適合生活化、服務(wù)類的輕負載、強交互應(yīng)用,不太適合高負載工業(yè)場景。比如我們設(shè)定單臂負載峰值是10公斤,這是人的普遍負載能力。如果要更重的,就該用機械設(shè)備輔助了。工業(yè)場景對高負載、效率要求高,還要穩(wěn)定快速停下,這種情況下繩驅(qū)彈性太大,不合適。像電梯那種平穩(wěn)控制的場景沒問題,但重工業(yè)高頻加減速的就不太行。所以我們認為繩驅(qū)更適合家庭、商業(yè)、人居環(huán)境。 行業(yè)主流是關(guān)節(jié)直驅(qū)、垂桿傳動,諧波減速器,優(yōu)點是高精密、強負載,但不耐沖擊,微小撞擊都可能損傷柔輪。工業(yè)環(huán)境程序化操作沒問題,但我們機器人學(xué)習(xí)大概率要“被撞、敲桌子,磕磕碰碰”,繩驅(qū)就很合適。 真正量產(chǎn)的除了我們幾乎沒有。很多友商說我們一量產(chǎn)他們就抄。去年WRC我們遮攔了一點,今年完全開放,有人拿著手機鏡頭一直拍我們的繩驅(qū),但我們無所謂,遙操作他們也都都過來看了。 問:繩驅(qū)技術(shù)下,零部件的壽命有多長? 來杰:我們做過壽命預(yù)測,連續(xù)多任務(wù)不同工況下可達3.2到6.2年。人形機器人出來也沒幾年,這個壽命其實不低。加上模塊化設(shè)計,部分損壞可單獨更換,比如小臂壞了就換小臂,壽命整體會提高,參考一輛車的保養(yǎng)環(huán)節(jié),還是可以接受的。 問:如果競爭對手仿制繩驅(qū)技術(shù)。 來杰:他們要先繞過我們的結(jié)構(gòu)專利,把樣機仿出來,大概半年到一年。然后要解決補償算法,把彈性問題補償?shù)?,重?fù)定位精度要做到0.03毫米以內(nèi),這至少還要一年半。我們當時在騰訊研究的就是最底層原理,包括材料、運控算法、電驅(qū)板全自研,所以光抄結(jié)構(gòu)是玩不轉(zhuǎn)的。 機器人智能化做到70分,提前實現(xiàn)商業(yè)閉環(huán)問:你們的機器人做成輪式,這是怎樣的考慮? 來杰:我們具備這方面能力,在騰訊時做過雙足、輪足、四足等移動方向的研究。當時技術(shù)很好,但后來創(chuàng)業(yè)時我一直在思考一個問題——電池放哪、放多大?雙足機器人的上半身空間有限,電池小,而機構(gòu)又費電。測算下來續(xù)航最多三小時,而且要用特殊電池。既然我們要做產(chǎn)品,讓機器人服務(wù)人類,就不能讓機器人干兩小時活就罷工。所以我們一開始就決定不做雙足,主打“高價值的上半身(重操作),可落地的下半身”。等電池問題解決、產(chǎn)品化可行時再考慮?,F(xiàn)在四足或其他機構(gòu)用我們的半身去配合,是完全可以支持的。 問:很多廠家不斷強調(diào)機器人自主性,你們?yōu)槭裁匆讶瞬僮鳈C器人當作賣點,它是剛需嗎? 來杰:我們的賣點其實頂尖本體+領(lǐng)先遙操+高效模型的結(jié)合,而且我們認為,遙操作的重要性被大家低估了。遙操作其實挺有意思,我們陸續(xù)接到很多需求。比如廣州一個化學(xué)研究所,他們在云南湖邊搞實驗,要爬山七天,只為采點水樣、做一小時實驗。如果能遙操機器人,就省事太多了。 之前有個美國教授體驗完以后腦洞大開。他做化學(xué)實驗,有實驗室要穿防化服,只能待一小時,他就想能不能遠程遙操。 甚至還有維和部隊找我們幫忙拆彈的。 這些場景都不需要AI自主,它們需要的是“人類的遠程分身”。這讓我們意識到:遙操作不是過渡期,而是長期存在的形態(tài)。我們認為機器人缺兩個關(guān)鍵接口,就像個人電腦的鼠標和鍵盤。遙操作+VR能讓人更自然地用機器人,這是未來人人都能用的關(guān)鍵平臺。 AI其實就是“數(shù)據(jù)+模型”。遙操作這層正好補足數(shù)據(jù)。近程遙操能記錄操作數(shù)據(jù),遠程遙操能適應(yīng)更復(fù)雜環(huán)境。當然,現(xiàn)在也有問題,站在機器人旁邊遙操是用第三視角,缺了第一人稱視角。從旁邊看,覺得機器人拿杯子很順,但機器人自己的視角可能根本沒看到杯子,這就會出偏差。我們希望“近程+遠程”結(jié)合,收集完整數(shù)據(jù)。 到了第二階段,AI模型主導(dǎo)、遙操作兜底,就能先形成商業(yè)閉環(huán)。比如,讓機器人完成一個任務(wù)要100%成功,才能商業(yè)化,AI做到70%可能只花100萬,做到90%要1000萬,做到100%可能要一個億。那我們干脆讓AI做到70%,剩下30%,用人補上,這樣就能把應(yīng)用快速跑起來,還能反哺AI進化,在這個過程中,又能反向積累數(shù)據(jù)。 問:你們的遙操作技術(shù)最大的優(yōu)勢是什么? 來杰:第一,我們的仿人結(jié)構(gòu)帶來人體同構(gòu)性的優(yōu)勢,這是軟硬件整體設(shè)計和性能上優(yōu)勢,短期內(nèi)除非別人改構(gòu)型或者改設(shè)計方案才能趕上??催b操作時,大家可以關(guān)注幾個性能緯度:低延時,讓機器人能跟上人,速度快效率就高;動作復(fù)刻性,比如大幅度轉(zhuǎn)身、下蹲取物、投擲等大范圍操作動作,對機器人很難,看能不能跟人同步映射;易用性,不同身高、臂長、年齡的人能輕易上手。我們一比一復(fù)刻的好處是什么?操作員就再也不用思考(don’t make me think),只需要下意識做動作就行。但延遲而動作不同步,操作員就得想“我動了,為什么機器人沒跟上?”“我動到位了,機器人為什么沒動到位”,錯誤的感受,就得調(diào)整和修改動作去迎合機器人,影響操作效率。 問:你們在模型訓(xùn)練上有什么技術(shù)特點? 來杰:模型訓(xùn)練上有共性,也有各家的方向。從今年1月份 P0開源開始,大家都有了一個大框架,稍微改動就能拿到不錯的效果,這屬于“低垂的果子”。 現(xiàn)在低垂的果子都差不多摘完了,剩下的是更高的果子,需要各家自己選擇。我們選擇的重點是“全身 VLA”,否則我們的含腰帶臂、雙臂聯(lián)動機器人優(yōu)勢發(fā)揮不出來。 另一塊是判斷系統(tǒng),這是我們的重點。別的公司可能加空間理解、活動記憶之類的模塊,各有選擇。我們也在投入模型架構(gòu)層面,不久后會發(fā)布一個偏向 Pre-train、關(guān)于基模構(gòu)建的成果。 問:那怎么克服 VLA 的數(shù)據(jù)問題? 來杰:真機數(shù)據(jù)、合成數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)、人體數(shù)據(jù),每種都有部分信息,都要聯(lián)合使用。我們以真機數(shù)據(jù)為基礎(chǔ)形成動作,再通過合成場景增強泛化,比如換桌面、換對象、換背景?;ヂ?lián)網(wǎng)數(shù)據(jù)我們也用,比如數(shù)字人骨骼數(shù)據(jù)、圖片信息。這些都能幫助合成。 真機數(shù)據(jù)成本高,但價值也高。其他外部數(shù)據(jù)會越來越便宜。我們有幾十人的數(shù)采團隊,可以24 小時采真機數(shù)據(jù),從采、標、訓(xùn)到模型產(chǎn)出都有自動化管線。部署驗證還沒全自動化,但模型訓(xùn)練產(chǎn)出這塊已經(jīng)自動化,研發(fā)只要把模型部署上去就能直接驗證和調(diào)整。 問:你怎么看現(xiàn)在行業(yè)追求的泛化性? 來杰:我們發(fā)現(xiàn)一個問題:所謂的泛化性是基礎(chǔ)能力,而在商業(yè)化要求的成功率、準確性上,可以通過場景迭代持續(xù)提升。 一個通用模型可能做不好專用任務(wù),比如焊電路這種需要專門訓(xùn)練的技能。 我們現(xiàn)在主力方向是產(chǎn)品和商業(yè)化,少部分人探索泛化性。下一步要發(fā)的 Pre-train 技術(shù)成果,就是為了提升泛化能力。 現(xiàn)在大模型還沒定局。一派認為應(yīng)基于大模型形成專項應(yīng)用,一派認為應(yīng)繼續(xù)做更大模型,讓它能自適應(yīng)專業(yè)任務(wù)。我們保持敬畏心,持續(xù)投入和比較。 本文僅為口述者獨立觀點,不代表鉛筆道立場,亦不構(gòu)成投資建議。
|