近日,在南京舉辦的“智匯金陵·AI開(kāi)源人才峰會(huì)”上,智元合伙人、高級(jí)副總裁、具身業(yè)務(wù)部總裁姚卯青發(fā)表主題演講表示,具身智能想要真正走進(jìn)實(shí)際場(chǎng)景、落地部署并賦能客戶,是一項(xiàng)極具挑戰(zhàn)性的系統(tǒng)工程,必須打通硬件、數(shù)據(jù)、模型、場(chǎng)景全鏈條閉環(huán)。
姚卯青表示,作為深耕具身智能領(lǐng)域的創(chuàng)新企業(yè),智元機(jī)器人構(gòu)建起從本體研發(fā)到場(chǎng)景應(yīng)用的完整布局,2024年打造國(guó)內(nèi)首個(gè)3000平方米機(jī)器人數(shù)據(jù)采集場(chǎng)地,采集海量行業(yè)數(shù)據(jù)并開(kāi)源;依托數(shù)據(jù)積累,自主研發(fā)VLA與世界模型等多款通用具身模型,推出覆蓋全流程的一站式開(kāi)發(fā)者平臺(tái),為具身智能產(chǎn)業(yè)化筑牢技術(shù)根基。
直面數(shù)據(jù)瓶頸這一行業(yè)核心痛點(diǎn),姚卯青指出:“語(yǔ)言模型可獲取數(shù)百萬(wàn)億Tokens的訓(xùn)練數(shù)據(jù),但具身智能的訓(xùn)練數(shù)據(jù)量,與之存在4到5個(gè)數(shù)量級(jí)的差距?!睘榇耍窃氏葐?dòng)真機(jī)數(shù)據(jù)采集,并于2024年12月開(kāi)源全球首個(gè)基于全域真實(shí)場(chǎng)景的百萬(wàn)真機(jī)數(shù)據(jù)集AGIBOT World,該數(shù)據(jù)集迅速成為全球下載量最高的開(kāi)源真機(jī)數(shù)據(jù)集,被英偉達(dá)等全球領(lǐng)軍企業(yè)廣泛采用。目前智元持續(xù)拓展數(shù)據(jù)維度,同步布局真機(jī)實(shí)操、人機(jī)交互、物理場(chǎng)景等多類數(shù)據(jù)采集,今年預(yù)計(jì)產(chǎn)出數(shù)百萬(wàn)小時(shí)高質(zhì)量有效數(shù)據(jù),以優(yōu)質(zhì)數(shù)據(jù)夯實(shí)模型訓(xùn)練基礎(chǔ)。
同時(shí),為解決落地成本難題,智元構(gòu)建了仿真全生命周期流程,“近90%的研發(fā)工作在仿真環(huán)境中提前搭建、驗(yàn)證并跑通,僅剩余10%的場(chǎng)景適配與落地調(diào)試工作?!币γ啾硎?,智元利用生成式AI實(shí)現(xiàn)小時(shí)級(jí)場(chǎng)景構(gòu)建,大幅縮短了從實(shí)驗(yàn)室到工廠的“最后一公里”。
圍繞核心技術(shù)突破,智元構(gòu)建了“數(shù)據(jù)—預(yù)訓(xùn)練—后訓(xùn)練—世界模型”全鏈路閉環(huán)體系,打造可持續(xù)進(jìn)化的具身智能模型。據(jù)姚卯青介紹,在預(yù)訓(xùn)練層面,智元推出全國(guó)首個(gè)通用具身基座模型GO-1,開(kāi)創(chuàng)性提出ViLLA架構(gòu),通過(guò)VLM與MOE的融合實(shí)現(xiàn)通用感知與動(dòng)作能力及跨任務(wù)泛化,讓機(jī)器人既能從人類視角學(xué)習(xí)動(dòng)作規(guī)律,又能掌握物理世界交互邏輯。
而在世界模型領(lǐng)域,姚卯青則強(qiáng)調(diào),“世界模型是我們堅(jiān)定投入的方向,早在2024年,智元就認(rèn)準(zhǔn)這一技術(shù)賽道。相較于語(yǔ)言模型偏向抽象邏輯思維表征,世界模型是從3D物理世界中學(xué)習(xí)規(guī)律,更適配具身智能場(chǎng)景需求?!比ツ?月,智元發(fā)布世界模型平臺(tái)Genie Envisioner,這是行業(yè)內(nèi)首次構(gòu)建的4D具身世界模型及基準(zhǔn)數(shù)據(jù)集EWMBench。該模型統(tǒng)一了世界動(dòng)作模型與仿真器,實(shí)現(xiàn)了從環(huán)境理解、動(dòng)作推理到仿真訓(xùn)練的全鏈路能力。
依托全棧技術(shù)突破,智元機(jī)器人已實(shí)現(xiàn)規(guī)?;a(chǎn)業(yè)落地,賦能新質(zhì)生產(chǎn)力發(fā)展。姚卯青介紹,“我們的機(jī)器人已在3C制造領(lǐng)域?qū)崿F(xiàn)零部件精準(zhǔn)檢測(cè)與上下料作業(yè),在泛工業(yè)場(chǎng)景完成吊箱拆卸與轉(zhuǎn)運(yùn),在汽車零部件領(lǐng)域?qū)崿F(xiàn)自動(dòng)化上下料,在物流場(chǎng)景完成包裹分揀與拆解?!蹦壳跋嚓P(guān)技術(shù)方案已在真實(shí)工業(yè)現(xiàn)場(chǎng)實(shí)現(xiàn)24小時(shí)連續(xù)不間斷作業(yè),產(chǎn)線效率(UPH)達(dá)到人類同等作業(yè)水平,平均無(wú)故障時(shí)間(MTBF)達(dá)百小時(shí)級(jí)別。
從數(shù)據(jù)采集、模型訓(xùn)練到場(chǎng)景落地,一套成熟的具身智能體系,需要穩(wěn)定可靠的硬件本體與VLA、強(qiáng)化學(xué)習(xí)、世界模型等核心技術(shù)的深度融合。姚卯青表示,“面向未來(lái),智元將持續(xù)深化技術(shù)迭代與生態(tài)共建,讓我們的技術(shù)體系、數(shù)據(jù)模型與場(chǎng)景適配能力不斷邁上新臺(tái)階。這一戰(zhàn)略路徑,正是具身智能賦能新質(zhì)生產(chǎn)力的生動(dòng)實(shí)踐。”
在本次峰會(huì)上,魔搭社區(qū)聯(lián)合CCF智能機(jī)器人專委會(huì)、工信部裝備數(shù)字孿生技術(shù)重點(diǎn)實(shí)驗(yàn)室及Lumina具身智能社區(qū)等權(quán)威機(jī)構(gòu),正式發(fā)布了EAI-100(Embodied Artificial Intelligence 100)具身智能年度百項(xiàng)代表性成果與人物榜單。其中,智元(AGIBOT)憑借全棧技術(shù)創(chuàng)新與規(guī)?;a(chǎn)業(yè)落地成果,獲得“先鋒人物”“年度10大突破”“年度10大數(shù)據(jù)集項(xiàng)目”及“年度10大落地典范”多項(xiàng)獎(jiǎng)項(xiàng)。