国产熟女一区二区三区四区,久久久久久久久国产精品无码色欲 ,亚洲人网站,精品自拍18,色偷偷男人天堂av

首個(gè)機(jī)器人世界模型開源平臺發(fā)布

時(shí)間:2025-08-15 03:23:26 來源:蓋世汽車 閱讀量:18517

近日,智元機(jī)器人推出行業(yè)首個(gè)面向真實(shí)世界機(jī)器人操控的統(tǒng)一世界模型平臺 Genie Envisioner,并宣布將開源全部代碼、預(yù)訓(xùn)練模型及評測工具。

該平臺創(chuàng)新性地將未來幀預(yù)測、策略學(xué)習(xí)與仿真評估整合進(jìn)以視頻生成為核心的閉環(huán)架構(gòu),首次實(shí)現(xiàn)機(jī)器人在同一世界模型中完成從感知到?jīng)Q策再到執(zhí)行的端到端推理流程。

傳統(tǒng)機(jī)器人學(xué)習(xí)系統(tǒng)普遍采用quot;數(shù)據(jù)收集—模型訓(xùn)練—策略評估quot;的分階段開發(fā)模式,各環(huán)節(jié)相互獨(dú)立且依賴任務(wù)特定調(diào)優(yōu),導(dǎo)致開發(fā)復(fù)雜度高、迭代周期長。

GE平臺通過構(gòu)建統(tǒng)一的視頻生成世界模型,破解了這一碎片化架構(gòu)瓶頸。基于約3000小時(shí)的真實(shí)機(jī)器人操控視頻數(shù)據(jù),平臺建立了語言指令到視覺空間的直接映射,完整保留機(jī)器人與環(huán)境交互的時(shí)空動(dòng)態(tài)信息。

核心突破在于視覺中心的世界建模范式。區(qū)別于主流VLA方法依賴語言抽象,GE直接在視覺空間中建模機(jī)器人與環(huán)境交互動(dòng)態(tài),實(shí)現(xiàn)對物理規(guī)律的精準(zhǔn)捕捉。這一范式帶來顯著性能躍升:

跨平臺泛化效率提升:在Agilex Cobot Magic等全新機(jī)器人平臺上,GE-Act動(dòng)作模型僅需1小時(shí)遙操作數(shù)據(jù)即可高質(zhì)量執(zhí)行任務(wù),優(yōu)于需大規(guī)模多本體預(yù)訓(xùn)練的π0和GR00T模型;

長時(shí)序任務(wù)執(zhí)行突破:在折疊紙盒等超10步連續(xù)任務(wù)中,GE-Act成功率高達(dá)76%,關(guān)鍵歸因于視覺空間顯式建模時(shí)空演化的能力及創(chuàng)新的稀疏記憶模塊設(shè)計(jì)。

技術(shù)架構(gòu)由三大協(xié)同組件構(gòu)成:

GE-Base多視角視頻基礎(chǔ)模型:采用自回歸視頻生成框架,通過頭部與雙臂腕部三路視角輸入保持空間一致性,結(jié)合稀疏記憶機(jī)制增強(qiáng)長時(shí)序推理。訓(xùn)練分兩階段:3-30Hz多分辨率時(shí)序適應(yīng)訓(xùn)練提升運(yùn)動(dòng)魯棒性,5Hz固定采樣策略對齊微調(diào);

GE-Act平行流匹配動(dòng)作模型:160M參數(shù)輕量架構(gòu)通過交叉注意力機(jī)制將視覺表征轉(zhuǎn)換為控制指令,采用quot;慢-快quot;異步推理,在RTX 4090 GPU實(shí)現(xiàn)200毫秒54步實(shí)時(shí)響應(yīng);

GE-Sim層次化動(dòng)作條件仿真器:通過Pose2Image條件與運(yùn)動(dòng)向量編碼,將控制指令精確轉(zhuǎn)換為視覺預(yù)測,支持閉環(huán)策略評估與數(shù)據(jù)生成,每小時(shí)可完成數(shù)千次策略rollout。

為量化世界模型質(zhì)量,團(tuán)隊(duì)同步推出EWMBench評測套件,從場景一致性、軌跡精度等維度評估建模能力。在Kling、OpenSora等模型對比中,GE-Base在關(guān)鍵指標(biāo)均領(lǐng)先且與人類判斷高度吻合。平臺現(xiàn)已開放項(xiàng)目主頁、論文及代碼倉庫,推動(dòng)具身智能從quot;被動(dòng)執(zhí)行quot;向quot;想象—驗(yàn)證—行動(dòng)quot;范式演進(jìn)。



聲明:本網(wǎng)轉(zhuǎn)發(fā)此文章,旨在為讀者提供更多信息資訊,所涉內(nèi)容不構(gòu)成投資、消費(fèi)建議。文章事實(shí)如有疑問,請與有關(guān)方核實(shí),文章觀點(diǎn)非本網(wǎng)觀點(diǎn),僅供讀者參考。
hhx6 精彩圖片