精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

具身VLA后訓練:TeleAI提出潛空間引導的VLA跨本體泛化方法

人工智能 新聞
中國電信人工智能研究院(TeleAl)具身智能團隊提出了一種 “對齊 - 引導 - 泛化”(Align then Steer, ATE)的 VLA 跨本體泛化框架,破解了 VLA 后訓練難題。

在多模態大模型的基座上,視覺 - 語言 - 動作(Visual-Language-Action, VLA)模型使用大量機器人操作數據進行預訓練,有望實現通用的具身操作能力。然而,現有 VLA 基座模型的能力仍存在很大不足,在進行目標場景應用時需要采集數十乃至數百小時目標本體數據完成后訓練(Post-Training),特別是當目標場景本體和預訓練本體存在差異時,預訓練和后訓練階段的動作分布出現嚴重失配,從而引發了 VLA 模型跨本體適配(Cross-Embodiment Adaption)挑戰。在后訓練階段通過堆疊目標本體數據對抗這種失配的邊際收益迅速遞減,也難以有效擬合目標場景動作分布。

為了解決該問題,中國電信人工智能研究院(TeleAl)具身智能團隊提出了一種 “對齊 - 引導 - 泛化”(Align then Steer, ATE)的 VLA 跨本體泛化框架,破解了 VLA 后訓練難題。其核心思想是在潛空間中對齊跨本體動作分布,從而在后訓練利用統一潛空間梯度引導 VLA 策略的更新方向。無需改動現有 VLA 主干架構,實現了 VLA 模型后訓練從調架構向調分布的范式轉移,適配 Diffusion 和 Flow-Matching 等主流的 VLA 模型,極大減少 VLA 跨本體適配的數據需求。


  • 論文題目:Align-Then-Steer: Adapting the Vision-Language Action Models through Unified Latent Guidance
  • 論文地址:https://arxiv.org/abs/2509.02055
  • 項目地址:https://align-then-steer.github.io/
  • 開源代碼:https://github.com/TeleHuman/Align-Then-Steer

研究動機:從分布一致性突破 VLA 的跨本體泛化訓練瓶頸

在面向特定具身場景的操作大模型應用中,決定 VLA 能否進行跨本體遷移的關鍵并非參數規模或主干架構的復雜度,而是預訓練階段與后訓練階段的目標本體和任務的動作分布的一致性。特別地,當目標本體的機械臂構型、執行器形態、關節自由度與本體物理約束等發生變化時,目標動作分布不可避免地偏離預訓練階段 VLA 學得的動作分布域。單純地通過采集大量真機數據在后訓練階段彌補這一鴻溝,面臨迅速遞減的邊際收益,即單純數據堆疊難以有效地引導策略抵達目標域。

為了解決 VLA 的跨本體泛化適配問題,目前學界采用的方法主要從以下兩個角度開展,構建統一的、語義級別的潛在動作表示,或通過運動學重定向(Retargeting)手動將跨本體數據構建到統一的動作空間。然而,這些路徑普遍存在兩類局限:一方面,目標動作分布與原分布相差過大時(如預訓練采用單臂數據,目標場景在雙臂),上述的方法難以準確刻畫目標本體的可行子分布;另一方面,現有方式依然面向自回歸范式,并沒有考慮擴散 / 流匹配類策略的條件生成結構。為了解決該問題,TeleAI 具身智能團隊提出了 “對齊 - 引導 - 泛化”(ATE)框架,在統一的潛空間中先對齊動作統計,并在后訓練階段引入可微的引導項牽引策略更新,僅利用少量樣本便可以將模型適配到目標本體。

研究方法

ATE 框架

ATE 框架的核心思想是先在潛空間中對齊動作分布,再利用潛空間的分類器引導去牽引后訓練策略更新方向。ATE 框架如上圖所示,共分為兩個階段。

第一階段先構建一個與跨本體的統一動作潛空間,將預訓練數據所蘊含的跨任務、跨環境結構性信息編碼到潛空間,再利用目標域的有限樣本將目標潛空間嵌入到預訓練潛空間。在完成潛空間的對齊后,第二階段在統一的潛空間上設計引導函數,并利用由此得到擴散 / 流匹配 VLA 模型的分類引導,在后訓練階段顯式地將微調過程牽引至期望的目標分布,而無需更改 VLA 模型主干模型結構。

在 ATE 框架中,“對齊 — 引導” 都從分布的角度出發:先把目標域的動作潛分布嵌入到預訓練動作潛分布的某個模態中,隨后用一個可微的分類器引導項把策略輸出的生成分布朝目標分布持續推近。第一步等價于在潛空間上完成一次分布投影;第二步等價于在生成過程中為分布流添加一個外部力場,沿著統一潛空間定義的能量梯度推進去噪,使最終的邊緣分布更接近適配數據分布。

這種 “從調模型到調分布” 的范式遷移具有如下優勢。第一,樣本效率提升:潛空間對齊將策略搜索范圍約束在包含目標分布域的流形上,顯著降低了擬合到可行動作分布所需的數據量。第二,訓練效率提升:分布引導避免模型全參數重訓練,能夠在既定訓練預算內獲得更快的有效收斂。第三,工程可復用性增強:潛空間引導只作用于動作專家模型后訓練,與頂層模型解耦,具備即插即用的特性,可適配目前主流分層 VLA。

第一階段:動作潛分布對齊

在對齊階段,ATE 框架分別構造了兩個小型變分自編碼器模型(VAE)來對齊兩階段數據的動作空間。具體而言,首先構建一個統一動作潛空間,將預訓練和適應階段的動作數據嵌入到同一潛空間中。該方法通過訓練一個 VAE 在預訓練動作數據上,獲得一個固定的動作潛先驗分布。接著,對適應階段的動作數據,訓練第二個 VAE,并通過反向 KL 散度約束,將適應動作的潛分布嵌入到預訓練潛分布的特定模式中。由于反向 KL 散度的模式尋找特性(mode seeking),能夠將適應動作的潛表示緊密嵌入到預訓練分布的主模式中,使適配數據的潛變量分布逼近預訓練潛分布 某一模態,從而把目標域的動作分布嵌入到預訓練域已經學到的潛空間中,得到統一的動作潛空間 Z,從而實現高效的跨實體和跨任務適應。此外,該方法僅需對 VAE 進行訓練,無需修改原始 VLA 架構,具有低計算開銷和高適配性。

第二階段:動作潛分布引導

在引導階段,設計了面向主流 VLA 框架的引導機制,通過能量函數和分類器,衡量生成動作與目標動作分布的差異,并將引導梯度整合進模型的訓練目標函數中。這一過程無需額外數據,僅依賴細調數據的噪聲樣本作為參考,即可在保持預訓練模型通用性的基礎上,高效地將模型輸出引導至與新任務和實體相匹配的動作分布。具體的,ATE 在潛空間內構造 classifier guidance 函數,度量當前去噪時間步的策略輸出動作塊(action truck)與目標動作塊在潛空間的距離,其梯度被直接加到擴散過程的分數函數或流匹配的速度場更新式中,從而在每個去噪 / 流動時間步對生成軌跡的分布施加 “拉力”,把概率質量往目標分布牽引。通過引入分類器引導函數無需通過改變 VLA 的主干結構和動作空間,卻可以改變訓練時優化的分布方向。

引導機制充分利用了統一潛空間的優勢,既解決了跨實體和跨任務的適應性問題,又保留了預訓練階段習得的通用視覺 - 運動先驗知識,顯著提升了模型在新環境下的適應效率和性能。

實驗結果

ATE 算法在 ManiSkill 與 RoboTwin 1.0 等多任務仿真評測中,相較于直接后訓練,平均多任務成功率最高提升 9.8%。而在真實機器人跨本體現實場景中,ATE 帶來最高 32% 的成功率增益,且表現出更穩健的收斂行為與對光照、干擾的魯棒性。這些結果表明:ATE 框架在統一潛空間中引導學習,使得 VLA 跨本體與跨任務泛化在有限數據下得到提升,而無需額外的數據與大規模重訓練。

上表匯總了 17 個機器人操作任務上,ATE 框架下 RDT 和 PI-0 在 RoboTwin 1.0 上的性能對比。ATE 框架對 RDT 與 PI-0 的平均提升分別約為 + 9.8 與 + 8.7 個百分點,顯示出跨任務的一致增益與較好的可遷移性。尤其在基線困難的長程任務中,單項增益明顯:例如,RDT 在 Empty Cup Place 任務成功率由 22% 提升到 61%(+39),Pi 0 在 Dual Bottles Pick (Easy) 任務上成功率由 48% 提升到 85%(+37),反映了潛空間對齊與引導在動作空間分布失配較大的場景中效果更顯著。與此同時,個別任務出現了小幅下降,如 RDT 在 Bottle Adjust(-16)、Tool Adjust(-12)、Shoe Place(-1),Pi 0 在 Pick Apple Messy(-7)、Blocks Stack (Hard)(-1)、Tool Adjust(-1)。這類現象通常表現為目標域動作分布較窄。從樣本效率與收斂速度角度,ATE 在 70k 步即可超過傳統 RDT 的 90k 步效果,說明 ATE 框架的對齊 — 引導機制,不僅提高任務成功率,也顯著提升了任務成功率。

為了驗證模型的跨本體泛化能力,我們自行搭建了雙臂睿爾曼實驗環境,該實驗平臺從未在預訓練數據中出現過,且雙臂的動作空間和預訓練數據有明顯不同。進而,構建了多個分鐘級長序雙臂協同操作任務,包括制作三明治、蒸包子等復雜協作任務,以及制作酸奶、烤面包等工具使用類任務。通過采集少量真機數據進行后訓練,ATE 算法能夠將基座 RDT 和 Pi-0 等 VLA 模型快速適配到目標本體上。上圖呈現了四個真機任務在不同訓練步數的成功率與整體平均,展示了在有限數據與分鐘級長程任務下 ATE 框架的性能。可見在需要雙臂協同、時序規劃與多階段配合的任務上,在統一的潛空間引導下 ATE 框架能使模型更快地收斂到目標域動作分布。

上圖可視化了空間泛化(初始位姿隨機偏移)、視覺干擾(放置未見過的雜物,如水果)、人為擾動(在關鍵點迫使策略重試)。ATE 框架在未見的光照、雜物干擾、空間偏移與外部干預下仍能維持任務相關注意與恢復能力。 

研究總結

在 VLA 基座模型尚不具備直接泛化能力的情況下,TeleAI 提出的跨本體 ATE 后訓練框架為數據稀缺與跨本體泛化后訓練難題提供了可行答案。面對數據預算、訓練窗口與算力上限的三重約束,無需寄望于數據堆疊或昂貴的全參重訓,而是以最小工程代價引入潛空間對齊與分布引導,實現快速、穩健的跨本體泛化適配。換言之,ATE 框架可以作為一個即插即用的模塊,成為兼容各種主流 VLA 模型的后訓練階段的對齊引導方案,用于提升后訓練的跨本體泛化能力,成為破解數據與訓練瓶頸的實踐路徑。

作者簡介:本文由 TeleAI 三名研究實習生:清華大學博士生張揚、港中文碩士生王陳煒、西工大碩士生陸歐陽作為共同第一作者,成果由 TeleAI 聯合清華大學、港中文、西工大合作完成,本文通訊作者為 TeleAI 具身智能團隊負責人白辰甲博士和 TeleAI 院長。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-11-20 08:47:53

2025-03-31 09:10:00

開源模型智能體

2025-07-25 09:31:49

2025-07-25 10:19:44

2025-05-06 15:31:55

智能模型AI

2025-10-29 16:04:51

模型數據生成AI

2025-07-10 14:55:12

機器人AI模型

2025-07-10 14:50:46

AI模型訓練

2025-10-13 09:08:00

2025-10-23 09:13:56

2025-01-10 09:30:00

2025-03-10 13:31:28

2025-11-12 08:45:38

2025-07-15 16:28:05

2025-11-10 08:48:00

AI模型自動駕駛

2025-07-08 15:13:31

模型AI智能

2025-10-29 16:11:39

AI模型工具

2025-09-30 09:00:00

2024-12-02 07:10:00

DeeR-VLALLM多模態模型

2025-08-01 09:10:00

點贊
收藏

51CTO技術棧公眾號

亚洲午夜激情网页| 亚洲欧美综合自拍| 精品国精品国产自在久不卡| 欧美一级色片| 美洲天堂一区二卡三卡四卡视频| 日韩欧美国产1| 在线视频不卡一区二区| 亚洲国产成人无码av在线| 人人狠狠综合久久亚洲婷| 欧美日韩亚洲一区二区| 国产高清精品一区二区三区| 91精品少妇一区二区三区蜜桃臀| 日本成人片在线| 91亚洲国产成人精品一区二三| 亚洲欧美日韩精品久久| 黄页免费在线观看视频| 成人h动漫精品一区二区无码| 在线 亚洲欧美在线综合一区| 日韩一区二区视频在线观看| 中文字幕一区二区三区精彩视频 | 黑人无套内谢中国美女| 精品久久av| 欧美18免费视频| 欧美日本免费一区二区三区| 图片区小说区区亚洲五月| 美日韩一二三区| 亚洲国产合集| 色婷婷综合在线| 欧美日韩在线高清| 黄色污污视频软件| 婷婷亚洲精品| 色婷婷亚洲综合| 亚洲一区二区三区av无码| 91午夜交换视频| 国产国产精品| 日韩一级片网站| 成人性生生活性生交12| yjizz视频网站在线播放| 日本亚洲天堂网| www日韩欧美| 99久久99精品| 黄网站在线观| 91美女福利视频| 国产 高清 精品 在线 a | 51精品国自产在线| 亚洲欧美一二三| 亚洲AV无码精品自拍| 最新成人av网站| 亚洲欧美日韩图片| 欧美深性狂猛ⅹxxx深喉| 日韩不卡免费高清视频| 国产精品久久久久久久久快鸭| 91免费欧美精品| 日本少妇在线观看| 欧美伦理在线视频| 日韩三级视频中文字幕| 搡的我好爽在线观看免费视频| 欧美xxxbbb| 久久精品欧美一区二区三区不卡| 国产欧美一区二区三区四区| 免费中文字幕在线观看| 亚欧日韩另类中文欧美| 日韩成人网免费视频| 亚洲这里只有精品| xxxx另类黑人| 欧美日韩激情网| 欧美精品一区二区三区免费播放| 免费不卡视频| 亚洲精品网站在线| 亚洲久久久久| 精品日韩在线观看| 男人搞女人网站| 久久久精品一区二区毛片免费看| 一区二区三区日韩欧美| 欧美一级日本a级v片| 一级做a爰片久久毛片16| 免费视频最近日韩| 亚洲一区国产精品| 精品免费囯产一区二区三区| 天天做天天爱天天爽综合网| 爱福利视频一区| 成年人av电影| 日韩欧美自拍| 亚洲欧美国产精品va在线观看| 魔女鞋交玉足榨精调教| 日本免费一区二区三区视频| 91成人在线观看喷潮| dy888午夜| 可以免费看污视频的网站在线| 国产成人精品免费在线| 国产日韩在线观看av| 国产精品怡红院| 日产欧产美韩系列久久99| 国产一区红桃视频| 日本毛片在线观看| 国产成人精品综合在线观看| 国产欧美在线看| 亚洲黄色精品视频| 国产网站一区二区| avav在线播放| 在线三级中文| 亚洲免费视频中文字幕| 亚洲午夜精品国产| 成a人v在线播放| 一级女性全黄久久生活片免费| 在线视频一区观看| 国产美女高潮在线| 亚洲超碰97人人做人人爱| wwwjizzjizzcom| 中文字幕有码在线视频| 日韩欧美高清视频| 免费在线观看的av网站| 不卡福利视频| 色域天天综合网| 黄页网站在线看| 久久免费大视频| 少妇高潮久久77777| 阿v天堂2014| 国产日产精品_国产精品毛片| 亚洲欧美三级在线| 欧美卡一卡二卡三| 青草av.久久免费一区| 精品久久久久久亚洲| 熟妇人妻av无码一区二区三区| 高清成人在线观看| 亚洲一区美女| 日本欧美不卡| 精品亚洲男同gayvideo网站| 丝袜美腿中文字幕| 亚洲午夜在线| 91高潮在线观看| 秋霞av一区二区三区| 日本特黄久久久高潮| 精品久久久久久一区| 丝袜在线视频| 欧美性少妇18aaaa视频| 成人一区二区三区仙踪林| 国产精品久久久网站| 精品亚洲一区二区三区在线播放| 久久精品第一页| 国产麻豆一精品一av一免费| 国产精品久久波多野结衣| 亚洲色图欧美视频| 日本一区二区综合亚洲| 中文字幕一区二区三区四区五区 | 蜜臀久久精品久久久久| 亚洲欧美日韩中文播放| 91成人综合网| 秋霞一区二区三区| 久久97精品久久久久久久不卡| 精品在线免费观看视频| 久久精品卡一| 成人精品一区二区三区电影黑人| www.麻豆av| 一区二区三区在线不卡| 可以看的av网址| 欧美午夜视频| 国产高清在线不卡| 99er热精品视频| 91年精品国产| 红桃av在线播放| 亚洲精品456| 国产精品99久久久久久久久| h网站在线免费观看| 欧美日韩国产精品成人| 国产精品视频一区二区三| 亚洲理伦在线| 欧美精品亚洲精品| 123成人网| 亚洲成人精品在线| 国产精品18在线| 99国产精品久久久久久久| 国产精品永久在线| 天天射天天色天天干| 欧美午夜影院在线视频| 免费黄色片网站| 极品美女销魂一区二区三区| 久久精精品视频| 性直播体位视频在线观看| 精品第一国产综合精品aⅴ| 欧美日韩生活片| 亚洲尤物精选| 国产精品视频免费观看| 在线天堂资源www在线污| 日韩免费电影一区| 91国产丝袜播放在线| 国产精品18久久久久久久久久久久 | 7m第一福利500精品视频| 可以直接在线观看的av| 欧美一区二区视频网站| 波多野结衣av在线观看| 亚洲第一黄色| 涩涩涩999| 一区二区三区在线资源| 精品国内产的精品视频在线观看| 亚洲永久精品一区| 亚洲码国产岛国毛片在线| 五月开心播播网| 久久精品国产精品亚洲精品| 日本一区二区高清视频| 亚洲国产综合在线观看| 伊人精品在线观看| 丁香社区五月天| 亚洲另类中文字| mm131丰满少妇人体欣赏图| 国产精品亚洲一区二区三区在线| 蜜臀视频一区二区三区| 欧美人与牛zoz0性行为| 欧美一区视频在线| 日韩资源在线| 91久久一区二区| 麻豆成人在线视频| 国产精品视频在线看| 在线观看av网页| 日韩毛片视频| 久久99精品国产99久久| 日韩高清一区| 国产精品爽爽爽| 日韩电影免费观| 久久人91精品久久久久久不卡| 国 产 黄 色 大 片| 香港成人在线视频| 色老板免费视频| 国产精品77777竹菊影视小说| 91av俱乐部| 亚洲永久视频| 亚洲午夜精品久久久久久人妖| 欧美三级电影在线| 亚洲自拍小视频免费观看| 国产第一亚洲| 久久亚洲精品网站| 亚洲欧美激情在线观看| 欧美另类高清zo欧美| 日本中文字幕免费在线观看| 欧美韩日一区二区三区四区| 中文字幕国产专区| 久久电影国产免费久久电影 | 国模无码视频一区| 99精品99| 日韩av中文字幕第一页| 欧美久久影院| 激情视频小说图片| 91久久久精品国产| 综合视频在线观看| 香蕉久久网站| 国产免费一区二区| 五月激情久久| 国产成人亚洲综合青青| 性高爱久久久久久久久| 国产极品jizzhd欧美| 欧美成人黑人| 国产精品成人一区二区| 尤物yw193can在线观看| 欧美成人小视频| 青青草免费在线| 亚洲区免费影片| aaa一区二区| 一本色道亚洲精品aⅴ| 日韩毛片一区二区三区| 日韩欧美黄色动漫| 波多野结衣电车痴汉| 欧美自拍偷拍午夜视频| 一卡二卡三卡在线| 日韩欧美国产三级| 欧美视频久久久| 亚洲欧美福利视频| av网在线观看| 日韩精品在线视频美女| 日av在线播放| 日韩在线播放一区| 国产三线在线| 日韩美女在线看| 男女视频在线| 欧美一级免费看| 秋霞国产精品| 亚洲综合第一页| 婷婷精品在线| 手机成人av在线| 99亚洲一区二区| 在线观看国产一级片| 国产福利91精品| 中文字幕在线看高清电影| 亚洲欧洲99久久| 亚洲综合欧美综合| 亚洲另类一区二区| 久久艹免费视频| 欧美人妖巨大在线| 手机在线不卡av| 综合国产在线视频| 激情综合闲人网| 另类专区欧美制服同性| 中日韩脚交footjobhd| 成人性生交大片免费看小说| 国产精品白丝av嫩草影院| 午夜精品电影在线观看| 亚洲欧洲综合| 国产精品嫩草影院8vv8| 奇米影视一区二区三区小说| 99久久综合网| 亚洲国产高清在线| 91看片在线播放| 欧美一区二区视频观看视频| 黄色国产在线| 国内精久久久久久久久久人| 欧美成人福利| 蜜桃导航-精品导航| 色综合久久中文| 色哟哟免费网站| 日韩电影免费在线看| 亚州精品一二三区| av亚洲精华国产精华精华 | www.欧美视频| 91在线色戒在线| 在线视频亚洲专区| 免费人成自慰网站| 精品亚洲免费视频| 四虎国产精品成人免费入口| 模特精品在线| 91在线高清视频| 精品一区在线| 无码中文字幕色专区| 国内精品伊人久久久久av影院 | 天天干天天摸天天操| 久久久精品一区| 日韩一区中文| 日韩在线电影一区| 一区二区小说| 美女扒开大腿让男人桶| 国产真实乱偷精品视频免| 免费不卡av网站| 国产精品电影一区二区三区| 欧美国产成人精品一区二区三区| 亚洲精品在线三区| av电影免费在线观看| 国产日韩欧美在线播放| 日韩国产欧美一区二区| 成人中文字幕av| 久久久久久久综合狠狠综合| 超碰人人人人人人人| 色综合久久综合中文综合网| 性感美女一级片| 午夜精品福利视频| 欧美色片在线观看| 久久riav二区三区| 夜夜嗨一区二区| 亚洲国产精品自拍视频| 午夜日韩在线观看| 国产 日韩 欧美 精品| 久久久久这里只有精品| jizz18欧美18| 婷婷久久五月天| 日本不卡一二三区黄网| 女人又爽又黄免费女仆| 色婷婷国产精品| 成年人在线观看网站| 国产欧美亚洲精品| 香蕉视频官网在线观看日本一区二区| www.成年人| 久久影院电视剧免费观看| 日本不卡一区视频| 欧美午夜一区二区| 手机看片一区二区| 538国产精品一区二区免费视频| 亚洲自拍电影| www亚洲成人| 亚洲美女视频在线| 日本免费一区视频| 国产成人av在线播放| 日韩欧美伦理| 日本特黄在线观看| 五月综合激情网| 国产中文字幕在线看| 成人国产在线视频| 伊人激情综合| 青娱乐国产视频| 日韩一级视频免费观看在线| av毛片午夜不卡高**水| 国产精品午夜视频| 91精品天堂福利在线观看| 国产探花一区二区三区| 午夜精品久久久| 97在线观看免费观看高清| 91久久久一线二线三线品牌| 成人影院天天5g天天爽无毒影院| www.超碰97.com| 亚洲第一福利视频在线| 99国产揄拍国产精品| 国产+成+人+亚洲欧洲| 成人羞羞网站| av电影中文字幕| 色成年激情久久综合| www国产在线观看| 国产精品一香蕉国产线看观看| 欧美在线影院| 性鲍视频在线观看| 欧美日韩亚洲高清| 操你啦视频在线| 欧美性天天影院| 国产91高潮流白浆在线麻豆| 成人免费一级片|