精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

讓機器人「不僅會想,還能準確去做」,VLA-R1把「推理+行動」帶進真實世界

人工智能 新聞
VLA-R1 是一個 “先推理、后執行” 的 VLA(視覺 - 語言 - 行動)基礎模型。它把鏈式思維(CoT)監督與可驗證獎勵的強化學習(RLVR,基于 GRPO)結合起來,同時優化 “推理質量” 和 “執行正確性”。

在機器人與智能體領域,一個老大難問題是:當你讓機器人 “把黃碗放進白色空籃子” 或 “從微波爐里把牛奶取出來放到餐桌上” 時,它不僅要看懂環境,更要解釋指令、規劃路徑 / 可操作區域,并把這些推理落實為準確的動作。目前,很多 VLA(Vision-Language-Action)模型仍傾向直接輸出動作,缺乏對可供性(affordance)與軌跡(trajectory)幾何關系的顯式推理,一旦遇到顏色相近、目標重復或容器多選等場景,就容易出錯。VLA-R1 的目標,不僅把 “會想” 這步補上,而且通過強化學習進一步加強執行動作的準確性,讓機器人解釋清楚再去準確執行。

VLA-R1 出場:它是什么?

論文標題:VLA-R1: Enhancing Reasoning in Vision-Language-Action Models

文章鏈接:https://arxiv.org/abs/2510.01623

項目主頁:https://gigaai-research.github.io/VLA-R1/

一句話概括:VLA-R1 是一個 “先推理、后執行” 的 VLA(視覺 - 語言 - 行動)基礎模型。它把鏈式思維(CoT)監督與可驗證獎勵的強化學習(RLVR,基于 GRPO)結合起來,同時優化 “推理質量” 和 “執行正確性”。簡單說,就是讓模型既能把思考過程講明白,還能把動作做準。

關鍵創新點

1)兩階段訓練:SFT + RL(基于 GRPO)

先用顯式 CoT 監督做有教師的指令微調(SFT),再用可驗證獎勵做后訓練強化(GRPO)。后者通過組內歸一化優勢與 KL 約束,穩定地把 “會想” 轉化為 “會做”。推理輸出采用固定結構:<think>…</think> + <output>…</output>,從而保證可讀、可查錯。

2)三類 “可驗證獎勵”(RLVR)直擊 “看準 + 走對 + 格式對”

  • 空間對齊獎勵(GIoU):即使預測框與真值不相交也能得到有效梯度,也能提供有效梯度,顯著加速區域對齊與學習穩定性;
  • 軌跡一致性獎勵(引入角度及段長比值的 Fréchet 距離(ALHF)):綜合位置、切向角度與段長尺度,懲罰 “軌跡形狀不對,彎曲不合理,段長突變” 的情況;
  • 輸出格式獎勵:強制推理段與動作段結構化輸出,減少 “答非所問”。

3)VLA-CoT 數據引擎與 VLA-CoT-13K 數據集

為讓模型 “學會按步驟思考”,作者用 Qwen2.5-VL-72B 自動生成可供性與軌跡兩類任務的結構化 CoT,并在提示中固定四步范式,最終得到 13K 條與視覺 / 動作嚴格對齊的 CoT 標注,用作 SFT 的高質量監督信號。

實驗速覽

VLA-R1 在四個層級進行了系統評測:域內(In-Domain)測試、域外(Out-of-Domain)測試、仿真平臺、真實機器人實驗。此外還做了有無 CoT,RL 的消融實驗以證明方法的有效性。

基準集(In-Domain)

VLA-R1 的基準集來自團隊自建的 VLA-CoT-13K 數據引擎,共含約 1.3 萬條視覺 - 語言 - 行動樣本,任務涵蓋 “可供性識別(Affordance Detection)” 與 “軌跡規劃(Trajectory Generation)” 兩大類。場景以桌面和實驗室為主,光照均勻、背景簡潔,包含碗、杯、勺、筆、盒子、籃子等常見物體,每條數據都配有精確的區域標注、軌跡點坐標和配套的鏈式思維推理。

實驗結果

  • 可供性 IoU:36.51,比強基線 ManipLVM-R1 提升 17.78%;
  • 軌跡平均誤差(Avg):91.74,相對基線降 17.25%。

域外集(Out-of-Domain)

為了檢驗模型的泛化與語義遷移能力,研究團隊引入兩個全新測試集:UMD Dataset 與 VAIT Dataset。UMD 提供豐富的家庭物體及其功能標簽(如 graspable、containable 等),而 VAIT 著重考察視覺場景與自然語言指令的對應關系。與基準集相比,域外數據在物體類別、背景風格、光照條件及語言結構上均存在顯著差異,幾乎不存在訓練重疊。

實驗結果

  • 可供性 IoU:33.96,在 UMD 數據集上仍然保持領先。
  • 軌跡平均誤差(Avg):93.90,在 VAIT 子集上展現穩健泛化。

真實機器人(4 個餐桌場景)

在 VLA-R1 的真實機器人實驗中,作者共設計了四個桌面場景(S1–S4),每個場景都針對不同的環境復雜度與視覺干擾進行布置,用以驗證模型在真實視覺條件下的穩健性與泛化性。S1 為彩色碗拾取與放置場景,主要測試模型在多種顏色相近物體下的目標區分與空間定位能力;S2 為水果拾取場景,物體外觀相似且數量較多,用于考察模型在同類物體識別與實例辨析下的可供性推理;S3 為廚房復雜遮擋場景,實驗臺上布置微波爐等大型遮擋物,考查模型在部分可見與非均勻光照環境下的穩健推理;S4 為混合雜亂場景,包含多類別、不同屬性的日常物體,模擬多目標混放與多容器選擇的真實桌面環境。四個場景均采用相同的機械臂與相機系統,在隨機物體排列與任務順序下獨立進行十次實驗,以評估模型在真實干擾條件中的整體穩定性與任務一致性。

  • 可供性感知 SR:62.5%;軌跡執行 SR:75%。
  • 在顏色相近、遮擋、目標擾動等干擾下,VLA-R1 仍能給出空間一致、接近目標的預測。

仿真(Piper / UR5,測試跨機器人平臺通用性)

為測試跨平臺通用性,VLA-R1 被部署到兩種機械臂仿真環境:輕量級的 Piper 與工業級的 UR5。仿真任務涵蓋多種隨機物體與動作指令。

  • 可供性 SR:60% / 50%;軌跡 SR:80% / 60%,
  • 跨機器人維持較好成功率,顯示出跨平臺泛化潛力。

消融實驗

為了測試 CoT,RL 的有效性,論文分別進行了直接輸出軌跡,只用 CoT,以及 CoT+RL 后訓練三種實驗的對比

  • 只用 CoT(無 RL):IoU 從 23.74 → 28.37,軌跡誤差也小幅下降;
  • CoT + RL:進一步把 IoU 拉到 36.51,軌跡各項顯著改進,說明 “先學會想,再用獎勵把想法煉成動作” 是有效路徑。

Demo 展示

仿真平臺

應用前景

家居拾放 / 收納等日常操控:面向客廳 / 廚房 / 書桌等開放環境,VLA-R1 可在多物體、光照不均、紋理干擾與部分遮擋下穩定完成 “找 — 拿 — 放” 的閉環。它先用顯式推理消解 “相似目標 / 相近顏色 / 多個容器可選” 等歧義,再輸出可供性區域與可執行軌跡,最終由低層控制棧完成抓取與放置。典型場景包括:將勺子→碗、筆→白盒、香蕉→籃子的收納,或在反光桌面、雜物堆疊的桌面上進行安全、可解釋的物品整理。

倉揀 / 輕工裝配:在料箱揀選、工位配盤、工裝上料等流程中,VLA-R1 把 “部件 — 工具 — 容器 / 工位” 的三元關系明確寫在推理里(如 “為何選擇該容器 / 該姿態 / 該路徑”),再生成滿足安全距離與路徑順滑度的軌跡,減少誤抓與誤放。它對重復件、套件、易混部件尤其有效:可在同批次零件中依據形狀 / 位置 / 容器容量做出解釋性選擇;同時結構化輸出便于與 MES/PLC/ 視覺檢測系統對接,形成可追溯的產線閉環。

教學 / 評測平臺:VLA-R1 的 < think>…</think>+<output>…</output > 格式天然適合教學演示與自動化評分:教師 / 研究者能直接檢查 “任務解析、場景理解、可供性定位、可行性校驗、軌跡邏輯” 等中間步驟是否合理。配合標準化的 IoU/Fréchet / 成功率等指標,可將其用作課程與競賽的基線模型,學生只需替換數據或模塊,即可對比 “僅 SFT”“SFT+RL”“不同獎勵 / 不同數據引擎” 的差異,快速定位問題與量化改進效果。

作者介紹

葉安根是中國科學院自動化研究所模式識別與智能系統方向的在讀博士,研究方向聚焦于強化學習、機器人操作、具身智能。曾參與多項科研項目,致力于通過強化學習構建少樣本、多任務的通用機器人系統。

張澤宇是 Richard Hartley 教授和 Ian Reid 教授指導的本科研究員。他的研究興趣扎根于計算機視覺領域,專注于探索幾何生成建模與前沿基礎模型之間的潛在聯系。張澤宇在多個研究領域擁有豐富的經驗,積極探索人工智能基礎和應用領域的前沿進展。

通訊作者朱政,極佳科技聯合創始人、首席科學家,2019 年博士畢業于中國科學院自動化研究所;2019 年至 2021 年在清華大學自動化系從事博士后研究。在 TPAMI、 CVPR、ICCV、 ECCV、NeurIPS 等頂級期刊和會議上發表論文 70 余篇,文章總引用 16000 余次 (Google Citations),連續 4 年入選全球前 2% 頂尖科學家榜單。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-10-30 16:04:35

AI模型機器人

2025-08-01 09:10:00

2025-07-07 08:50:00

2025-01-02 14:30:00

AI訓練模型

2025-07-10 14:55:12

機器人AI模型

2025-04-27 08:55:00

2025-09-18 10:06:52

2020-12-31 06:55:37

機器人自然語言人工智能

2018-07-05 17:01:42

人工智能機器學習機器人

2024-12-27 11:52:25

GRAPEVLA 模型人工智能

2025-11-12 08:45:38

2021-06-07 08:28:26

人工智能AI機器人

2017-08-24 13:14:38

AI人工智能機器人

2025-09-28 02:00:00

2020-10-15 15:42:00

人工智能

2025-07-08 15:13:31

模型AI智能

2025-02-08 12:45:08

2024-09-18 13:30:00

2022-03-04 10:14:46

機器人
點贊
收藏

51CTO技術棧公眾號

国产伦精品一区二区三区高清| 91久久久免费一区二区| 国产日韩欧美另类| av电影网站在线观看| 在线天堂中文资源最新版| 91麻豆文化传媒在线观看| 国产精品一区专区欧美日韩| 纪美影视在线观看电视版使用方法| 韩日一区二区| 综合久久久久久久| 国产成人精品免费视频大全最热 | 日本一区二区在线观看视频| 一区二区电影免费观看| 中文字幕一区二区在线观看| 国产精品久久久久久久久婷婷| 日韩欧美国产另类| 欧美日韩一二三四| 欧美一区二区三区视频在线观看 | 日本欧美久久久久免费播放网| 欧美高清自拍一区| 国产精品久久久免费看| 你微笑时很美电视剧整集高清不卡| 欧美性猛片aaaaaaa做受| 国产黄色片免费在线观看| 色一情一乱一乱一区91av| 日韩av电影天堂| 97国产成人精品视频| 免费成人深夜夜行网站| 精品国产一区二区三区小蝌蚪| 7777精品伊人久久久大香线蕉超级流畅 | 大乳护士喂奶hd| 欧美一区一区| 777色狠狠一区二区三区| 污版视频在线观看| 樱花草涩涩www在线播放| 亚洲欧洲国产专区| 亚洲欧美成人一区| 国产在线一二| av一区二区三区黑人| 91在线免费看网站| 国产精品污视频| 老司机免费视频一区二区三区| 国产成人精品在线| 亚洲免费在线视频观看| 亚洲视频大全| 亚州av一区二区| 久久久美女视频| 午夜电影亚洲| 欧美激情亚洲激情| 青娱乐国产盛宴| 中文av一区| 欧美日韩福利在线观看| 欧美日韩免费一区二区| 国产一区二区三区四区三区四| 久久伊人色综合| 婷婷伊人五月天| 成人激情视频| 久久精品美女视频网站| 国产视频123区| 围产精品久久久久久久| 久久天天躁日日躁| 搜索黄色一级片| 自拍视频亚洲| 久热精品视频在线观看一区| 免费中文字幕在线观看| 在线播放一区| 日本久久久久久久久久久| 在线观看中文字幕视频| 欧美在线综合| 国产精品美女免费| 亚洲一卡二卡在线| 精一区二区三区| 国产免费久久av| 国产精品久久久久久免费免熟| 国产在线不卡一区| 国产欧美一区二区视频| 欧美午夜黄色| 国产午夜精品久久久久久免费视| 伊人久久婷婷色综合98网| 污污在线观看| 亚洲最大色网站| 久久美女福利视频| 亚洲国产91视频| 精品乱人伦小说| 美女洗澡无遮挡| 久久久久午夜电影| 91国语精品自产拍在线观看性色| 99久久精品国产亚洲| 麻豆国产一区二区| 国产精品一区二区三区观看| 日本护士...精品国| 亚洲欧美在线aaa| 国产h视频在线播放| 成人a在线观看高清电影| 制服视频三区第一页精品| 国产aⅴ爽av久久久久| 老牛影视av一区二区在线观看| 亚洲欧美综合区自拍另类| 中文天堂资源在线| 激情六月综合| 国产精品久久久久久久久久久新郎 | 欧美人与禽zozo性伦| xxxxxx黄色| 外国成人免费视频| 国产精品99久久久久久白浆小说| 国产精品伦理一区| 久久久久久夜精品精品免费| 国产精品久久久影院| 亚洲人免费短视频| 91精品国产一区二区人妖| 奇米777第四色| 日韩欧美不卡| 国产成人91久久精品| 成人爽a毛片一区二区| 中文字幕精品—区二区四季| 黄页免费在线观看视频| 中文字幕系列一区| 亚洲加勒比久久88色综合| 国产女片a归国片aa| 奇米一区二区三区| 精品视频高清无人区区二区三区| v天堂福利视频在线观看| 在线视频观看一区| 97香蕉碰碰人妻国产欧美| 午夜精品一区二区三区国产 | 老司机激情视频| 日本久久二区| 国产一区二区三区在线免费观看 | 国产精华一区二区三区| av在线播放网站| 亚洲大型综合色站| 91视频这里只有精品| 老司机在线精品视频| 精品中文视频在线| 久久久久久久久久久久久久av| jlzzjlzz国产精品久久| 国产在线视频综合| 欧美专区一区| 欧美日韩国产91| 性一交一乱一精一晶| 中文字幕国产精品一区二区| 久久久久久三级| 久久超碰99| 91成人免费观看网站| 国产高清视频免费| 国产精品护士白丝一区av| 女性女同性aⅴ免费观女性恋| 国产精品对白久久久久粗| 久久久久久久久中文字幕| 狠狠躁日日躁夜夜躁av| 午夜精品久久久久久久99水蜜桃| 中文字幕在线播放一区| 在线成人av| 久久精品美女| 欧美男男tv网站在线播放| 日韩高清免费在线| aaa在线视频| 国产欧美一区二区精品婷婷| www黄色av| 免费一区二区| 成人黄色在线播放| 婷婷色在线资源| 精品电影一区二区三区 | 影音先锋久久久| 国产成人一区二区三区免费看| av电影在线免费| 亚洲国产精品99久久| 91精品国产高清一区二区三密臀| 久久久精品国产免费观看同学| jizz大全欧美jizzcom| 欧美日韩高清| 97影院在线午夜| 理论不卡电影大全神| 亚洲人在线观看| 国产又粗又猛又黄又爽| 亚洲欧美日韩一区二区 | 欧美国产乱子伦| 日韩av手机版| 欧美aⅴ99久久黑人专区| 99超碰麻豆| 亚洲免费福利| 久久亚洲精品中文字幕冲田杏梨 | 综合av色偷偷网| 国产农村老头老太视频| 一区二区三区在线观看网站| 香港三级日本三级| 麻豆中文一区二区| 成人免费播放器| 欧美日韩精品在线一区| 高清不卡日本v二区在线| 美女日批视频在线观看| 亚洲欧美日韩国产中文| 国产日韩一级片| 一本大道久久精品懂色aⅴ | 在线精品视频在线观看高清| 黄色小网站91| 亚洲电影二区| 久久久亚洲成人| 欧美边添边摸边做边爱免费| 日韩电影大全免费观看2023年上| 国产欧美综合视频| 91久久精品一区二区三区| 精品99在线观看| 中文字幕av一区二区三区高 | 国产精品久久久久久久久久辛辛 | 91亚洲精品国偷拍自产在线观看 | 久久99热这里只有精品国产| 久草在线青青草| 欧美大片在线观看| 亚洲婷婷久久综合| 亚洲国产视频一区| 国产aⅴ激情无码久久久无码| 久久精品国产99| 日本黄网站免费| 99re国产精品| 日本一区二区不卡高清更新| 欧美变态网站| 91高跟黑色丝袜呻吟在线观看| 中国av在线播放| 视频在线观看一区二区| 搞黄视频在线观看| 日韩精品极品视频免费观看| 超碰人人人人人人| 欧美亚洲日本国产| 黄色一级视频免费| 久久精品视频在线看| 三级黄色片网站| youjizz久久| 91丨porny丨对白| 国产黄色成人av| 亚洲精品综合在线观看| 日本免费在线视频不卡一不卡二| 又粗又黑又大的吊av| 亚洲精品美女91| 无码熟妇人妻av在线电影| 午夜天堂精品久久久久| 蜜臀在线免费观看| 亚洲色图插插| 亚洲欧洲久久| 99精品视频在线| 一道本在线观看视频| 亚洲精品午夜av福利久久蜜桃| 最新国产精品久久| 99久久精品国产亚洲精品| 四虎影院一区二区三区 | 丰满人妻一区二区三区四区| 在线视频一区二区三区| 中文字幕 自拍偷拍| 欧美日韩一区二区三区视频| 91在线视频免费播放| 日韩欧美黄色动漫| 日本丰满少妇做爰爽爽| 欧美日韩国产一级二级| 亚洲综合精品视频| 7777女厕盗摄久久久| 精品人妻一区二区三区三区四区| 精品精品欲导航| 无套内谢的新婚少妇国语播放| 亚洲精品中文字幕女同| 国产私拍精品| 精品福利二区三区| 亚洲欧美日韩免费| 亚洲视屏在线播放| 97电影在线| 欧美激情国内偷拍| 欧美gay囗交囗交| 国产精品欧美在线| 日韩在线成人| 麻豆亚洲一区| 天天做天天爱天天爽综合网| 无码人妻精品一区二区蜜桃网站| 亚洲制服少妇| 亚洲综合色在线观看| 国产激情一区二区三区| 30一40一50老女人毛片| 中文字幕一区二区三| 2021亚洲天堂| 色综合中文字幕| 亚洲欧美另类在线视频| 欧美精品丝袜久久久中文字幕| 亚洲欧美黄色片| 国产亚洲在线播放| 天堂av在线电影| 国产成人91久久精品| 亚洲精品福利| 激情小说综合网| 97色伦图片97综合影院| 亚洲国产成人精品无码区99| 免费欧美在线视频| av电影在线播放| 久久综合视频网| jizz18女人高潮| 亚洲国产精品一区二区久久| 精品国产青草久久久久96| 精品少妇一区二区三区日产乱码 | 青青青国产在线| 欧美色图片你懂的| 天堂av在线免费| 久久精品成人一区二区三区| 忘忧草在线影院两性视频| 92国产精品视频| 精品日韩欧美一区| 缅甸午夜性猛交xxxx| 国产一区亚洲一区| 欧美黄色激情视频| 婷婷一区二区三区| 999av视频| 中文字幕国产精品| 亚洲最大网站| 国产综合18久久久久久| 综合一区二区三区| 美女一区二区三区视频| 99re6这里只有精品视频在线观看| 成人免费毛片xxx| 天天av天天翘天天综合网色鬼国产| 国产特级aaaaaa大片| 中文字幕亚洲欧美日韩在线不卡| 精品极品在线| 成人精品一二区| 国产精品一区二区av日韩在线| 极品粉嫩国产18尤物| 国产精品99久久久久久有的能看| 国产视频不卡在线| 亚洲v中文字幕| 国精品人妻无码一区二区三区喝尿 | 午夜日韩在线电影| 国产又爽又黄免费软件| 亚洲一级片在线看| 91精品论坛| 久久久福利视频| 亚洲欧洲一区二区天堂久久| 久久久久亚洲AV成人网人人小说| 成人免费一区二区三区在线观看| 亚洲av无码精品一区二区| 日韩精品电影网| 亚洲最大成人| 欧美大陆一区二区| 性色一区二区| 大黑人交xxx极品hd| 亚洲国产日韩一级| 人妻夜夜爽天天爽| 欧美激情视频免费观看| 精品国产三级| 男插女免费视频| 国产二区国产一区在线观看| 可以直接看的黄色网址| 日韩欧美国产一区二区三区| 日本在线观看高清完整版| 91免费版黄色| 国内自拍一区| 亚洲高清无码久久| 精品久久久久久久久久久久久| 天天综合网在线| 国产成人亚洲综合| 91视频综合| 少妇性l交大片7724com| 亚洲一卡二卡三卡四卡| 天天综合在线视频| 日产日韩在线亚洲欧美| 欧美色女视频| 亚洲黄色片免费看| 亚洲一区二区视频在线| 午夜在线视频免费| 91精品国产色综合久久不卡98| 台湾色综合娱乐中文网| 天堂社区在线视频| 亚洲欧美日韩综合aⅴ视频| 国产精品无码白浆高潮| 欧美激情视频在线| 亚洲免费成人av在线| 国产二区视频在线播放| 中文一区在线播放| 国产露脸国语对白在线| 欧美日本黄视频| 欧洲在线一区| 在线观看国产一级片| 一区二区在线免费观看| 日本亚洲欧美| 成人av色在线观看| 欧美日本不卡高清| 精品欧美一区二区久久久| 欧美日韩成人高清| 白浆视频在线观看| 亚洲精品不卡| 粉嫩高潮美女一区二区三区| 亚洲中文字幕无码爆乳av| 欧美成人激情图片网| 日本精品在线观看| www.99热这里只有精品| 国产精品欧美综合在线| 亚洲国产999| 国产精品成久久久久三级| 国产主播精品| jizz18女人高潮| 日韩精品免费在线视频| 亚洲一区导航| 激情视频综合网| 亚洲一区二区精品视频| 91精品大全| 蜜桃av噜噜一区二区三|