精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

機器人的「GPT時刻」來了?豐田研究院悄悄做了一場最嚴謹的VLA驗證實驗

人工智能 新聞
這份工作來自豐田研究院(TRI)的大型行為模型團隊。作者之一是麻省理工學院教授,豐田研究院機器人研究副總裁 Russ Tedrake。

提到機械臂,第一反應的關鍵詞是「抓取」,高級些的機械臂也就做做冰淇淋和咖啡之類的小任務。

但若要機械臂自主完成繁重且復雜的任務,如布置餐桌、組裝自行車,難度便呈指數級上升。這類任務對感知、理解與動作控制的協同提出了極高要求。

近年來,隨著視覺 - 語言 - 動作(VLA)模型的迅速發展,機器人已逐步具備整合多模態信息(如圖像、指令、場景語義)并執行復雜任務的能力,朝著更智能、更通用的方向邁進。

但是目前 VLA 的研究尚未達到里程碑式的成果,具身智能的「GPT」似乎離我們還很遙遠。

直到我看到了這兩段視頻:

機械臂在現實世界中已經能夠實現雙臂寫作,完成如此復雜的組合任務,并且還能夠在操作過程中糾錯。這相比過去的 VLA 研究成果有了非常明顯的提高。

深入探索了一下這份研究,作者在 VLA 的思路基礎上更進一步,在擴散模型策略的基礎上,完全構建了一個針對機器人的大型行為模型(Large Behavior Model,LBM),經過訓練和微調,便能夠實現機械臂自主執行復雜操作中如此令人驚艷的結果。

ca8e662e109c187ba2d8d4ddedb4204b.jpg

來自谷歌的研究者 Ted Xiao 說:

「如果你從事機器人技術和人工智能領域,最近在斯坦福大學關于擴展多任務機器人操作的視頻是必看的,毫無疑問。 沒有營銷,沒有炒作。只有基于堅實假設的科學,有證據支持的斷言。 在當今的背景下,這是一個寶藏!」

image.png

前英偉達學者 Jiafei Duan 表示:

「我是 TRI 這項工作的忠實粉絲,嚴格的評估是機器人領域真正進步的催化劑。」

這份工作來自豐田研究院(TRI)的大型行為模型團隊。作者之一是麻省理工學院教授,豐田研究院機器人研究副總裁 Russ Tedrake。

據說,Russ 是一位低調但極其嚴謹的學者,對于這篇論文,僅在推特和領英各發了一則短文進行簡要介紹。然而,有限的宣傳并未掩蓋這項工作的卓越價值 —— 論文本身足以說明一切。

該論文通過在模擬與真實機器人數據集上擴展擴散(Diffusion)策略框架,系統性評估了一類多任務機器人操作策略,稱為大型行為模型。論文設計并驗證了一套嚴謹的評估流程,以統計置信的方式分析這些模型的能力。通過盲測與隨機試驗,在控制環境下將多任務策略與單任務基線模型進行了對比,涵蓋仿真與現實實驗。

image.png

  • 論文標題:A Careful Examination of Large Behavior Models for Multitask Dexterous Manipulation
  • 論文鏈接:https://arxiv.org/pdf/2507.05331
  • 項目鏈接:https://toyotaresearchinstitute.github.io/lbm1/

image.png

大型行為模型是一類視覺 - 運動策略,基于多樣化的模擬與真實世界操作數據進行訓練。

采取傳統的單任務行為策略的機器人在面對任務變化或訓練分布之外的環境時表現出有限的泛化能力。為了克服這種脆弱性,該領域正越來越多地采用 LBM —— 在包含動作級演示的大規模多任務數據集上訓練的視覺運動基礎模型。盡管 LBM 的研究與開發蓬勃發展,但關于觀察到的成功主要是否源于多任務預訓練,仍然存在重大不確定性。

為了嚴謹地研究多任務預訓練的影響,論文在近 1,700 小時的機器人數據上訓練了一系列基于擴散的 LBM,并進行了 1,800 次真實世界的評估部署和超過 47,000 次模擬部署,以嚴格研究它們的能力。

論文發現:

  • 相對于從頭開始的策略,LBM 提供一致的性能提升;
  • 在具有挑戰性的環境中,LBM 使用 3-5 倍更少的數據來學習新任務,并要求對各種環境因素具有魯棒性;
  • 隨著預訓練數據的增加,LBM 的性能穩步提高。

即便只有數百小時多樣化的數據、每種行為僅有幾百條演示,模型的性能依然實現了顯著提升。預訓練在遠小于預期規模的條件下,便能帶來持續穩定的性能增益。雖然當前還沒有如同「互聯網級」的機器人數據量,但令人欣喜的是,性能收益在遠未達到那一規模時就已顯現 —— 這是一個積極信號,預示著通過數據獲取與性能自舉的良性循環是完全可能實現的。

這樣積極的結論,似乎預示著機器人領域的通用大規模模型的到來,具身智能的「GPT 時刻」還有多遙遠?

LBM 架構

image.png

LBM 架構:論文采用了一種 Diffusion Transformer 架構,該模型以語言、視覺和本體感知(proprioception)作為條件輸入,并輸出 20 維動作序列,覆蓋未來 16 個時間步長。

在部署階段,策略以 10 Hz 的頻率運行,機器人會執行前 8 個時間步的預測動作,然后重新規劃后續動作。

本文的 LBM(Large Behavior Models)是一類擴展的多任務擴散策略模型,具備多模態的 ViT(視覺 Transformer)視覺 - 語言編碼器,并采用基于 AdaLN 的 Transformer 去噪頭對編碼觀察進行條件建模。這些模型能夠處理手腕攝像頭和場景攝像頭圖像、機器人本體狀態(proprioception)以及語言提示,并預測連續 16 步(1.6 秒)的動作片段(action chunks)。

論文在一個混合數據集上訓練 LBM,包含:

  • 468 小時的內部采集的雙臂機器人遙操作數據,
  • 45 小時的模擬環境中的遙操作數據,
  • 32 小時的通用操作接口(UMI)數據,
  • 以及約 1,150 小時從 Open X-Embodiment 數據集中整理的互聯網數據。

盡管模擬數據所占比例較小,但它的納入確保了可以在模擬環境和真實世界中使用同一個 LBM 檢查點進行評估。

實驗細節

測試平臺

本文的 LBM 在采用 Franka Panda FR3 手臂和最多六個攝像頭的物理和 Drake 模擬的雙臂工作站上進行了評估 —— 每只手腕最多兩個攝像頭,以及兩個靜態場景攝像頭。

image.png

在雙手操作平臺上,在模擬和現實世界中,針對多種任務和環境條件,評估了的 LBM 模型。

評估指標

論文衡量策略性能的主要指標包括:成功率(Success Rate)和任務完成度(Task Completion)。

其中,成功率是機器人學習領域的標準評估指標,能有效反映策略能否完成任務的整體表現,但它無法全面刻畫策略的細節表現。例如,一個策略「幾乎完成任務」與「完全沒有動作」在成功率上表現相同,然而實際能力差異極大。為了更細致地區分這些情況,論文引入了任務完成度指標。

具體來說:

  • 在真實世界評估中,設計了打分量表(rubrics),用于基于任務的中間目標(milestones)來量化完成度。該評分過程由人工填寫,并引入了一套質量保證(QA)流程來確保量表評估結果的可靠性。
  • 在仿真環境中,采用自動化謂詞(predicates)來判斷是否達到各個中間目標,進而計算任務完成度。

盡管報告了絕對成功率,但論文認為相對成功率才是對比不同方法性能的核心依據。因為絕對成功率高度依賴任務本身的設計 —— 例如起始條件的隨機性、演示數量的多少都能顯著改變任務難度,進而影響最終結果。

因此,論文研究者在實驗設計上刻意提高任務難度,期望策略成功率在 50% 左右,以便更清晰地區分方法之間的優劣。不過在實際運行中,成功率可能會顯著高于或低于這個目標值。

實驗結果

LBM 在「已見」任務上的性能。

image.png

LBM 在真實世界和仿真環境中的「已見任務」表現:(a)無分布偏移,(b)有分布偏移。論文比較了單任務模型、預訓練的 LBM 以及微調后的 LBM。

在這一組實驗中,研究者們發現:

1. 微調后的 LBM 在「已見任務」上表現優于單任務基線模型。

2. 微調后的 LBM 對「已見任務」的分布偏移更具魯棒性。

3. 未經微調的 LBM 在「已見任務」中也有非零成功率,且性能與單任務模型相近。

LBM 在「未見」任務上的性能

對于「未見」任務,尤其是那些復雜任務,研究者并不指望預訓練的 LBM 能夠成功完成。因此只比較微調后的 LBM 與單任務基線模型的表現。

此外,針對這些復雜任務,預期其成功率較低,因此更側重于通過任務完成度(task completion)圖來獲得直觀見解。

image.png

LBM 在來自仿真訓練集場景的「未見」仿真任務上的表現。左圖:在正常條件下進行評估。右圖:在分布偏移條件下進行評估。

image.png

LBM 在現實世界和仿真環境中「未見」任務下的表現(在正常條件下評估)。論文將單任務基線方法與微調后的 LBM 進行對比。上排展示的是成功率結果,下排展示的是任務完成度結果。

在「未見」的任務評估中,研究者得出結論:

1、微調后的 LBM 在「未見」任務上優于單任務基線模型。

2、微調 LBM 達到與單任務基線模型相似的性能所需的任務特定數據更少。

綜合來看,通過插值可估算出,若對 LBM 進行微調,僅需不到 30% 的任務特定數據即可達到從零開始訓練所需全部數據的效果。

并排比較設置早餐桌的模型:(左) 單任務基線,(右) LBM。

預訓練規模法則

這是這篇論文中作者最喜歡的圖表,它概括了所有內容。

 這個圖表比較了在訓練新任務之前使用不同數量的預訓練數據時的性能:0%(即單任務),25%,50% 或 100% 的 TRI 數據,然后是 100% 的 TRI 數據加上整理的所有開源機器人數據(紅線)。

「任務完成分布如此緊密,而且隨著數據量的增加,趨勢如此一致,這真是太棒了。」

結果表明,通過預訓練,可以用更少的數據量訓練出新的技能,或者使用相同的數據量并獲得更好的任務性能。而且,隨著數據量的增加,這些優勢似乎會持續下去。

image.png

在標準條件下對五個模擬環境中的「未見」任務進行評估,并報告所有任務的平均任務完成度指標。

論文用極其長篇的篇幅,系統地闡述了實驗流程、平臺設計、仿真與真實世界評估細節、數據分析方法以及數據集構建等各個方面,做了大量的完備的實驗,最終凝練成 Russ 推文中的:「LBM 有效!」

image.png

論文包含LBM完整架構與訓練策略,海量實驗細節與評估細節,請參閱原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2020-03-05 20:37:08

工業4.0機器人工業物聯網

2020-09-17 13:17:04

QA機器人物流

2020-04-09 09:56:55

機器人導航框架

2025-10-31 01:25:00

2025-01-02 14:30:00

AI訓練模型

2025-08-01 09:10:00

2009-04-21 14:36:44

微軟女性職場

2023-06-27 13:58:10

豐田汽車人工智能

2009-03-13 10:14:47

中移動人才標準招聘

2023-09-04 14:52:35

2024-07-22 08:00:00

機器人虛擬

2021-02-01 09:51:35

IBM中國研究院

2017-02-20 09:20:49

2020-02-10 10:20:25

機器人人工智能系統

2018-07-31 16:19:57

機器人科學家工業

2023-12-24 23:00:26

生成式人工智能AI機器人

2013-04-10 10:05:15

沃森Watson客戶體驗

2024-09-18 13:30:00

點贊
收藏

51CTO技術棧公眾號

亚洲一区二区四区蜜桃| 亚洲天堂久久久久| 免费黄色片在线观看| 国产三级一区| 狠狠久久婷婷| 欧美日韩免费一区二区三区视频| 精品国产一区二区三区麻豆小说 | 少妇免费毛片久久久久久久久| 91麻豆精品国产91久久久资源速度 | 日韩欧美在线观看一区二区| 欧美黄色免费| 欧美丰满少妇xxxxx高潮对白 | 人妻一区二区三区四区| 午夜精品一区二区三区国产| 欧美亚洲国产怡红院影院| 久久伊人一区| 国产91国语对白在线| 日韩av三区| 欧美日韩亚洲成人| 久久综合伊人77777麻豆| 国产精品无码白浆高潮| 香蕉久久网站| 亚洲性av在线| 污污视频网站免费观看| 精品人妻一区二区三区换脸明星 | 国产四区在线观看| 中文字幕在线观看1| 国产精品久久久乱弄| 欧美日韩国产系列| 久久久久人妻精品一区三寸| 国产区在线视频| 免费国产亚洲视频| 久久九九全国免费精品观看| 污污视频在线免费| 激情网站在线| 久久香蕉国产线看观看99| 国产成人在线亚洲欧美| 国产精品18在线| 国产精品一区二区三区av| 一区二区三区丝袜| 精品乱子伦一区二区三区| 国产成人精品无码高潮| 亚洲清纯自拍| 国产亚洲人成网站在线观看| 女人被狂躁c到高潮| 国产精品xxx| 亚洲精品国产成人久久av盗摄| 亚洲高清在线观看一区| 国产成人精品一区二三区四区五区 | 99精品一区二区| 日本一欧美一欧美一亚洲视频| 天天操天天舔天天射| 91国产一区| 午夜精品久久久久久久久久| 视频一区视频二区视频三区视频四区国产 | 亚洲天堂网站在线观看视频| 美女爆乳18禁www久久久久久| 日本久久二区| 欧美日韩国产在线| 国产h视频在线播放| 888av在线| 国产不卡在线播放| 国产精品27p| 五月婷婷激情五月| 伊人成年综合电影网| 中文亚洲视频在线| 无码国产69精品久久久久网站 | 国产精品亚洲自拍| 久久精品欧美一区二区| 激情综合网站| 亚洲韩国日本中文字幕| 亚洲精品免费一区亚洲精品免费精品一区| 欧美xxx黑人xxx水蜜桃| 国产清纯白嫩初高生在线观看91 | 成人午夜大片| 欧美日本国产一区| 久久精品亚洲天堂| 911亚洲精品| 欧美日韩视频在线第一区 | 欧美自拍资源在线| 成人高潮片免费视频| 成人午夜视频网站| 91亚洲精品在线| 精品乱码一区内射人妻无码| 99热精品在线观看| 欧美人在线观看| 欧日韩不卡视频| 免费一区二区| 亚洲第一精品夜夜躁人人躁| www.色.com| 欧美视频免费看| 日韩女优制服丝袜电影| www.com污| 91成人精品在线| 亚洲天堂2020| 国产人妻大战黑人20p| 欧美激情黄色片| 中文字幕亚洲精品| 久久久久久久久久一区二区三区| 亚洲草久电影| 91极品女神在线| 国产成人亚洲欧洲在线| 欧美午夜电影在线观看 | 黄色录像一级片| 日韩国产欧美| 日韩午夜在线视频| 色www亚洲国产阿娇yao| 国产精品分类| 国产精品永久免费在线| 男人天堂手机在线观看| 国产精品萝li| 亚洲一区二区在线看| se在线电影| 国产精品国产精品国产专区不蜜 | 一区二区三区四区影院| 麻豆久久一区| 日韩欧美资源站| 亚洲国产欧美日韩在线| 日韩影片在线观看| 欧美α欧美αv大片| 成人免费看片载| 色喇叭免费久久综合网| 欧美一区二区三区……| 潘金莲一级淫片aaaaaa播放| 日韩中文字幕1| 国产精品女主播视频| 97精品人妻一区二区三区香蕉| 精品在线播放午夜| 99国产视频| 偷拍精品一区二区三区| 久久一夜天堂av一区二区三区| 日韩中文字幕亚洲精品欧美| 91jq激情在线观看| 丁香五六月婷婷久久激情| 香蕉视频xxxx| 无需播放器亚洲| 国产精品久久久久久久久久三级| 在线免费观看一级片| 久久久精品蜜桃| 五月天男人天堂| 成人在线中文| 在线观看日韩av| 欧美日韩在线视频免费| 9色精品在线| 国产伦精品一区二区三区四区视频 | 国内精品在线播放| 99精彩视频在线观看免费| 美女黄视频在线观看| 亚洲国产精品尤物yw在线观看| 久草资源站在线观看| 成人精品高清在线视频| 中文日韩电影网站| 亚洲天堂手机在线| 亚洲图片欧美激情| 国产a级一级片| 蜜桃一区av| 精品国产视频在线| 国产一区二区在线视频观看| 亚洲色图另类专区| 精品无码av一区二区三区不卡| 亚洲精品一级二级三级| 久久手机免费视频| 亚洲黄色免费观看| 国产欧美日韩亚州综合 | 成人三级伦理片| 久久久久久久久久网| 福利视频亚洲| 麻豆国产精品va在线观看不卡| 99国产精品久久久久久久成人| 久久青草欧美一区二区三区| 无码日韩人妻精品久久蜜桃| 久久五月天小说| 波多野结衣成人在线| а√在线天堂官网| 91精品国产美女浴室洗澡无遮挡| 中文字幕狠狠干| 欧美日韩hd| 久久精品国产综合精品| 污片在线免费观看| 欧美日韩国产色站一区二区三区| 亚洲天堂一级片| 男人的天堂久久精品| 五月天综合婷婷| 国产精品宾馆| 欧美精品日韩www.p站| 中文字幕一区二区久久人妻| 亚洲免费观看在线观看| 69久久久久久| 蜜乳av综合| 国产专区精品视频| 91社区在线| 欧美一级电影网站| 日本高清不卡码| 亚洲免费av观看| 99久久人妻无码精品系列| 国产欧美一区二区色老头| 国产成人精品免费视频大全最热| 中文字幕在线播放网址| 日韩一卡二卡三卡国产欧美| 中文字幕视频网| 久久久亚洲欧洲日产国码αv| 污视频网址在线观看| 第一sis亚洲原创| 国产精品视频精品| 丰满诱人av在线播放| 日韩亚洲第一页| 日本免费不卡| 精品成人一区二区三区四区| 久久免费小视频| 国产精品污www在线观看| 蜜桃免费在线视频| 激情久久一区| 国产日产欧美一区二区| 日本精品视频| 国产精品网址在线| 欧美黑人疯狂性受xxxxx野外| 亚洲欧美国产高清va在线播| 成人av网站在线播放| 亚洲午夜久久久久中文字幕久| 亚洲AV成人无码网站天堂久久| 91在线国内视频| 国产伦精品一区二区免费| 午夜综合激情| 日韩伦理一区二区三区av在线| 91精品国产66| 欧美在线免费看| 91在线观看| 亚洲欧洲中文天堂| 欧美男男激情freegay| 精品成人一区二区三区四区| 超碰免费在线97| 日韩一区二区三区视频| 国产免费av观看| 91.麻豆视频| 中文字幕人妻一区二区三区视频| 一本大道av伊人久久综合| 97精品在线播放| 欧美极品aⅴ影院| 91激情视频在线观看| 久久精品国产99久久6| 水蜜桃在线免费观看| 999久久久91| 在线观看精品视频| 国产精品国产| 91超碰在线免费观看| 不卡一二三区| 久久午夜a级毛片| 免费av不卡| 久久久精品国产网站| 超碰个人在线| 亚洲色图美腿丝袜| 国产爆初菊在线观看免费视频网站| 亚洲午夜久久久久久久| 成年人在线观看视频| 中文字幕亚洲国产| 国产在线看片| 亚洲精品在线看| 性生活三级视频| 欧美午夜电影网| 中文字幕第99页| 8x福利精品第一导航| av加勒比在线| 欧美精品一区二区三| 香蕉视频网站在线| 国产一区二区三区在线看| 日本激情在线观看| 亚洲人成网站免费播放| 99精品老司机免费视频| 免费99精品国产自在在线| 黑人精品视频| 日韩免费不卡av| 亚洲最大的免费视频网站| 69堂成人精品视频免费| 国产精品xxxav免费视频| 免费国产一区二区| 久久亚洲成人| 免费一级特黄毛片| 91精品成人| 欧美久久在线观看| 亚洲老妇激情| 亚洲国产一区二区三区在线 | av爱爱亚洲一区| 欧美午夜精品理论片| 国产成人av自拍| 偷拍女澡堂一区二区三区| 国产精品久久久久aaaa樱花 | 欧美日韩美女一区二区| av中文字幕播放| 亚洲女人被黑人巨大进入| 日本www在线观看视频| 久久久亚洲国产天美传媒修理工| 国产美女av在线| 97在线观看免费| h片在线观看视频免费| 国产精品久久久久福利| 伊人久久大香线蕉av超碰| 欧洲av一区| 激情国产一区| 国产成人在线综合| 久久久久久一二三区| 国产女人18水真多毛片18精品 | 久久中文字幕在线观看| 一本色道综合亚洲| 亚洲AV无码乱码国产精品牛牛| 亚洲午夜精品视频| 蜜桃麻豆av在线| 欧美中文字幕在线观看| 欧州一区二区三区| 亚洲欧洲精品一区二区| 香蕉久久久久久久av网站| 中文字幕1区2区| 国产精品高潮呻吟| 亚洲国产精品无码久久久| 亚洲国产精品成人av| 午夜伦理在线视频| 国产区亚洲区欧美区| 黑人操亚洲人| 日韩av片在线看| 99re8在线精品视频免费播放| 久草视频中文在线| 福利二区91精品bt7086| 国产成人精品一区二三区四区五区| 中文精品99久久国产香蕉| 视频二区不卡| 久久久一本精品99久久精品66| 尤物网精品视频| 九九热视频免费| 亚洲少妇中出一区| 97超视频在线观看| 精品国产拍在线观看| 色狠狠一区二区三区| 亚洲精品日韩精品| 日韩高清一区二区| 永久免费毛片在线观看| 色婷婷综合久久久久中文一区二区| 欧日韩在线视频| 午夜精品一区二区三区在线播放 | 激情成人午夜视频| 网站永久看片免费| 欧美美女视频在线观看| 精品自拍一区| 成人国产在线视频| 国产精品巨作av| 欧美一区二区视频在线播放| 老鸭窝91久久精品色噜噜导演| 亚洲综合欧美激情| 成人激情视频网站| 激情高潮到大叫狂喷水| 欧美日韩三级在线| 1024国产在线| 91久久精品国产91久久| 欧美a级一区| 丰满少妇xbxb毛片日本| 午夜精品福利久久久| 天堂在线中文| 欧美多人爱爱视频网站| 欧美一区国产| 日本在线播放不卡| 久久精品国产精品亚洲精品| 黄色精品视频在线观看| 日韩天堂在线观看| 成人一级福利| 日本三级中国三级99人妇网站 | 在线观看一区二区三区四区| 亚洲高清中文字幕| 欧美日韩在线中文字幕| 国产精品视频中文字幕91| 欧美一级本道电影免费专区| 日韩va在线观看| 亚洲国产一二三| 三级av在线播放| 国产欧美日韩高清| 国产精品啊v在线| 国精产品一区一区三区免费视频 | 少妇激情一区二区三区| 国产精品久久久久久久久晋中| 成人av一区二区三区在线观看| 欧美一区二粉嫩精品国产一线天| 成人精品天堂一区二区三区| 亚洲欧美日韩中文字幕在线观看| 欧美日韩在线视频观看| 亚洲视频一区在线播放| 欧美贵妇videos办公室| 香蕉久久夜色精品国产更新时间 | 日本午夜精品视频在线观看| 欧美夫妇交换xxx| 欧美亚洲禁片免费| 黄色在线观看视频网站| 三区精品视频观看| 国产成人av影院| 欧美高清69hd| 久久久视频在线| 日韩电影免费网址| 无码一区二区精品| 91麻豆精品国产91久久久久久| 九九色在线视频| 亚洲国产午夜伦理片大全在线观看网站| 国产成人精品影视| 国产97免费视频| 亚洲欧美在线免费|