精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

手把手教機器人:斯坦福大學提出RTR框架,讓機械臂助力人形機器人真機訓練

人工智能 新聞
RTR 框架的提出,不僅為解決當前人形機器人真機部署與訓練的瓶頸提供了切實可行的方案,更重要的是,它引入了主動力輔助這一全新的范式來幫助機器人在真實世界學習。

人形機器人的運動控制,正成為強化學習(RL)算法應用的下一個熱點研究領域。當前,主流方案大多遵循 “仿真到現實”(Sim-to-Real)的范式。研究者們通過域隨機化(Domain Randomization)技術,在成千上萬個具有不同物理參數的仿真環境中訓練通用控制模型,期望它能憑借強大的泛化能力,直接適應動力學特性未知的真實世界。盡管這類 “零樣本遷移”(Zero-Shot Transfer)方案在多種運動任務上取得了卓越表現,但其本質目標是訓練一種在任何環境下都 “能用” 的保守策略。這種策略犧牲了機器人在特定真實環境中的性能上限,因為對于最終落地而言,真實世界的表現才是唯一重要的標準。

為了突破這一瓶頸,近期一些工作開始探索在仿真預訓練后,利用少量真實數據對模型進行微調。例如,來自英偉達和 CMU 等機構的研究者提出的 ASAP [1],通過訓練一個殘差網絡來快速補償仿真與現實的動態差異;而學界經典的 RMA (Rapid Motor Adaptation) 算法 [2] 也被應用于雙足機器人,通過一個適配模塊從歷史動作中推斷環境動力學信息 [3]。然而,這些工作大多仍著眼于對動態偏差進行一次性補償,交互范式也更偏向于離線學習,并未在真實環境中對模型本身進行持續的在線調整。由于人形機器人本身極不穩定,任何微小的失誤都可能導致昂貴的硬件損壞,因此在真實環境中直接進行強化學習訓練,長期以來被視為一個難以逾越的障礙。

從人類父母教授嬰兒學步的過程中汲取靈感,我們創造性地提出,使用一個 “教師” 機械臂在現實世界中 “手把手” 地指導 “學生” 人形機器人進行在線強化學習。

在這一過程中,教師機械臂扮演了多重關鍵角色:它既是保護安全的 “吊索”,防止學生摔倒 ;也是自動重置的 “幫手”,可以在失敗后迅速扶起學生繼續訓練;它還是敏銳的 “信號源”,通過力傳感器收集寶貴的訓練數據,為學生提供在真實環境中不易獲得的獎勵信號;更是智慧的 “教練”,通過設置課程學習(Curriculum Learning)進度和施加對抗性擾動,在訓練初期幫助學生快速適應環境,再循序漸進地提升訓練難度,增強學生的學習效率和策略的魯棒性。

我們將這一創新的軟硬件協同系統命名為 RTR (Robot-Trains-Robot),凸顯了由機器人教師提供主動物理輔助,對于實現人形機器人真機強化學習有重要意義。同時,為解決真實世界數據采集成本高昂的難題,團隊還提出了一種新穎的強化學習算法,通過僅優化一個與環境動力學相關的低維隱變量來快速調整機器人的行為,極大地提升了樣本效率。這一算法上的貢獻進一步解放了真機強化學習的潛力,在評測中顯著超越了 RMA 等傳統的在線系統識別基準。

論文標題:Robot Trains Robot: Automatic Real-World Policy Adaptation and Learning for Humanoids

論文地址:https://arxiv.org/abs/2508.12252

方法

具體來說,RTR 系統由硬件和算法兩部分構成:

硬件設置:教師與學生的協同生態系統

RTR 的硬件系統由 “教師” 和 “學生” 兩組機器人組成。

教師系統:核心是一臺帶有力 - 矩(Force / Torque)傳感器的 UR5 六軸機械臂。四根彈性纜繩將機械臂的末端與人形機器人的肩部相連,這種柔性連接可以平滑地傳遞輔助力,避免剛性連接帶來的沖擊。在行走任務中,一臺可編程的跑步機作為輔助,確保學生始終在教師的臂展范圍內。一臺迷你 PC 作為教師系統的 “大腦”,統一處理力反饋信號并控制機械臂與跑步機的行為。

學生系統:學生基于開源的 ToddlerBot 人形機器人 [4],它擁有 30 個自由度,體型緊湊且硬件堅固,適合長時間的連續訓練。開源的機器人設計使得根據需要對其進行修改更加便捷,一臺獨立的工作站則負責運行強化學習算法,并在學生手機數據的同時持續將最新的策略模型發送給學生執行。

算法設計:三階段式高效 Sim-to-Real 微調

為了最大化數據效率,RTR 提出 Sim-to-Real 過程分為三個階段:

1. 仿真訓練具有環境適應性的策略。在大量域隨機化的仿真環境中,訓練一個接受編碼了環境物理參數(如摩擦力、阻尼等)的隱變量 z 作為輸入的控制策略。該隱變量通過 FiLM (Feature-wise Linear Modulation) [5] 層融入策略網絡,使得機器人的策略能夠根據不同的動力學環境進行自適應調整。

2. 優化通用初始隱變量。由于真實世界的物理參數未知,直接部署第一階段的模型會面臨 “真實環境中隱變量 z 該如何設置” 的難題。為此,我們參考域隨機化方法的思路,首先在仿真中優化一個 “通用” 的隱變量  ,使其在所有見過的仿真環境中都能取得不錯的平均表現。這個 能夠引導策略產生能夠適應各種環境的動作輸出,成為了真實世界微調的可靠起點。

3. 真實世界在線微調。將仿真訓練的策略加上通用隱變量 作為環境狀態輸入,部署到真實機器人上。在教師機械臂的輔助下,凍結策略網絡參數,僅在線優化低維的隱變量 z 。這種隱變量的優化方式,用極少的數據量就能快速使機器人的步態適應真實世界的動力學特性,實現了極高的微調效率和穩定的微調過程。相比之下,直接使用 PPO 等強化學習算法在真實世界微調策略網絡本身,極易讓策略不再穩定而產生危險的動作。

實驗驗證

我們通過行走和 “蕩秋千” 兩個任務,全面驗證了 RTR 系統的有效性。

仿真到現實微調的行走任務中,我們是讓機器人在跑步機上精準地追蹤目標速度。消融實驗證明了 RTR 系統設計的優越性:

教師的輔助效果:與固定的吊架相比,能夠主動順應機器人運動的 “柔性” 機械臂(XY Compliant)顯著提升了學習效果。同時,從高額輔助逐漸過渡到零輔助的 “課程學習” 策略(Z Schedule),優于全程高輔助或全程低輔助的固定策略。

微調算法的數據效率:RTR 提出的 “微調隱變量” 方法,在數據效率和最終性能上均優于微調整個策略網絡或微調殘差網絡的基線方法。僅需 20 分鐘的真實世界訓練,RTR 就能將在仿真中預訓練的行走策略速度提升一倍。

我們還進一步設計了對比實驗,驗證了使用 FiLM 層向策略網絡添加關于環境動態的隱變量條件輸入,其效果優于直接將環境動態變量拼接到策略網絡的觀測中。基于 RTR 提出方法的真機微調效果,也要強于 RMA 為代表的在線參數識別基線。

除了 Sim-to-Real 任務,我們還設計了純真實環境強化學習的 “蕩秋千” 實驗,以展示 RTR 系統在直接強化學習任務中的潛力。在這個任務中,人形機器人需要學會協調雙腿,像孩子一樣蕩起秋千,以最大化擺動幅度。教師機械臂通過實時力反饋感知學生的擺動相位,在適當時機給予 “推動”(幫助)或 “阻尼”(擾動)。實驗結果表明,有教師主動參與的 “幫助” 和 “擾動” 課程學習,其效率高于教師僅作為固定吊架的方案,同時教師感知到的力信息,始終作為重要的獎勵信號指導學生訓練。整個學習過程從零開始,在 20 分鐘內就學會了幅度明顯的周期性擺蕩動作。


總結與展望

RTR 框架的提出,不僅為解決當前人形機器人真機部署與訓練的瓶頸提供了切實可行的方案,更重要的是,它引入了主動力輔助這一全新的范式來幫助機器人在真實世界學習。這一極具擴展性的框架在未來可以通過使用承載能力更強的工業機械臂或帶有力傳感的龍門吊系統,將 RTR 的成功經驗推廣到全尺寸人形機器人,乃至其他各類復雜機器人系統的真實世界強化學習任務中。

作者介紹

本文的共同第一作者為清華大學交叉信息研究院許華哲組博士生胡開哲,與斯坦福大學 C. Karen Liu 和 Shuran Song 組博士生史浩辰。文章在胡開哲于斯坦福大學訪問期間完成。共同通訊作者為斯坦福大學計算機系教授 C. Karen Liu,與斯坦福大學電子工程系助理教授 Shuran Song。RTR 已被 CoRL 2025 會議接收,項目代碼已全部開放,更多信息可以參考項目網站:robot-trains-robot.github.io,

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-05-22 07:02:50

電子皮膚機器人

2023-09-08 06:39:03

ChatGPT人工智能聊天機器人

2024-02-21 12:20:00

AI訓練

2025-11-20 08:00:00

AIPython人形機器人

2022-10-21 17:30:26

機器人

2025-09-04 14:26:55

機器人Figure識別

2020-10-15 15:42:00

人工智能

2023-11-10 12:58:00

模型數據

2025-02-25 10:32:10

2020-12-31 06:55:37

機器人自然語言人工智能

2023-03-28 07:49:38

2021-07-22 10:17:55

加密機器人加密貨幣機器人

2015-07-28 09:36:11

機器人

2021-08-19 15:44:20

機器人人工智能機器學習

2024-09-11 14:59:00

2023-05-14 23:39:51

機器人深度學習

2024-12-25 11:30:43

點贊
收藏

51CTO技術棧公眾號

一区二区三区国产盗摄| 日韩欧美2区| 91在线porny国产在线看| 日本视频久久久| 国产中文字幕久久| av成人资源| 欧美伊人久久久久久午夜久久久久| 宅男av一区二区三区| 香蕉视频网站在线| 国产在线一区二区综合免费视频| 78m国产成人精品视频| 国产在线免费av| 国产欧美三级电影| 4438x成人网最大色成网站| 欧美日韩在线一| 麻豆tv在线| 久久久久久久久久看片| av一区二区三区四区电影| 波多野结衣电影在线播放| 欧美日韩一区二区国产| 影音先锋欧美精品| 大乳护士喂奶hd| 国产麻豆精品| 欧美午夜精品一区二区蜜桃| 国产精品后入内射日本在线观看| 黄色免费在线观看网站| 国产精品天干天干在观线| 国产精品视频在线免费观看| 国产精品一区二区免费视频| 日精品一区二区三区| 欧美国产第一页| 亚洲综合图片一区| 国产乱码精品一区二区三区四区| 亚洲成avwww人| 999在线观看| 日韩三区在线| 色综合天天综合网天天看片| a级黄色一级片| 变态调教一区二区三区| 亚洲欧美日韩国产成人精品影院| 亚洲精品日韩成人| 国产主播福利在线| 26uuu亚洲| 久久免费99精品久久久久久| 熟妇高潮一区二区高潮| 成人在线视频一区| 波多野结衣久草一区| 国产不卡av在线播放| 精品无人码麻豆乱码1区2区 | 亚洲精美色品网站| 国产乱淫av片| 麻豆成人入口| 精品视频—区二区三区免费| 一女三黑人理论片在线| 日韩极品在线| 亚洲午夜国产成人av电影男同| 国产在线观看无码免费视频| 丝袜美腿综合| 亚洲天堂av高清| 性の欲びの女javhd| 日韩精品免费一区二区三区| 日韩视频一区在线| 日韩一级片大全| 欧美一区二区三区另类| 色综合男人天堂| 日本网站在线免费观看| 一区二区三区导航| 国产99久久精品一区二区 夜夜躁日日躁 | 在线视频一区二区三| 亚洲精品一二三四五区| 欧美男男gaygay1069| 在线成人小视频| 亚洲精选在线观看| 男人j进女人j| 免费看电影在线| 亚洲777理论| av片中文字幕| 激情小说亚洲| 精品欧美一区二区久久| 老司机福利av| 91日韩免费| 久久久亚洲影院| 无码人妻一区二区三区线| 美女一区二区久久| 97久久精品午夜一区二区| 四虎在线免费看| 国产精品家庭影院| 国产一区 在线播放| 人人草在线视频| 欧美乱熟臀69xxxxxx| 波多野结衣办公室双飞| 国产va免费精品观看精品视频| 久久精品最新地址| 香蕉视频一区二区| 奇米777欧美一区二区| 亚洲最大成人网色| 男女网站在线观看| 亚洲欧美日韩久久| 无码aⅴ精品一区二区三区浪潮| 婷婷成人av| 亚洲精品视频中文字幕| 蜜臀久久精品久久久用户群体| 中文亚洲免费| 国产99精品视频| 成人国产在线视频| 无码国产精品一区二区免费16| 欧美国产精品一区| 国产精品999视频| 97精品资源在线观看| 亚洲精品一区二区在线| 欧美精品成人久久| 久久精品久久精品| 欧洲精品码一区二区三区免费看| 日本伦理一区二区| 欧美日韩精品是欧美日韩精品| 800av在线播放| 影视亚洲一区二区三区| 国产精品女视频| 日韩精品视频无播放器在线看 | 丁香婷婷深情五月亚洲| 亚洲欧洲国产精品久久| 少妇淫片在线影院| 欧美v日韩v国产v| 四虎884aa成人精品| 久色成人在线| 蜜桃av色综合| 欧美调教sm| 亚洲国产精品字幕| 青娱乐91视频| 国产在线播放一区三区四| 日韩中文一区| 黄色成人免费网| 日韩精品在线免费播放| 欧美精品亚洲精品日韩精品| 成人久久视频在线观看| 国产性生活免费视频| 精品视频一二| 美女视频久久黄| 国产精品人人爽| 国产精品电影一区二区| 日日噜噜夜夜狠狠| 欧美天天综合| 国产精品中文字幕在线| a视频网址在线观看| 欧美性猛交一区二区三区精品| 久久精品无码一区| 日韩国产在线一| 视频一区国产精品| 懂色aⅴ精品一区二区三区| 亚洲最大在线视频| 中文字幕第一页在线播放| 中文字幕不卡一区| 四季av一区二区三区| 久久精品国内一区二区三区水蜜桃 | www.日韩在线| 欧美精品99久久| 国产精品一在线观看| 国产精品人人做人人爽| 日本免费视频在线观看| 在线播放国产精品二区一二区四区| 99自拍视频在线| 国产精品一区二区无线| 日韩国产成人无码av毛片| 精品国产一区二区三区成人影院| 26uuu久久噜噜噜噜| 国产区高清在线| 欧美高清视频一二三区 | 国产激情视频在线观看| 精品日韩在线观看| 在线观看黄网站| 国产欧美一区二区精品久导航 | 最新中文字幕亚洲| av综合在线观看| 亚洲成人精品一区二区| 37p粉嫩大胆色噜噜噜| 免费观看成人av| 肉大捧一出免费观看网站在线播放| 成人h动漫精品一区二区器材| 88国产精品欧美一区二区三区| 国产毛片在线| 欧美一级高清大全免费观看| www.伊人久久| 中文字幕亚洲精品在线观看| 日本五十肥熟交尾| 日韩av不卡在线观看| 亚洲一区 在线播放| 日韩欧美美女在线观看| 成人国产精品av| 色综合桃花网| 久久精品久久久久| 深夜福利在线观看直播| 欧美精品亚洲一区二区在线播放| 国产精品a成v人在线播放| 国产视频不卡一区| 中文字幕永久免费| 日韩综合小视频| 农民人伦一区二区三区| 日本道不卡免费一区| 国偷自产av一区二区三区小尤奈| 福利精品在线| 97久久精品人搡人人玩| 欧美18一19xxx性| 日韩成人中文电影| 国产女人18毛片水18精| 日本精品一级二级| 国产精品自拍视频一区| 国产精品久99| 久久亚洲无码视频| 99久久伊人网影院| 女人扒开双腿让男人捅| 热久久久久久久| 免费在线激情视频| 亚洲一级电影| 91精品国产吴梦梦| 日韩大片在线观看| 欧美aaaaa喷水| 草草视频在线一区二区| 亚洲影院污污.| 成人18视频在线观看| 国产成人久久久精品一区| а√在线中文在线新版| 欧美区二区三区| 中文字幕中文字幕在线中高清免费版| 国产一区二区免费| 秋霞av在线| 日韩精品中文字幕久久臀| 国产91免费看| 精品三级av在线| 亚洲乱码在线观看| 欧美一级黄色大片| 99久久国产免费| 在线成人小视频| 91在线精品入口| 欧美精品日韩综合在线| 一个人看的www日本高清视频| 欧美性xxxxxx少妇| 奴色虐av一区二区三区| 色婷婷av一区二区三区之一色屋| 中国一级特黄毛片| 欧美日韩美女视频| 51国产偷自视频区视频| 欧美日韩国产一区二区三区| 亚洲精品视频在线观看免费视频| 精品久久久久久中文字幕| 精品视频一区二区在线观看| 亚洲高清在线精品| 日本免费观看视| 色综合天天综合给合国产| 久久精品视频7| 在线观看日产精品| 亚洲天堂网视频| 欧美欧美欧美欧美首页| 国产精品九九九九| 日韩欧美中文字幕公布| 亚洲国产精品久久人人爱潘金莲| 精品国产污污免费网站入口 | 久久综合九色综合97婷婷女人| aaaaa级少妇高潮大片免费看| 久久精品人人爽人人爽| 国产探花视频在线播放| 国产精品入口麻豆九色| 国产美女福利视频| 亚洲线精品一区二区三区八戒| 日本一级黄色录像| 一本一道久久a久久精品| 波多野结衣视频免费观看| 欧美日韩一本到| 午夜精品久久久久久久91蜜桃| 亚洲精品在线观| 激情福利在线| 久久国产精品久久国产精品| zzzwww在线看片免费| 国产99视频精品免视看7| 久久人体av| av一本久道久久波多野结衣| 亚洲综合小说图片| 一区二区三区在线视频看| 国产一区二区三区四区老人| 激情五月宗合网| 久久超级碰视频| 你懂的在线观看网站| 国产日韩亚洲欧美综合| 日韩在线观看视频一区二区| 五月天激情小说综合| 一级片免费网站| 亚洲第一男人天堂| 高清性色生活片在线观看| 欧美人在线观看| 激情亚洲影院在线观看| 91福利视频导航| 欧美丝袜丝交足nylons172| 久久久久久久久久久综合| 久久综合影视| 国产一级免费片| 中文字幕成人av| 日韩熟女精品一区二区三区| 678五月天丁香亚洲综合网| 日本中文字幕一区二区有码在线| 免费91在线视频| 日韩精品99| 韩国一区二区三区美女美女秀| 久久麻豆精品| 毛片一区二区三区四区| 国产不卡视频在线观看| 天堂а√在线中文在线鲁大师| 欧美日韩免费在线观看| 国内精品偷拍视频| 日韩在线视频线视频免费网站| 玛雅亚洲电影| 国产精品久久久对白| 天天综合一区| 性欧美极品xxxx欧美一区二区| 岛国av在线一区| 男的操女的网站| 欧美日韩在线综合| 欧洲成人av| 97国产精品久久| 亚洲精选av| 9色视频在线观看| 久久99精品网久久| 制服 丝袜 综合 日韩 欧美| 亚洲高清视频在线| 东京干手机福利视频| 久久天天躁狠狠躁夜夜爽蜜月| 国产激情欧美| 欧美系列一区| 久久亚洲精选| 亚洲av无码成人精品国产| 亚洲成a人在线观看| 国产高潮流白浆喷水视频| 久久中文字幕一区| 亚洲青青一区| 一区二区三区免费看| 麻豆精品国产传媒mv男同| 国产精品美女高潮无套| 欧美性猛交xxxxxx富婆| av电影在线观看| 国产精品中文在线| 99久久影视| 91 视频免费观看| 中文字幕一区二区三区色视频| 91国偷自产中文字幕久久| 中文字幕亚洲一区二区三区| 成人免费毛片嘿嘿连载视频…| 日韩精品一区二区三区色偷偷| 久久亚洲视频| 日本少妇xxxxx| 欧美亚洲综合在线| 久久日韩视频| 91精品国自产在线观看 | 亚洲欧洲国产日本综合| 国产乱淫a∨片免费视频| 久久综合伊人77777尤物| 久久av网站| 婷婷无套内射影院| 91麻豆成人久久精品二区三区| 久久久蜜桃一区二区| 一区二区三区天堂av | 精品国产一区二区三区麻豆小说| 99riav国产精品| a级大片在线观看| 欧美在线色视频| 黄在线免费看| 国产精品一区二区三区不卡| 久久久久久黄| 色婷婷粉嫩av| 欧美精品一区二区三区很污很色的| 理论不卡电影大全神| 日韩精品欧美一区二区三区| 国产自产2019最新不卡| 精品少妇theporn| 亚洲欧美激情精品一区二区| 91精品福利观看| 福利视频一二区| 国产欧美精品一区| 成人h动漫精品一区二区无码| 97在线视频一区| 欧美三级伦理在线| 最新日本中文字幕| 日本高清不卡aⅴ免费网站| www.久久ai| 欧美第一黄网| 国产精品1区2区3区| 五月天激情国产综合婷婷婷| x99av成人免费| 加勒比色综合久久久久久久久 | 99视频一区二区| 中文字幕一区二区人妻痴汉电车| 久久久久久久影院| 精品国产aⅴ| 国产91在线免费观看| 一本色道亚洲精品aⅴ| 污污影院在线观看| 日韩成人在线资源| av网站免费线看精品| 亚洲资源在线播放| 欧美一级在线播放| 欧美日韩第一区| 日韩av片在线免费观看| 日韩电影免费观看中文字幕|