精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

適應多形態多任務,最強開源機器人學習系統「八爪魚」誕生

人工智能 新聞
一位優秀的相聲演員需要吹拉彈唱樣樣在行,類似地,一個優秀的機器人模型也應能適應多樣化的機器人形態和不同的任務,但目前大多數機器人模型都只能控制一種形態的機器人執行一類任務。現在 Octo(八爪魚)來了!

在機器人學習方面,一種常用方法是收集針對特定機器人和任務的數據集,然后用其來訓練策略。但是,如果使用這種方法來從頭開始學習,每一個任務都需要收集足夠數據,并且所得策略的泛化能力通常也不佳。

原理上講,從其它機器人和任務收集的經驗能提供可能的解決方案,能讓模型看到多種多樣的機器人控制問題,而這些問題也許能提升機器人在下游任務上的泛化能力和性能。但是,即便現在已經出現了能處理多種自然語言和計算機視覺任務的通用模型,構建「通用機器人模型」依然困難重重。

要為機器人訓練一個統一的控制策略非常困難,其中涉及諸多難點,包括操作不同的機器人機體、傳感器配置、動作空間、任務規范、環境和計算預算。

為了實現這一目標,已經出現了一些「機器人基礎模型」相關研究成果;它們的做法是直接將機器人觀察映射成動作,然后通過零樣本或少樣本方式泛化至新領域或新機器人。這些模型通常被稱為「通才機器人策略(generalist robot policy)」,簡稱 GRP,這強調了機器人跨多種任務、環境和機器人系統執行低階視覺運動控制的能力。

舉些例子:GNM(General Navigation Model,通用導航模型) 適用于多種不同的機器人導航場景,RoboCat 可針對任務目標操作不同的機器人機體,RT-X 能通過語言操控五種不同的機器人機體。盡管這些模型確實是重要進展,但它們也存在多方面的局限:它們的輸入觀察通常是預定義的且通常很有限(比如單相機輸入視頻流);它們難以有效地微調至新領域;這些模型中最大型的版本都沒有提供人們使用(這一點很重要)。

近日,加州大學伯克利分校、斯坦福大學、卡內基梅隆大學和谷歌 DeepMind 的 18 位研究者組成的 Octo Model Team 發布了他們的開創性研究成果:Octo 模型。該項目有效地克服了上述局限。

圖片

  • 論文標題:Octo: An Open-Source Generalist Robot Policy
  • 論文地址:https://arxiv.org/pdf/2405.12213
  • 開源項目:https://octo-models.github.io/

他們設計了一個系統,能讓 GRP 更輕松地應對下游機器人應用的接口多樣化問題。

該模型的核心是 Transformer 架構,其可將任意輸入 token(根據觀察和任務創建)映射成輸出 token(然后編碼成動作),而且該架構可使用多樣化的機器人和任務數據集進行訓練。該策略無需額外訓練就能接受不同的相機配置,也能控制不同的機器人,還能通過語言命令或目標圖像進行引導 —— 所有這些只需通過改變輸入模型的 token 即可實現。

最重要的是,該模型還能適應傳感器輸入、動作空間或機器人形態不同的新機器人配置,所需的只是采用適當的適配器(adapter)并使用一個小的目標領域數據集和少量計算預算進行微調。

不僅如此,Octo 還已經在迄今為止最大的機器人操控數據集上完成了預訓練 —— 該數據集包含來自 Open X-Embodiment 數據集的 80 萬個機器人演示。Octo 不僅是首個可有效微調至新觀察和動作空間的 GRP,也是首個完全開源(訓練工作流程、模型檢查點和數據)的通才機器人操控策略。該團隊也在論文中強調了其組合 Octo 各組件的獨特創新性。

圖片

Octo 模型

下面我們來看看 Octo 這個開源的通才機器人策略是如何構建的。總體而言,Octo 的設計目標是讓其成為一個靈活且廣泛適用的通才機器人策略,可被大量不同的下游機器人應用和研究項目使用。

架構

Octo 的核心是基于 Transformer 的策略 π。其包含三個關鍵部分:輸入 token 化器、Transformer 骨干網絡和讀出頭。

如圖 2 所示,其中輸入 token 化器的作用是將語言指令、目標和觀察序列轉換成 token,Transformer 骨干會把這些 token 處理成嵌入,讀出頭則是得出所需的輸出,即動作。

圖片

任務和觀察 token 化器

為了將任務定義(比如語言指令和目標圖像)與觀察(比如相機視頻流)轉換成常用的已 token 化的格式,該團隊針對不同模態使用了不同的 token 化器:

對于語言輸入,先 token 化,然后通過一個預訓練的 Transformer 將其處理成一個語言嵌入 token 序列。具體而言,他們使用的模型是 t5-base (111M)。

對于圖像觀察和目標,則是通過一個較淺的卷積堆棧來處理,然后再拆分成平展后圖塊構成的序列。

最后,通過向任務和觀察 token 添加可學習的位置嵌入并按一定順序排列它們來構建 Transformer 的輸入序列。

Transformer 骨干和讀出頭

將輸入處理成一種統一化的 token 序列之后,就能交給 Transformer 處理了。這與之前的研究工作類似:基于觀察和動作系列來訓練基于 Transformer 的策略。

Octo 的注意力模式是逐塊掩碼式:觀察 token 只能按照因果關系關注來自同一或之前時間步驟的 token 以及任務 token。對應于不存在觀察的 token 會被完全掩蔽掉(比如沒有語言指令的數據集)。這種模塊化設計很方便,可在微調階段添加或移除觀察或任務。

除了這些輸入 token 模塊,該團隊還插入了已學習完成的讀出 token。讀出 token 會關注其之前的觀察和任務 token,但不會被任何觀察或任務 token 關注。因此,讀出 token 只能讀取和處理內部嵌入,而無法影響內部嵌入。讀出 token 的作用類似于 BERT 中的 [CLS] token,充當截至目前的觀察序列的緊湊向量嵌入。針對讀出 token 的嵌入,會使用一個輕量的實現擴散過程的「動作頭」。這個動作頭會預測多個連續動作構成的一個「塊(chunk)」。

這樣的設計可讓用戶在下游微調時向模型靈活地添加新的任務和觀察輸入或動作輸出頭。當在下游添加新的任務、觀察或損失函數時,可以在整體上保留 Transformer 的預訓練權重,僅添加新的位置嵌入、一個新的輕量編碼器、或由于規范變化而必需的新頭的參數。這不同于之前的架構 —— 對于之前的架構,如果添加或移除圖像輸入或改變任務規范,就需要重新初始化或重新訓練預訓練模型的大量組件。

要讓 Octo 成為真正的「通才」模型,這種靈活性至關重要:由于我們不可能在預訓練階段覆蓋所有可能的機器人傳感器和動作配置,因此,如果能在微調階段調整 Octo 的輸入和輸出,便能讓其成為機器人社區的一種多功能工具。另外,之前使用標準 Transformer 骨干或融合使用視覺編碼器與 MLP 輸出頭的模型設計固定了模型輸入的類型和順序。相較之下,切換 Octo 的觀察或任務并不需要對大部分模型進行重新初始化。

訓練數據

該團隊從 Open X-Embodiment 中取用了包含 25 個數據集的混合數據集。圖 3 給出了數據集的組成。

圖片

有關訓練目標和訓練硬件配置等更多細節請參閱原論文。

模型檢查點和代碼

重點來了!該團隊不僅發了 Octo 的論文,還完全開源了所有資源,其中包括:

  • 預訓練完成的 Octo 檢查點,包括 2700 萬參數的 Octo-Small 和 9300 萬參數的 Octo-Base。
  • 用于 Octo 模型的微調腳本,基于 JAX。
  • 用于在 Open X-Embodiment 數據集上預訓練 Octo 的模型預訓練工作流程,基于 JAX。用于 Open X-Embodiment 數據的數據加載器,兼容 JAX 和 PyTorch。

實驗

該團隊也通過實驗對 Octo 進行了實證分析,在多個維度上評估了其作為機器人基礎模型的性能:

  1. 能否直接使用 Octo 控制多臺機器人機體并解決語言和目標任務?
  2. Octo 權重可否作為優質的初始化基礎,支持面向新任務和機器人的數據高效型微調,以及它是否優于從頭開始訓練的方法和常用的預訓練表征?
  3. 在構建通才機器人策略方面,Octo 中的哪種設計決策最重要?

圖 4 展示了評估 Octo 的 9 種任務。

圖片

直接使用 Octo 控制多臺機器人

該團隊比較了 Octo、RT-1-X、RT-2-X 的零樣本操控能力,結果見圖 5。

圖片

可以看到,Octo 的成功率比 RT-1-X(3500 萬參數)高 29%。而在 WidowX 和 RT-1 Robot 評估上,Octo 與 550 億參數的 RT-2-X 性能相當。

此外,RT-1-X 和 RT-2-X 僅支持語言指令,而 Octo 還支持以目標圖像為條件。該團隊還發現,在 WidowX 任務上,如果使用目標圖像為條件,成功率比使用語言為條件高 25%。這可能是因為目標圖像能提供更多有關任務完成的信息。

Octo 能高效地使用數據來適應新領域

表 1 給出了數據高效型微調的實驗結果。

圖片

可以看到,相比于從頭開始訓練或使用預訓練的 VC-1 權重進行預訓練,微調 Octo 得到的結果更好。在 6 種評估設置上,Octo 相較于第二名基準的平均優勢為 52%!

并且不得不提的是:針對所有這些評估任務,微調 Octo 時使用的配方和超參數全都一樣,由此可見該團隊找到了一個非常好的默認配置。

通才機器人策略訓練的設計決策

上面的結果表明 Octo 確實能作為零樣本多機器人控制器,也能作為策略微調的初始化基礎。接下來,該團隊分析了不同設計決策對 Octo 策略性能的影響。具體而言,他們關注的重點是以下方面:模型架構、訓練數據、訓練目標、模型規模。為此,他們進行了消融研究。

表 2 給出了在模型架構、訓練數據和訓練目標的消融研究結果。

圖片

圖 6 則展現了模型規模對零樣本成功率的影響,可以看出來更大的模型有更好的視覺場景感知能力。

圖片

整體而言,Octo 各組件的有效性得到了證明。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-09-15 14:50:03

AI機器人開發

2020-09-02 10:36:52

機器人人工智能系統

2022-10-28 13:16:07

四足機器人機器人人工智能

2025-06-11 14:45:26

機器人訓練數據

2018-07-06 08:58:53

機器人人工智能系統

2019-12-24 09:31:55

機器人人工智能編程

2017-03-27 09:59:25

機器人自創語言交流

2017-12-01 08:53:28

機器學習大數據物聯網

2025-10-27 09:02:00

2025-09-08 09:12:00

2022-08-27 15:10:36

Ameca機器人模仿

2023-10-22 20:14:08

人工智能GPT-4

2025-07-25 09:42:47

2021-01-04 09:18:36

機器人人工智能系統

2022-06-07 14:35:53

機器人人工智能

2024-02-01 13:03:00

AI模型

2023-07-29 13:14:40

谷歌人工智能

2025-01-07 20:54:34

2025-10-09 13:19:47

點贊
收藏

51CTO技術棧公眾號

亚洲精品欧美综合四区| 欧美电影一区| 黑人巨大精品欧美一区二区一视频 | 久久美女视频| 日韩精品中文字幕一区| 色偷偷噜噜噜亚洲男人| 成人久久18免费网站漫画| 久久久久久久福利| 四虎884aa成人精品最新| 欧美色男人天堂| 国产又粗又长又爽视频| 三级国产在线观看| 精品一区二区在线看| 久久久久久久久久久久av| 一级黄色片大全| 中文字幕一区在线播放| 天天操天天干天天插| 另类图片国产| 九九精品在线视频| 69视频在线观看免费| ccyy激情综合| 欧美日本不卡视频| 亚洲国产精品久久久久婷蜜芽| 日本三级在线播放完整版| av一本久道久久综合久久鬼色| 国产精品444| 日本少妇毛茸茸高潮| 不卡中文一二三区| 日韩精品免费看| xxxxwww一片| 91国拍精品国产粉嫩亚洲一区 | 日产中文字幕在线精品一区 | 国产美女av一区二区三区| 欧美一级视频一区二区| 久久久久成人精品无码| 秋霞欧美视频| 亚洲美女视频网站| 国产精品入口麻豆| 北岛玲一区二区| 最爽无遮挡行房视频在线| 国产亚洲美州欧州综合国| 国产亚洲一区在线播放| 国产高清视频免费| 国内精品视频一区二区三区八戒| 国产精品91在线观看| 西西44rtwww国产精品| 精品1区2区3区4区| 欧美精品xxx| 久久久久久天堂| 亚洲精彩视频| 久久手机精品视频| 亚洲国产123| 天天射综合网视频| 久久精品国产精品亚洲| 激情无码人妻又粗又大| 欧美国产一级| xxav国产精品美女主播| 开心激情五月网| 99久久婷婷| 欧美刺激性大交免费视频| 成人免费精品动漫网站| 欧美激情1区2区3区| 蜜臀久久99精品久久久久久宅男 | 亚洲午夜一区二区| 国产欧美精品aaaaaa片| 欧美另类tv| 午夜视频在线观看一区二区| 无码av免费一区二区三区试看| 欧美久久久久久久| 久久经典视频| 欧美国产日韩精品免费观看| 日韩免费电影一区二区| 中文字幕在线视频区| 国产精品第五页| 国产女主播av| sm久久捆绑调教精品一区| 欧美日韩黄色大片| 搡女人真爽免费午夜网站| 久久伊人国产| 欧美成人aa大片| 91丝袜在线观看| 国产亚洲第一伦理第一区| 伊人久久精品视频| 天天干中文字幕| 在线成人www免费观看视频| 97免费视频在线| 成年人晚上看的视频| 精品午夜久久福利影院| 国产伦精品一区二区三区| 日本福利片在线| 国产精品乱人伦| 久久久久久久久久伊人| 在线男人天堂| 三级影片在线观看欧美日韩一区二区| 香蕉成人伊视频在线观看| 成人免费性视频| 在线观看精品| 日韩三级.com| 一级片视频免费看| 亚洲天天综合| 日韩免费中文字幕| 国产夫妻性生活视频| 91啪亚洲精品| 超碰超碰超碰超碰超碰| 欧美成人影院| 日韩美一区二区三区| 人人人妻人人澡人人爽欧美一区| 中文字幕亚洲综合久久五月天色无吗'' | 国内精品嫩模av私拍在线观看| 国产成人免费av电影| 亚洲av色香蕉一区二区三区| 国产亚洲欧美在线| 日韩黄色短视频| 亚洲a成人v| 亚洲欧美制服丝袜| 精品无码免费视频| 久久精品999| 亚洲国产精品成人综合色在线婷婷| 亚洲xxxx视频| 国产网站在线播放| 亚洲成人av一区| 一级黄色在线播放| 成人激情开心网| 97在线看免费观看视频在线观看| 国产绿帽一区二区三区| 国产日产欧美一区| 国产男女无遮挡| 成人盗摄视频| 久久777国产线看观看精品| 成人小视频在线播放| www.视频一区| 久久这里只有精品8| 国产精品视频首页| 亚洲性无码av在线| 中文字幕av日韩精品| 外国精品视频在线观看| 亚洲国产精品成人久久综合一区| 高清在线观看免费| 凹凸av导航大全精品| 欧美成人激情视频| 国产精品久久久久久久成人午夜| 国产日本欧美一区二区| 欧美aⅴ在线观看| 国产香蕉精品| 欧美风情在线观看| 国产高中女学生第一次| 1024成人网色www| 五月花丁香婷婷| 99国产精品一区二区| 国产精品黄视频| 国产免费av在线| 色婷婷亚洲精品| 97超碰在线资源| 久久国产毛片| 日韩久久久久久久| 黄色成人在线观看网站| 国产精品福利影院| 久久色免费在线视频| 4438国产精品一区二区| 97精品视频在线观看自产线路二| 日韩a∨精品日韩在线观看| 国产精品xxxav免费视频| 高清一区二区三区四区五区| 三级网站在线看| 午夜精品久久久久久不卡8050| 中国极品少妇xxxx| 亚洲欧美bt| 日韩精品欧美专区| 91综合国产| 国产亚洲精品综合一区91| 中文字幕乱码在线观看| 亚洲欧洲www| 色欲欲www成人网站| 亚洲高清资源| 你懂的网址一区二区三区| 色婷婷综合久久久中字幕精品久久| 亚洲午夜国产成人av电影男同| 这里只有精品6| 一区二区高清视频在线观看| 久久人妻一区二区| 日韩影院免费视频| 国产女人18毛片| 加勒比色综合久久久久久久久| 欧美在线视频a| www黄在线观看| 欧美一个色资源| 久久久久久久久久影院| 欧美激情资源网| japan高清日本乱xxxxx| 国产精品久久久亚洲一区| 亚洲一区二区三区色| 18国产精品| 国产精品99久久久久久白浆小说| 蜜桃av在线免费观看| 亚洲精品黄网在线观看| 中文字幕一区二区三区四区免费看 | 9.1国产丝袜在线观看| 国产www.大片在线| 精品久久久久99| 国内av在线播放| 亚洲图片一区二区| 天天舔天天操天天干| 国产jizzjizz一区二区| 国产97色在线 | 日韩| 欧美涩涩网站| 欧美一区三区二区在线观看| 亚洲午夜免费| 国产乱肥老妇国产一区二 | 欧美a级一区二区| 99国产在线| 精品无人乱码一区二区三区| 欧美激情奇米色| 91社区在线| 亚洲欧美日本精品| 亚洲精品久久久蜜桃动漫| 欧美性高清videossexo| 欧美国产日韩综合| 国产精品入口麻豆九色| 一本色道久久综合亚洲精品图片| 国产精品18久久久久久久网站| 亚洲乱码中文字幕久久孕妇黑人| 中文字幕免费一区二区三区| 亚洲欧洲久久| 亚洲黄页网站| 国产在线精品一区二区三区| 国产日韩欧美中文在线| 国产精品中文字幕久久久| 亚洲啊v在线| 久久免费国产精品1| 麻豆免费在线观看| 亚洲人成伊人成综合网久久久| 国产黄色高清视频| 欧美福利电影网| 中文字幕制服诱惑| 一本大道av一区二区在线播放| 日韩av无码中文字幕| 一区二区视频在线| 亚洲成人生活片| 亚洲丝袜另类动漫二区| 日本激情视频一区二区三区| 中文在线免费一区三区高中清不卡| 亚洲精品乱码久久久久久久| 大桥未久av一区二区三区中文| 亚洲综合在线一区二区| 国产在线视频一区二区| 亚洲一级免费在线观看| 蜜臀精品久久久久久蜜臀| 黄色av免费在线播放| 久久精品亚洲| 免费大片在线观看| 久久精品网址| 麻豆一区二区三区视频| 蜜臀av一区二区在线免费观看 | 永久免费av无码网站性色av| 久久青草国产手机看片福利盒子| 亚洲一区二区三区无码久久| 91蝌蚪porny| 国产又粗又猛又爽视频| 国产亚洲综合av| 黄色免费一级视频| 亚洲美女在线一区| 国产乡下妇女做爰| 黑人精品xxx一区一二区| 亚洲国产成人精品女人久久| 在线视频国内自拍亚洲视频| 中文天堂在线播放| 91麻豆精品久久久久蜜臀| 成人精品福利视频| 国产精品高清乱码在线观看| 国产精品狠色婷| 祥仔av免费一区二区三区四区| 91欧美精品午夜性色福利在线| 亚洲免费一区三区| 久久精品中文字幕一区二区三区 | 亚洲欧洲精品一区| 91精品99| 黄色av网址在线播放| 免费视频一区| 亚洲人视频在线| 国产一区不卡视频| 国产激情第一页| 国产欧美综合在线| 欧美老熟妇一区二区三区| 一区二区三区中文字幕电影| 日本少妇xxxx动漫| 色哟哟一区二区三区| 国产又大又黄又爽| 亚洲大胆美女视频| 亚洲乱亚洲乱妇| 久久久久久久久爱| 国产91亚洲精品久久久| 91手机在线视频| 在线视频亚洲专区| 久久免费一级片| 久久这里有精品15一区二区三区| 国产福利精品一区二区三区| 99久久免费精品高清特色大片| 欧美巨胸大乳hitomi| 亚洲一区二区高清| 中文字幕丰满人伦在线| 欧美精品一区二区三区在线播放 | 久久久久久久久久美女| 清纯粉嫩极品夜夜嗨av| 色老汉av一区二区三区| 亚洲av综合色区无码一二三区| 亚洲老板91色精品久久| 91精选在线| 国产精品嫩草影院一区二区| 欧美中文一区| 欧美 国产 精品| 日本不卡一区二区三区 | 国产精品nxnn| 中文字幕精品—区二区日日骚| 国产精品一二| 成人做爰69片免费| 综合欧美一区二区三区| 精品国产一区二区三区四| 欧美成人伊人久久综合网| av福利精品| 日韩美女免费线视频| 99国产精品免费网站| 自拍偷拍99| 蜜桃精品视频在线| 免费看污片网站| 亚洲大片在线观看| 亚洲第九十九页| 久久久电影免费观看完整版| 精品欧美一区二区三区在线观看| 好吊色欧美一区二区三区| 午夜久久一区| 亚洲精品www.| 国产精品久久久久久户外露出 | 久久国产精品一区二区三区| 欧美日韩国产精品一区二区亚洲| 青青草原国产在线视频| 国产精品素人视频| 亚洲精品国产欧美在线观看| 亚洲天堂视频在线观看| 成人美女大片| 免费影院在线观看一区| 国产日韩综合| 免费在线观看成年人视频| 亚洲不卡av一区二区三区| 成人精品在线播放| 欧美精品久久久久a| av成人男女| 加勒比成人在线| bt7086福利一区国产| 日本一级淫片色费放| 精品国产污网站| 9999在线视频| 精品久久久久久中文字幕动漫| 夜夜精品视频| 国产美女精品久久| 在线看一区二区| porn亚洲| 91精品视频一区| 欧美福利影院| 国产51自产区| 岛国av一区二区三区| 久久久久久久影视| 国产精品日韩一区| 99精品视频在线观看播放| www.午夜av| 亚洲一区二区三区美女| 少妇高潮一区二区三区99小说| 91爱爱小视频k| 精品免费在线| 国产高清999| 亚洲国产精品尤物yw在线观看| 天天综合在线视频| 国产精品高潮在线| 我不卡影院28| 在线中文字日产幕| 色婷婷久久一区二区三区麻豆| 成全电影播放在线观看国语| 国产在线98福利播放视频| 亚洲女同一区| www.88av| 欧美肥妇毛茸茸| 国产黄色大片在线观看| 免费久久久一本精品久久区| 日韩电影免费在线| 欧美色图亚洲天堂| 亚洲精品成a人在线观看| 99久久婷婷国产综合精品首页| 三上悠亚免费在线观看| 99re这里只有精品6| 伊人久久一区二区| 国内精久久久久久久久久人| 青青草97国产精品麻豆| 日本少妇一级片| 欧美性极品少妇| 91豆花视频在线播放| 先锋影音欧美| 成人动漫精品一区二区| 91麻豆国产视频| 欧美在线观看视频| 亚洲大全视频| 麻豆精品免费视频|