精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

機器人學會轉筆、盤核桃了!GPT-4加持,任務越復雜,表現越優秀

人工智能
家人們,繼人工智能(AI)攻占象棋、圍棋、Dota之后,轉筆這一技能也被 AI 機器人學會了。

大數據文摘出品

家人們,繼人工智能(AI)攻占象棋、圍棋、Dota之后,轉筆這一技能也被 AI 機器人學會了。

上面這個筆轉的賊溜的機器人,得益于名叫Eureka的智能體(Agent),是來自英偉達、賓夕法尼亞大學、加州理工學院和得克薩斯大學奧斯汀分校的一項研究。

得Eureka“指點”后的機器人還可以打開抽屜和柜子、扔球和接球,或者使用剪刀。據英偉達介紹,Eureka有10種不同的類型,可執行29種不同的任務。

要知道在之前,單就轉筆這一功能,僅靠人類專家手工編程,是無法如此順滑的實現的。

機器人盤核桃

而Eureka 能夠自主編寫獎勵算法來訓練機器人,且碼力強勁:自編的獎勵程序在 83% 的任務中超越了人類專家,能使機器人的性能平均提升52%。

Eureka開創了一種從人類反饋中無梯度學習的新途徑,它能夠輕松吸收人類提供的獎勵和文字反饋,從而進一步完善自己的獎勵生成機制。

具體而言,Eureka 利用了 OpenAI 的 GPT-4 來編寫用于機器人的試錯學習的獎勵程序。這意味著該系統并不依賴于人類特定任務的提示或預設的獎勵模式。

Eureka 通過在 Isaac Gym 中使用 GPU 加速的仿真,能夠快速評估大量候選獎勵的優劣,從而實現更有效率的訓練。接著,Eureka 會生成訓練結果的關鍵統計信息摘要,并指導 LLM(Language Model,語言模型)改進獎勵函數的生成。通過這種方式,AI 智能體能夠獨立地改善對機器人的指令。

Eureka的框架

研究人員還發現,任務越復雜,GPT-4 的指令就越能優于所謂的"獎勵工程師"的人類指令。參與該研究的研究員甚至稱 Eureka 為“超人類獎勵工程師”。

Eureka 成功地彌補了高層推理(編碼)和低層運動控制之間的鴻溝。其采用了一種被稱為 "混合梯度架構":一個純推理的黑盒子 LLM(Language Model,語言模型)引導一個可學習的神經網絡。在這個架構中,外層循環運行 GPT-4 來優化獎勵函數(無梯度),而內層循環則運行強化學習以訓練機器人的控制器(基于梯度)。

——NVIDIA的高級研究科學家Linxi "Jim" Fan

Eureka 可以整合人類的反饋,以便更好地調整獎勵,使其更符合開發者的期望。Nvidia 把這個過程稱為"in-context RLHF"(從人類反饋中進行上下文學習)

值得注意的是,Nvidia 的研究團隊已經開源了 Eureka 的 AI 算法庫。這將使得個人和機構能夠通過 Nvidia Isaac Gym 來探索和實驗這些算法。Isaac Gym 是建立在 Nvidia Omniverse 平臺上的,這是一個基于 Open USD 框架用于創建 3D 工具和應用程序的開發框架。

  • 論文鏈接:https://arxiv.org/pdf/2310.12931.pdf
  • 項目鏈接:https://eureka-research.github.io/
  • 代碼鏈接:https://github.com/eureka-research/Eureka

如何評價?

在過去的十年中,強化學習取得了巨大的成功,但我們必須承認其中仍存在持續的挑戰。之前雖然有嘗試引入類似的技術,但與使用語言模型(LLM)來輔助獎勵設計的 L2R(Learning to Reward)相比,Eureka 更為突出,因為它消除了特定任務提示的需要。Eureka 之所以能比 L2R 更出色,是因為它能夠創建自由表達的獎勵算法,并利用環境源代碼作為背景信息。

英偉達的研究團隊進行了一項調查,以探索在使用人類獎勵函數啟動時,是否能提供一些優勢。實驗的目的是想看看是否你們能順利地用初始 Eureka 迭代的輸出替代原始的人類獎勵函數。

在測試中,英偉達的研究團隊在每個任務的情境下,使用相同的強化學習算法和相同的超參數對所有最終獎勵函數進行了優化。為了測試這些特定任務的超參數是否經過良好調整以確保人工設計的獎勵的有效性,他們采用了經過充分調整的近端策略優化(PPO)實現,這個實現基于之前的工作,沒有進行任何修改。對于每個獎勵,研究人員進行了五次獨立的 PPO 訓練運行,并報告了策略檢查點達到的最大任務指標值的平均值,作為獎勵性能的度量。

結果顯示:人類設計者通常對相關狀態變量有很好的理解,但在設計有效獎勵方面可能缺乏一定的熟練度。

Nvidia 的這項開創性研究在強化學習和獎勵設計領域開辟了新的疆界。他們的通用獎勵設計算法 Eureka 利用了大型語言模型和上下文進化搜索的力量,能夠在廣泛的機器人任務領域生成人類水平的獎勵,而無需特定任務提示或人工干預,這在很大程度上改變了我們對 AI 和機器學習的理解。

責任編輯:趙寧寧 來源: 大數據文摘
相關推薦

2023-10-21 21:14:00

AI模型

2019-12-24 09:31:55

機器人人工智能編程

2022-10-28 13:16:07

四足機器人機器人人工智能

2017-03-27 09:59:25

機器人自創語言交流

2023-10-29 18:14:08

GPT4機器人算法

2025-06-11 14:45:26

機器人訓練數據

2025-09-08 09:12:00

2025-09-15 14:50:03

AI機器人開發

2012-10-09 10:12:12

2021-01-04 09:18:36

機器人人工智能系統

2023-07-29 13:14:40

谷歌人工智能

2018-07-06 08:58:53

機器人人工智能系統

2020-04-28 10:20:23

5G窄帶物聯網運營商

2023-03-16 19:17:57

2022-02-13 00:03:06

AndroidAndroid 13安卓

2025-10-09 13:19:47

2024-05-28 13:03:50

2023-06-19 08:19:50

2020-09-02 10:36:52

機器人人工智能系統

2022-06-07 14:35:53

機器人人工智能
點贊
收藏

51CTO技術棧公眾號

亚洲视频在线观看一区二区| 国产手机在线观看| 黄色在线播放网站| 国产成人精品一区二区三区四区| 久久久久久国产三级电影| 亚州av综合色区无码一区| 日韩免费福利视频| 综合激情成人伊人| 黄色一区三区| 亚洲视频在线免费播放| 欧美日本亚洲韩国国产| 日韩精品一区二区三区第95| 艹b视频在线观看| 日本动漫理论片在线观看网站| 26uuu欧美| 成人国产精品免费视频| 日韩av片在线播放| 99欧美视频| 亚洲欧美日韩在线一区| 欧美日韩理论片| 不卡av播放| 一区二区不卡在线播放| 天堂av一区二区| 色哟哟国产精品色哟哟| 国内精品国产成人| 国产不卡精品视男人的天堂| 国产亚洲欧美久久久久| 91综合视频| 亚洲色图13p| 波多野结衣办公室双飞| 日韩黄色碟片| 一本到不卡精品视频在线观看| 久青草视频在线播放| av网站在线播放| 99久久综合国产精品| 91美女高潮出水| 国产精品无码一区| 男人的天堂亚洲在线| 欧美日韩成人在线观看| 亚洲区一区二区三| 国产成人一区二区三区影院| 亚洲国产精品视频在线观看| 9.1在线观看免费| av成人在线网站| 欧美日韩中字一区| 久久久久久久片| 色黄视频在线观看| 午夜精品在线看| 热久久最新地址| 成人日韩欧美| 国产精品免费免费| 色噜噜色狠狠狠狠狠综合色一 | 这里只有精品视频在线观看| 日日碰狠狠丁香久燥| 中文字幕在线免费观看视频| 香蕉乱码成人久久天堂爱免费| 国产 欧美 日韩 一区| 亚洲小说区图片| 亚洲欧美色图小说| www.激情网| 国产网红女主播精品视频| 亚洲黄一区二区三区| 国产在线视频综合| 美女网站视频在线| 亚洲国产精品久久艾草纯爱| 日韩av中文字幕第一页| 伦理av在线| 午夜伦欧美伦电影理论片| 黄色免费福利视频| 亚洲性色av| 在线中文字幕不卡| 91人人澡人人爽人人精品| 久久免费资源| 91精品国产一区二区| 天堂在线精品视频| 粉嫩一区二区三区四区公司1| 亚洲精品在线观看视频| 成人在线视频免费播放| 免费欧美激情| 色悠悠久久久久| 欧美人妻精品一区二区免费看| 亚洲一级影院| 日本一欧美一欧美一亚洲视频| 国产美女www爽爽爽| 激情五月婷婷综合| dy888夜精品国产专区| 天堂资源最新在线| 中文天堂在线一区| 一二三在线视频| 国产精品专区免费| 欧美日韩亚洲不卡| 国产精品无码自拍| 国产亚洲一区| 九九精品在线观看| 欧美另类一区二区| 毛片不卡一区二区| 国产精品免费看一区二区三区| 日韩av免费观影| 亚洲丝袜制服诱惑| 黄色成人在线看| 欧美电影在线观看网站| 欧美精品乱码久久久久久| 亚洲成年人在线观看| 精品一区av| 欧美精品18videos性欧美| 久久精品五月天| 国产iv一区二区三区| 美日韩精品免费| 亚洲精品天堂| 欧美在线你懂得| 欧产日产国产精品98| 日韩中文首页| 欧美一级淫片videoshd| 国产成人精品毛片| 久久久久九九视频| 日韩中文字幕在线免费| 日韩一级特黄| 亚洲人成77777在线观看网| 日本妇女毛茸茸| 日本在线不卡视频| 久久国产精品一区二区三区四区| 黄色av电影在线观看| 91高清在线观看| 中文字幕乱码在线| 午夜精品久久| 成人黄色免费看| 国产一区二区三区福利| 午夜亚洲福利老司机| 欧美性猛交xx| 99久久激情| 国产99视频在线观看| 色丁香婷婷综合久久| 亚洲人午夜精品天堂一二香蕉| 免费观看成人网| 亚欧日韩另类中文欧美| 久久久久久久久久久人体| 国产又色又爽又黄又免费| 国产日本欧洲亚洲| 久久精品免费一区二区| 欧美成a人免费观看久久| 欧美—级高清免费播放| 国产黄色片免费观看| 亚洲男同1069视频| 少妇一级淫免费播放| 欧美在线电影| 国产精品91在线观看| 国产69久久| 在线观看日韩av先锋影音电影院| 国产夫妻性爱视频| 国产精品色网| 久久婷婷开心| 亚洲福利影院| 亚洲人成在线观| 成人免费毛片视频| 日本一区二区三级电影在线观看| mm1313亚洲国产精品无码试看| 国产成人精品999在线观看| 国产成人+综合亚洲+天堂| 国产在线视频福利| 91国偷自产一区二区三区观看 | 日韩理论电影大全| 国产精品网站大全| 秋霞影院午夜丰满少妇在线视频| 欧美区在线观看| 一起操在线播放| 国产成a人亚洲精| 亚洲色成人www永久在线观看| 欧美a一欧美| 国产精彩精品视频| 麻豆影视在线观看_| 欧美一区二区三区四区五区 | 99国产超薄丝袜足j在线观看| 麻豆av在线播放| 日韩经典一区二区三区| 亚洲图片欧美日韩| 日韩理论片中文av| 天堂va欧美va亚洲va老司机| 午夜影院日韩| 一区二区三区的久久的视频| 国产精品va视频| 欧美精品videosex性欧美| 欧美视频综合| 欧美精品一级二级| 久久久久亚洲av片无码下载蜜桃| 99re热这里只有精品免费视频 | 国产精品视频久久久久久久| 国产午夜精品久久久久久免费视| 日韩欧美亚洲另类| 韩日精品视频| 日韩精品一区二区三区色偷偷| 美女视频一区| 国外成人在线直播| 成全电影播放在线观看国语| 欧美一区日韩一区| 51国产偷自视频区视频| 中文字幕中文在线不卡住| 99riav国产精品视频| 日韩av电影免费观看高清完整版| 日本黄xxxxxxxxx100| 日韩mv欧美mv国产网站| 成人网在线视频| 一区二区三区短视频| 久久资源免费视频| 蝌蚪视频在线播放| 日韩欧美一级片| 艳妇乳肉豪妇荡乳av无码福利| 亚洲影院久久精品| 啪啪一区二区三区| 91影院在线免费观看| www.桃色.com| 久久尤物视频| 97超碰在线人人| 围产精品久久久久久久| 欧美中文娱乐网| 免费看久久久| 成人动漫视频在线观看完整版| 在线成人视屏| 日韩美女写真福利在线观看| 成人免费高清观看| 久久躁日日躁aaaaxxxx| 高清国产福利在线观看| 亚洲激情成人网| 精品久久国产视频| 欧美精三区欧美精三区| 这里只有精品国产| 日韩人体视频一二区| 久久久无码一区二区三区| 亚洲视频一二三区| 中文字幕第二区| 久久精品欧美日韩| 国产精品300页| www.欧美.com| 超碰caoprom| 粉嫩蜜臀av国产精品网站| 日日夜夜精品视频免费观看| 另类中文字幕网| 天堂在线资源视频| 日韩电影在线观看电影| 日韩有码免费视频| 国产一级久久| 日日鲁鲁鲁夜夜爽爽狠狠视频97 | 欧洲一区二区视频| а√在线中文网新版地址在线| 欧美国产日韩一区| 日本不卡影院| 欧美精品久久久久久久久久| 好了av在线| 欧美国产视频一区二区| 直接在线观看的三级网址| 久久不射电影网| 亚洲制服国产| 欧美激情网站在线观看| 成年人视频免费在线播放| 欧美精品久久久久久久免费观看| 国产美女一区视频| 午夜精品视频网站| 超碰aⅴ人人做人人爽欧美| 日韩美女av在线免费观看| 欧美日韩国产网站| 国产精品成人国产乱一区| 欧美xxx网站| 国产美女搞久久| 精品精品视频| 国产在线一区二区三区四区 | 成人综合在线网站| 97精品人人妻人人| 91美女视频网站| 卡一卡二卡三在线观看| 亚洲欧洲精品一区二区三区 | 欧美日韩aaaaaa| 国产成人av免费看| 亚洲国产精品免费| 国产午夜在线视频| 精品国偷自产在线| 七七成人影院| 日韩av免费在线| 日韩五码电影| 精品国产免费人成电影在线观...| 精品一区在线| 日韩视频在线免费播放| 黑人一区二区三区四区五区| 午夜精品久久久内射近拍高清 | 91啪国产在线| gogo久久日韩裸体艺术| 欧美一区二区在线视频观看| 久久网站免费观看| 成人免费a级片| 日av在线不卡| 男人的天堂影院| 国产精品视频线看| 日韩av在线播| 在线电影院国产精品| 神马久久久久久久久久| 一区二区三区在线播放欧美| 污污的网站在线免费观看| 日本韩国欧美精品大片卡二| av在线成人| 开心色怡人综合网站| 久久精品青草| 日韩中文字幕二区| 国产成人综合亚洲网站| 亚洲日本精品视频| 亚洲观看高清完整版在线观看| 涩涩视频在线观看| 日韩成人在线视频观看| 动漫一区在线| 国产成人免费av| 久久精品凹凸全集| 久久久成人精品一区二区三区| 久久精品天堂| 人妻 日韩 欧美 综合 制服| 国产精品另类一区| 特一级黄色大片| 日韩欧美一二三四区| 在线日本视频| 日本成人黄色片| 精品久久ai| 欧美 日韩 国产精品| 麻豆国产精品视频| 中文幕无线码中文字蜜桃| 亚洲午夜久久久久中文字幕久| 一二三区中文字幕| 亚洲欧美制服丝袜| h片在线观看下载| 51成人做爰www免费看网站| 久久综合国产| 另类小说色综合| 国产调教视频一区| www亚洲视频| 亚洲白虎美女被爆操| 在线你懂的视频| 91九色在线视频| 欧美韩国日本在线观看| 我要看一级黄色大片| 久久精品欧美日韩精品| 毛片视频网站在线观看| 精品美女在线观看| 手机在线免费看av| 91久久在线视频| 亚洲精品电影| 久久精品久久99| 亚洲男同1069视频| av中文字幕第一页| 久久夜精品香蕉| 欧美视频三区| 精品视频在线观看一区二区| 国产河南妇女毛片精品久久久| 麻豆明星ai换脸视频| 91麻豆精品国产91久久久| 黄视频在线观看网站| 91在线观看欧美日韩| 亚洲字幕久久| 欧美图片自拍偷拍| 亚洲成人av在线电影| 天天综合网天天综合| 97av在线视频免费播放| 偷拍亚洲色图| 无码少妇一区二区三区芒果| 欧美国产精品久久| 亚洲网站在线免费观看| 久久精品国产精品亚洲| 国产精品99久久免费| 国产精品久久久久久久乖乖| 99久久伊人网影院| 亚洲色成人www永久网站| 中文字幕精品一区二区精品| 亚洲美女色播| 国产视频在线观看网站| 97se狠狠狠综合亚洲狠狠| 男人天堂视频网| 日韩三级影视基地| 日韩一区二区三区精品视频第3页| 国产小视频免费| 久久综合一区二区| 91丨九色丨蝌蚪丨对白| 欧美猛交免费看| 清纯唯美亚洲经典中文字幕| 国产精品视频分类| 一区二区三区四区不卡在线| av女名字大全列表| 国产精品美女无圣光视频| 国产精品v欧美精品v日本精品动漫| 中文字幕一区二区人妻电影丶| 91电影在线观看| 天堂亚洲精品| 日韩av影视| 国产福利精品导航| 国产一区二区视频网站| 精品自在线视频| 成人女性视频| 亚洲欧美综合视频| 欧美午夜理伦三级在线观看| 午夜小视频福利在线观看| 欧美成人蜜桃| 国产成人精品午夜视频免费| 无码人妻精品一区二区50| 欧美成人免费全部观看天天性色| 国产一区二区三区四区二区| 日本黄色三级网站| 欧洲国产伦久久久久久久|