精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ICLR25賓大提出REGENT:檢索增強通用智能體,看兩眼就會學新技能,1.38億參數打贏百億模型

發布于 2025-11-4 07:34
瀏覽
0收藏

你有沒有過這種經歷:手機更新個系統,之前會用的功能突然找不到北?連我們人類學個新APP都要摸索半天,更別說讓AI在陌生環境里“即插即用”了。

ICLR25賓大提出REGENT:檢索增強通用智能體,看兩眼就會學新技能,1.38億參數打贏百億模型-AI.x社區

最近我在ICLR 2025的論文里發現一個叫REGENT的AI智能體,不用練幾百萬次,也不用裝個“超級大腦”,就靠“翻筆記”的本事,在機器人操控、游戲通關這些任務里,比那些參數多3倍、數據多10倍的大模型還厲害。今天我們聊聊這個“會抄作業還會舉一反三”的AI到底怎么回事。

先吐槽下:現在的AI都是“偏科生”

要理解REGENT的牛,得先說說現在的AI有多“死板”。

我們總聽說“大模型”很厲害,比如能玩幾十種游戲的Gato,能操控機器人的JAT。但這些AI有個通病:學新東西要“拆家式”投入。就像一個只會死記硬背的學霸,要學新題型,就得把整本練習冊重新做一遍——參數要堆到百億級,數據要喂到上億條,最后換個新環境(比如從“打乒乓球”游戲換成“打外星人”),還是會懵。

朋友做機器人實驗時就踩過坑:訓練好的機械臂能疊杯子,換個大點的盤子,就得重新喂幾百次演示數據,調半天參數。用論文里的話說,這叫“缺乏跨環境自適應能力”,說人話就是“不會舉一反三”。

更麻煩的是,這些大模型還“傲嬌”:就算給它點新環境的演示,比如教它玩新游戲的10個片段,它也得“閉關修煉”(微調)半天,最后效果還不一定好。就像你給朋友看了兩遍新家電的用法,他還得對著說明書研究一小時,最后可能還按錯鍵。

破局思路:先從“抄作業”開始——R&P的意外驚喜

REGENT團隊最聰明的地方,是先放下“堆模型堆數據”的執念,問了個簡單問題:能不能讓AI像學生抄作業一樣,遇到不會的題,先找最像的例題照著做?

他們搞了個超簡單的方法,叫“Retrieve and Play(R&P)”,翻譯過來就是“檢索了就用”。原理說出來你可能會笑:

比如AI在玩《吃豆人》,現在遇到一個“怪物在左邊,豆子在右邊”的場景(狀態),它就去之前給的演示數據里,找和當前場景最像的那一幕,然后直接用那一幕里的動作(比如“向右走”)。就像你考試時遇到一道數學題,想不起來公式,翻了翻筆記,找到一道條件差不多的題,照著它的步驟寫答案。

ICLR25賓大提出REGENT:檢索增強通用智能體,看兩眼就會學新技能,1.38億參數打贏百億模型-AI.x社區

最讓我驚訝的是實驗結果:這個連神經網絡都沒有的“笨方法”,在Atari游戲、機器人抓取這些任務里,居然和Gato、JAT這些大模型打得有來有回,甚至還能贏。

這就像一個沒上過高數課的學生,就靠死記硬背例題,居然考贏了天天刷題的學霸。這說明什么?有時候“找對參考”比“硬記知識”更重要。AI適應新環境的瓶頸,可能不是“腦子不夠大”,而是“不會查資料”。

REGENT的真本事:把“抄作業”和“真本事”結合起來

但R&P有個明顯的問題:如果遇到演示數據里沒有的“新題”怎么辦?比如演示里只有“吃豆人躲1個怪物”的場景,突然出現3個怪物,R&P就傻眼了。

ICLR25賓大提出REGENT:檢索增強通用智能體,看兩眼就會學新技能,1.38億參數打贏百億模型-AI.x社區

這時候REGENT就登場了。它的核心思路很簡單:讓AI既會“抄作業”(R&P),又有自己的“解題思路”(Transformer模型),兩者結合著來

我給你打個比方:把REGENT比作一個學做家常菜的新手廚師。

“抄作業”打底(R&P):廚房里有本食譜(演示數據),遇到不會做的菜,先翻食譜找最像的做法——比如要做“番茄炒蛋”,先看食譜里“番茄炒雞蛋”的步驟,知道先炒蛋再炒番茄。ICLR25賓大提出REGENT:檢索增強通用智能體,看兩眼就會學新技能,1.38億參數打贏百億模型-AI.x社區

“經驗調整”補漏(Transformer):但新手廚師也不是完全照抄,他會根據自己之前炒過“青椒炒蛋”的經驗(預訓練學到的知識),調整火候——比如知道雞蛋容易老,炒的時候火可以小一點。

聰明的“折中方案”:如果當前場景和食譜里的幾乎一樣(比如番茄和雞蛋的比例都一樣),就主要照食譜來;如果場景差別大(比如番茄多了一半),就多靠自己的經驗調整。這就像你抄作業時,遇到題干稍微變化的題,會根據自己的理解改幾個步驟,而不是全抄。

具體到技術上,REGENT是個“半參數化”智能體——可以理解為“帶了本工具書的工程師”:

ICLR25賓大提出REGENT:檢索增強通用智能體,看兩眼就會學新技能,1.38億參數打贏百億模型-AI.x社區

參數部分(Transformer):相當于工程師腦子里的基礎知識,比如電路原理、機械結構,是預訓練好的,不用每次換任務都重新學。

非參數部分(檢索庫):相當于工程師隨身帶的工具書,里面是各種具體任務的案例(比如修冰箱的步驟、裝空調的圖紙),遇到新任務就查,不用把所有案例都記在腦子里。

這種設計的好處太明顯了:不用超大模型,也不用海量數據。REGENT的參數只有1.38億(比JAT少30%,比Gato少90%),預訓練數據只有1450萬條(比JAT少5-10倍),但效果卻更好。

三大創新點:為什么REGENT能“以小勝大”?

讀論文時,我特別注意到REGENT的三個設計,看似簡單,實則戳中了傳統AI的痛點:

1. 檢索優先:讓“參考資料”替模型“減負”

傳統大模型像個“書呆子”,把所有知識都塞在腦子里,結果遇到新問題反而反應慢。REGENT則是“實用主義者”——能查資料解決的,就不麻煩自己的“大腦”。

比如機器人要做“開門”動作,傳統模型得把“開木門、開鐵門、開抽屜”的所有情況都學一遍;REGENT則只需要學“怎么判斷當前門和哪類參考案例像”,然后調用參考案例里的動作。這就像你不用背下所有城市的地圖,只要會用導航APP,去哪都能找到路。

2. 上下文學習:看兩眼就會,不用“閉關修煉”

很多AI學新東西要“微調”——相當于你學新軟件時,得花幾小時看教程、做練習。REGENT則是“上下文學習”:給它10個新任務的演示片段(比如玩新游戲的10個操作),它當場就能學會,不用額外訓練。

這就像你看朋友用新咖啡機做了兩杯咖啡,你不用看說明書,也能照著他的動作做一杯。論文里說,REGENT適應新Atari游戲只需要1萬條數據,而傳統模型得要100萬條——差距整整100倍。

3. 平滑插值:既不盲目抄,也不瞎創新

最妙的是REGENT處理“抄作業”和“自己來”的關系的方式——不是非此即彼,而是“看情況調整比例”。

就像你開車:如果在熟悉的高速上(場景和參考案例很像),就多靠定速巡航(R&P);如果到了陌生的小巷(場景差異大),就多靠自己操控(Transformer)。這種“平滑插值”的設計,讓REGENT既不會因為“死抄”而在新場景翻車,也不會因為“瞎創新”而犯低級錯誤。

實驗結果:小個子也能打贏大塊頭

光說不練假把式,REGENT的實驗數據確實讓人眼前一亮:

機器人操控任務(比如抓取、開門)里,REGENT不用微調,直接用50個演示片段,就能比JAT(全量數據訓練的版本)表現好30%;就算JAT用新環境的數據微調,還是打不過REGENT。

ICLR25賓大提出REGENT:檢索增強通用智能體,看兩眼就會學新技能,1.38億參數打贏百億模型-AI.x社區

游戲任務(ProcGen游戲套件)里,REGENT的參數只有MTT(另一個能上下文學習的模型)的1/3,預訓練數據少10倍,但在《忍者》《登山者》這些游戲里,分數比MTT高20%-50%。更狠的是,就算給游戲加了“隨機干擾”(比如按鍵盤有20%概率沒反應),REGENT照樣能穩定通關,而傳統模型早就亂套了。

ICLR25賓大提出REGENT:檢索增強通用智能體,看兩眼就會學新技能,1.38億參數打贏百億模型-AI.x社區

最讓我覺得有價值的是:REGENT在“老任務”上也沒拉胯——在它預訓練過的環境里,表現和JAT、MTT差不多,甚至在Metaworld機器人任務里還更好。這說明它不是“偏科生”,而是“全能選手”:既能快速學新東西,又不丟老本事。

未來可期,但還有兩個小遺憾

當然,REGENT也不是完美的。我在論文里看到兩個待解決的問題:

一是長任務有點吃力。比如玩《太空侵略者》這種關卡特別長的游戲,REGENT的表現會下降。這就像你看小說,前面的情節記得清楚,看到后面就忘了前面的伏筆,REGENT對“長期記憶”的處理還需要優化。

二是新“身體”適應難。如果給機器人換個新的“身體”(比如從機械臂換成四足機器人),REGENT的表現會變差。這就像你習慣了用鼠標,突然換成觸控板,得適應半天——AI對“身體結構”的抽象理解還不夠。

但這些都是前進中的問題。REGENT的意義不在于它完美,而在于它提供了一條新路子:AI的“通用性”不一定靠“堆資源”,靠“會檢索、會借鑒”也能實現。這對小團隊、小公司來說太重要了——不用買幾百塊GPU,不用喂上億條數據,也能做出能快速適應新環境的AI。

最后:AI的“學習能力”,可能比“記憶力”更重要

讀完這篇論文,我最大的感受是:我們之前可能把AI的“聰明”想錯了。

不是參數越多、數據越多,AI就越聰明,就像不是書讀得越多、筆記記得越全,人就越厲害。真正的聰明,是“遇到新問題時,知道怎么找參考、怎么舉一反三”——這正是REGENT做到的。

未來,當你的掃地機器人能自己適應新房間的布局,當你的智能家居能看懂你的新需求,當工廠的機器人換個零件就能做新任務時,背后可能就有REGENT這種“檢索增強”技術的影子。

最后問你個問題:如果家里的家電都有REGENT這種“看兩眼就會”的能力,你最想讓哪個家電先升級?評論區聊聊~

參考資料

標題:REGENT: A RETRIEVAL-AUGMENTED GENERALIST AGENT THAT CAN ACT IN-CONTEXT IN NEW ENVIRONMENTS

作者:Kaustubh Sridhar (賓夕法尼亞大學), Souradeep Dutta (賓夕法尼亞大學/英屬哥倫比亞大學), Dinesh Jayaraman (賓夕法尼亞大學), Insup Lee (賓夕法尼亞大學)

鏈接:https://openreview.net/pdf?id=NxyfSW6mLK

本文轉載自??旺知識??,作者:旺知識

已于2025-11-4 10:02:16修改
收藏
回復
舉報
回復
相關推薦
欧美一级日韩免费不卡| 国产精品区一区二区三区| 国内揄拍国内精品| 免费黄色片网站| 亚洲欧美一级| 五月婷婷久久综合| 天堂精品一区二区三区| 精品久久久久久亚洲综合网站| 亚洲无线视频| 在线观看日韩专区| 少妇极品熟妇人妻无码| 日本免费久久| 亚洲午夜羞羞片| 色阁综合av| 日本波多野结衣在线| 日本在线观看不卡视频| 久久久久久久久久久成人| 久久久久久国产精品无码| 国语精品视频| 91福利区一区二区三区| 日韩一级片免费视频| 欧美成人xxx| 91久色porny| 99久久伊人精品影院| а中文在线天堂| 亚洲一区二区成人| 欧美激情图片区| 久久免费看少妇高潮v片特黄| 国产精品一区二区99| 精品处破学生在线二十三| 热久久久久久久久| 九九久久国产| 色视频成人在线观看免| 久久黄色片视频| 丝袜综合欧美| 亚洲日本欧美天堂| 亚洲黄色成人久久久| 香港三日本三级少妇66| 国产a精品视频| 91在线免费看网站| 夜夜躁很很躁日日躁麻豆| 三级久久三级久久| 日本sm极度另类视频| 国产精品午夜影院| 亚洲免费播放| 91国产精品91| 男人的天堂一区| 精品69视频一区二区三区Q| 美女999久久久精品视频| 99热这里只有精品4| 99精品综合| 久久精品2019中文字幕| 蜜桃av.com| 国产精品久久久久久久久久10秀 | 久久精品国产亚洲av久| 米奇精品关键词| 日韩av在线不卡| 国产麻豆xxxvideo实拍| 美女网站色精品尤物极品姐弟| 亚洲电影在线观看| 成人在线视频免费播放| 日韩激情网站| 一本色道久久88精品综合| 在线观看国产精品一区| 精品毛片免费观看| 北条麻妃久久精品| 亚洲av无码一区二区三区在线| 久久国产精品亚洲人一区二区三区 | 91丝袜在线观看| 日本一区福利在线| 亚洲人成电影网站色xx| 成人在线观看免费高清| 亚洲精品网址| 久久免费福利视频| 久久青青草视频| 日本成人在线一区| 亚洲va电影大全| 少妇一级淫片免费看| 久久只精品国产| 亚洲一区3d动漫同人无遮挡 | 第一会所sis001亚洲| 久久精品电影网| 久久网一区二区| 免费视频一区二区三区在线观看| 国产精品电影在线观看| 国产青青草视频| 99久久er热在这里只有精品66| 蜜桃麻豆91| 日本在线看片免费人成视1000| 亚洲一区自拍偷拍| 欧美 国产 日本| 青草综合视频| 亚洲精品久久久久国产| 婷婷丁香综合网| 尤物在线精品| 国产一区私人高清影院| 日韩中文字幕免费观看| 亚洲国产精品高清| 精品视频在线观看一区| av成人在线播放| 亚洲激情视频在线播放| 视频国产一区二区| 国产午夜精品一区二区三区欧美 | 婷婷精品视频| 毛片精品免费在线观看| www.亚洲激情| 99久久99久久免费精品蜜臀| 99re99热| 日韩av电影资源网| 亚洲国产小视频在线观看| 中文字幕第69页| 久久精品在线| 国产精品区二区三区日本| 欧美天天影院| 一本色道久久综合狠狠躁的推荐 | 黑森林福利视频导航| 久久伊人影院| 最近2019免费中文字幕视频三| 日韩欧美亚洲一区二区三区| 国产黑丝在线一区二区三区| 日韩国产在线一区| 欧美sm一区| 精品国产凹凸成av人网站| 老司机成人免费视频| 老司机精品视频网站| 国产三区精品| 国产网红在线观看| 欧美一区二区高清| 黄色裸体一级片| 青草av.久久免费一区| 麻豆成人av| 国产激情在线播放| 亚洲第一天堂av| 黄色一级片在线| 国产高清精品久久久久| 自拍另类欧美| 4438五月综合| 久久国产精品久久国产精品| 91国产精品一区| 国产精品久久久久久久久免费樱桃 | 欧美一区二区三区的| 91无套直看片红桃在线观看| 免费在线看一区| 亚洲国产日韩综合一区| 99re久久| 中文字幕免费国产精品| 在线免费a视频| 一色桃子久久精品亚洲| 亚洲免费黄色网| 中文字幕av亚洲精品一部二部| 国产综合久久久久| 一区二区三区视频网站| 欧美在线影院一区二区| 亚欧精品视频一区二区三区| 免费在线观看不卡| 一区二区在线观看网站| 国产精品视频一区二区三区综合| 久久久精品2019中文字幕神马| 国产精品嫩草影院桃色| 亚洲乱码一区二区三区在线观看| 国产又粗又猛大又黄又爽| 欧美精品日本| 久久av二区| 欧美va视频| 精品国产欧美一区二区三区成人| 99er热精品视频| 亚洲国产美国国产综合一区二区| 最新版天堂资源在线| 国产欧美高清| 亚洲精品免费在线看| 欧美二区观看| 97成人超碰免| 北条麻妃在线| 日韩你懂的在线观看| 国产精品视频久久久久久久| 国产日韩综合av| 黄色a级三级三级三级| 亚洲全部视频| 亚洲欧美电影在线观看| 一区二区三区视频播放| 茄子视频成人在线| caopo在线| 国产丝袜精品视频| 国产精品高潮呻吟av| 亚洲一区二区欧美日韩| 微拍福利一区二区| 国产精品视频一区二区三区综合| 成人午夜国产| 欧美成人精品在线视频| 天堂影院在线| 欧美人妖巨大在线| 日韩乱码在线观看| 国产精品久久久久久久浪潮网站| 特级特黄刘亦菲aaa级| 视频一区欧美精品| 大荫蒂性生交片| 欧美丝袜丝交足nylons172| 99re在线视频上| 日韩毛片一区| 国外成人在线视频| 超碰caoporn久久| 亚洲天堂av高清| 亚洲免费视频网| 欧美日本免费一区二区三区| 影音先锋亚洲天堂| 亚洲丝袜另类动漫二区| 中文精品在线观看| 国产91精品久久久久久久网曝门 | 99视频只有精品| 中文文精品字幕一区二区| 俄罗斯黄色录像| 精品在线一区二区三区| 成人观看免费完整观看| 欧美日韩国产欧| 中文字幕在线观看一区二区三区| 国产免费播放一区二区| 好吊色欧美一区二区三区四区 | www.99re6| 久久一二三国产| 丰满岳乱妇一区二区| 国产一区二区导航在线播放| 欧美精品成人网| 亚洲一区二区成人| 少妇无码av无码专区在线观看| 欧美粗暴jizz性欧美20| 一区二区高清视频| 欧美日韩第一| 日本不卡一区二区三区在线观看| 欧美黄色录像| 久久大片网站| 牛牛影视久久网| 国产日韩一区二区三区| aaa国产精品视频| 成人自拍网站| 91麻豆精品激情在线观看最新 | 成人在线免费公开观看视频| 亚洲精品自拍视频| 色屁屁草草影院ccyycom| 日韩欧美精品三级| 国产三级三级在线观看| 91精品国产综合久久久久久| 一级片一区二区三区| 欧美日韩情趣电影| 伊人色综合久久久| 欧美电影一区二区| 99热这里只有精品9| 欧美一区二区日韩| 亚洲av无码片一区二区三区 | 久久伊伊香蕉| 亚洲人成在线播放| 国产精品四虎| 精品国偷自产在线| 在线观看h网| 欧美精品久久久久久久久| av伦理在线| 91黑丝高跟在线| 亚洲四虎影院| 91丨九色丨国产在线| 国产精品日韩精品在线播放| 成人免费观看网站| 日韩a级大片| 手机成人在线| 中文字幕日韩一区二区不卡| 国产成人一区二区三区别| 亚洲看片一区| 国产一级做a爰片久久| 久久国产福利国产秒拍| 国产老头和老头xxxx×| www.一区二区| 欧美老女人性生活视频| 自拍偷拍欧美精品| 久久高清免费视频| 欧美主播一区二区三区| 国产一区二区小视频| 精品处破学生在线二十三| 美女做暖暖视频免费在线观看全部网址91 | 91看片在线观看| 欧美成在线视频| 欧美aa免费在线| 国产视频福利一区| 老司机aⅴ在线精品导航| 亚洲精品一区二区三区四区五区| 欧美一区国产在线| 无码人妻丰满熟妇区五十路百度| 久久99国产精品麻豆| 国产大学生视频| 欧美国产在线观看| 国产一级片视频| 欧美视频一区在线观看| 丰满人妻熟女aⅴ一区| 有码中文亚洲精品| bl在线肉h视频大尺度| 国产精品偷伦一区二区 | 狠狠v欧美v日韩v亚洲ⅴ| 韩国三级hd两男一女| 国产精品欧美久久久久无广告| 久久午夜无码鲁丝片午夜精品| 欧美自拍偷拍一区| 亚洲精品久久久狠狠狠爱| 这里只有视频精品| 久草在线资源福利站| 亚洲free性xxxx护士白浆| 一区二区美女| 久久www视频| 久久国产免费看| 3d动漫精品啪啪一区二区下载 | 99国产精品一区| 欧美做爰啪啪xxxⅹ性| 欧美天堂在线观看| www.五月婷婷| 久久精品色欧美aⅴ一区二区| 桃色一区二区| 国产精品污www一区二区三区| 97色伦图片97综合影院| 国产无套内射久久久国产| 国产成人精品一区二区三区四区| 东京热无码av男人的天堂| 舔着乳尖日韩一区| 亚洲国产精品成人久久蜜臀| 色偷偷88888欧美精品久久久| 中文字幕乱码在线播放| 国产精品日本一区二区| 91精品99| 天堂网成人在线| 成人免费一区二区三区视频| 波多野结衣二区三区| 国产视频精品在线| 国产传媒av在线| 国内精品**久久毛片app| 欧美~级网站不卡| 天堂av.com| 亚洲欧美色一区| 99精品免费观看| 久久精品一区中文字幕| 四虎国产精品免费久久| 亚洲欧美日韩在线综合 | 欧美另类专区| 初高中福利视频网站| 亚洲女爱视频在线| 国产女人18毛片18精品| 麻豆一区二区在线观看| 精品国产亚洲一区二区三区| 天天综合中文字幕| 老司机精品视频一区二区三区| 美国美女黄色片| 欧美日韩三级在线| 日本在线www| 亚洲综合精品伊人久久| 欧美三级不卡| 偷偷色噜狠狠狠狠的777米奇| 天天影视色香欲综合网老头| 国产又爽又黄网站亚洲视频123| 91chinesevideo永久地址| 欧美成人午夜77777| 青青草原成人网| 国产欧美精品日韩区二区麻豆天美| 亚洲中文一区二区| 在线国产精品视频| 成人在线视频区| 欧美乱做爰xxxⅹ久久久| av在线综合网| 国产日韩久久久| 欧美精品性视频| 欧美福利在线播放网址导航| 99久久国产宗和精品1上映| 亚洲国产精品t66y| 国产免费久久久| 性金发美女69hd大尺寸| 亚洲人成网77777色在线播放 | 91精品美女| 亚洲成人动漫在线| 成人av在线一区二区| 日本熟女毛茸茸| 北条麻妃99精品青青久久| 97久久亚洲| 亚洲性生活网站| 亚洲九九爱视频| 日韩电影免费| 91精品在线看| 国产日本精品| 国产中文字幕久久| 亚洲成人久久久久| 日本欧美在线| 国产精品成人久久电影| 国产欧美日韩中文久久| wwwav在线播放| 国产成人精品电影| 午夜天堂精品久久久久| 高潮毛片无遮挡| 精品奇米国产一区二区三区| 另类激情视频| www.18av.com| 中文字幕乱码久久午夜不卡| 人妻精品一区一区三区蜜桃91| 国产精品久久9| 激情久久久久久| 91香蕉一区二区三区在线观看| 亚洲白虎美女被爆操| 日韩三区四区| 精品一区二区中文字幕|