精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

突破Agent長程推理效率瓶頸!MIT&新加坡國立聯合推出強化學習新訓練方法

人工智能 新聞
MIT和新加坡國立大學聯合提出了MEM1框架。實驗結果顯示,7B參數MEM1模型的推理速度能達到傳統14B模型的3.5倍,同時峰值上下文token(peak token)數量約為后者1/4。

AI Agent正在被要求處理越來越多復雜的任務。

但當它要不停地查資料、跳頁面、篩選信息時,顯存狂飆、算力吃緊的問題就來了。

針對這一難題,MIT和新加坡國立大學聯合提出了MEM1框架。實驗結果顯示,7B參數MEM1模型的推理速度能達到傳統14B模型的3.5倍,同時峰值上下文token(peak token)數量約為后者1/4。

該框架提出了一種基于強化學習的推理方案,通過讓智能體學會將記憶更新作為上下文的一部分,從而實現近似常量級的顯存開銷(near constant memory)。

目前相關論文已被大語言模型會議COLM 2025 Reasoning,Attention & Memory:RAM 2 workshop收錄為口頭報告(Oral),會議將于今年10月份在加拿大蒙特利爾舉辦。

MEM1:讓AI學會自主整理思緒+管理工作記憶

想象一位科研工作者連續工作一周后的大腦——充斥著各種公式、實驗數據和臨時靈感,但真正用于解決問題的只是其中核心片段。

對于人來說,每過一段時間起身喝杯咖啡醒醒腦,可以整理思緒,但是對于AI agent來說,這就難了。

經典的大語言模型采用全上下文提示技術,每輪交互都完整附上所有歷史記錄。隨著對話輪次增加,計算成本和內存需求都呈線性增長(O(N))

無限線性增長的上下文導致三個嚴重問題:

  • 無限增長的計算代價;
  • 超出訓練長度的泛化失效;
  • 因信息過載導致的推理能力退化,即使相關信息仍在上下文中,模型也無法有效利用它們。

MEM1的核心創新在于通過訓練的方式讓模型自主將記憶與推理統一

不同于簡單地添加外部記憶模塊(如RAG類的方法),MEM1通過端到端強化學習訓練代理,使其在每一步自動完成三個關鍵操作:

1、提取——從新觀察中識別關鍵信息;2、整合——將新信息與內部記憶狀態融合;3、修剪——丟棄冗余或無關內容。

通過這種訓練方法,AI Agent僅需維護自己上下文中的一個<IS>內部狀態(Internal State),這個<IS>包含之前上下文中所有模型自己認為需要保留的重要信息。

通過引入<IS>,模型的上下文不會隨交互輪次增加而膨脹

不僅如此,<IS>的引入使得模型的推理過程與記憶整合可以有機地結合在一起,它不僅提供對當前查詢的深度洞察,還充當“工作記憶”,從收集信息中提取關鍵組件構建下一步推理。

這種過程也十分符合人們自己整理思緒的過程:雜亂陳舊的記憶被遺忘,同時隨著記憶被整合,下一步的工作重點也隨之顯現出來。

MEM1采用端到端的基于結果獎勵(Outcome Reward)的強化學習訓練方式,并引入一種特殊的注意力掩碼機制(Attention Mask)。

該機制限定Agent在生成下一步輸出時只能關注到上一輪交互的內容,從而迫使其學會對歷史信息進行高效壓縮,同時提升推理與問題求解能力。

相對于傳統的RL訓練,MEM1在rollout期間引入了多個trajectories來訓練compressed reasoning。為了提升訓練效率,MEM1使用attention masking技巧將面向同一個任務的多個trajectories壓縮成一個進行高效訓練。

在推理階段,MEM1 agent會在推理時由agent自主地不斷整合自己的context。整合完之后,之前的memory會自動從context中移出,從而達到在長程環境交互任務下控制context長度的目的。

上圖為MEM1(下)和現有推理模型(上)在長程任務上上下文占用的對比,可以看出現有推理模型上下文會隨著輪次增加線性增長,但MEM1每一輪后將被壓縮過的信息移出context使得上下文保持近似不變。

推理與信息整合的雙重能力

經典的RL環境通常是為短交互設計,并不能很好的鼓勵模型進行長期多輪的推理。大家比較熟知的多輪對話數據集,例如hotpot QA等通常也只需要模型進行兩輪推理。

為了驗證MEM1訓練方法的效果,MEM1團隊基于現有的數據集構造了一個高難度多目標問答任務的訓練環境。團隊基于以下不同領域的數據集構建了訓練環境并進行訓練:

1、Doc檢索QA:模擬研究代理查閱內部文檔;

2、開放域Web QA:真實網絡環境信息獲取;

3、多輪網購:WebShop平臺的復雜決策鏈。

團隊在2目標任務上訓練MEM1 agent,然后在復雜的16目標任務上測試。

MEM1展現出了超越訓練范圍的強大泛化能力,在16目標任務上,MEM1準確率,上下文長度,推理速度三個維度上全方面超過比他更大的模型以及帶有外部記憶模塊的模型。

隨后,研究團隊對MEM1 agent的推理行為進行了定性分析,發現MEM1在處理多輪搜索推理任務時成功展現出了推理與信息整合的雙重能力

記憶方面,MEM1展現出了分問題獨立存儲以及信息更新能力。在推理方面,MEM1能夠掌握自適應的搜索策略,例如拆解子問題,調整關鍵詞查詢,以及任務規劃等等。

MEM1為處理AI Agent長推理上下文這一重大挑戰提供了一個非常有意思的思路。

當下工業界處理上下文仍是以接入外部記憶模塊作為主流方法。但是這種做法通常需要很繁瑣的工程,而且效果難以掌控。

隨著AI Agent端到端強化學習范式的興起,智能體記憶或許可以通過RL的方式讓模型自己來處理。正如MEM1團隊提到的:智能不是讓AI記住一切,而是教會它自己決定應該如何記憶。

論文地址:https://arxiv.org/abs/2506.15841

代碼地址:https://github.com/MIT-MI/MEM1

開源模型:https://huggingface.co/Mem-Lab/Qwen2.5-7B-RL-RAG-Q2-EM-Release

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-06-27 10:10:43

AI模型技術

2025-06-09 09:32:35

2025-08-07 09:16:41

2025-09-24 09:10:24

2025-03-03 09:12:00

2025-10-11 09:23:28

RLPT強化學習預訓練數據

2025-06-25 09:28:38

2017-02-27 11:36:31

阿里

2020-06-30 09:54:30

框架AI開發

2022-04-11 15:30:48

深度學習數據分析

2025-07-25 09:03:24

2020-09-02 10:36:52

機器人人工智能系統

2020-04-15 16:44:38

谷歌強化學習算法

2025-06-20 08:40:32

2025-10-21 09:06:00

2022-11-27 12:50:01

AI算法MIT

2025-05-09 08:40:00

2025-07-22 09:05:00

強化學習AI模型

2025-10-08 10:26:04

2025-11-12 04:10:00

阿里ROLL FlashChatGPT
點贊
收藏

51CTO技術棧公眾號

国产伦精品一区二区三区免费迷 | 日本暖暖在线视频| 国产在线精品视频| 1769国内精品视频在线播放| 国产调教在线观看| gogo久久日韩裸体艺术| 日本久久精品电影| 欧美另类videos| 日韩一二三四| 国产在线精品不卡| 国产成人综合一区二区三区| 黄色一级片在线免费观看| 九色精品91| 亚洲的天堂在线中文字幕| 污片在线免费看| 久久影院午夜精品| 亚洲精品成人少妇| 亚洲精品成人自拍| 欧美孕妇孕交| av午夜精品一区二区三区| 成人av在线天堂| 在线精品免费视| 欧美视频导航| 俺去了亚洲欧美日韩| 波多野结衣 在线| 国产精品一区二区中文字幕| 欧美一区二区在线免费观看| 四季av一区二区| 免费一二一二在线视频| 一个色妞综合视频在线观看| 伊人久久大香线蕉av一区| 免费一级在线观看播放网址| 国产成人高清在线| 91人成网站www| 中文字幕有码视频| 日韩电影免费在线| 国产精品91久久久| 特黄视频免费看| 999亚洲国产精| 欧美精品videosex极品1| 中文字幕电影av| 国产精品国内免费一区二区三区| 国产一区二区三区直播精品电影| 右手影院亚洲欧美| 婷婷激情久久| 亚洲欧美变态国产另类| 97人妻天天摸天天爽天天| 久久国产精品色av免费看| 欧美精品一区视频| 亚洲视频在线播放免费| 农村少妇一区二区三区四区五区| 亚洲第一网中文字幕| 日本69式三人交| 牛牛影视一区二区三区免费看| 亚洲国产精品yw在线观看 | 欧美激情第99页| 久草国产在线观看| 激情婷婷久久| 欧美一级黄色网| 中文字幕69页| 免费观看久久久4p| 成人中文字幕在线观看| 国产免费的av| 成人免费视频视频| 久久精品丝袜高跟鞋| 久热av在线| 国产精品无圣光一区二区| 一区二区三区偷拍| 天堂va在线| 欧美日韩午夜视频在线观看| 黄色av免费在线播放| 成人黄色在线| 欧美一级夜夜爽| 亚洲成av人片在线观看无| 性欧美xxxx免费岛国不卡电影| 亚洲女人天堂成人av在线| 黑人と日本人の交わりビデオ| 天天久久综合| 91国内在线视频| 秋霞av一区二区三区| 久久精品国产亚洲一区二区三区 | 国产av无码专区亚洲av| 成人午夜激情片| 欧美一区二区三区四区夜夜大片 | 国产日产精品一区二区三区四区的观看方式| 亚洲视屏在线播放| 日本中文字幕免费在线观看| 99精品热6080yy久久| 国产精品久久久久999| 国产99对白在线播放| 91热门视频在线观看| 亚洲精品一区二区三区樱花 | 国模私拍视频在线| 国产欧美综合在线观看第十页| 国产三级中文字幕| 自拍一区在线观看| 欧美一区二区三区在线观看视频| 在线看黄色的网站| 91九色精品| 日本一区二区在线播放| 国产熟女一区二区三区四区| 久久久亚洲高清| 吴梦梦av在线| 久久精品女人天堂av免费观看 | av网站无病毒在线| 亚洲午夜久久久久| 亚洲一二三av| 国产a久久精品一区二区三区 | 黑人巨大亚洲一区二区久| 欧美一区二区在线免费观看| 中文字幕第4页| 影音先锋亚洲一区| 91亚洲国产精品| 国产在线自天天| 性做久久久久久| 天堂网成人在线| 欧美肉体xxxx裸体137大胆| 久久久久久亚洲精品中文字幕| 亚洲一区二区三区网站| 久久久久久99久久久精品网站| 日韩精品一区二区免费| 97精品资源在线观看| 亚洲深夜福利在线| 丁香六月婷婷综合| 99视频一区二区| 日本香蕉视频在线观看| 精品久久国产一区| 日韩网站在线观看| 一级全黄裸体免费视频| 久久久精品免费网站| 丰满爆乳一区二区三区| 国产欧美自拍一区| 欧美猛交免费看| 99视频免费看| 亚洲欧美日韩久久| 激情五月婷婷基地| 91欧美国产| 国产精品视频永久免费播放| 国产最新视频在线观看| 亚洲欧洲另类| 久久久综合网站| 中文字幕一区综合| 欧美视频免费看| 中文字幕在线观看亚洲| 一级黄色大片免费| 中文字幕免费一区| 色婷婷一区二区三区av免费看| 国产亚洲一卡2卡3卡4卡新区| 欧亚精品在线观看| 黄色片在线播放| 色88888久久久久久影院野外| 伊人网在线视频观看| 日韩在线卡一卡二| 污视频在线免费观看一区二区三区| 国产 日韩 欧美一区| 这里精品视频免费| 91av久久久| 一级精品视频在线观看宜春院| 亚洲一级片免费观看| 国产精品大片免费观看| 黄色91av| 成人做爰视频www| 精品国产一区二区在线| 国产区精品在线| 亚洲图片自拍偷拍| 午夜一区二区三区免费| 日韩精品久久久久久| 亚洲欧洲日韩精品| 欧美日韩黄网站| 国内精品国产三级国产在线专 | 成人午夜视频网站| 国产美女三级视频| 日韩欧美视频| 成人羞羞视频免费| 午夜裸体女人视频网站在线观看| 8v天堂国产在线一区二区| 黄色一级视频在线观看| 91麻豆福利精品推荐| 三上悠亚av一区二区三区| 68国产成人综合久久精品| 国产一区二区三区免费不卡| 国产私拍福利精品视频二区| 美女国内精品自产拍在线播放| 免费观看的毛片| 在线观看三级视频欧美| 欧美日韩一级大片| 久久久久久久综合色一本| 黄色三级视频在线播放| 一本色道久久综合亚洲精品不卡 | 老司机在线视频二区| 欧美不卡视频一区| 亚洲成熟少妇视频在线观看| 成人免费视频在线观看| 丰满大乳奶做爰ⅹxx视频 | xxxxxx黄色| 奇米四色…亚洲| wwwwww欧美| 欧美高清视频手机在在线| 国产一区免费在线| 成人在线视频www| 国产91精品青草社区| gogo在线观看| 一本色道久久88综合日韩精品| 国产黄色片网站| 欧美在线一二三四区| 日本天堂在线视频| 亚洲视频在线一区二区| 中国女人特级毛片| 成人福利一区二区| 亚洲欧美日韩在线| 午夜时刻免费入口| a在线播放不卡| 日本一二三区在线| 欧美aⅴ一区二区三区视频| 成人网站免费观看入口| 香蕉av一区二区| 亚州欧美一区三区三区在线| 欧美人体视频| 国产不卡一区二区在线观看| 国产中文欧美日韩在线| 国产日韩欧美另类| 精品免费av在线 | 成人国产精品| 青草成人免费视频| av在线加勒比| 欧美福利在线观看| 国产婷婷视频在线| 最近2019好看的中文字幕免费| 日本视频在线观看一区二区三区| 精品日韩欧美一区二区| 午夜老司机福利| 日韩精品一区二区三区四区| 国产99对白在线播放| 欧美一区二区三区在线观看| 一级做a爱片性色毛片| 欧美伊人久久大香线蕉综合69| 一级片视频在线观看| 欧美日韩国产精品一区二区三区四区 | 日韩av自拍偷拍| 麻豆视频观看网址久久| 91香蕉视频污版| 日韩国产精品大片| 国产又粗又长又大的视频| 热久久一区二区| 日本中文字幕精品—区二区| 美女视频一区二区| 午夜免费福利视频在线观看| 蜜臀久久久久久久| 天天操天天干天天做| 国产一区久久久| 野战少妇38p| 波多野结衣一区二区三区 | 国产精品久久久久影视| 影音先锋男人资源在线观看| 中文字幕在线不卡国产视频| 亚洲xxxx3d动漫| 亚洲一二三区在线观看| 日韩av在线天堂| 色素色在线综合| 久久久999久久久| 911精品产国品一二三产区| 国产乱码精品一区二区| 精品国产人成亚洲区| 少妇性bbb搡bbb爽爽爽欧美| 亚洲性视频网址| 成人影院www在线观看| 欧美国产中文字幕| 日韩脚交footjobhd| 国产成人精品视频| 国产精品xnxxcom| 国产一区二区高清不卡| 国产亚洲一卡2卡3卡4卡新区| 一区二区视频在线免费| 黄色av日韩| 老头吃奶性行交视频| 国产一区二区按摩在线观看| 少妇激情一区二区三区视频| 国产日韩欧美一区二区三区乱码| 日本精品在线免费观看| 亚洲va韩国va欧美va精品| 91麻豆精品在线| 日韩视频一区在线观看| 日韩亚洲视频在线观看| 在线日韩第一页| 久久亚洲导航| 国产精品久久久久999| aaa国产精品视频| 欧美连裤袜在线视频| 最新精品国产| 国产精品无码av无码| 国产在线国偷精品免费看| 瑟瑟视频在线观看| 亚洲精品高清在线| 色老头在线视频| 日韩美女视频在线| 成人欧美亚洲| 久久久久久久久中文字幕| 本网站久久精品| 久久www免费人成精品| 午夜精品毛片| 欧美日韩亚洲一| 国产成a人无v码亚洲福利| 亚洲午夜精品久久久久久高潮| 一区二区三区四区不卡在线| 国产天堂第一区| 日韩国产高清视频在线| 制服丝袜中文字幕在线| 国产精品普通话| 亚洲欧美成人vr| 国产一线二线三线女| 久久狠狠亚洲综合| 欧美激情 一区| 大奶在线精品| 国产男人精品视频| 亚洲免费毛片| 国产妇女馒头高清泬20p多| 美国三级日本三级久久99| 老鸭窝一区二区| 午夜欧美视频在线观看| 国产www免费观看| 精品国模在线视频| 国产一区精品福利| 日本高清不卡一区二区三| 亚洲伦伦在线| 污污免费在线观看| 夜夜揉揉日日人人青青一国产精品| 亚洲一卡二卡在线观看| 国产一区二区三区丝袜| 欧美一区 二区 三区| 久久精品欧美| 国产亚洲在线| 人妻激情偷乱频一区二区三区 | 精品无人区乱码1区2区3区在线| 一区二区三区伦理| 亚洲专区中文字幕| 亚洲精品一区二区妖精| 少妇一级淫免费放| 日本一区二区三区高清不卡 | 三级成人在线视频| 三上悠亚ssⅰn939无码播放| 黄色成人在线免费| 网站黄在线观看| 57pao成人永久免费视频| 欧美激情久久久久久久久久久| 免费一级特黄毛片| 97久久精品人人做人人爽50路| 日韩精品――中文字幕| 亚洲精品国产精品国产自| 日韩精品av| 日本一区二区在线| 另类成人小视频在线| 大地资源高清在线视频观看| 3d成人动漫网站| 三级福利片在线观看| 国产手机精品在线| 日韩视频不卡| 丰满少妇高潮一区二区| 在线视频欧美区| 麻豆影视在线观看_| 99精品国产一区二区| 亚洲美洲欧洲综合国产一区| 丰腴饱满的极品熟妇| 欧美性猛交xxxx乱大交退制版 | 97精品伊人久久久大香线蕉| 亚洲a级精品| 欧美wwwwwww| 一区二区三区美女| 婷婷久久久久久| 国产精品日韩在线| 91精品国产自产拍在线观看蜜| 日本人妻一区二区三区| 欧美日韩一区免费| 亚洲麻豆精品| 欧美性videosxxxxx| 久久精品波多野结衣| 日韩黄色高清视频| 久久夜夜久久| 成人免费看片'免费看| 久久久噜噜噜久久中文字幕色伊伊| 国产乡下妇女三片| 欧美大秀在线观看| 自拍自偷一区二区三区| 天天久久综合网| 精品久久中文字幕| 天天影视久久综合| 国新精品乱码一区二区三区18| 日韩在线卡一卡二| 久久97人妻无码一区二区三区| 亚洲精品国产免费| 成人在线视频区| 午夜精品久久久内射近拍高清| 《视频一区视频二区| 日漫免费在线观看网站| 成人网址在线观看| 久久精品电影| 国产在线观看免费视频今夜| 中文字幕精品久久久久| 欧美综合自拍| 天天干天天曰天天操| 欧美视频日韩视频|