精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Memory-R1:強化學習如何大幅提升 LLM 記憶 Agent 能力

譯文 精選
人工智能
大語言模型(LLMs)已成為眾多 AI 突破的核心技術,廣泛應用于聊天機器人、編程助手、問答系統、創意寫作等領域。然而,盡管功能強大,這些模型仍然是無狀態的:每次查詢都是獨立的,無法記住之前的交互內容。受到固定上下文窗口的限制,它們無法在長時間對話或跨會話任務中積累持久記憶,更難以基于復雜的歷史信息進行推理。

譯者 | 劉汪洋

審校 | 重樓

Memory-R1 通過強化學習為 LLM 智能體提供主動且高效的記憶管理能力,實現了最先進的效果。

大語言模型(LLMs)已成為眾多 AI 突破的核心技術,廣泛應用于聊天機器人、編程助手、問答系統、創意寫作等領域。然而,盡管功能強大,這些模型仍然是無狀態的:每次查詢都是獨立的,無法記住之前的交互內容。受到固定上下文窗口的限制,它們無法在長時間對話或跨會話任務中積累持久記憶,更難以基于復雜的歷史信息進行推理。雖然檢索增強生成(RAG)等近期方案試圖通過在提示中附加歷史信息來解決這一問題,但往往產生嘈雜、未經篩選的上下文,要么用大量無關細節淹沒模型,要么遺漏關鍵信息。

來自慕尼黑大學、慕尼黑工業大學、劍橋大學和香港大學的聯合研究團隊提出了 Memory-R1,一個能夠教會 LLM 智能體如何決定記憶內容和使用方式的創新框架。在這個框架下,LLM 智能體學會了主動管理和運用外部記憶,可以自主決定哪些信息需要添加、更新、刪除或忽略,并在回答問題時有效過濾噪音。關鍵創新是利用強化學習(RL)訓練這些行為:系統只需要基于結果的獎勵信號就能學習,大大減少了監督需求,同時在多種模型和任務中都表現出色。

LLMs 為什么難以處理記憶?

設想這樣一個多輪對話場景:用戶在第一輪中說:"我領養了一只叫 Buddy 的狗。"隨后又補充:"我又領養了一只叫 Scout 的狗。"面對這種情況,系統應該替換原有信息、合并兩條信息,還是忽略這次更新?傳統記憶系統往往會判斷失誤,它們可能刪除"Buddy"的記錄并添加"Scout",錯誤地將新信息理解為矛盾而非補充。久而久之,這類系統會失去連貫性,導致用戶知識呈現碎片化而非有機演進。

RAG 系統雖能檢索信息,卻缺乏過濾機制:無關條目會污染推理過程,噪音干擾模型的注意力。而人類的做法截然不同,我們會廣泛搜索信息,然后有選擇地篩選出重要內容。目前大多數 AI 記憶系統都是靜態的,依賴人工設計的啟發式規則來決定記憶內容,而非通過反饋進行學習。

Memory-R1 框架

Memory-R1 的核心架構包含兩個專門的 RL 微調智能體:

  • 記憶管理器:在每輪對話結束后決定執行何種記憶操作(添加、更新、刪除或無操作),動態維護外部記憶庫。
  • 回答 Agent:針對每個用戶問題,檢索最多 60 個候選記憶片段,將其精煉為最相關的子集,然后基于這些過濾后的上下文進行推理并生成答案。

兩個組件均采用強化學習進行訓練——具體使用近端策略優化(PPO)或群體相對策略優化(GRPO)算法——僅將問答準確性作為獎勵信號。這意味著智能體無需人工標注的記憶操作數據,而是通過試錯機制學習,直接優化最終任務性能。

記憶管理器:學習編輯知識

每輪對話結束后,LLM 會提取其中的關鍵事實。記憶管理器隨即從記憶庫中檢索相關條目,并選擇相應的操作:

  • 添加:插入尚未存在的新信息。
  • 更新:當新細節詳細說明或完善先前事實時,將其合并到現有記憶中。
  • 刪除:移除過時或矛盾的信息。
  • 無操作:如果沒有添加相關內容,則保持記憶不變。

訓練:記憶管理器根據回答 Agent 基于新編輯的記憶庫所生成答案的質量來進行更新。如果記憶操作能夠幫助回答 Agent 生成準確回答,記憶管理器就會獲得正獎勵。這種基于結果的獎勵機制避免了對記憶操作進行大量人工標注。

具體案例:當用戶先說"我領養了一只叫 Buddy 的狗",后來又說"我又領養了一只叫 Scout 的狗"時,傳統系統往往會刪除"Buddy"的記錄并添加"Scout",錯誤地將其視為矛盾信息。而經過 RL 訓練的記憶管理器則會更新記憶為:"Andrew 領養了兩只狗,Buddy 和 Scout",從而維持了知識庫的連貫性和成長性。

消融實驗:RL 微調顯著改善了記憶管理,PPO 和 GRPO 都優于基于上下文的啟發式管理器。系統實現了知識的融合貫通,而非割裂分散。

回答 Agent:選擇性推理

對于每個問題,系統使用 RAG 檢索多達 60 個候選記憶。但回答 Agent不是將所有這些都輸入給 LLM,而是首先對候選集進行提煉,只保留最相關的條目,然后再生成答案。

訓練:回答 Agent 也使用 RL 訓練,使用其答案與標準答案之間的精確匹配作為獎勵。這鼓勵它專注于過濾噪音和在高質量上下文上進行推理。

示例:當被問到"John 住在海灘附近還是山區附近?"時,傳統 LLM 受到無關記憶的影響可能輸出"山區"。然而,Memory-R1 的回答 Agent 在回答之前只提取海灘相關的條目,從而得出正確的"海灘"回答。

消融實驗結果:RL 微調顯著提升了靜態檢索的答案質量。記憶精煉(過濾無關記憶)機制進一步提升了性能表現。在更優秀的記憶管理器配合下,收益更為明顯,產生了多重疊加的改進效果。

訓練數據效率

Memory-R1 的訓練非常高效:只用 152 個問答對就能訓練出有效的模型。原因在于智能體能直接從最終結果中學習,不需要大量人工標注的記憶操作數據。這種最小化監督的方式使系統能夠輕松擴展到大規模、真實世界的對話歷史場景。

評估采用的 LOCOMO 基準包含多輪對話(每個對話約 600 輪,平均 26,000 tokens)及相應的問答對,涵蓋單跳推理、多跳推理、開放域問答和時間推理等多個維度——這為測試長期記憶管理能力提供了理想的評估環境。

實驗結果

研究團隊在 LLaMA-3.1-8B-Instruct 和 Qwen-2.5-7B-Instruct 兩個基礎模型上測試了 Memory-R1,并與多個對比基準(LOCOMO、Zep、A-Mem、LangMem、Mem0)進行對比。主要評估指標包括:

  • F1 分數:衡量預測答案與標準答案之間的重疊程度。
  • BLEU-1 分數:評估單詞級別的詞匯相似性。
  • LLM 評判:采用獨立的 LLM 代替人類來評估答案的事實準確性、相關性和完整性。
  • 實驗結果:Memory-R1-GRPO 實現了最佳整體性能,在 LLaMA-3.1-8B 模型上相比 Mem0(此前的最佳基線)實現了 F1 分數 48% 的提升、BLEU-1 分數 69% 的提升,以及 LLM 評判分數 37% 的提升。在 Qwen-2.5-7B 模型上也觀察到了類似的明顯改進。這些改進效果涵蓋各類問題,且在多種模型架構中都能復現。

為什么這很重要

Memory-R1 證明了記憶管理和利用能力是可以習得的,LLM 智能體無需依賴脆弱的啟發式規則。通過采用結果驅動的 RL 方法,該系統實現了:

  • 知識的自動整合,伴隨對話發展而非簡單分割或覆蓋。
  • 有效的噪音過濾,在回答過程中提升事實準確性和推理質量。
  • 高效的學習機制,僅需少量監督即可擴展至真實世界的長期任務。
  • 良好的跨模型泛化性,為下一代智能體式、記憶感知 AI 系統奠定了堅實基礎。

結論

Memory-R1 成功將 LLM 智能體從無狀態限制中解放出來,通過強化學習賦予它們有效管理和運用長期記憶的能力。通過將記憶操作和信息過濾重新定義為 RL 問題,該方法以最小的監督需求和優異的通用性達到了頂尖的性能表現。這意味著 AI 系統正從單純的對話能力邁向具備記憶、學習和推理能力的智能體,為用戶提供更加豐富、持久且實用的 AI 體驗。

常見問題解答

問題1:Memory-R1 相比傳統 LLM 記憶系統有何優勢?

Memory-R1 采用強化學習主動管理記憶,即智能決定信息的添加、更新、刪除或保留。相比靜態的啟發式方法,實現了更加智能的知識整合和更少的信息碎片化。

問題2:Memory-R1如何提升長對話中的答案質量?

回答 Agent 采用"記憶精煉"策略:從檢索到的最多 60 個記憶片段中篩選出與當前問題最相關的內容,相比于簡單地將所有上下文直接輸入模型,這種方式有效減少了噪音干擾并大幅改善了事實準確性。

問題3:Memory-R1 的訓練數據效率如何?

非常高效。Memory-R1 僅使用 152 個問答對就達到了業界領先的性能提升,這得益于其面向結果的 RL 獎勵機制,避免了對每個記憶操作進行昂貴人工標注的需要。

查看論文鏈接。歡迎查看我們的GitHub頁面獲取教程、代碼和筆記

原文標題:Memory-R1: How Reinforcement Learning Supercharges LLM Memory Agents,作者:Asif Razzaq

譯者介紹

劉汪洋,51CTO社區編輯,昵稱:明明如月,一個擁有 5 年開發經驗的某大廠高級 Java 工程師。

責任編輯:姜華 來源: 51CTO內容精選
相關推薦

2024-09-30 14:40:00

AI強化學習框架

2025-06-23 09:09:00

2025-11-07 08:44:38

2025-03-25 09:12:00

LIMAI模型

2025-10-11 04:00:00

2023-04-23 10:12:14

算法強化學習

2025-05-30 04:00:00

IBMRLVRGRPO

2025-05-28 02:25:00

2025-04-09 09:15:00

數據模型AI

2025-04-09 09:41:43

2025-02-25 08:06:05

2025-06-16 08:46:00

2024-09-13 06:32:25

2025-11-10 04:15:00

2025-06-10 11:22:09

強化學習AI模型

2025-04-25 13:34:53

R1DeepSeekAgent

2025-06-23 09:26:24

2025-06-09 09:32:35

2025-03-07 09:24:00

2025-06-05 06:36:17

點贊
收藏

51CTO技術棧公眾號

欧美大片91| 色视频在线观看免费| 亚洲欧美日韩高清在线| 91精品秘密在线观看| 综合在线观看色| 国产嫩草一区二区三区在线观看| 91精品国产高清一区二区三密臀| 日韩在线观看| 亚洲精品电影在线观看| 色婷婷一区二区三区av免费看| 四虎av在线| 国产欧美日韩另类一区| 成人免费看片网站| 激情网站在线观看| 一区二区亚洲精品| 色噜噜狠狠狠综合曰曰曰| 在线看黄色的网站| 亚洲伊人精品酒店| 一本一道久久a久久精品 | 免费欧美视频| 日韩区在线观看| 精品久久久久久中文字幕2017| 丝袜国产在线| 国产精品久久777777| 久久久水蜜桃| 日本韩国免费观看| 国产一区二区看久久| 国产精品久久久久久久久借妻| 精品无码久久久久久久| 亚洲精品极品少妇16p| 亚洲性69xxxbbb| 在线免费观看a级片| 日本一区二区三区播放| 欧美日韩成人激情| 九一精品在线观看| 二吊插入一穴一区二区| 天天av天天翘天天综合网色鬼国产| 国产卡一卡二在线| 在线观看免费网站黄| 国产欧美日韩精品一区| 欧美午夜精品久久久久久蜜| 日韩一区免费视频| 成人国产免费视频| 成人高清在线观看| 亚洲AV无码一区二区三区性| 黄色日韩网站视频| 91精品久久久久久久| 在线观看xxxx| 免费成人美女在线观看.| 国产精品久久久久久久久久| 成人毛片一区二区三区| 日韩高清一级片| 国产成人亚洲综合91精品| 欧美一区二区三区网站| 久久久777| 国产成人avxxxxx在线看| 探花视频在线观看| 首页国产欧美久久| 国产精品色视频| 亚洲一区精品在线观看| 精品亚洲免费视频| 俄罗斯精品一区二区三区| 国产精品久久久久精| 国产美女精品一区二区三区| 91九色视频在线观看| 国产18精品乱码免费看| 99re66热这里只有精品3直播| 精品视频第一区| 久青草国产在线| 国产精品免费网站在线观看| 一区中文字幕在线观看| 手机在线免费av| 岛国视频午夜一区免费在线观看 | 123区在线| 狠狠躁夜夜躁人人爽超碰91| 韩国日本在线视频| 精品亚洲a∨| 日韩精品中文字幕在线不卡尤物| 亚洲一级Av无码毛片久久精品| 欧美黑人做爰爽爽爽| 亚洲欧美日韩直播| 99鲁鲁精品一区二区三区| 欧美日本免费| 国产97在线|亚洲| 国产精品无码AV| 99久久综合精品| 亚洲国产欧美不卡在线观看| 在线xxxx| 色国产综合视频| 人妻换人妻仑乱| 校园春色另类视频| 久久激情视频免费观看| 日本熟妇毛茸茸丰满| 日韩成人精品在线观看| 91在线播放视频| 天天综合天天色| 中文字幕一区二区三区不卡| 亚洲熟妇无码一区二区三区| 国产一区高清| 日韩国产中文字幕| 欧美爱爱免费视频| 蜜桃伊人久久| 99re热精品| 阿v免费在线观看| 五月激情综合色| 午夜不卡福利视频| 免费观看久久av| 欧美激情乱人伦| 亚洲天堂手机版| 51自拍视频在线观看| 免费看日本一区二区| 欧美国产精品va在线观看| 18国产免费视频| 99精品欧美一区二区蜜桃免费| 亚洲一卡二卡三卡| 老司机成人影院| 亚洲风情亚aⅴ在线发布| 午夜三级在线观看| 天堂精品中文字幕在线| 国产一级特黄a大片99| 黄色网在线免费观看| 色综合久久综合网97色综合| 91人妻一区二区| 91成人精品| 国产精品久久久久久久久久久不卡| 亚洲乱码国产乱码精品精软件| 国产精品色眯眯| www.xxx亚洲| 男男gay无套免费视频欧美 | 欧美一区 二区 三区| 亚洲国产成人精品久久| 久久综合综合久久| 国产a视频精品免费观看| 中文字幕av日韩精品| 亚洲爱爱视频| 136导航精品福利| 欧美性猛交xxxx乱大交退制版| 国产免费a级片| 欧美区国产区| 91嫩草国产在线观看| h视频在线免费观看| 91精品在线一区二区| 韩国一级黄色录像| 精品一区二区三区免费毛片爱 | 五十路六十路七十路熟婆| 欧美日韩天堂| 国产精品欧美久久| 91九色国产在线播放| 欧美精品一区二区三区视频| xxxxxx国产| 91蜜桃网址入口| 黄在线观看网站| 国产一区日韩| 国产精品视频公开费视频| av网站无病毒在线| 欧美精品视频www在线观看| 久草视频手机在线| 国产成人精品影视| 久操网在线观看| 亚洲免费福利一区| 国产精品91视频| 午夜小视频在线| 欧美一区二区三区在线看| 欧美精品一区二区蜜桃| 成人免费视频网站在线观看| 久久黄色片视频| 天堂在线视频观看| 天海翼精品一区二区三区| 欧美精品中文字幕一区| 欧美熟妇另类久久久久久不卡| 黄色成人av在线| 国产精品国产三级国产专业不| 久久99精品一区二区三区三区| 黄色网zhan| 亚洲国产欧美日韩在线观看第一区| 欧美尤物巨大精品爽| 在线观看美女网站大全免费| 91精品福利在线一区二区三区| 成人免费毛片东京热| 91小视频在线| 一区二区三区网址| 亚洲视屏一区| 四虎影院一区二区三区| 天堂va欧美ⅴa亚洲va一国产| 2019日本中文字幕| 91xxx在线观看| 亚洲国产另类 国产精品国产免费| 日韩在线播放中文字幕| 国产精品久久久久一区二区三区| 三大队在线观看| 噜噜噜在线观看免费视频日韩| 综合网五月天| 久久av资源| 亚洲综合自拍一区| 视频在线日韩| 色综合男人天堂| 国产高清视频在线播放| 欧美精品一区二区三区高清aⅴ | 欧美a级片免费看| а√天堂在线官网| 不卡的看片网站| 一区二区三区免费播放| 亚洲性感美女99在线| 亚洲午夜久久久影院伊人| 精品视频高潮| 91夜夜揉人人捏人人添红杏| 日本美女一区| 97国产在线观看| 国产黄色在线观看| 中文字幕精品国产| 深夜福利视频一区| 精品久久久久久久人人人人传媒 | 综合欧美国产视频二区| 人人妻人人玩人人澡人人爽| 91精品在线一区二区| 国产免费一级视频| 无吗不卡中文字幕| 欧美精品久久久久性色| 亚洲丝袜制服诱惑| 免费黄在线观看| 久久嫩草精品久久久精品| 久草免费资源站| 国产在线乱码一区二区三区| 中文字幕在线观看第三页| 午夜在线视频观看日韩17c| 国产一级黄色录像片| 午夜激情久久| 视频一区二区三区在线观看| 夜夜春成人影院| 久久久久久久久四区三区| 国产香蕉精品| 国产精品v欧美精品v日韩| 日韩中文字幕无砖| 91福利视频导航| 日韩在线观看视频网站| 亚洲天堂久久| 日本在线观看不卡| 久久av影视| 日韩高清三级| 成人久久一区| 亚洲五月六月| 欧美jizz| 天天综合五月天| 欧美99在线视频观看| 日韩精品福利片午夜免费观看| 亚洲啊v在线观看| 免费成人深夜夜行网站视频| 天天插综合网| 免费在线精品视频| 欧美成人69| 搞av.com| 一区二区三区高清视频在线观看| 国产精品自拍片| 国产精品亚洲产品| 国产激情在线观看视频| 日本人妖一区二区| 亚洲午夜激情影院| 国产精品一区在线| 欧美激情一区二区三区p站| 成人av电影在线观看| 国产伦精品一区二区三区妓女 | 国模少妇一区二区三区| 天堂在线一区二区三区| 国产成人免费视频网站高清观看视频| 三级网站免费看| 成人av电影免费观看| 国产精品揄拍100视频| 国产日韩欧美一区二区三区乱码 | 国产麻豆剧传媒精品国产| 成人国产亚洲欧美成人综合网| 国产精品三级在线观看无码| 国产精品免费视频网站| 久草免费在线观看视频| 精品久久久久久久久中文字幕| 午夜久久久久久久久久影院| 欧美日韩国产综合视频在线观看| 国产精品怡红院| 亚洲精品久久久久久久久久久久久| 你懂的好爽在线观看| 俺去了亚洲欧美日韩| 九色porny视频在线观看| 国产精品久久久久久久久免费看| 电影一区二区三区久久免费观看| 九色91国产| 欧美oldwomenvideos| 精品无码国模私拍视频| 蜜臀av一区二区| 精品国产一区二区三区av性色| 波多野结衣电车| 日韩一卡二卡三卡国产欧美| 深夜福利在线看| 久久精品久久久久久国产 免费| 波多野结衣中文字幕久久| 国产精品久久av| 精品国产影院| 三年中国中文在线观看免费播放| 夜夜夜久久久| 日韩av片免费观看| 久久久激情视频| 国产性70yerg老太| 欧美日韩美女一区二区| 亚洲aⅴ在线观看| 欧美成人h版在线观看| 韩国精品主播一区二区在线观看| 成人羞羞视频免费| 久久国产中文字幕| 色综合av综合无码综合网站| 国产成人综合亚洲91猫咪| 天堂网av2018| 在线一区二区三区四区| 欧美一区,二区| 免费97视频在线精品国自产拍| 精品欧美一区二区三区在线观看 | 久久久com| 欧美韩国一区| 亚洲综合欧美激情| 久久久久久久久久久电影| 亚洲国产综合久久| 日韩精品一区二区三区在线| 久久五月精品| 国产97在线播放| 免费av一区二区三区四区| 久久精品国产sm调教网站演员| 国产伦精品一区二区三区免费迷| 一级黄色录像毛片| 日本久久电影网| 蜜桃视频在线观看网站| 91黑丝在线观看| 秋霞蜜臀av久久电影网免费 | 日韩高清dvd碟片| 精品污污网站免费看| 国产黄在线观看免费观看不卡| 欧美一区视频在线| 亚洲品质自拍| 国产成人亚洲精品无码h在线| 不卡视频一二三| 国产在线观看你懂的| 精品国产乱码久久| 欧美videos另类精品| 91免费看网站| 国产一区二区三区四区老人| 色婷婷狠狠18禁久久| 艳妇臀荡乳欲伦亚洲一区| 2014国产精品| 91精品国产66| 亚洲欧美日韩不卡一区二区三区| 日韩精品电影在线| 日韩精品电影一区二区三区| 欧美在线啊v一区| 欧美高清视频| 91大片在线观看| 在线观看日韩av电影| 一本加勒比波多野结衣| 欧美日韩国产在线| 黑人与亚洲人色ⅹvideos| 国产精品久久77777| 91精品啪在线观看国产18| av在线网站免费观看| 亚洲综合偷拍欧美一区色| 日本激情一区二区三区| 91精品国产91久久久久| 欧美人妖在线| 午夜精品久久久久久久99热影院| 亚洲精品欧美在线| 天堂av一区二区三区| 日韩av电影在线播放| 青青草国产免费一区二区下载| 欧洲美女亚洲激情| 亚洲午夜精品在线| 精品电影在线| 成人欧美一区二区三区在线| 黄色成人91| 日本一级免费视频| 制服丝袜亚洲网站| 极品在线视频| 伊人色综合影院| 成人高清视频免费观看| 69亚洲精品久久久蜜桃小说| 日韩视频第一页| 激情小说一区| 欧美第一页浮力影院| 亚洲一区在线免费观看| 日本在线视频1区| 91视频免费网站| 性伦欧美刺激片在线观看| 男人晚上看的视频| 亚洲第一av在线| 99re久久| 国产免费黄色av| 亚洲欧美日韩在线播放| 青青草在线免费视频| 91情侣偷在线精品国产| 国产亚洲精品v| 日韩福利小视频| 亚洲精品自产拍| 97视频一区| 亚洲黄色片免费看| 一本久久a久久精品亚洲| 日韩精品卡一| 一区二区高清视频|