精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM記憶管理終于不用“手把手教”了,新框架讓智能體自主管理記憶系統(tǒng)

人工智能 新聞
來(lái)自來(lái)自加州大學(xué)圣地亞哥分校、斯坦福大學(xué)的研究人員提出了一個(gè)創(chuàng)新的強(qiáng)化學(xué)習(xí)框架。

不再依賴(lài)人工設(shè)計(jì),讓模型真正學(xué)會(huì)管理記憶。

來(lái)自來(lái)自加州大學(xué)圣地亞哥分校、斯坦福大學(xué)的研究人員提出了一個(gè)創(chuàng)新的強(qiáng)化學(xué)習(xí)框架——

Mem-α,用于訓(xùn)練LLM智能體自主管理復(fù)雜的記憶系統(tǒng)。

在實(shí)際應(yīng)用中,僅僅依靠prompts和instructions往往不足以覆蓋所有場(chǎng)景:模型經(jīng)常會(huì)遇到不知道如何更新記憶的情況,尤其是當(dāng)記憶系統(tǒng)像MIRIX那樣變得復(fù)雜時(shí)。

不同于MIRIX、MemGPT等依賴(lài)prompts和instructions的傳統(tǒng)方案,Mem-α采用數(shù)據(jù)驅(qū)動(dòng)的強(qiáng)化學(xué)習(xí)方法,讓模型在交互中自主學(xué)習(xí)最優(yōu)記憶管理策略。

如何做到的呢?

讓模型真正學(xué)會(huì)如何管理記憶

上下文窗口限制&現(xiàn)有記憶系統(tǒng)的缺陷

大語(yǔ)言模型(LLM)智能體受限于有限的上下文窗口,這使得外部記憶系統(tǒng)對(duì)于長(zhǎng)期信息理解變得至關(guān)重要。

即使像GPT-4.1這樣支持100萬(wàn)tokens的模型,在長(zhǎng)期交互中也會(huì)隨著窗口增長(zhǎng)而導(dǎo)致成本激增和延遲增加。

當(dāng)前的記憶增強(qiáng)智能體通常依賴(lài)預(yù)定義的指令和工具來(lái)進(jìn)行記憶更新。

然而,語(yǔ)言模型往往缺乏決定存儲(chǔ)哪些信息、如何結(jié)構(gòu)化組織以及何時(shí)更新的能力——尤其是當(dāng)記憶系統(tǒng)變得更加復(fù)雜時(shí)。

這種局限性導(dǎo)致了次優(yōu)的記憶構(gòu)建和信息丟失,嚴(yán)重影響了智能體在長(zhǎng)期交互中的表現(xiàn)。

如上圖所示,在沒(méi)有強(qiáng)化學(xué)習(xí)的情況下,模型在管理記憶系統(tǒng)時(shí)會(huì)出現(xiàn)明顯的錯(cuò)誤:核心記憶沒(méi)有更新導(dǎo)致重要信息丟失,語(yǔ)義記憶中只保存了單一條目造成信息損失。

而經(jīng)過(guò)Mem-α訓(xùn)練后的模型能夠正確地在核心記憶、情景記憶和語(yǔ)義記憶中存儲(chǔ)相應(yīng)信息,實(shí)現(xiàn)全面的記憶管理。

Mem-α 強(qiáng)化學(xué)習(xí)框架

Mem-α的核心貢獻(xiàn)在于將記憶構(gòu)建問(wèn)題轉(zhuǎn)化為一個(gè)可通過(guò)強(qiáng)化學(xué)習(xí)優(yōu)化的序列決策問(wèn)題。

與以往依賴(lài)監(jiān)督學(xué)習(xí)或手工規(guī)則的方法不同,Mem-α讓智能體在處理信息流的過(guò)程中自主探索最優(yōu)的記憶管理策略,并通過(guò)下游任務(wù)表現(xiàn)直接獲得反饋。這種端到端的優(yōu)化方式使得模型能夠?qū)W習(xí)到真正有效的記憶構(gòu)建策略。

任務(wù)設(shè)定(Task Setup)

如上圖所示,Mem-α將記憶構(gòu)建建模為順序決策過(guò)程。智能體依次處理信息塊,決定執(zhí)行哪些記憶操作,處理完成后利用構(gòu)建的記憶系統(tǒng)回答問(wèn)題。

訓(xùn)練過(guò)程中通過(guò)多個(gè)獎(jiǎng)勵(lì)信號(hào)(獲得反饋。被訓(xùn)練的智能體(??)專(zhuān)注學(xué)習(xí)記憶管理策略,固定的大語(yǔ)言模型(??)負(fù)責(zé)根據(jù)記憶回答問(wèn)題。

獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)

Mem-α 采用多維度獎(jiǎng)勵(lì)函數(shù)優(yōu)化記憶構(gòu)建:

  1. 問(wèn)答準(zhǔn)確率():最核心的信號(hào),直接衡量基于記憶回答問(wèn)題的準(zhǔn)確率
  2. 工具調(diào)用格式():確保智能體正確使用記憶操作工具
  3. 記憶壓縮():鼓勵(lì)高效利用記憶空間
  4. 內(nèi)容有效性():通過(guò)LLM評(píng)判器評(píng)估記憶質(zhì)量

最終獎(jiǎng)勵(lì):(實(shí)驗(yàn)發(fā)現(xiàn)效果最佳)。

記憶系統(tǒng)架構(gòu)

為了展示Mem-α框架的有效性,研究團(tuán)隊(duì)設(shè)計(jì)了一個(gè)包含三種記憶類(lèi)型的復(fù)雜記憶系統(tǒng),靈感來(lái)源于認(rèn)知科學(xué)中的記憶分類(lèi)理論:

  1. 核心記憶(Core Memory):存儲(chǔ)用戶(hù)的基本、持久信息(角色、偏好、目標(biāo)),容量512tokens;
  2. 情景記憶(Episodic Memory):記錄帶時(shí)間戳的事件,如 “[9:15]在咖啡館遇見(jiàn)Alice”;
  3. 語(yǔ)義記憶(Semantic Memory):存儲(chǔ)結(jié)構(gòu)化知識(shí)和事實(shí),如專(zhuān)業(yè)知識(shí)、操作指南等。

每種記憶類(lèi)型支持插入、更新、刪除操作。智能體需要學(xué)習(xí)在適當(dāng)時(shí)機(jī)選擇合適的工具和記憶類(lèi)型。

訓(xùn)練數(shù)據(jù)集構(gòu)建

Mem-α的訓(xùn)練數(shù)據(jù)集的構(gòu)建思路來(lái)源于MemoryAgentBench中的四個(gè)維度:

  1. 精確檢索(Accurate Retrieval):從歷史數(shù)據(jù)中提取正確信息以回答查詢(xún),涵蓋單跳和多跳檢索場(chǎng)景
  2. 測(cè)試時(shí)學(xué)習(xí)(Test-Time Learning):在部署期間獲取新行為或能力
  3. 長(zhǎng)期理解(Long-Range Understanding):整合分布在多個(gè)片段中的信息,回答需要全面序列分析的查詢(xún)
  4. 沖突解決(Conflict Resolution):在遇到矛盾證據(jù)時(shí)修訂、覆蓋或刪除先前存儲(chǔ)的信息

本研究聚焦于前三個(gè)維度,排除了沖突解決維度。這是因?yàn)槟壳叭狈φ鎸?shí)的評(píng)估基準(zhǔn)——現(xiàn)有的沖突解決數(shù)據(jù)集主要是合成的,未能充分捕捉真實(shí)世界的復(fù)雜性。

研究團(tuán)隊(duì)收集并整理了來(lái)自不同源頭的八個(gè)數(shù)據(jù)集,處理到統(tǒng)一的范式,最后構(gòu)造了一個(gè)完善的數(shù)據(jù)集并保證與MemoryAgentBench的測(cè)試集沒(méi)有交織,涵蓋了以上的前三個(gè)維度進(jìn)行訓(xùn)練。

實(shí)驗(yàn)結(jié)果

主實(shí)驗(yàn):性能與泛化能力

Mem-α在30k tokens上訓(xùn)練,在驗(yàn)證集(驗(yàn)證集也是<30k tokens的)上的效果如下:

在測(cè)試集上的效果如下:

四個(gè)關(guān)鍵發(fā)現(xiàn)

  1. 全面超越現(xiàn)有方法:在所有任務(wù)上顯著優(yōu)于基線(xiàn)。在MemoryAgentBench上,精確檢索(AR)和長(zhǎng)期理解(LRU)任務(wù)尤其突出,證明了對(duì)未見(jiàn)分布的強(qiáng)泛化能力。
  2. 高效記憶壓縮:相比Long-Context和RAG-Top2,記憶占用減少約50%的同時(shí)保持更優(yōu)性能。在BookSum和InfBench-Sum上壓縮效果更佳,驗(yàn)證了語(yǔ)義壓縮機(jī)制在性能和效率間的平衡。
  3. 結(jié)構(gòu)化架構(gòu)的必要性:扁平記憶基線(xiàn)(MEM1、MemAgent)使用單段落表示,性能明顯受限,凸顯了非結(jié)構(gòu)化記憶在復(fù)雜信息處理中的不足。這驗(yàn)證了分層記憶設(shè)計(jì)和強(qiáng)化學(xué)習(xí)優(yōu)化策略的有效性。
  4. 極強(qiáng)的長(zhǎng)度泛化:訓(xùn)練時(shí)僅使用平均<30K tokens 的文檔,成功泛化到超過(guò)400K tokens的文檔(MemoryAgentBench 多文檔數(shù)據(jù)集最長(zhǎng)達(dá)474K),展現(xiàn)了訓(xùn)練框架對(duì)極端長(zhǎng)度外推的魯棒性。

消融實(shí)驗(yàn):性能與泛化能力

實(shí)驗(yàn)對(duì)比了Qwen3-4B在強(qiáng)化學(xué)習(xí)訓(xùn)練前后的表現(xiàn)。訓(xùn)練前,模型在使用復(fù)雜記憶系統(tǒng)時(shí)表現(xiàn)不佳,平均準(zhǔn)確率僅為38.9%,且經(jīng)常出現(xiàn)工具使用錯(cuò)誤。

經(jīng)過(guò)Mem-α訓(xùn)練后,同一模型的性能提升到64.2%,展現(xiàn)出正確的記憶管理行為。

Mem-α證明了當(dāng)涉及LLM智能體的記憶管理時(shí),學(xué)習(xí)勝過(guò)工程。

傳統(tǒng)上被視為需要精心工程化的系統(tǒng)組件,實(shí)際上可以通過(guò)端到端的學(xué)習(xí)得到優(yōu)化,未來(lái),能夠構(gòu)建更智能、更自適應(yīng)的AI系統(tǒng)。

論文鏈接:https://arxiv.org/abs/2509.25911

代碼倉(cāng)庫(kù):https://github.com/wangyu-ustc/Mem-alpha

開(kāi)源模型:https://huggingface.co/YuWangX/Memalpha-4B

訓(xùn)練數(shù)據(jù)集:https://huggingface.co/datasets/YuWangX/Memalpha

測(cè)試數(shù)據(jù)集: https://huggingface.co/datasets/YuWangX/Memalpha-Memoryagentbench

責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2025-07-29 00:00:00

LLM上下文窗口系統(tǒng)

2025-11-06 08:54:00

AI模型系統(tǒng)

2025-05-12 02:50:00

2024-07-12 14:07:04

2025-11-13 17:35:55

AIHaluMemMem0

2025-06-03 08:32:00

2025-08-08 14:06:48

MemToolLLM智能體

2025-08-29 07:47:54

2025-09-18 10:10:31

2022-09-14 17:12:15

flowable源碼DEMO

2009-11-06 10:44:31

Visual Stud

2025-08-08 02:15:00

2020-11-10 09:00:00

JavaMule ESB開(kāi)發(fā)

2025-10-27 01:11:00

2025-11-07 08:44:38

2025-09-12 13:32:48

2025-06-23 09:26:24

2009-10-21 10:47:03

Siliverligh

2010-08-18 09:15:45

路由器網(wǎng)絡(luò)診斷

2010-07-07 10:24:46

Python多線(xiàn)程
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

日韩视频免费播放| 国产欧美最新羞羞视频在线观看| 国产艳妇疯狂做爰视频| zzzwww在线看片免费| 97se亚洲国产综合在线| 7777kkkk成人观看| 色www亚洲国产阿娇yao| aaa国产精品| 一本久道久久综合中文字幕| 日韩av电影免费在线| 国产成人毛毛毛片| 噜噜噜91成人网| 欧美另类极品videosbestfree| 久久久久国产精品区片区无码| 中文字幕亚洲高清| 色综合综合色| 欧美成人免费网站| 成人一区二区三| 美足av综合网| 中文字幕在线不卡| 久久久久久国产精品mv| 99久久精品日本一区二区免费| 99精品视频免费全部在线| 日韩一区二区三区xxxx| 亚洲专区区免费| 91精品啪在线观看国产手机| 欧美日韩精品福利| 日本午夜激情视频| 伊人影院在线视频| 国产精品久久久久久一区二区三区| 精品国产电影| www.99视频| 激情都市一区二区| 日韩美女福利视频| 午夜精品久久久久久久久久久久久蜜桃 | 青青一区二区| 精品免费99久久| 日韩av自拍偷拍| 日韩电影免费观看高清完整版在线观看 | 亚洲欧美国产不卡| 加勒比一区二区三区在线| 成人97人人超碰人人99| av免费观看久久| 国产麻豆免费观看| 久88久久88久久久| 国产一区私人高清影院| 青娱乐在线免费视频| 久久一区中文字幕| 日本成人黄色片| 六月丁香激情综合| 久久精品五月| 国产成人拍精品视频午夜网站| 好吊妞视频一区二区三区| 亚洲人体大胆视频| 91精品国产99久久久久久| 国产精选第一页| 亚洲欧洲日本一区二区三区| 97视频国产在线| 国产精品午夜影院| 免费看黄裸体一级大秀欧美| 热99在线视频| 姑娘第5集在线观看免费好剧| 天堂久久久久va久久久久| 日韩av不卡电影| 国产性生活视频| 日韩av电影天堂| 国产精品免费在线免费| 在线观看免费黄色小视频| 久久国内精品视频| 亚洲自拍偷拍视频| 日韩有码第一页| 91亚洲精品乱码久久久久久蜜桃| 欧美日韩大片一区二区三区| www.亚洲.com| 亚洲色图第一区| 男女日批视频在线观看| 日本不卡网站| 欧美色视频在线观看| 国产女同无遮挡互慰高潮91| 国产成人夜色高潮福利影视| 亚洲精品视频在线观看视频| 黄色国产在线播放| 欧美午夜一区| 欧美中文在线免费| 91tv国产成人福利| 成人v精品蜜桃久久一区| 欧美一区1区三区3区公司| 在线免费av网站| 亚洲成a人在线观看| 那种视频在线观看| 国产美女亚洲精品7777| 亚洲精品videossex少妇| 最近中文字幕免费视频| 久久精品影视| 欧美一区二区三区图| 亚洲专区第一页| av网站免费线看精品| 亚洲 日韩 国产第一区| 宅男在线观看免费高清网站| 色香蕉久久蜜桃| 中文写幕一区二区三区免费观成熟| 特黄特色欧美大片| 欧美成人免费观看| 精品国产一区二区三区四| 韩国一区二区在线观看| 免费成人av网站| 少妇视频在线| 欧美色男人天堂| 亚洲av成人片色在线观看高潮| 色综合狠狠操| 欧美影院在线播放| 精品国产伦一区二区三| 国产三级精品视频| 国产免费黄色小视频| 开心久久婷婷综合中文字幕 | 黄网站在线观看| 亚洲综合网站在线观看| 天天干天天操天天玩| 日韩精品欧美大片| 欧美福利小视频| 在线免费观看视频网站| 久久女同性恋中文字幕| 大陆av在线播放| 国产精品一区二区精品视频观看 | 国产aⅴ激情无码久久久无码| 欧美三级黄美女| 国产日韩欧美在线| 超碰国产在线| 91国产丝袜在线播放| 欧美肉大捧一进一出免费视频| 99精品在线观看| 国产精品日韩av| 激情在线视频| 色菇凉天天综合网| 性久久久久久久久久| 亚洲三级观看| 国产精品久久久一区二区三区| 成人福利网站| 欧美一区二区在线免费播放| 国产精品视频看看| 免费一级片91| 先锋影音欧美| 免费成人高清在线视频| 少妇av一区二区三区| 蜜臀99久久精品久久久久小说| 91蜜桃免费观看视频| 日本在线xxx| 麻豆精品99| 97avcom| 天天影院图片亚洲| 午夜久久久久久久久| 亚洲香蕉中文网| 99国产精品| 精品国产乱码久久久久久丨区2区| bl在线肉h视频大尺度| 亚洲国产精品成人精品| 日韩免费视频一区二区视频在线观看| 99久久精品免费| 国产超级av在线| 国产成人精品三级高清久久91| 日本中文字幕久久看| www免费网站在线观看| 欧美精品v国产精品v日韩精品 | 欧美在线你懂的| 91精品国自产在线| 精品写真视频在线观看| 影音先锋男人的网站| 中文久久电影小说| 81精品国产乱码久久久久久| 青青草免费在线| 欧美性生交片4| 午夜成人亚洲理伦片在线观看| 韩国欧美一区二区| 欧美日韩福利在线| 国产欧美一区| 91久久在线播放| sm久久捆绑调教精品一区| 亚洲欧美制服综合另类| 一级黄色片免费| 一区二区三区欧美激情| 国产草草浮力影院| 麻豆极品一区二区三区| 永久免费看av| 中文字幕中文字幕精品| 91精品国产自产在线观看永久| 羞羞视频在线观看不卡| 日韩福利在线播放| 国产伦精品一区二区三区四区 | youjizz在线视频| 国产精品久久久久久久第一福利| 永久看看免费大片| 久久精品中文| 黄色成人在线免费观看| 国产精品免费大片| 亚洲一区二区久久久久久久| 在线观看特色大片免费视频| 久久久精品久久久久| 四虎影视在线观看2413| 日韩一二三区视频| 在线观看亚洲黄色| 亚洲不卡一区二区三区| 美女网站视频色| 久久免费偷拍视频| 中文字幕1区2区| 人禽交欧美网站| 日本少妇高潮喷水视频| 午夜久久免费观看| 日本精品视频一区| 成人爽a毛片| 成人中心免费视频| 亚洲播播91| 久久人91精品久久久久久不卡| av在线播放网| 精品在线观看国产| 午夜精品久久久久久久91蜜桃| 欧美午夜理伦三级在线观看| 日本少妇久久久| 亚洲精选免费视频| 国产精品视频看看| 欧美国产精品一区二区三区| 国产精品久久无码| 大白屁股一区二区视频| 欧美国产日韩在线视频| 蜜桃av一区二区| 久草在在线视频| 免费一区视频| 久久综合色视频| 99视频一区| 老子影院午夜伦不卡大全| 婷婷亚洲最大| 亚洲三区在线观看| av中字幕久久| 色之综合天天综合色天天棕色| 欧美性生活一级片| 国产日韩久久| 福利在线一区| 国产精品国模大尺度私拍| 国产视频网站一区二区三区| 国产精品视频大全| 123成人网| 国产精品亚洲欧美导航| 国产91亚洲精品久久久| 国产精品稀缺呦系列在线| 欧美成人aaa| 国产精品免费小视频| 久久天堂影院| 91免费看国产| 欧美日韩中出| 成人在线看片| 成人影院中文字幕| 精品视频在线观看| 蜜桃tv一区二区三区| 欧美日韩大片一区二区三区| 国产91一区| 亚洲乱码国产乱码精品天美传媒| 欧美熟乱15p| 一本一道久久a久久综合精品| 日本电影一区二区| eeuss中文| 国语精品一区| 日本免费黄视频| 免费成人av在线播放| 亚洲一区二区福利视频| 国产盗摄一区二区三区| 一级黄色免费视频| 26uuu亚洲综合色| a资源在线观看| 亚洲欧美日韩综合aⅴ视频| 加勒比av在线播放| 欧美日韩中文字幕在线视频| 精品国产乱子伦| 欧美剧情片在线观看| 亚洲av无码乱码国产麻豆| 亚洲国产精品大全| 成人在线免费公开观看视频| 超在线视频97| 毛片在线网站| 国产日韩精品在线观看| 高清日韩欧美| 手机看片福利永久国产日韩| 亚洲精品成人| 精品中文字幕av| 久久精品999| 黄色网址在线视频| 中文字幕av一区二区三区高| 日日骚一区二区三区| 欧美日韩一区二区精品| 国产又粗又猛又黄| 精品国产电影一区二区| 国自产拍在线网站网址视频| 久久综合电影一区| 在线一区av| 91亚色免费| 精品国产一区一区二区三亚瑟| 777久久精品一区二区三区无码| 国产亚洲在线| 善良的小姨在线| 久久久精品黄色| 久草视频中文在线| 欧美性感一区二区三区| 女人18毛片一区二区三区| 中文字幕欧美精品在线| 僵尸再翻生在线观看免费国语| 国产欧美精品一区二区三区-老狼| 精品国产乱子伦一区二区| 一区二区成人国产精品 | 91成人在线播放| 成人免费91| 色播亚洲婷婷| 国产欧美不卡| avtt中文字幕| 国产精品久久久久久久久搜平片| www日韩精品| 日韩欧美精品三级| 欧美高清视频| 国产不卡视频在线| 欧美变态挠脚心| 久久手机在线视频| 精品在线你懂的| 无码人中文字幕| 色天使久久综合网天天| 天堂成人在线观看| 欧美夫妻性生活xx| 国产午夜亚洲精品一级在线| 亚洲韩国在线| 日韩中文字幕av电影| 男人天堂av电影| 黑人巨大精品欧美一区二区三区| 囯产精品久久久久久| 久久伊人色综合| 亚洲国产一区二区久久| 亚洲精品在线免费| 日韩精品一区第一页| 一级黄色片大全| 色婷婷精品久久二区二区蜜臂av| 五月婷婷伊人网| 97婷婷大伊香蕉精品视频| 超碰成人在线观看| 成人短视频在线观看免费| 黄一区二区三区| 人人澡人人澡人人看| 欧美日韩高清一区| 日本视频在线观看| 成人观看高清在线观看免费| 亚州av乱码久久精品蜜桃| 国产性生活一级片| 亚洲免费色视频| 午夜精品在线播放| 欧美精品www| 久久悠悠精品综合网| 欧美日韩黄色一级片| 91免费看`日韩一区二区| 无码人妻丰满熟妇区五十路| 亚洲一区二区久久久| 日本成人福利| 正在播放一区| 国产精品白丝av| 国产精品美女毛片真酒店| 亚洲国产成人一区| 成人香蕉视频| 一本一生久久a久久精品综合蜜 | 国产特级黄色录像| 一本大道久久a久久综合| 精品影院一区| 成人国产精品一区| 影音先锋在线一区| 国产精品无码一区二区三区免费| 狠狠色狠色综合曰曰| 激情在线视频| 91亚洲精品在线| 在线免费观看欧美| 欧美特级黄色录像| 欧美日韩国产电影| 18aaaa精品欧美大片h| 欧美日韩一区在线视频| 国内精品在线播放| 国产成人亚洲精品自产在线| 亚洲人成网站免费播放| 国产在线不卡一区二区三区| 欧美一级视频免费看| 欧美国产欧美亚州国产日韩mv天天看完整| 国产露脸无套对白在线播放| 97精品伊人久久久大香线蕉| 成人激情免费视频| 成人啪啪18免费游戏链接| 在线视频一区二区三| caopeng在线| 欧美精品尤物在线| 国产一区在线看| 男人日女人网站| 久久伊人色综合| 国产麻豆精品久久| 欧美日韩一区二区区| 一本在线高清不卡dvd| 成人在线免费看黄| 欧美亚洲免费高清在线观看| 国产真实乱子伦精品视频| 精品人妻无码一区二区性色| 欧美日韩国产999| 成人嘿咻视频免费看|