從聊天記錄到數(shù)字資產(chǎn):MIRIX 讓記憶可買賣

大家好,我是肆〇柒。當(dāng)下,LLM 智能體在各種復(fù)雜任務(wù)中表現(xiàn)得越來越出色。然而,記憶這一關(guān)鍵要素卻始終制約著 LLM 智能體的進(jìn)一步發(fā)展。在與這些智能體的交互中,我們常常發(fā)現(xiàn)它們難以像人類一樣記住過去的對話、識別模式或根據(jù)以往經(jīng)驗調(diào)整行為。這種“健忘癥”限制了它們在現(xiàn)實世界中的長期可用性,也讓用戶對它們的期待大打折扣。
痛點對比:傳統(tǒng) RAG 的三大健忘瞬間
- 對話一:用戶曾說 “The CEO of Twitter is Linda Yaccarino”,但幾天后詢問 “Who is the CEO of Twitter?” 時,傳統(tǒng) RAG 智能體依賴過時知識錯誤回答 “Elon Musk”。
- 對話二:在 LOCOMO 數(shù)據(jù)集中,對于 “When is Melanie planning on going camping?” 這一問題,傳統(tǒng)方法因?qū)υ捴星昂竺埽ㄔ缙谟媱澟c實際發(fā)生)難以準(zhǔn)確判斷時間。
- 對話三:面對 “Where did Caroline move from 4 years ago?” 這類需要整合多處信息的復(fù)雜問題,傳統(tǒng) RAG 無法有效拼湊分散證據(jù),導(dǎo)致回答錯誤或不完整。
這些痛點凸顯了傳統(tǒng) RAG 的局限性,而由 MIRIX AI 提出的 MIRIX,正是為了解決這些問題。攜六種創(chuàng)新記憶類型與多智能體架構(gòu),為 LLM 智能體的記憶難題帶來了創(chuàng)新的解決方案。它不僅能夠精準(zhǔn)捕捉和存儲豐富的視覺及多模態(tài)體驗,還通過主動檢索機制讓記憶的調(diào)用變得高效和智能。
它能做什么?3 個真實場景
說了這么多,MIRIX 到底能幫你做什么?我們先用三個真實場景感受一下。
場景一:跨平臺個人助理
MIRIX 驅(qū)動的跨平臺個人助理應(yīng)用程序,是你數(shù)字生活的得力助手。它能實時監(jiān)控你的屏幕活動,每 1.5 秒截取一次屏幕圖像,智能去重后,每 60 秒左右更新一次記憶。借助 Gemini API,它實現(xiàn)高效、低延遲的視覺數(shù)據(jù)傳輸,讓你幾乎實時看到記憶更新。你可以在聊天界面中查詢過去的操作細(xì)節(jié)、文件摘要或特定事件背景,智能體都能憑借強大的記憶能力給出準(zhǔn)確答復(fù)。如下圖所示。

聊天窗口
語義記憶以樹結(jié)構(gòu)呈現(xiàn),清晰展示概念關(guān)系;程序性記憶以列表視圖展示任務(wù)步驟,方便你回顧和總結(jié)經(jīng)驗。
比如,一句話對話示例:“上周我在 VS Code 里改了哪個配置讓代碼高亮失效?”
場景二:可穿戴設(shè)備中的智能助手
在可穿戴設(shè)備領(lǐng)域,MIRIX 為智能個人助理注入了新的活力。以人工智能眼鏡為例,配備 MIRIX 系統(tǒng)的設(shè)備能夠自動總結(jié)會議內(nèi)容,提煉關(guān)鍵要點;記住你經(jīng)常訪問的地點,提供精準(zhǔn)導(dǎo)航建議;識別重復(fù)出現(xiàn)的視覺模式,記錄生活中的重要時刻;回溯之前的對話或任務(wù),讓你迅速獲取相關(guān)記憶。它完美契合輕量級、便攜設(shè)備需求,程序性記憶學(xué)習(xí)日常習(xí)慣,語義記憶存儲環(huán)境偏好,情景記憶捕獲時間戳事件,混合存儲設(shè)計巧妙適應(yīng)硬件限制,確保隱私安全的同時節(jié)省設(shè)備存儲空間。鑒于可穿戴設(shè)備硬件約束(limited compute and storage),MIRIX 采用 hybrid on-device/cloud memory management,將知識庫等關(guān)鍵信息本地存儲,資源記憶等大規(guī)模記憶云端調(diào)取,既保障隱私又節(jié)省空間。
比如,一句話對話示例:“我在咖啡店遇到的那個人名片上寫的郵箱是什么?”
場景三:智能體記憶市場中的數(shù)字資產(chǎn)
MIRIX 提出了一個大膽而創(chuàng)新的概念 —— 將個人記憶打造成為一種全新的數(shù)字資產(chǎn)類別。在這個時代,記憶不再僅僅是過去事件的被動記錄,而是成為了可共享、個性化和貨幣化的活躍知識庫。在智能體記憶市場中,用戶可以在記憶社交 / 交易平臺上分享和交換記憶,通過代幣化的方式實現(xiàn)記憶的價值轉(zhuǎn)化。專家社區(qū)聚焦特定領(lǐng)域,集體構(gòu)建專業(yè)知識記憶庫。粉絲經(jīng)濟與約會應(yīng)用為直觀地展示出與名人或網(wǎng)紅數(shù)字人設(shè)互動的新途徑,創(chuàng)造者也迎來了新的商業(yè)機會。
比如,一句話對話示例:“把我上個月研究‘聯(lián)邦學(xué)習(xí)’的完整工作流掛到市場賣 5 美元。”
它怎么做到?—— 拆開瞅瞅
看完這些場景,我們一起來看看 MIRIX 是怎么記住“你上周看過哪份報告” 的?
與需要重訓(xùn) Transformer 結(jié)構(gòu)才能記憶的最新研究不同,MIRIX 采用外掛式多智能體架構(gòu),零侵入、零重訓(xùn),直接兼容 GPT-4、Gemini 等閉源模型,即插即用。接下來我們拆開它的“記憶抽屜”。
記憶分類對照表
人類認(rèn)知模型類型 | MIRIX 記憶組件 | 字段名對照 |
Episodic(情景記憶) | Episodic Memory | event_type、summary、details、actor、timestamp |
Semantic(語義記憶) | Semantic Memory | name、summary、details、source |
Procedural(程序性記憶) | Procedural Memory | entry_type、description、steps |
— | Core Memory | persona、human(包含姓名、愛好等持久信息) |
— | Resource Memory | title、summary、resource_type、content |
— | Knowledge Vault | entry_type、source、sensitivity_level、secret_value |
記憶組件
MIRIX 有六種記憶類型,每種類型的功能和結(jié)構(gòu)各不相同,共同構(gòu)成了其堅實的基礎(chǔ)。這六種劃分參考了認(rèn)知科學(xué)中經(jīng)典的情景、語義、程序記憶模型,既保留人類記憶的抽象層次,又針對 LLM 場景做了工程化擴展。

MIRIX 的六個記憶組件
核心記憶(Core Memory)
核心記憶分為 persona 和 human 塊。persona 塊編碼智能體的個性身份、語氣風(fēng)格以及行為模式,塑造智能體獨特的“人格魅力”;human 塊記錄用戶的持久信息,包括姓名、愛好、生活習(xí)慣等關(guān)鍵屬性。例如,human 塊會存儲 “User’s name is David”“User enjoys Japanese cuisine” 等信息。當(dāng)記憶容量接近上限時,系統(tǒng)會智能觸發(fā)受控重寫過程,去除冗余和過時的信息,確保記憶的緊湊性和相關(guān)性。
情景記憶(Episodic Memory)
情景記憶以結(jié)構(gòu)化方式記錄時間戳事件,涵蓋事件類型、摘要、細(xì)節(jié)、參與者和時間戳等關(guān)鍵字段。例如,當(dāng)你提到一次旅行計劃,情景記憶會記錄提及時間(如 2025-03-05 10:15)、行程安排(user_message 表示這是用戶發(fā)送的消息)、參與人員等信息,為后續(xù)提供跟進(jìn)服務(wù)和提醒事項奠定基礎(chǔ)。
語義記憶(Semantic Memory)
語義記憶專注存儲抽象知識和事實信息,包含名稱、摘要、細(xì)節(jié)和來源等字段。它不局限于特定時間和事件,更注重知識的普遍性和關(guān)聯(lián)性。比如,它會記錄“巴黎是法國的首都”這類地理知識,或“用戶喜歡閱讀科幻小說”這類個人偏好信息,為智能體構(gòu)建豐富全面的知識網(wǎng)絡(luò)。

示例語義記憶的樹形結(jié)構(gòu)
程序性記憶(Procedural Memory)
程序性記憶存儲結(jié)構(gòu)化、目標(biāo)導(dǎo)向的流程,涵蓋工作流程、指南和腳本的類型、目標(biāo)和步驟列表。比如,撰寫商務(wù)報告時,它提供從資料收集到排版的一系列步驟指導(dǎo);學(xué)習(xí)烹飪新菜肴時,給出分步操作流程;在處理差旅報銷時,它會存儲 “how to file a travel reimbursement form” 的詳細(xì)步驟,從收集票據(jù)到提交申請,確保用戶順利完成任務(wù)。

示例程序性記憶的列表視圖
資源記憶(Resource Memory)
資源記憶處理用戶正在使用的完整或部分文檔、腳本或多媒體文件,包含標(biāo)題、摘要、資源類型和內(nèi)容等字段。閱讀研究報告時,它存儲關(guān)鍵章節(jié)和摘要,方便查閱和引用;編輯視頻時,保存素材片段和編輯進(jìn)度,確保多任務(wù)處理或長時間工作中不會丟失成果。
知識庫記憶(Knowledge Vault)
知識庫安全存儲憑證、地址、聯(lián)系信息和 API 密鑰等逐字和敏感信息。通過嚴(yán)格訪問控制機制和敏感度級別設(shè)置,確保高敏感信息的安全性。銀行賬戶信息、私人郵箱密碼等在知識庫中得到最高級別保護,只有經(jīng)過嚴(yán)格授權(quán)驗證,智能體才能在合法必要場景下使用這些信息,有效防止隱私泄露。
主動檢索與檢索設(shè)計
MIRIX 的主動檢索機制解決了現(xiàn)有記憶增強系統(tǒng)中記憶檢索需顯式觸發(fā)的問題。它將檢索過程分為兩個階段。首先,智能體基于輸入上下文生成精準(zhǔn)的當(dāng)前主題;接著,利用該主題從每個記憶組件中檢索相關(guān)記憶,并將結(jié)果注入系統(tǒng)提示中。例如,詢問“誰是 Twitter 的 CEO?”時,智能體判斷主題為“Twitter 的 CEO 信息”,從六個記憶組件中檢索最新記憶內(nèi)容,如對話中提到的 CEO 姓名、相關(guān)新聞報道中的變更記錄等,并整合反饋給用戶。這一過程如下圖所示。

主動檢索演示
為避免模型依賴過時知識錯誤回答問題,主動檢索機制確保回答的及時性和準(zhǔn)確性。檢索到的內(nèi)容會進(jìn)行來源標(biāo)記,讓模型清楚知曉每條信息的內(nèi)容和來源,從而在生成回答時合理引用和整合這些記憶。此外,MIRIX 支持多種檢索功能,如 embedding_match、bm25_match 和 string_match,適用于不同類型的數(shù)據(jù)和查詢需求。例如,基于語義相似度的查詢,embedding_match 能快速找到匹配記憶;基于關(guān)鍵詞精確匹配的場景,string_match 能精準(zhǔn)定位相關(guān)內(nèi)容。MIRIX 正不斷擴展更多檢索策略,以滿足日益多樣化的應(yīng)用場景,確保在各種復(fù)雜情況下都能高效精準(zhǔn)地檢索到所需記憶。
多智能體工作流
與需要重訓(xùn) Transformer 結(jié)構(gòu)才能記憶的最新研究不同,MIRIX 采用外掛式多智能體架構(gòu),零侵入、零重訓(xùn),直接兼容 GPT-4、Gemini 等閉源模型,即插即用。
記憶更新工作流
多智能體架構(gòu)是 MIRIX 靈活應(yīng)對用戶交互復(fù)雜性和異構(gòu)性的關(guān)鍵。在記憶更新工作流中,接收到用戶輸入后,系統(tǒng)首先在記憶庫中全面搜索,初步篩選出可能相關(guān)的信息。然后,元記憶管理器分析這些內(nèi)容,精準(zhǔn)將其路由到相應(yīng)的記憶管理器。這些記憶管理器高效執(zhí)行更新任務(wù),同時避免冗余信息干擾。更新完成后,它們向元記憶管理器匯報,元記憶管理器確認(rèn)所有更新任務(wù)成功完成后,才向用戶發(fā)送更新完成通知。這一過程既保證了記憶更新的準(zhǔn)確性,又提高了更新效率,使系統(tǒng)能夠及時跟上用戶信息的快速變化。這一過程如下圖所示。

記憶更新工作流程
對話檢索工作流
在對話檢索工作流中,聊天智能體收到用戶查詢后,先進(jìn)行粗略檢索,快速掃描所有六個記憶組件,獲取與查詢相關(guān)的高級別摘要信息。然后,它深入分析查詢,判斷哪些記憶組件可能藏有更關(guān)鍵的線索。接下來,聊天智能體選擇合適檢索方法,獲取詳細(xì)結(jié)果,并整合加工,最終形成完整準(zhǔn)確富有邏輯的響應(yīng)呈現(xiàn)給用戶。如果用戶查詢涉及記憶更新,聊天智能體還能直接與相應(yīng)的記憶管理器交互,精準(zhǔn)地對特定記憶組件進(jìn)行更新,確保記憶的時效性和完整性。如下圖所示。

響應(yīng)用戶查詢的工作流程
技術(shù)架構(gòu)
多智能體架構(gòu)的協(xié)作機制
MIRIX 的多智能體架構(gòu)由 8 個智能體組成,包括 1 個 Meta Memory Manager、6 個 Memory Managers 和 1 個 Chat Agent。Meta Memory Manager 起著核心的協(xié)調(diào)作用。當(dāng)接收到用戶輸入后,它會先對輸入內(nèi)容進(jìn)行全面分析,判斷其中的關(guān)鍵信息和記憶需求,然后確定與此輸入相關(guān)的記憶組件,并將任務(wù)精準(zhǔn)地路由到對應(yīng)的 Memory Managers。例如,如果用戶輸入的內(nèi)容涉及一個新的事件描述,Meta Memory Manager 會識別出該內(nèi)容包含事件類型、參與者、時間等關(guān)鍵要素,從而判定其屬于情景記憶的范疇,并將任務(wù)分配給情景記憶管理器,由它來進(jìn)一步處理和存儲該事件信息。這種基于內(nèi)容的動態(tài)任務(wù)分配機制,使得各記憶組件能夠高效地協(xié)作,避免了記憶處理的混亂和冗余。
存儲壓縮技術(shù)的實現(xiàn)
MIRIX 實現(xiàn)了高達(dá) 99.9% 的存儲壓縮,這一成果主要得益于其對原始圖像的處理方式。它不存儲任何原始圖像,而是通過高效的摘要算法對圖像內(nèi)容進(jìn)行提煉和壓縮,僅保留關(guān)鍵的結(jié)構(gòu)化信息。具體來說,在處理用戶屏幕截圖時,MIRIX 會先對圖像進(jìn)行分析,提取出其中的核心內(nèi)容和特征,如圖像中包含的關(guān)鍵物體、文字信息、布局結(jié)構(gòu)等,并將這些信息轉(zhuǎn)化為簡潔的文本描述或數(shù)據(jù)結(jié)構(gòu)進(jìn)行存儲。同時,它還會運用去重策略,識別和過濾掉相似度極高的圖像內(nèi)容,進(jìn)一步減少存儲負(fù)擔(dān)。這種摘要算法與去重策略相結(jié)合的方式,使得 MIRIX 能夠以極小的存儲空間保存大量的多模態(tài)信息,其存儲效率遠(yuǎn)超傳統(tǒng)方法。例如,在實驗中,對于 SigLIP 需要存儲 22.55GB 的圖像數(shù)據(jù),MIRIX 僅需 20.57MB 即可完成存儲,壓縮比達(dá)到了驚人的 949:1。
隱私機制的保障
在可穿戴設(shè)備場景中,MIRIX 的混合存儲設(shè)計充分考慮了隱私保護。對于知識庫記憶中的敏感信息,如用戶的私人聯(lián)系信息、賬戶密碼等,MIRIX 采用了嚴(yán)格的敏感度分級機制。這些高敏感信息會被標(biāo)記為最高敏感度級別,并通過訪問控制機制進(jìn)行嚴(yán)格保護。只有在用戶明確授權(quán)且符合特定的安全策略時,智能體才能訪問這些信息。此外,MIRIX 還將關(guān)鍵信息存儲在本地,而非云端,進(jìn)一步降低了隱私數(shù)據(jù)泄露的風(fēng)險。例如,在知識庫記憶的字段設(shè)計中,包含 sensitivity_level 字段,用于明確標(biāo)識每條信息的敏感程度,從而確保高敏感數(shù)據(jù)不會被隨意檢索和使用。
記憶市場的爭議澄清
針對記憶市場中可能引發(fā)的數(shù)據(jù)權(quán)屬爭議,MIRIX 強調(diào)其技術(shù)的中立性。其隱私基礎(chǔ)設(shè)施包含三層設(shè)計:加密層、權(quán)限控制和去中心化存儲。加密層確保所有記憶數(shù)據(jù)在存儲和傳輸過程中都被加密處理,只有經(jīng)過授權(quán)的用戶和智能體才能解密使用;權(quán)限控制允許用戶精細(xì)地設(shè)置哪些記憶可以共享、交易或限制訪問,用戶對自身的記憶資產(chǎn)擁有絕對的控制權(quán);去中心化存儲則避免了記憶數(shù)據(jù)被集中掌控,降低了數(shù)據(jù)被濫用的風(fēng)險。這種隱私保護機制為記憶市場的健康發(fā)展提供了堅實的基礎(chǔ),確保了用戶在共享和交易記憶時的權(quán)益得到充分保障。
實驗:3 位博士生的 3 萬截圖
為了驗證 MIRIX 的性能,研究者邀請了 3 位博士生參與實驗。他們在日常使用電腦的過程中,通過一個自動化腳本,每秒截取一次屏幕圖像。如果當(dāng)前圖像與上一張圖像相似度超過 99%,則跳過當(dāng)前圖像,以減少重復(fù)數(shù)據(jù)。通過這種方式,研究者收集了大量高分辨率的屏幕截圖,總計超過 3 萬張。這些截圖涵蓋了他們一個月內(nèi)的各種計算機使用場景,包括閱讀文獻(xiàn)、編寫代碼、參加在線會議等。基于這些截圖,構(gòu)建了一個具有挑戰(zhàn)性的多模態(tài)數(shù)據(jù)集,并提出了相關(guān)的問題,用于測試 MIRIX 的記憶能力和推理能力。
實驗設(shè)計:為什么用截圖
傳統(tǒng)文本記憶系統(tǒng)無法處理視覺輸入,而 MIRIX 的一大創(chuàng)新點在于能夠處理多模態(tài)輸入,包括視覺信息。因此,研究者需要驗證 MIRIX 是否能從真實用戶的屏幕活動中提取并記憶信息。為此,他們選擇了 3 位博士生作為參與者,這些博士生分別來自計算機科學(xué)和物理學(xué)領(lǐng)域,自愿運行腳本 1 周到 1 個月不等。數(shù)據(jù)采集的具體過程是:每秒截屏一次,然后通過去重算法(相似度超過 99% 的圖像被跳過),最終得到的截圖數(shù)量分別為:第一位博士生 5,886 張(1 天內(nèi))、第二位博士生 18,178 張(20 天內(nèi))、第三位博士生 5,349 張(超過 1 個月)。總計超過 3 萬張高分辨率截圖。為了構(gòu)建測試問題,每位博士生根據(jù)截圖手寫問答對,研究者再進(jìn)行交叉驗證以確保問題的可答性,最終得到 87 個問題(第一位博士生 11 個、第二位博士生 21 個、第三位博士生 55 個)。
對比基線
為了更全面地評估 MIRIX 的性能,研究者選擇了以下幾種基線方法進(jìn)行對比:
方法 | 說明 | 是否支持多模態(tài) | 存儲方式 |
Gemini | 長上下文基線,將 3,600 張縮略圖一次性輸入模型 | ? | 142–439 MB |
SigLIP | RAG 基線,先用視覺模型檢索 Top50 圖,再讓 Gemini 回答 | ? | 2.8–22.5 GB |
MIRIX | 本文方法,僅存儲結(jié)構(gòu)化記憶 | ? | 7–21 MB |
結(jié)果速覽
一句話總結(jié):MIRIX 用 1% 的存儲空間,換來了 4 倍的準(zhǔn)確率提升。
指標(biāo) | Gemini | SigLIP | MIRIX |
平均準(zhǔn)確率 | 11.7 % | 44.1 % | 59.5 % |
平均存儲 | 237 MB | 15.1 GB | 15.9 MB |
具體實驗結(jié)果如下表所示。

ScreenshotVQA 實驗結(jié)果
深入分析
存儲效率
MIRIX 不存原圖,僅保留結(jié)構(gòu)化摘要,壓縮比達(dá)到 949 : 1(SigLIP vs MIRIX)。具體來說,對于第一位博士生的數(shù)據(jù),SigLIP 存儲大小為 22.55GB,而 MIRIX 僅為 20.57MB;第二位博士生的數(shù)據(jù),SigLIP 存儲為 19.88GB,MIRIX 為 19.83MB;第三位博士生,SigLIP 存儲 2.82GB,MIRIX 僅 7.28MB。這種高效的存儲方式使得 MIRIX 在處理大規(guī)模多模態(tài)數(shù)據(jù)時更具優(yōu)勢。
準(zhǔn)確率提升
相比 RAG 基線,MIRIX 提高了 35% 的準(zhǔn)確率;相比長上下文基線,MIRIX 提升了 410% 的準(zhǔn)確率。MIRIX 的高準(zhǔn)確率得益于其獨特的記憶組件和主動檢索機制。例如,在處理復(fù)雜問題時,MIRIX 能夠快速從多個記憶組件中檢索到相關(guān)信息,并整合后生成準(zhǔn)確的回答。而 Gemini 和 SigLIP 等基線方法由于缺乏這種高效的檢索和整合能力,導(dǎo)致準(zhǔn)確率較低。
錯誤案例
盡管 MIRIX 在總體上表現(xiàn)優(yōu)異,但在某些特定情況下也會出現(xiàn)錯誤。例如,Gemini 由于需要一次性處理大量圖像,容易出現(xiàn)“幻覺”,即生成與問題無關(guān)的回答;SigLIP 在檢索 Top50 圖像時可能會漏掉關(guān)鍵幀,從而導(dǎo)致回答不準(zhǔn)確;MIRIX 由于需要對圖像內(nèi)容進(jìn)行摘要,可能會丟失一些細(xì)節(jié)信息,從而在某些情況下出現(xiàn)誤判。這些錯誤案例為未來的研究提供了改進(jìn)的方向。
LOCOMO 對話實驗
實驗背景
除了多模態(tài)數(shù)據(jù)集的實驗,研究者還對 MIRIX 進(jìn)行了長對話問答實驗。實驗使用了 LOCOMO 數(shù)據(jù)集,該數(shù)據(jù)集包含 10 段對話,每段對話平均有 200 個問題,總共有 26,000 個 token。實驗的設(shè)定是:不直接將對話原文輸入模型,而是僅依靠模型從記憶中檢索到的信息來回答問題。這種設(shè)定更能體現(xiàn)模型的記憶能力和推理能力。
實驗結(jié)果
在 LOCOMO 數(shù)據(jù)集上,MIRIX 的表現(xiàn)非常出色,其平均 J 評分達(dá)到了 85.38%(三次獨立運行的 Overall 區(qū)間為 83.98 % –87.34 %,標(biāo)準(zhǔn)差 1.8 pp,穩(wěn)定性良好),領(lǐng)先最強開源對手 +8.0 pp,逼近 Full-Context 上界(87.5%)。具體來看,在不同類型的問答中,MIRIX 的表現(xiàn)如下:
- 單跳問題 :MIRIX 的準(zhǔn)確率為 85.11%,略低于 Full-Context 方法(88.53%),但遠(yuǎn)高于其他基線方法。這表明 MIRIX 在處理簡單事實查找問題時已經(jīng)非常接近人類水平。
- 多跳問題 :MIRIX 的準(zhǔn)確率為 83.70%,領(lǐng)先第二名 +24 pp。這得益于 MIRIX 的事件整合存儲機制,能夠快速將分散的信息整合成完整的事件,從而更高效地回答多跳問題。
- 開放領(lǐng)域問題 :MIRIX 的準(zhǔn)確率為 65.62%,與基線方法的差距相對較小。這表明在開放領(lǐng)域問題上,MIRIX 的推理能力還有提升空間。
- 時間順序問題 :MIRIX 的準(zhǔn)確率為 88.39%,表現(xiàn)非常出色,這得益于其情景記憶組件對時間戳事件的精準(zhǔn)記錄和推理能力。
具體如下表

LOCOMO 數(shù)據(jù)集的 LLM-as-a-Judge 評分

LOCOMO 數(shù)據(jù)集的 LLM-as-a-Judge 評分(不同運行結(jié)果)
實驗亮點
在 LOCOMO 數(shù)據(jù)集上,MIRIX 的表現(xiàn)令人矚目。它在 200 個問題的全面測試中,以 85.4% 的準(zhǔn)確率逼近人類水平的上限(87.5%)。尤其是在需要整合多處對話信息的多跳問題上,MIRIX 憑借其獨特的事件整合存儲機制,比現(xiàn)有方法高出 24%。這使得它能夠快速調(diào)取完整的事件記憶,而無需在查詢時拼湊碎片化信息。
總結(jié):MIRIX - 讓記憶更高效、精準(zhǔn)與實用
MIRIX 用約 15MB 存儲空間高效記住 3 萬張截圖關(guān)鍵信息,并在對話中準(zhǔn)確回答超 85% 的復(fù)雜問題,實現(xiàn)技術(shù)突破,推動記憶系統(tǒng)從傳統(tǒng)工具向價值創(chuàng)造轉(zhuǎn)變。
不放想象一下,MIRIX 的巨大潛力。比如未來,在會議場景中,配備 MIRIX 系統(tǒng)的智能眼鏡能精準(zhǔn)總結(jié)會議內(nèi)容。同時,用戶可選擇將 “如何在 3 分鐘內(nèi)提煉會議紀(jì)要” 的技巧以匿名方式分享給其他授權(quán)用戶。這種共享是知識的安全流轉(zhuǎn),用戶技能與經(jīng)驗成為他人受益資源,且用戶隱私始終掌控在自己手中。
這種轉(zhuǎn)變預(yù)示著記憶系統(tǒng)未來發(fā)展方向,即從單純的信息存儲檢索轉(zhuǎn)變?yōu)榭晒蚕怼⒖蓮?fù)用的知識資產(chǎn)。MIRIX 通過隱私保護機制確保用戶對自身記憶資產(chǎn)擁有絕對控制權(quán),其隱私基礎(chǔ)設(shè)施包含加密層、權(quán)限控制和去中心化存儲三層設(shè)計。加密層確保記憶數(shù)據(jù)存儲傳輸過程加密,僅授權(quán)用戶和智能體可解密使用;權(quán)限控制允許用戶精細(xì)設(shè)置記憶共享、交易或限制訪問權(quán)限;去中心化存儲避免記憶數(shù)據(jù)集中掌控,降低數(shù)據(jù)濫用風(fēng)險。
MIRIX 為開發(fā)者帶來一種新思路。例如,程序性記憶的 JSON 步驟可轉(zhuǎn)化為可交易技能卡,使高效工作流程成為可購買數(shù)字商品;知識庫記憶則能設(shè)計得像密碼箱一樣,僅由用戶解鎖,讓敏感信息保護機制更直觀可靠。MIRIX 可以讓這些想法逐漸成為現(xiàn)實,重新定義 LLM 智能體記憶能力,平衡隱私保護與價值創(chuàng)造。至此,大家可通過其GitHub頁面下載完整代碼和 Demo 應(yīng)用,體驗這一創(chuàng)新技術(shù)如何改變我們與數(shù)字世界的交互方式(如需體驗見參考資料)。
記憶,是智能體工作的核心部件,也是 AI 與環(huán)境交互的即時體現(xiàn)。































