NeurIPS'25 智能體最新技術即時洞察:6大方向、代表論文、發展趨勢
隨著人工智能尤其是大模型技術的快速發展,基于大型語言模型(LLM)的智能體(Agent)正成為研究和應用的新焦點。NeurIPS 2025 會議收錄了大量圍繞智能體架構設計、多智能體協作、具身推理、安全對齊等方向的前沿工作。這些研究不僅在理論上推動了對智能體行為與認知的建模,也在實際應用中展現出廣泛潛力。本文將系統梳理會議中具有代表性的智能體相關論文,分類綜述其核心貢獻,并總結關鍵技術趨勢。
一、基礎架構與優化方法
該類研究聚焦于提升智能體的基礎架構設計、訓練效率與泛化能力,涵蓋網絡結構優化、分布式訓練、課程學習、元強化學習等方法。
英文標題:1000 Layer Networks for Self-Supervised RL: Scaling Depth Can Enable New Goal-Reaching Capabilities
中文標題:千層網絡的自監督強化學習:通過擴展網絡深度實現新的目標達成能力
作者:Kevin Wang, Ishaan Javali, Micha? Bortkiewicz, Tomasz Trzcinski, Benjamin Eysenbach
摘要:本文研究了通過顯著增加網絡深度(最高達1024層)來提升自監督強化學習在無獎勵、無監督目標達成任務中的性能。在模擬運動與操控任務中,該方法相比基線算法有2倍至50倍的性能提升。
重要貢獻:首次系統驗證了超深網絡在RL中的有效性,證明其不僅能提高成功率,還可引導智能體產生質變的行為模式。
英文標題:A Bayesian Fast-Slow Framework to Mitigate Interference in Non-Stationary Reinforcement Learning
中文標題:用于緩解非穩態強化學習干擾的貝葉斯快慢框架
作者:Yihuan Mao, Chongjie Zhang
摘要:提出一種結合“快策略”與“慢策略”的貝葉斯框架,在任務發生變動時通過機制平衡探索與利用,減少跨任務干擾。
重要貢獻:在非平穩MDP中實現高效跨任務泛化,并引入雙重置機制加快對新任務的適應。
英文標題:Continual Knowledge Adaptation for Reinforcement Learning
中文標題:強化學習中的持續知識適應方法
作者:Jinwu Hu et al.
摘要:提出CKA-RL框架,通過維護任務特定的知識向量池,實現歷史知識的積累與跨任務遷移,緩解災難性遺忘。
重要貢獻:在多個持續學習基準上取得SOTA效果,顯著提升前向傳輸效率。
二、多智能體協作與博弈
多智能體系統在合作、競爭與溝通機制方面的研究日益深入,涵蓋團隊協作、博弈推理、溝通效率等多個維度。
?英文標題:Adaptively Coordinating with Novel Partners via Learned Latent Strategies
中文標題:通過潛在策略學習實現與新伙伴的自適應協作
作者:Benjamin J Li et al.
摘要:構建了一個基于變分自編碼器的策略表示空間,通過對伙伴策略進行在線識別與動態調整,實現高效人機協作。
重要貢獻:在Overcooked環境中顯著優于基線方法,并驗證了在實時人機協作中的有效性。
英文標題:Belief-Calibrated Multi-Agent Consensus Seeking for Complex NLP Tasks
中文標題:面向復雜NLP任務的信念校準多智能體共識尋求機制
作者:Wentao Deng et al.
摘要:提出BCCS框架,通過內部信念校準和最優協作伙伴選擇,提升多智能體在數學推理與問答任務中的共識穩定性。
重要貢獻:在MATH和MMLU任務上準確率提升超過3%,系統共識穩定性顯著增強。
英文標題:Fair Cooperation in Mixed-motive Games via Conflict-Aware Gradient Adjustment
中文標題:通過沖突感知的梯度調整實現混合動機博弈中的公平合作
作者:Woojun Kim, Katia Sycara
摘要:在部分合作、部分競爭的場景中,提出一種梯度調節方法,在優化團隊效用的同時保證個體公平性。
重要貢獻:首次在多智能體強化學習框架中同時優化社會效益與公平性指標。
三、安全、對齊與價值觀建模
隨著智能體廣泛應用,其行為的安全性、價值觀對齊和隱私保護成為關鍵問題。相關研究集中在對抗攻擊、機制設計、價值觀評估等方面。
?英文標題:AgentAuditor: Human-level Safety and Security Evaluation for LLM Agents
中文標題:AgentAuditor:面向LLM智能體的人類水平安全與安全性評估框架
作者:Hanjun Luo et al.
摘要:提出一個訓練無關、基于記憶增強推理的評估框架,用于檢測智能體在逐步決策中的潛在風險。
重要貢獻:構建了涵蓋15類風險、29個場景的ASSEBench基準,評估準確率接近人類水平。
英文標題:Attractive Metadata Attack: Inducing LLM Agents to Invoke Malicious Tools
中文標題:誘人元數據攻擊:誘導LLM智能體調用惡意工具
作者:Kanghua Mo et al.
摘要:發現通過對工具元數據(名稱、描述等)進行黑盒優化攻擊,可誘使智能體高概率選擇惡意工具。
重要貢獻:揭示了智能體系統在元數據層面的脆弱性,在10個場景中攻擊成功率超80%。
英文標題:Distributive Fairness in Large Language Models: Evaluating Alignment with Human Values
中文標題:大語言模型中的分配公平性:評估與人類價值觀的對齊程度
作者:Hadi Hosseini, Samarth Khanna
摘要:通過多選擇問答評估LLM在資源分配任務中是否遵循公平性原則(如無嫉妒性、最大化最小值等)。
重要貢獻:發現當前LLM在分配決策中與人類偏好存在顯著差距,且無法有效利用貨幣進行轉移支付。
四、具身智能與導航系統
具身智能體在物理或虛擬環境中的感知、導航與交互能力是當前的研究熱點,尤其是結合多模態建模與三維空間推理的工作。
英文標題:3DLLM-Mem: Long-Term Spatial-Temporal Memory for Embodied 3D Large Language Model
中文標題:3DLLM-Mem:具身3D大語言模型的長時空記憶機制
作者:Wenbo Hu et al.
摘要:提出一種動態記憶管理模型,通過工作記憶令牌檢索并融合過去觀測中的時空特征,支持智能體在復雜多房間環境中進行長期推理。
重要貢獻:在包含2.6萬條軌跡的3DMem-Bench上,相比基線成功率提升16.5%。
英文標題:BeliefMapNav: 3D Voxel-Based Belief Map for Zero-Shot Object Navigation
中文標題:BeliefMapNav:基于三維體素信念地圖的零樣本目標導航
作者:Zibo Zhou et al.
摘要:通過體素化信念地圖建模目標在空間中的分布,融合語義先驗與實時觀測,實現高效全局導航決策。
重要貢獻:在HM3D、MP3D等基準上取得SOTA,路徑長度加權成功率提升46.4%。
英文標題:EfficientNav: Towards On-Device Object-Goal Navigation with Navigation Map Caching and Retrieval
中文標題:EfficientNav:基于導航地圖緩存與檢索的端側目標導航系統
作者:Zebin Yang et al.
摘要:提出語義感知的記憶檢索與緩存機制,壓縮冗余地圖信息,使得輕量LLM也可支持高效導航。
重要貢獻:在HM3D上成功率提升11.1%,推理延遲降低6.7倍。
五、記憶、推理與知識管理
智能體的長期記憶管理、推理鏈優化與知識復用機制直接影響其執行復雜任務的能力,是當前系統實現“自我進化”的關鍵。
英文標題:A-Mem: Agentic Memory for LLM Agents
中文標題:A-Mem:面向LLM智能體的主動記憶系統
作者:Wujiang Xu et al.
摘要:受Zettelkasten方法啟發,設計了一種通過動態索引與鏈接構建記憶網絡的方法,支持記憶的演化與上下文感知檢索。
重要貢獻:在六個基礎模型上相比現有記憶基線有顯著提升,且代碼已開源。
英文標題:CAM: A Constructivist View of Agentic Memory for LLM-Based Reading Comprehension
中文標題:CAM:基于建構主義理論的LLM閱讀理解記憶模型
作者:Rui Li et al.
摘要:提出一種結構化的記憶組織方案,通過增量聚類與層次化摘要提升長文本理解中的信息提取效率。
重要貢獻:在長文本問答、摘要和事實核查任務中均表現出更高的效率與準確性。
英文標題:Generalizing Experience for Language Agents with Hierarchical MetaFlows
中文標題:通過分層元流程實現語言智能體的經驗泛化
作者:Shengda Fan et al.
摘要:構建層次化經驗樹,將歷史任務解構為可復用的元流程(MetaFlow),在新任務中通過檢索與執行相應流程大幅降低響應成本。
重要貢獻:在AppWorld和WorkBench上任務執行成功率提升超30%,代價顯著降低。
六、應用、基準測試與自動化工具
智能體在實際場景中的應用測試與評估框架日趨重要,涵蓋軟件工程、網絡安全、科學發現、自動化工作流等方向。
英文標題:BountyBench: Dollar Impact of AI Agent Attackers and Defenders on Real-World Cybersecurity Systems
中文標題:BountyBench:AI智能體攻防對現實網絡安全系統的經濟影響評估
作者:Andy Zhang et al.
摘要:構建了包含25個真實系統、40個漏洞獎勵任務的測試平臺,評估智能體在攻擊、防御與補丁任務中的表現。
重要貢獻:首次以經濟價值(美元)量化智能體在網絡安全中的實際作用,Claude 3.7在攻擊任務中達成55%的成功率。
英文標題:AI-Researcher: Autonomous Scientific Innovation
中文標題:AI-Researcher:自主科研創新系統
作者:Jiabin Tang et al.
摘要:提出全自動科研流程框架,涵蓋文獻回顧、假設生成、算法實現與論文撰寫,在Scientist-Bench上達到接近人類的論文質量。
重要貢獻:實現了首個覆蓋科研全流程的自主智能體,在多個AI子領域表現優異。
英文標題:Automated Composition of Agents: A Knapsack Approach for Agentic Component Selection
中文標題:基于背包問題的智能體組件自動組合方法
作者:Michelle Yuan et al.
摘要:將智能體組件選擇建模為背包問題,基于性能、預算與兼容性動態組裝最優系統,在5個基準上優于檢索基線。
重要貢獻:在多智能體系統組合中成功率提升至87%,組件成本降低98.5%。
技術發展趨勢總結
基于上述論文,可提煉出NeurIPS 2025在智能體研究中的主要趨勢:
架構深度化與系統化:智能體模型向更深的網絡結構、更復雜的內存與推理機制發展,以支持長期任務與環境交互。
協作與博弈機制深化:多智能體系統不僅關注團隊效能,也開始納入公平性、信任和動態策略適應等社會維度。
安全與對齊成為核心議題:從紅隊攻擊、元數據安全到價值觀評估,智能體行為的安全性受到廣泛關注。
端側部署與效率優化:輕量化、本地化與緩存技術助力智能體在移動設備與邊緣計算環境中高效運行。
自動化與通用性增強:智能體在科研、編程、網絡安全等領域的應用表明,其自動化和通用問題解決能力正迅速提升。
評估基準日趨嚴謹:出現大量高質量、多模態的測試基準(如3DMem-Bench、ASSEBench、BountyBench),推動研究向可復現、可比較的方向發展。
總體而言,智能體研究正從單一模型能力提升走向復雜系統構建、安全部署與生態化發展,成為AI領域中最具活力與廣泛應用前景的方向之一。
參考資料
鏈接:https://neurips.cc/Conferences/2025
本文轉載自???旺知識??,作者:旺知識

















