精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

NeurIPS 2025 Spotlight | 讓檢索、推理真正「合體」的小而強模型,AceSearcher來了

人工智能 新聞
近期,來自埃默里大學,佐治亞理工大學,羅格斯大學,紐約州立大學奧爾巴尼分校,得克薩斯大學西南醫學中心的研究團隊發布 AceSearcher 模型。

如何讓一個并不巨大的開源大模型,在面對需要多步檢索與復雜邏輯整合的問題時,依然像 “冷靜的研究員” 那樣先拆解、再查證、后歸納,最后給出可核實的結論?

近期,來自埃默里大學,佐治亞理工大學,羅格斯大學,紐約州立大學奧爾巴尼分校,得克薩斯大學西南醫學中心的研究團隊發布 AceSearcher 模型,一個讓同一語言模型在推理時兼任 “問題分解者(Decomposer)” 與 “答案求解者(Solver)” 的合作式自博弈框架:它以兩階段訓練(SFT→RFT)為骨架,把 “會拆題、會找料、會整合” 的完整能力鏈擰成了一根繩。更重要的是,這不是單純的 “又一個新模型”,而是一個更優的框架:它把公開的推理數據集引入到檢索增強的訓練流程中,讓模型真正學會如何把推理與檢索結合起來,顯著提升了復雜檢索任務的效果。

在三大類推理密集任務、十個數據集上,它拿到了平均 EM +7.6% 的優勢;32B 版本在文檔級金融推理上,表現可對標 685B 的 DeepSeek-V3,但參數量卻不到 5%。

  • 論文題目:AceSearcher: Bootstrapping Reasoning and Search for LLMs via Reinforced Self-Play
  • 接收會議:NeurIPS 2025 Spotlight
  • 論文地址:https://arxiv.org/pdf/2509.24193
  • 模型 / 數據集地址:https://huggingface.co/AceSearcher
  • 代碼地址:https://github.com/ritaranx/AceSearcher/

把人類的 “拆解 — 檢索 — 整合” 過程,規約成一個統一策略

現實世界的問題,常常不是 “一問一答” 能解決:線索散落在不同文檔,需要多跳檢索把證據拼齊,還要在此基礎上進行跨段落乃至跨文檔的整合推理。傳統 RAG 在這里容易 “卡殼”—— 單步檢索召回不足、推理鏈整合不穩、推理時擴展又容易帶來延遲和資源開銷。

AceSearcher 的關鍵,是把這一流程變成一個單模型、雙角色的閉環:

  • 分解者 :把原始問題  拆成子問題序列 ,以子問題為查詢錨點,逐跳拉起相關證據;
  • 求解者:在每一跳證據上產出中間答案,最終基于匯總出答案

直觀來說:分解更好 → 檢索更準 → 整合更穩 → 答案更對。AceSearcher 就是沿著這條因果鏈,推動  與  在一個模型體內彼此成就。

AceSearcher 到底 “練” 了什么?

一、Stage I:監督微調(SFT)——“打底三件套”:會搜、會拆、會想

SFT 階段的訓練集是一個覆蓋面很廣的混合拼盤(約 18 萬樣本),包括:

1. 上下文豐富的 QA(NQ、SQuAD、DROP、NarrativeQA、Quoref、ROPES、FEVER、TAT-QA),讓模型學會在證據上作答;

2. 問題分解數據(GSM8K、ConvFinQA、StrategyQA),讓模型學會把復雜問題拆成子目標;

3. 鏈式推理數據(GSM8K、TabMWP、IfQA、MathInstruct 等 CoT/PoT),讓模型形成多步推理的 “肌肉記憶”。

這一步的關鍵是:AceSearcher 首次系統地把這些公開的推理數據集,與檢索增強任務結合起來。我們希望模型不僅學會了 “如何在上下文中找答案”,更學會了 “如何通過推理去驅動檢索、再通過檢索去支撐推理”。這是它與以往 RAG 方法最大的差別之一。

二、Stage II:偏好強化微調(RFT)—— 只看 “最終答案”,也能學會 “更好的過程”

現實里很難拿到 “中間推理步驟” 的標注。AceSearcher 的 RFT 階段因此選擇只用最終答案來給獎勵:

  • 在 RAG 環境(HotpotQA、2WikiMHQA、HOVER 等)下, 先采樣 m 條分解路徑,每條分解上  再采樣 條完整解答軌跡;
  • 在上下文推理環境(GSM8K、TabMWP、ConvFinQA 等)下,仍負責拆題, 在表格 / 文本等上下文上生成中間答案與最終解;
  • 獎勵基于 EM(Exact Match) 與格式校驗,對整條軌跡  評分;
  • 把 “最好 vs 最差” 的分解、子問答、最終回答構造成偏好對,合并成 ,用 DPO(Direct Preference Optimization) 類目標訓練;并采用在線多輪迭代(第 t 輪用當前策略采樣偏好,再更新到 t+1 輪)。

實現上還有兩個細節很 “工程”:

  • 控制長度與成本:中間子問題階段只產出短答案,僅在最終回答處生成較完整的推理;
  • 檢索預算分配:總檢索配額 N=15,如果分解出 n 個子問題,則每個子問題最多分到  個文檔,以免某一步 “吃太多”。

在這里,利用推理數據集預訓練出來的 “分解與推理能力”,在 RFT 階段通過最終答案獎勵被進一步固化和遷移到復雜檢索任務,形成了推理與檢索的真正耦合。

評測設置:任務譜系、檢索器與指標

論文的評測覆蓋三個任務大類,共十個公開數據集:

  • 多跳問答:2WikiMHQA、HotpotQA、Bamboogle、MusiQue;
  • 多跳事實驗證:HOVER、ExFEVER;
  • 文檔級金融 / 數學推理:我們使用 DocMath-Eval 基準,包含 TAT-QA、FinQA、MultiHiertt、TAT-HQA 等任務。

實驗結果分析:既要 “能搜會拆”,也要 “合并同類項”

1)多跳 QA / 事實驗證:平均提升 7.6%,小中模型亦能 “越級”

在六個數據集的綜合評測中(2WikiMHQA、HotpotQA、Bamboogle、MusiQue、HOVER、ExFEVER),AceSearcher 全面優于近期開源 / 閉源基線;其中 32B 版本的綜合得分達到 60.7,相對多種強基線的平均 EM 最高可增 7.6%。更具代表性的是 “參數效率”:1.5B 版本已可對標 / 超越 8B 級基線,8B 版本還壓過 70B 級模型。

2)文檔級推理:32B ≈ DeepSeek-V3@685B(≈1/20 參數)

在 DocMath-Eval 上,AceSearcher-32B 的平均準確率與 DeepSeek-V3(685B) 幾乎持平;14B 版本還超過了若干 72B 級模型;8B 相對同量級 / 略大模型亦有明顯優勢。這表明 “分解→檢索→整合” 的統一范式,能在長文檔與表格混合的復雜情境里保持穩健的泛化。

3)效率與可擴展性:少量數據就能 “拉滿”,推理 - 時間性價比更優

  • 數據效率:SFT 只取 2K 樣本時,性能已可追平如 Search-R1 等強基線;RFT 追加 5K 提示后進一步拉升。
  • 推理效率:雖然比分步 RAG 多了 “分解 + 多跳” 的環節,但相對樹搜索 / 思維鏈擴展等方法,AceSearcher 在相近推理時間下拿到更高分。

消融:為什么一定要 “分解 + 求解” 都練?

系統消融清晰地回答了這個問題:

  • 缺哪樣都不行:去掉 RFT 或 SFT,成績明顯下滑;把  替換成 “凍結” 的通用指令模型,也會失分;
  • 只練上下文 QA 遠遠不夠:不加入 “分解 / 推理” 類數據,泛化與魯棒性都不如 “全配方”;
  • RL 替代方案不如在線迭代 DPO 穩定:RAFT、REST-EM、離線 DPO、迭代 SimPO 都做了橫比,AceSearcher 綜合更優。

這背后,其實是  與 的正反饋回路:好分解讓好檢索與好整合更容易發生,而持續的最終答案獎勵又把這條路走得更穩。這再次印證:AceSearcher 的貢獻不僅是性能超越,更是框架的超越。它證明了推理與檢索不該被割裂開來,而應在一個統一框架中通過數據與優化手段協同提升。

未來:從 “固定檢索器” 到 “聯合優化”,再到更廣的任務譜系

AceSearcher 證明了:聰明的訓練范式勝過盲目擴參。接下來有三條有潛力的路:

1. 檢索 - 推理聯合優化:目前檢索器固定,未來可嘗試把檢索表征、重排與生成策略聯學,進一步提高 “證據命中→推理穩定” 的閉環質量;

2. 極端時延場景的工程優化:在保持性能的前提下做緩存、動態步長與早停機制;

3. 更廣任務類型:從多跳問答 / 事實驗證 / 長文檔,擴展到對話式信息采集、實時工具使用、跨模態檢索等。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-11-11 08:45:00

2025-11-07 08:42:00

AI模型數據

2025-10-16 08:57:00

AI模型訓練

2025-10-09 13:19:47

2025-10-23 09:18:46

2025-11-20 08:38:46

2025-05-21 08:47:00

2024-12-17 11:30:00

2025-10-08 11:22:01

2025-11-06 08:50:00

2025-11-12 08:56:15

2023-02-16 13:48:56

模型論文

2024-12-02 13:30:00

2025-06-30 08:36:00

AI模型強化學習

2025-09-26 10:58:03

AI視覺語言模型

2024-12-05 13:00:00

2025-10-17 09:08:05

2025-03-03 07:15:00

模型訓練AI

2025-08-29 09:09:00

AI模型數據
點贊
收藏

51CTO技術棧公眾號

91国内精品久久久| 一区二区三区在线观看免费视频| av香蕉成人| 成人午夜视频在线| 欧美一区二区色| 欧日韩不卡视频| 亚洲精品黑牛一区二区三区| 午夜av一区二区| 日本在线免费观看一区| 姑娘第5集在线观看免费好剧| 牛牛国产精品| 亚洲女成人图区| 亚洲另类第一页| 周于希免费高清在线观看 | 欧美丝袜美女中出在线| 亚洲va韩国va欧美va精四季| 亚洲欧美另类综合| 蜜芽一区二区三区| 欧美激情精品久久久久| 国产免费嫩草影院| 偷拍亚洲色图| 欧美www视频| 在线能看的av网站| 成人美女大片| 夜夜亚洲天天久久| 一本一道久久久a久久久精品91| 天天舔天天干天天操| 激情综合色综合久久| 欧亚精品在线观看| 久久免费公开视频| 亚洲经典一区| 日韩视频免费在线| 精品人伦一区二区| 五月天亚洲一区| 精品国产自在久精品国产| 国产原创精品在线| 欧美日韩五码| 色综合av在线| 欧美精品一区免费| 91av久久| 亚洲一区二区在线免费看| 伊人久久青草| 尤物网在线观看| 久久久影院官网| 韩国一区二区三区美女美女秀 | 国产一区中文字幕| 国产精品久久久久9999| 精品国产xxx| 男人的天堂成人在线| 91精品国产亚洲| 日本少妇xxxx动漫| 亚洲欧洲日本一区二区三区| 欧美激情综合亚洲一二区| 中文字幕在线有码| 影视一区二区| 欧美国产日韩一区二区三区| 青青草原在线免费观看| 亚洲激情中文| 久久久久国产精品免费网站| 久久精品女人毛片国产| 影音先锋中文字幕一区| 久久久这里只有精品视频| 亚洲一区 视频| 99国产精品久久久久久久 | japanese在线视频| 成年人黄视频在线观看| 伊人一区二区三区| 国产高清av在线播放| 成人免费网站观看| 色婷婷精品大在线视频| 国产wwwxx| 国产精品一区二区精品| 欧美一级免费大片| 久久免费精品国产| 九九热线有精品视频99| 国产一区二区黄| 国产精品成人69xxx免费视频| 欧美成人久久| 97免费中文视频在线观看| 欧美日韩一二三四区| 日韩va欧美va亚洲va久久| 国产欧美精品va在线观看| 国产精品国产三级国产普通话对白| 国产一区二区中文字幕| 国产精品成人一区二区三区| 外国精品视频在线观看 | 91精品麻豆| 欧美成人精品3d动漫h| 欧美丰满少妇人妻精品| 精品久久久久中文字幕小说| 成人444kkkk在线观看| 圆产精品久久久久久久久久久| 久久精品一本| 亚洲专区中文字幕| 日本一区视频| 日韩理论片在线| 国产av天堂无码一区二区三区| 亚洲综合在线电影| 欧美videos大乳护士334| 亚洲午夜福利在线观看| 亚洲一区 二区 三区| 97热精品视频官网| 国产精品福利电影| 91蜜桃免费观看视频| 成年人黄色在线观看| 亚洲私拍视频| 日韩一区二区三区四区| 婷婷色一区二区三区| 国产一区欧美| 国产中文字幕日韩| 爽爽视频在线观看| 亚洲人精品午夜| 男人舔女人下面高潮视频| 中文字幕av一区二区三区四区| 一区二区亚洲欧洲国产日韩| 久久中文字幕在线观看| 麻豆国产精品一区二区三区| 精品国产一区二区三区麻豆小说 | 精品999在线观看| 毛片av在线| 色丁香久综合在线久综合在线观看| 精品人妻一区二区三区免费| 国产欧美久久一区二区三区| 国外成人在线直播| 国产视频手机在线观看| 欧美激情一区二区三区蜜桃视频 | 亚洲精蜜桃久在线| 丝袜诱惑一区二区| 欧美精品一区男女天堂| 麻豆天美蜜桃91| 免费在线观看一区二区三区| 蜜桃久久精品乱码一区二区| 欧美aaa免费| 欧美一级黄色录像| 小向美奈子av| 久久成人久久鬼色| 五月天丁香综合久久国产 | 91久久视频| 91麻豆蜜桃| av黄在线观看| 欧美一卡二卡在线观看| 国产色无码精品视频国产| 美国一区二区三区在线播放| 欧美下载看逼逼| 日本乱码一区二区三区不卡| 日韩av综合网| www成人在线| 91视频国产观看| 国产亚洲天堂网| 亚洲瘦老头同性70tv| 国产91ⅴ在线精品免费观看| 色欲久久久天天天综合网| 亚洲午夜精品网| 国产精品成人99一区无码| 亚洲调教视频在线观看| 国产综合动作在线观看| 涩涩av在线| 亚洲视频在线免费看| 青青视频在线免费观看| 欧美激情综合五月色丁香| 香蕉视频禁止18| 欧美激情另类| 亚洲在线www| 欧美hdxxxx| 亚洲精品天天看| 黄色大全在线观看| 国产精品国产三级国产三级人妇| 国产又大又黄又粗又爽| 国产精品99久久| 国产精品视频一区二区三区经| 成人黄色动漫| 中文字幕日本精品| 国产情侣一区二区| 亚洲国产日日夜夜| 插吧插吧综合网| 男女激情视频一区| 青青草综合视频| 欧美色资源站| 国产精品久久久久91| av在线麻豆| 日韩精品久久久久久福利| 国产情侣免费视频| 亚洲蜜臀av乱码久久精品| 日韩免费高清一区二区| 日本免费新一区视频| 久久久久久久久久久久久国产| 国产精品传媒| 国产精品久久久久久搜索| 丝袜美腿av在线| 亚洲视频电影图片偷拍一区| 99热这里只有精品在线| 高跟丝袜欧美一区| 人人澡人人澡人人看| thepron国产精品| 特黄视频免费观看| 亚洲国产片色| 91制片厂免费观看| 亚洲97av| 91美女福利视频高清| 亚洲伊人av| 理论片在线不卡免费观看| 日韩黄色影片| 日韩欧美视频在线| 日韩黄色片网站| 亚洲午夜久久久久久久久电影网| 午夜影院黄色片| www.成人在线| 丰满人妻一区二区三区大胸| 日韩国产成人精品| 日本人体一区二区| 亚洲午夜精品一区二区国产| 色阁综合av| 18国产精品| 成人h片在线播放免费网站| 欧美私密网站| 久久久久免费视频| 麻豆tv免费在线观看| 永久免费毛片在线播放不卡| 日韩一级免费毛片| 欧美一区二区二区| 亚洲综合视频在线播放| 日韩欧美成人精品| 日本五十路女优| 一区二区高清免费观看影视大全| 国产白丝一区二区三区| 久久婷婷国产综合国色天香| 四虎永久免费观看| 国产一区二区精品久久99| 五月婷婷丁香综合网| 久久久久免费| 国产极品粉嫩福利姬萌白酱| 欧美特黄一区| 国产精品av免费观看| 91精品国产91久久久久久密臀| 亚洲免费不卡| 日韩av在线中文字幕| 欧美一区二区三区四区五区六区| 日韩mv欧美mv国产网站| 国产精品一 二 三| 9国产精品午夜| 999在线观看免费大全电视剧| 亚洲色图图片| 成人免费在线视频网址| 少妇高潮一区二区三区99| 国产在线观看精品| 9999在线精品视频| 91在线视频九色| 人人九九精品视频| 99在线观看| 动漫3d精品一区二区三区乱码| a级国产乱理论片在线观看99| 一区中文字幕电影| 国产伦理一区二区三区| 免费萌白酱国产一区二区三区| 国产一级特黄a大片99| 欧美男人操女人视频| 欧洲久久久久久| 成人激情诱惑| 91免费视频黄| 欧美日韩国产成人精品| 男人用嘴添女人下身免费视频| 一本色道88久久加勒比精品| 欧美女人性生活视频| 久久久青草婷婷精品综合日韩| 国产三级三级三级看三级| 久久国产剧场电影| 亚洲成a人无码| 91麻豆福利精品推荐| 成人黄色免费网址| 成人欧美一区二区三区小说| 欧美黑人猛猛猛| 精品美女国产在线| 欧美成人精品网站| 日韩亚洲欧美在线| 婷婷国产在线| 主播福利视频一区| 黑人玩欧美人三根一起进| 91av视频在线播放| 成人在线视频免费| 99在线观看视频| 国产日产精品_国产精品毛片| 一本久道久久综合| 伊人久久成人| 欧美男女交配视频| 成人av手机在线观看| 亚洲а∨天堂久久精品2021| 亚洲另类中文字| 国产精品777777| 91精品国产91久久综合桃花| 亚洲欧洲国产综合| 久久精品国亚洲| 亚洲十八**毛片| 99热在线国产| 狠狠做深爱婷婷综合一区| 91大学生片黄在线观看| 亚洲欧美高清| 亚洲女人在线观看| 久久久精品tv| 久久亚洲国产成人精品性色| 欧美又粗又大又爽| 刘玥91精选国产在线观看| 色偷偷亚洲男人天堂| 免费一二一二在线视频| 亚洲精品免费在线视频| av在线不卡顿| 国产3p露脸普通话对白| 激情文学综合插| 丰腴饱满的极品熟妇| 亚洲一区二区在线观看视频| 亚洲一卡二卡在线观看| 亚洲乱码av中文一区二区| 新版中文在线官网| 国产精品专区一| 亚洲人成伊人成综合图片| 99在线免费视频观看| 激情欧美一区二区| 国产肥白大熟妇bbbb视频| 午夜欧美大尺度福利影院在线看| 国产精品久久777777换脸| 夜夜躁日日躁狠狠久久88av| 校园春色亚洲| 精品久久精品久久| 国产综合自拍| 一个人看的视频www| 亚洲欧美在线高清| 久草热在线观看| 亚洲欧洲一区二区三区在线观看| av中文在线资源| 不卡日韩av| 欧美一区二区三区久久精品| 五月天视频在线观看| 国产精品区一区二区三区| 国产又粗又猛又黄视频| 亚洲男人天堂2023| 极品av在线| 久久精品中文字幕一区二区三区| 精品动漫av| 国产精品久久久久久在线观看| 一区二区三区美女视频| aaa一区二区| 免费成人高清视频| 久久久91麻豆精品国产一区| 日本精品免费视频| 国产一区二区三区精品欧美日韩一区二区三区 | 影视亚洲一区二区三区| 中文字幕 欧美日韩| 亚洲手机成人高清视频| 国产免费一区二区三区最新不卡 | 亚洲色婷婷一区二区三区| 欧美久久久久久蜜桃| 欧美一区二区三区| 成人免费网站在线观看| 婷婷精品进入| 亚洲 自拍 另类 欧美 丝袜| 一区二区三区四区视频精品免费 | 91国内免费在线视频| 特黄特色欧美大片| 妞干网在线免费视频| 国产精品免费人成网站| 国产乱淫片视频| 久久久久久九九九| 欧美激情极品| 黄色国产小视频| 最新成人av在线| 亚洲大尺度视频| 欧美在线www| 欧美亚洲激情| 波多野结衣电影免费观看| 亚洲国产精品久久一线不卡| 四虎影视精品成人| 国产精品自拍网| 欧美午夜a级限制福利片| 懂色av粉嫩av蜜乳av| 欧美日韩一区小说| 青青在线视频| 日本一区视频在线观看免费| 极品少妇xxxx精品少妇偷拍| 黄色激情视频在线观看| 亚洲性无码av在线| 国产在线不卡一区二区三区| 久久国产精品网| 中文字幕精品三区| wwwxxxx国产| 国产97在线|亚洲| 欧美fxxxxxx另类| 欧美图片一区二区| 69av一区二区三区| 涩涩视频在线| 99re8这里只有精品| 91视频com| 国产黄a三级三级看三级| 欧美壮男野外gaytube| 久久精品亚洲人成影院| 国产精品无码网站| 欧美一区二区免费观在线| 桃花岛成人影院| 黄网站色视频免费观看| 国产日韩高清在线| 欧美一区二区三区激情| 国产日韩在线亚洲字幕中文|