精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

RAG長上下文加速解碼策略-meta基于RAG的解決思路淺嘗（REFRAG）原創(chuàng)

大模型自然語言處理

發(fā)布于 2025-9-9 09:44

瀏覽

0收藏

前文在??RAG常見13種分塊策略大總結(jié)（一覽表）???提到，分塊策略在RAG中至關(guān)重要，目的是提高效率、相關(guān)性和上下文保持。但也會帶來冗余。引發(fā)長上下文 RAG 應用的效率痛點：

在 RAG 等依賴外部知識的任務(wù)（如多輪對話、長文檔總結(jié)）中，LLMs 需要將檢索到的大量段落拼接為長上下文輸入，但這會引發(fā)兩大問題：

高延遲與高內(nèi)存消耗：長上下文需占用大量鍵值緩存（KV Cache），且生成第一個token的時間（TTFT，Time-to-First-Token）隨上下文長度呈二次方增長，后續(xù)token生成時間（TTIT）呈線性增長，導致系統(tǒng)吞吐量顯著下降，難以滿足Web級檢索等低延遲場景需求。
冗余計算嚴重：RAG 上下文由多個檢索段落拼接而成，但其中僅小部分與查詢直接相關(guān)；且檢索段落因多樣性或去重處理，語義相似度極低，形成“塊對角注意力模式”（即不同段落間的交叉注意力幾乎為零）?，F(xiàn)有 LLM 解碼時會對整個上下文進行全量計算，而這些與查詢無關(guān)的段落計算大多是不必要的。

下面看下meta的解決思路/目標：在不損失 RAG 任務(wù)性能（如回答準確性、困惑度）的前提下，通過針對性優(yōu)化 RAG 解碼過程，大幅降低延遲（尤其是 TTFT）和內(nèi)存消耗，同時擴展 LLM 的有效上下文窗口。

模型架構(gòu)

該模型由一個僅解碼器的LLM（LLaMA）和一個輕量級編碼器模型（Roberta ）組成。

RAG長上下文加速解碼策略-meta基于RAG的解決思路淺嘗（REFRAG）-AI.x社區(qū)

REFRAG架構(gòu)：輸入上下文被分塊，并由輕量級編碼器處理以生成塊嵌入，這些嵌入可預先計算以實現(xiàn)高效重用。一個輕量級強化學習策略決定擴展少數(shù)塊。這些塊嵌入與問題輸入的 token 嵌入一起送入解碼器。

REFRAG的解碼過程分為預處理（離線/在線） 和生成（在線） 兩個階段，完整流程如上。

階段1：上下文預處理

RAG長上下文加速解碼策略-meta基于RAG的解決思路淺嘗（REFRAG）-AI.x社區(qū)

階段2：解碼器生成（帶動態(tài)擴展）

將“主輸入token嵌入（（用戶的核心輸入，如查詢q）） + 壓縮塊嵌入（RAG 檢索到的長上下文）”作為解碼器輸入，生成答案；同時通過RL策略動態(tài)擴展關(guān)鍵塊，避免壓縮導致的信息丟失：

解碼器輸入構(gòu)造
解碼器接收兩類輸入的拼接序列：

RAG長上下文加速解碼策略-meta基于RAG的解決思路淺嘗（REFRAG）-AI.x社區(qū)

RL動態(tài)塊擴展
并非所有塊都適合壓縮（如與查詢強相關(guān)的塊壓縮后可能丟失關(guān)鍵信息）。REFRAG通過輕量級RL策略，在解碼前或解碼中決定：

a.對低信息塊：保留壓縮嵌入e_i^cnk，減少計算；

b.對高信息塊：替換為原始塊的token嵌入（即“擴展”），確保信息完整。
RL策略以“下一段預測的困惑度（Perplexity）”為負獎勵，學習選擇最優(yōu)擴展塊，且擴展不破壞解碼器的自回歸特性（可在上下文任意位置進行）。

RAG長上下文加速解碼策略-meta基于RAG的解決思路淺嘗（REFRAG）-AI.x社區(qū)

3.答案生成解碼器基于處理后的輸入序列生成答案： RAG長上下文加速解碼策略-meta基于RAG的解決思路淺嘗（REFRAG）-AI.x社區(qū) ，生成過程與原生LLM完全一致，無需修改解碼器架構(gòu)。

訓練方法邏輯概述

REFRAG 不修改基礎(chǔ) LLM 解碼器架構(gòu)，通過 “預訓練 + 微調(diào)” 讓解碼器學會理解和利用編碼器生成的壓縮塊嵌入。

對齊階段：通過 “重建任務(wù)” 讓編碼器生成的塊嵌入能準確還原原始上下文，同時讓投影層將塊嵌入映射到解碼器兼容的維度（解決 “壓縮后信息丟失” 問題）。
優(yōu)化階段：通過 “課程學習” 降低訓練難度，讓模型從單塊重建逐步過渡到多塊處理，避免直接訓練長序列導致的優(yōu)化困難（解決 “多塊壓縮難以收斂” 問題）。
適配階段：通過 “RL 選擇性壓縮” 動態(tài)決定哪些塊保留原始 token（擴展）、哪些用壓縮嵌入（壓縮），在保證性能的前提下最大化效率（解決 “全量壓縮可能損失關(guān)鍵信息” 問題）。

實驗

RAG長上下文加速解碼策略-meta基于RAG的解決思路淺嘗（REFRAG）-AI.x社區(qū)

RAG長上下文加速解碼策略-meta基于RAG的解決思路淺嘗（REFRAG）-AI.x社區(qū)

RAG長上下文加速解碼策略-meta基于RAG的解決思路淺嘗（REFRAG）-AI.x社區(qū)

RAG長上下文加速解碼策略-meta基于RAG的解決思路淺嘗（REFRAG）-AI.x社區(qū)

RAG長上下文加速解碼策略-meta基于RAG的解決思路淺嘗（REFRAG）-AI.x社區(qū)

REFRAG: Rethinking RAG based Decoding,https://arxiv.org/pdf/2509.01092

本文轉(zhuǎn)載自???大模型自然語言處理???? 作者：llmnlp

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責任

標簽

贊

收藏

回復

舉報

回復

相關(guān)推薦

LLM超長上下文查詢-性能評估實戰(zhàn)

ermulong ? 4433瀏覽 ? 0回復
百萬上下文RAG，Agent還能這么玩

ermulong ? 4945瀏覽 ? 0回復
LLM超長上下文查詢-性能評估實戰(zhàn)

ermulong ? 4352瀏覽 ? 0回復
提升5.69倍，高效RAG上下文壓縮方法COCOM

Aceryt ? 4203瀏覽 ? 0回復
長上下文 還是 RAG？ Google:我全都要！

探索AGI ? 3533瀏覽 ? 0回復
在長上下文LLM的時代，RAG是否仍然必要？

sbf_2000 ? 3986瀏覽 ? 0回復
#AIGC創(chuàng)新先鋒者征文大賽# RAG vs 長上下文 LLMs：誰主沉?。?/a>

Baihai_IDP ? 3733瀏覽 ? 0回復
智能決策進化之路：從長上下文LLM到自主RAG系統(tǒng)

Halo咯咯 ? 5114瀏覽 ? 0回復
基于Agent的金融問答系統(tǒng)：RAG的檢索增強之上下文重排和壓縮

一起AI技術(shù) ? 3938瀏覽 ? 0回復
HiQA：一種用于多文檔問答的層次化上下文增強RAG

大模型自然語言處理 ? 3783瀏覽 ? 0回復
長上下文語言模型評估體系探析

Baihai_IDP ? 4776瀏覽 ? 0回復
大模型超長窗口上下文與檢索增強生成——RAG

AI探索時代 ? 4238瀏覽 ? 0回復
RAG系統(tǒng)中的困境：上下文不是想加就能加的

芝士AI吃魚 ? 3666瀏覽 ? 0回復
為什么大語言模型難以處理長上下文？從 Transformer 到 Mamba

Baihai_IDP ? 4725瀏覽 ? 0回復
RAG應用要如何吃到大模型長上下文的紅利？-LongRAG

NLP前沿1 ? 1776瀏覽 ? 0回復
REFRAG：基于塊壓縮的RAG解碼優(yōu)化

sbf_2000 ? 1524瀏覽 ? 0回復
Meta 再出狠招：REFRAG，讓 RAG 長上下文提速 31 倍，還能看 16 倍更多內(nèi)容

Halo咯咯 ? 1484瀏覽 ? 0回復
Glyph：文本轉(zhuǎn)圖片解決長上下文困境，智譜把“DeepSeek-OCR”具像化了

Syrupup ? 1307瀏覽 ? 0回復
探討超長上下文推理的潛力

Baihai_IDP ? 417瀏覽 ? 0回復

大模型自然語言處理

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

多模態(tài)文檔智能解析-MonkeyOCR v1.5框架、數(shù)據(jù)構(gòu)造及特點 6天前發(fā)布
股票研究報告生成-基于LLM的多智能體框架FinRpt-Gen數(shù)據(jù)構(gòu)建、方法框架 2025-11-12 08:20:30發(fā)布

熱門推薦

用 Cognee 構(gòu)建端到端知識圖譜，實現(xiàn)當前效果最好的AI Agent記憶層 0回復

Spring AI Alibaba：Java 后端接入大模型，終于不用羨慕 Python 了！ 0回復

小模型，大能量：阿里巴巴 Qwen3-VL 4B/8B，重新定義多模態(tài)輕量化邊界 0回復

2025 年最強 OCR 大比拼：從識別文本到文檔智能，誰才是終極解法？ 0回復

8%價格，2倍速度！國產(chǎn)MiniMax M2暴打Claude Sonnet 4.5？我們實測后發(fā)現(xiàn)堪稱性價比之王！ 0回復

上一篇：如何讓多模態(tài)大模型學會“自動思考”-R-4B訓練框架核心設(shè)計與訓練方法

下一篇：在開源模型上復現(xiàn)類似OpenAI o3的“thinking-with-image”能力：Mini-o3淺嘗

社區(qū)精華內(nèi)容

目錄

91精品国产91久久久久久不卡| 在线播放日韩导航| 欧美日本亚洲| 欧美亚洲另类激情另类| 国产精品99久久精品| 日韩一级片网址| 北条麻妃69av| 亚洲免费视频一区二区三区| 激情六月婷婷久久| 91国内在线视频| 国产在线免费av| 日韩精品一级| 色综合av在线| 91精品国产毛片武则天| 天堂a中文在线| 久久99精品国产麻豆婷婷| 色综合久久88| 老头老太做爰xxx视频| 精品999日本久久久影院| 午夜国产不卡在线观看视频| 亚洲精品国产一区| 成人午夜免费福利| 麻豆精品视频在线| 69影院欧美专区视频| 午夜剧场免费在线观看| 久久久伦理片| 在线综合亚洲欧美在线视频| 精品人妻一区二区三区四区在线 | 欧美不卡视频一区| av免费网站观看| 福利在线导航136| 中文字幕在线不卡国产视频| 免费av在线一区二区| 国精产品乱码一区一区三区四区| 日本不卡高清视频| 91黄色8090| 久久人人爽人人爽人人| 日韩在线欧美| 亚洲午夜激情免费视频| 99久久免费看精品国产一区| 亚洲午夜剧场| 欧美天堂亚洲电影院在线播放| 欧洲精品一区二区三区久久| 午夜成年人在线免费视频| 中文字幕av在线一区二区三区| 六十路精品视频| 免费看国产片在线观看| 国产精品系列在线观看| 91免费欧美精品| 91超薄丝袜肉丝一区二区| 日本怡春院一区二区| 日本一本a高清免费不卡| 天堂资源在线播放| 狠狠爱www人成狠狠爱综合网 | 国产理论在线| 亚洲无人区一区| 日本久久高清视频| huan性巨大欧美| 亚洲人成在线观看一区二区| 在线一区日本视频| 免费大片在线观看www| 国产精品福利一区| 中文字幕中文字幕在线中心一区| 日本高清视频在线播放| 最新日韩在线视频| 欧美精品久久96人妻无码| h网站久久久| 亚洲一区二区三区视频在线 | 亚欧美中日韩视频| 88国产精品欧美一区二区三区| 亚洲国产综合久久| 国产日韩欧美一区| 日韩美女视频免费看| 在线免费观看av网址| 男人的天堂久久精品| 91精品久久久久久久久久| 97人妻精品一区二区三区动漫| 国内精品久久久久影院一蜜桃| 亚洲va男人天堂| 成人午夜免费在线观看| 2023国产精品视频| 日韩国产一区久久| 欧洲美女少妇精品| 亚洲专区一二三| 丝袜老师办公室里做好紧好爽| 欧美一区久久久| 欧美日韩国产综合一区二区| 亚洲成人手机在线观看| 久草精品视频| 一本久久综合亚洲鲁鲁| 国产精品丝袜一区二区| 99成人精品| 国产精品偷伦视频免费观看国产| 国产www免费观看| 99re这里都是精品| 亚洲精品中文字幕在线| 日本h片在线观看| 欧美性猛交xxxx| 天堂在线中文在线| 卡通动漫精品一区二区三区| 自拍偷拍亚洲区| 精品午夜福利视频| 美国毛片一区二区三区| 国产精品v欧美精品v日韩精品| 你懂的视频在线播放| 亚洲欧美一区二区三区久本道91| 国产日韩av网站| 久久日本片精品aaaaa国产| 日韩精品一区二区三区视频| 日本一道本视频| 欧美视频官网| 国产精品男人爽免费视频1| 性生活三级视频| 久久久久国产精品厨房| 黄色网址在线免费看| 日韩影院在线| 欧美tk—视频vk| 在线观看日本黄色| 国产视频一区免费看| 成人免费观看a| 精品欧美不卡一区二区在线观看 | 国产精品69毛片高清亚洲| 久久久99国产精品免费| 操你啦视频在线| 色av综合在线| 亚洲一区二区在线免费| 亚洲影视一区| 国产精品自产拍高潮在线观看| 欧洲av在线播放| 亚洲精品成人a在线观看| 激情婷婷综合网| 欧美挤奶吃奶水xxxxx| 久久久97精品| 在线黄色av网站| 久久九九国产精品| 国产最新免费视频| 国产三级精品三级在线观看国产| 久久香蕉频线观| 在线黄色av网站| 中文字幕精品综合| 日韩中文字幕二区| 你懂的一区二区三区| 91福利视频网| 午夜国产在线视频| 午夜不卡av免费| 黄色激情在线观看| 亚洲国产高清一区| 国产精品国模大尺度私拍| 污污的网站在线看| 日韩欧美中文一区二区| 唐朝av高清盛宴| 国产精品888| 欧美国产视频一区| 亚洲图色一区二区三区| 欧美激情视频给我| 黄色小视频免费观看| 一区二区三区四区乱视频| 日本亚洲一区二区三区| 欧美成人久久| 国产精品大全| 国产高清自产拍av在线| 亚洲另类欧美自拍| 丁香社区五月天| 国产女人aaa级久久久级 | 亚洲娇小xxxx欧美娇小| 日本熟女一区二区| 久久午夜羞羞影院免费观看| 欧美极品欧美精品欧美图片| 国产a久久精品一区二区三区| 日本伊人精品一区二区三区介绍| 第一页在线观看| 欧美三级在线视频| 欧美h片在线观看| 国产精品亚洲人在线观看| 97视频在线免费| 蜜桃久久久久| 国产盗摄xxxx视频xxx69| 电影在线高清| 4hu四虎永久在线影院成人| 久草国产在线视频| 久久先锋影音av| 天天操狠狠操夜夜操| 欧美久久一区| 欧美精品久久| 亚洲日本免费电影| 久久久久久久久久久成人| 欧美孕妇孕交xxⅹ孕妇交| 欧美性xxxxxxxx| 午夜写真片福利电影网| 99久久免费精品高清特色大片| 久久精品午夜福利| 欧美一区二区三区久久精品| 久99久在线| 欧美成人高清视频在线观看| 国内精品久久久久伊人av| 青青国产在线| 日韩手机在线导航| 91精品国产高清一区二区三密臀| 国产精品美女www爽爽爽| 亚洲欧美日韩中文字幕在线观看| 国产精品嫩草99av在线| 色香蕉在线观看| 欧美三级午夜理伦三级在线观看 | 中日韩av在线| 亚洲美女免费在线| 亚洲av片不卡无码久久| 精品在线视频一区| 两根大肉大捧一进一出好爽视频| 成人3d精品动漫精品一二三| 丁香五月网久久综合| 久久亚洲国产精品尤物| 9.1国产丝袜在线观看| 国产三区视频在线观看| 亚洲一级一级97网| 欧美熟妇另类久久久久久不卡 | 日韩免费毛片视频| 一区二区三区四区日韩| 日本a级片久久久| 综合伊人久久| 成人欧美一区二区三区黑人| 中文日产幕无线码一区二区| 欧美激情精品久久久久久蜜臀| www视频在线观看免费| 日韩成人黄色av| www.97av| 欧美精品日韩| 亚洲综合成人av| 欧美日韩免费看| 久久一区二区三| 亚洲蜜桃精久久久久久久| 国产探花视频在线播放| 久久综合久色欧美综合狠狠| www.com日本| 国产精品主播直播| 日本不卡一区在线| 免费成人你懂的| 久久久久免费精品| 亚洲一区国产| 大陆极品少妇内射aaaaa| 国产精品观看| 国产成人免费高清视频| 图片小说视频色综合| 亚洲一区二区三区加勒比| 精品视频网站| 日韩久久精品一区二区三区| 精品一区亚洲| 欧美日本韩国国产| 国产一区二区精品福利地址| 欧美福利精品| 怕怕欧美视频免费大全| 日韩av电影免费观看| 久久91成人| 日韩精品不卡| 日韩欧美不卡| 伊人天天久久大香线蕉av色| 999精品视频| 艳母动漫在线观看| 欧美一区高清| 国产女教师bbwbbwbbw| 黑人一区二区| 自拍日韩亚洲一区在线| 亚洲一区不卡| caoporn超碰97| 麻豆91在线观看| 欧美日韩理论片| 国产91精品一区二区麻豆网站| 极品白嫩的小少妇| 99久久精品免费精品国产| 少妇精品一区二区| 欧美激情资源网| 久久av红桃一区二区禁漫| 亚洲人成人一区二区在线观看 | 欧美精选一区| 福利视频一二区| 久久精品网址| 亚洲美女性囗交| 成人国产电影网| 中文字幕一区二区三区人妻| 日本一区二区三区在线不卡| 欧美肥妇bbwbbw| 亚洲6080在线| 精品一区二三区| 欧美一区二区视频观看视频| 成人毛片视频免费看| 亚洲欧美综合v| 黄色一级片在线观看| 久久久久久久久久久免费精品| 亚洲黄色免费看| 成人欧美一区二区三区在线| av毛片精品| 视频在线99re| 国产精品sm| 激情婷婷综合网| 国产成人av电影在线| 成年人网站免费在线观看| 国产精品久久久久久久久图文区 | 91av一区二区三区| 色婷婷av一区二区三区丝袜美腿 | 欧美激情自拍| 国产成人精品无码播放| 国产大陆精品国产| b站大片免费直播| 亚洲国产va精品久久久不卡综合| 四虎影院在线免费播放| 日韩欧美的一区二区| 国产在线视频资源| 久久免费国产视频| 91麻豆精品| 日韩精品av一区二区三区| 亚洲视频久久| 色网站在线视频| 久久综合狠狠综合久久综合88| 全网免费在线播放视频入口| 日韩欧美在线视频| 成人av无码一区二区三区| 在线播放国产一区二区三区| 精精国产xxxx视频在线播放| 亚洲一区二区三区777| 国内精品久久久久久久影视简单 | 国产成人免费观看网站| 亚洲成av人**亚洲成av**| 国产一区二区三区视频免费观看| 精品呦交小u女在线| 美女精品导航| 91久久久久久| 欧美伦理在线视频| 激情综合在线观看| bt欧美亚洲午夜电影天堂| 极品盗摄国产盗摄合集| 欧美日韩精品一区二区三区四区| 久久精品国产亚洲a∨麻豆| 国内免费精品永久在线视频| 日韩精品中文字幕吗一区二区| 亚洲欧洲日韩精品| 日本欧美大码aⅴ在线播放| 黄色aaa视频| 欧美性xxxx极品hd欧美风情| 欧美一区二不卡视频| 欧美成人激情在线| 亚洲欧洲二区| 一区二区三区在线视频111| 蜜臀av性久久久久蜜臀av麻豆| 大又大又粗又硬又爽少妇毛片| 亚瑟在线精品视频| 农村少妇久久久久久久| 欧美激情伊人电影| 99久久婷婷国产综合精品青牛牛| 加勒比海盗1在线观看免费国语版| 国产自产v一区二区三区c| 国产午夜精品理论片在线| 7777精品伊人久久久大香线蕉| av在线播放av| 国产欧美在线播放| 99久久这里只有精品| 欧美视频亚洲图片| 亚洲毛片av在线| 黄色aaa毛片| 性欧美xxxx视频在线观看| 国产成人精品福利| 国产96在线 | 亚洲| 97精品国产露脸对白| 亚洲不卡在线视频| 一区二区三区四区视频| 日韩一区中文| 视色,视色影院,视色影库,视色网日韩精品福利片午夜免费观看 | 99精品国产视频| 懂色av中文字幕| 少妇高潮久久77777| av一级久久| 丰满的少妇愉情hd高清果冻传媒 | 懂色一区二区三区av片| 亚洲东热激情| 给我看免费高清在线观看| 在线精品亚洲一区二区不卡| 91caoporm在线视频| 亚洲自拍av在线| 亚洲啪啪91| 白丝女仆被免费网站| 欧美视频三区在线播放| 成人免费网站在线观看视频| 国产精品久久一区二区三区| 鲁大师成人一区二区三区| 日本高清黄色片| 91精品国产综合久久久久久| av中文字幕在线看| 日本一区二区在线视频观看| 国内外成人在线视频| 日韩成人av毛片| 亚洲最新中文字幕| 国产视频网站一区二区三区| 国产网站免费在线观看| 亚洲国产成人一区二区三区| 亚洲精品国产一区二| 欧美在线亚洲一区| 99久久.com| 一二三不卡视频| 日韩一区二区三区av| 国产伦精品一区二区三区视频金莲| 一区精品在线| 99精品视频在线观看|