精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

繞過 RAG 實時檢索瓶頸,緩存增強生成(CAG)如何助力性能突破? 原創 精華

發布于 2025-2-28 10:37
瀏覽
0收藏

編者按: 你是否曾經遇到過這樣的困擾:在開發基于 RAG 的應用時,實時檢索的延遲讓用戶體驗大打折扣?或者在處理復雜查詢時,檢索結果的不準確導致回答質量不盡如人意?

在當前大語言模型應用大規模落地的背景下,這些挑戰正成為制約產品競爭力的關鍵瓶頸。傳統 RAG 方案中的檢索延遲、準確性波動以及系統復雜度,都在考驗著開發者的耐心和智慧。

緩存增強生成(CAG)技術巧妙地利用了新一代大語言模型處理長上下文的能力,通過預加載文檔和預計算 KV 緩存,消除了實時檢索的需求。實驗結果表明,在可管理的知識庫場景下,這種方案不僅能將推理時間縮短數倍,還能提供更連貫、更準確的響應。

作者 | Vishal Rajput

編譯 | 岳揚

檢索增強生成(RAG)作為一種通過整合外部知識源來增強語言模型的強大方法而備受矚目。不過,這種方法也帶來了一些挑戰,比如檢索過程的延遲、文檔挑選時可能出現的誤差,以及系統復雜度的增加。

隨著能夠處理更長上下文的大語言模型(LLMs)的興起,緩存增強生成(CAG)技術應運而生,它避免了實時的信息檢索。這項技術通過將所有必要資源預先加載到模型的擴展上下文中,并在緩存其相關運行時(runtime)參數,尤其在處理數量有限且易于管理的文檔或知識時更為有效。

話不多說,讓我們來深入探討這一新穎的技術。

本文將討論以下主題:

  • RAG 如何擴展上下文的處理能力?
  • 無限擴展的上下文窗口
  • CAG 技術有何優勢?
  • 其他方面的改進
  • CAG 框架的運作原理
  • 總結

繞過 RAG 實時檢索瓶頸,緩存增強生成(CAG)如何助力性能突破?-AI.x社區

01 RAG 如何擴展上下文的處理能力?

RAG 是一種半參數化系統,其中參數化部分由大語言模型構成,而非參數化部分則包括其他元素。將這兩部分結合,便形成了半參數化系統。在 LLMs 中,所有信息都以編碼形式存儲在模型的權重或參數中,而系統的其他部分則沒有用參數來定義這些知識。

那么,這種設計是如何解決問題的呢?

  • 通過在 LLMs 中靈活地替換索引(即特定的信息),能夠實現信息的個性化定制,這意味著我們不會因為信息過時而受限,同時也能夠更新索引的內容。
  • 將 LLMs 與這些索引相結合,可以減少錯誤信息的產生,并且我們能夠通過指向信息原始來源來進行引用和歸屬描述。

因此,從理論上講,RAG 提升了我們為 LLMs 創建更佳上下文的能力,使其表現更加出色。

但這個過程真的這么簡單嗎?答案是否定的。

現有的 RAG 系統并不夠智能,它們相對簡單,無法應對那些需要大量自定義上下文的復雜任務。

因此,簡而言之,正是由于上下文窗口對 LLMs 的限制,RAG 才得以發展起來。

02 無限擴展的上下文窗口

相關論文在此:《Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention》。

這篇論文提出了一種高效的方法,可以在有限的內存和計算資源約束下,將基于 Transformer 的大語言模型(LLMs)擴展到處理無限長的輸入。該方法中的一個關鍵創新是一種名為 Infini-attention 的全新注意力機制。

Infini-attention 的核心思想是將局部注意力和全局注意力相結合。具體來說,首先將整篇文章分割成多個片段,在其中一個片段上應用標準的注意力機制,而為了獲取前一個片段的上下文,我們采用了一種線性注意力機制。以下是對這篇論文的簡要概述:

  • 混合注意力機制:局部注意力集中于單詞周圍的即時上下文,而長距離注意力則通過參考迄今為止所見的整個序列的壓縮摘要來保持全局視野。
  • 壓縮記憶:利用線性注意力來記憶之前的文本片段。
  • 高效更新:為了避免冗余和節省計算量,Infini-attention 不會直接將新信息添加到記憶中。相反,它會首先檢查已知信息,然后只更新記憶中的新信息或不同信息,這與 ResNet 中的跳躍連接(skip connections)類似。
  • 權衡控制:通過一個超參數來調節局部信息和壓縮記憶的混合比例。

03 CAG 技術有何優勢?

無檢索長上下文范式:提出了一種創新方法,通過利用預加載文檔和預計算 KV 緩存的長上下文 LLMs,消除了檢索延遲、錯誤和系統復雜性。

性能比較:實驗表明,長上下文 LLMs 的性能優于傳統的 RAG 系統,特別是在可管理的知識庫中。

實用見解:提出可操作的優化策略以提升知識密集型工作流效率,通過實證驗證無檢索方法在特定應用場景下的可行性。

CAG 相較于傳統 RAG 系統具有以下顯著優勢:

  • 縮短推理時間:由于無需實時檢索,推理過程變得更快、更高效,能夠更快地響應用戶查詢。
  • 統一上下文:將整個知識集合預加載到 LLM 中,可提供對文檔的整體和連貫理解,從而在各種任務中提高響應質量和響應一致性。
  • 簡化架構:通過移除整合檢索器和生成器的需求,系統變得更加簡潔,降低了系統復雜性,提高了可維護性,并減少了開發成本。

04 其他方面的改進

對于知識密集型任務而言,增加的計算資源通常被用來融入更多的外部知識。然而,如果沒有有效地利用這些知識,單純地擴展上下文并不總是能提升性能。

兩種推理擴展策略:上下文學習(In-context learning)和迭代式提示技術(iterative prompting)。

這些策略為擴展測試時計算(test-time computation)提供了額外的靈活性(例如,通過增加檢索的文檔數量或生成步驟),從而增強 LLMs 獲取和利用上下文信息的能力。

我們需要回答兩個關鍵問題:

(1) 在進行最優配置時,RAG 性能如何通過推理計算規模的擴展獲得提升?

(2) 能否通過建模 RAG 性能與推理參數之間的量化關系,預測給定預算約束下的最優測試時計算資源分配?

在最優推理參數配置下,RAG性能隨著測試時計算量級的提升呈現近似線性增長。基于實驗觀測,我們推導出RAG的推理擴展規律及其配套計算資源分配模型,該模型可預測不同超參數配置下的系統性能表現。

欲了解更多信息請閱讀此論文:??https://arxiv.org/pdf/2410.04343??

另一項工作則更多地從硬件(優化)設計的角度出發:

研究團隊開發了智能知識存儲系統(Intelligent Knowledge Store, IKS),這是一種基于 CXL 2.0 協議的設備,采用橫向擴展的近內存加速架構,通過在主機 CPU 與近內存加速器之間構建新型緩存一致性接口實現性能突破。

在 512GB 向量數據庫上,IKS 執行精確最近鄰搜索的速度相比 Intel Sapphire Rapids CPU 提升 13.4-27.9 倍。這種搜索性能優勢使典型 RAG 應用的端到端推理時間縮短 1.7-26.3 倍。作為內存擴展器,IKS 的內部 DRAM 可解耦供服務器其他應用使用,有效避免當今服務器中最昂貴的 DRAM 資源閑置浪費。

欲了解更多信息,請閱讀這里:??https://arxiv.org/pdf/2412.15246??

另一篇論文系統性地研究了長上下文對 20 種主流開源和商業大語言模型(LLM)的檢索增強生成(RAG)性能影響。研究團隊通過在三個專有領域數據集上改變總上下文長度(從 2,000 到 128,000 tokens,并在可能情況下擴展至 200 萬 tokens)運行 RAG 工作流,揭示了長上下文在 RAG 應用中的優勢與局限性。

他們的研究發現,雖然檢索更多文檔可以提高性能,但只有少數最新一代的最先進 LLMs 能夠在超過 64k tokens 的長上下文中保持穩定的準確性。 他們還確定了長上下文場景中的不同故障模式,為未來的研究提出了方向。

欲了解更多信息,請閱讀此論文:??https://arxiv.org/pdf/2411.03538??

05 CAG 框架的運作原理

CAG 框架利用長上下文 LLMs 的擴展上下文能力,消除了實時檢索的需求。通過預加載外部知識源(例如,文檔集合 D={d1,d2,…} )并預計算鍵值(KV)緩存(C_KV),它克服了傳統 RAG 系統的效率低下問題。該框架主要分三個階段運行:

1. 外部知識預加載

  • 對精選的文檔集合 D 進行預處理,使其適配模型的擴展上下文窗口。
  • LLM 處理這些文檔,將它們轉換為預計算的鍵值(KV)緩存,該緩存封裝了 LLM 的推理狀態。LLM(M)將文檔集合 D 編碼成預計算的 KV 緩存:

繞過 RAG 實時檢索瓶頸,緩存增強生成(CAG)如何助力性能突破?-AI.x社區

  • 該預計算緩存被存儲以供復用,確保無論后續執行多少次查詢,處理文檔集合D的計算成本僅需支付一次。

2. 推理階段

  • 在推理階段,KV 緩存(C_KV)與用戶查詢 Q 一起加載。
  • LLM 利用這個緩存中的上下文來生成響應,從而消除了檢索延遲,并減少了由于動態檢索引起的錯誤或遺漏的風險。LLM 通過利用緩存中的上下文來生成響應:

繞過 RAG 實時檢索瓶頸,緩存增強生成(CAG)如何助力性能突破?-AI.x社區

這種方法消除了檢索延遲,將檢索錯誤的風險降至最低。組合提示詞 P=Concat(D,Q) 確保了對外部知識和查詢的統一理解。

3. 緩存重置

  • 為維持性能,需對 KV 緩存進行高效重置。在推理過程中,隨著新 token(t1,t2,…,tk)被添加至上下文窗口,重置過程會截斷這些 tokens:

繞過 RAG 實時檢索瓶頸,緩存增強生成(CAG)如何助力性能突破?-AI.x社區

  • 隨著新 token 的連續添加,KV 緩存逐漸增長,重置時僅需截斷這些新增 token,即可實現快速重新初始化,無需從磁盤重新加載整個緩存。這種設計避免了全量緩存加載的 I/O 瓶頸,確保了系統響應速度的持續穩定。

06 Conclusion

緩存增強生成(CAG)在實時檢索不可行或需要極低延遲響應的場景中優勢顯著。通過將海量外部知識嵌入模型的上下文窗口,CAG 能夠生成信息豐富且上下文相關的回答,避免了傳統檢索增強生成(RAG)系統的檢索延遲。

Thanks for reading!

Hope you have enjoyed and learned new things from this blog!

About the author

Vishal Rajput

3x??Top writer in AI |

AI Book ??: ??https://rb.gy/xc8m46?? |

LinkedIn +: ??https://www.linkedin.com/in/vishal-rajput-999164122/??

END

本期互動內容 ??

?你認為隨著大模型上下文窗口持續擴大,RAG和CAG的技術路線會如何演進?哪些場景仍然更適合使用RAG?

原文鏈接:

??https://medium.com/aiguys/dont-do-rag-it-s-time-for-cag-fb24ff87932b??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
標簽
收藏
回復
舉報
回復
相關推薦
欧美激情在线一区| 五月激情六月综合| 亚洲综合色激情五月| 国产一级久久久| 偷拍自拍亚洲色图| 九色综合狠狠综合久久| 久久综合九色九九 | 久久久成人网| 日韩中文在线视频| www.日本高清| 午夜dj在线观看高清视频完整版| 成人综合在线视频| 国产a级全部精品| 午夜福利三级理论电影| 午夜精品久久久久久久久久蜜桃| 成人免费毛片app| 国产成+人+综合+亚洲欧洲| 神马午夜精品91| 成人在线中文| 精品成人久久av| 中文字幕一区综合| 男女视频在线观看免费| 国产大片一区二区| 国产精品视频久久| 国产做受高潮漫动| 在线中文一区| 在线视频国产日韩| 欧美深性狂猛ⅹxxx深喉| 99国内精品久久久久| 日韩欧美成人精品| 久草视频国产在线| 成人午夜在线影视| 国产欧美一区二区三区鸳鸯浴| 国产精品一区二区在线观看| 国产欧美日韩综合精品一区二区三区| 乱人伦精品视频在线观看| 欧美激情国产精品| 91精产国品一二三| 国产精品第一国产精品| 色综合久久久久久久久| 欧日韩免费视频| caoporn97在线视频| 国产欧美一区二区精品性| 精品午夜一区二区| 高清一区二区三区四区| 国产成人av电影在线观看| 96精品久久久久中文字幕| 波多野结衣mp4| 久久精品午夜| 国产99久久精品一区二区永久免费 | 岛国av中文字幕| 在线视频日韩| 97成人精品视频在线观看| 久久久久久久久久综合| 午夜久久影院| 欧美日韩国产第一页| 中文字幕在线2021| 亚洲乱码电影| 欧美精品一区二区免费| 18岁成人毛片| 韩国一区二区三区在线观看| 欧美乱大交做爰xxxⅹ性3| 日本福利片在线观看| 91精品电影| 欧美成人在线免费| 久久精品99久久久久久| 欧美午夜国产| 久久久久久久一| 亚州国产精品视频| 丝袜美腿亚洲色图| 国产精品美女呻吟| 国产美女精品视频国产| 国产精品夜夜嗨| 国产一区免费视频| 免费国产在线视频| 中文字幕不卡三区| 91大学生片黄在线观看| 成人三级小说| 色综合久久综合中文综合网| 黄色片视频在线| 婷婷久久免费视频| 亚洲第一av网| 夜夜春很很躁夜夜躁| 中文字幕一区二区三区乱码图片| 欧美激情高清视频| 亚洲中文字幕无码爆乳av| 精品无人码麻豆乱码1区2区 | 91av在线看| 最近中文字幕在线视频| 亚洲精品一区二区在线看| 欧美日韩成人精品| 国产亚洲欧美在线精品| 精品无人区卡一卡二卡三乱码免费卡 | 米仓穗香在线观看| 中日韩脚交footjobhd| 精品视频色一区| 国产精品久久久久久亚洲av| 国产一区二区区别| 欧美福利视频在线观看| 无码人妻丰满熟妇区五十路 | eeuss鲁片一区二区三区| 亚洲精品福利在线| 三级黄色片在线观看| 亚洲午夜av| 国产精品女主播| 国产91久久久| 国产精品国产三级国产aⅴ原创| 老司机午夜免费福利视频| 欧美日韩美女| 精品国偷自产国产一区| 宇都宫紫苑在线播放| 亚洲+小说+欧美+激情+另类| 日韩视频在线免费| 精品国产xxx| 成人丝袜18视频在线观看| 水蜜桃一区二区三区| 成人三级高清视频在线看| 一区二区三区在线看| 欧美日韩亚洲第一| 成午夜精品一区二区三区软件| 色先锋资源久久综合5566| 日产亚洲一区二区三区| 国产一区在线不卡| 91亚洲va在线va天堂va国| 亚洲视频久久久| 91丝袜美腿高跟国产极品老师| 色撸撸在线观看| 亚洲天堂一区二区| 亚洲精品久久久久久久久久久久久| 国产免费美女视频| 性欧美又大又长又硬| 国产刺激高潮av| 五月婷婷亚洲综合| 国产精品酒店视频| 奇米777在线视频| 日本女人高潮视频| 久久久综合亚洲91久久98| 91精品国产综合久久香蕉麻豆 | 日韩av在线网站| 亚洲精品国产视频| 97久久超碰国产精品电影| 青青草国产成人99久久| 亚洲伦理一区| 人人澡人人添人人爽一区二区| 亚洲色图38p| 欧美一区二区视频在线| 99精品国产高清一区二区| 国产精品二区三区| 久草免费在线视频观看| 久久精品久久综合| 亚洲成人自拍| 欧美久久久网站| 色偷偷偷综合中文字幕;dd| 亚洲精品国产精品国自产网站按摩| 26uuu欧美日本| 欧美男同性恋视频网站| 亚洲影视在线观看| 亚洲色图欧洲色图婷婷| 激情久久婷婷| 国产黄色在线播放| 国产精品第一页在线观看| 精品人妻少妇嫩草av无码专区| 丁香婷婷综合五月| 成人黄色777网| 国产成人亚洲综合a∨猫咪| 久久久久久亚洲精品杨幂换脸| 欧美成人午夜| 久久综合五月| 中文字幕一区二区视频| 欧美日韩视频在线一区二区 | 国产做受高潮漫动| 欧美一区二区三区四| 免费的毛片视频| 久久久精品人妻一区二区三区四 | 丝袜美腿小色网| 色呦呦视频在线| 国产精品你懂的在线欣赏| 久艹在线免费观看| 日韩av三区| 国产成人91久久精品| 午夜激情视频在线观看| 懂色av一区二区三区免费看| 免费的一级黄色片| 精品自拍偷拍| 国产精品入口免费视| 国产不卡在线| 日韩av在线播放资源| 国产女优在线播放| 一区二区三区精品视频| 国产麻豆天美果冻无码视频| 日韩精品二区| 国产精品一区电影| a级片国产精品自在拍在线播放| 日韩三级视频在线看| 国产亚洲自拍av| 久久日韩粉嫩一区二区三区| 亚洲 激情 在线| 影音先锋中文字幕一区| 色就是色欧美| 99这里只有精品视频| 国产91精品视频在线观看| 欧美精品videos另类| 亚洲第一色在线| 一级黄色a视频| 欧美日韩国产一区在线| 激情五月激情综合| av不卡在线播放| 手机成人在线| 九色丨蝌蚪丨成人| 成人黄色av播放免费| 毛片在线网站| 久久久电影免费观看完整版| 深夜影院在线观看| 欧美一级日韩不卡播放免费| 性无码专区无码| 亚洲精品你懂的| 无码人妻精品一区二区三区66| 99久久99久久精品国产片果冰| 精品亚洲欧美日韩| 国产一区一区| 国产精品成人一区二区| av成人福利| 欧美大尺度在线观看| av影片在线看| 亚洲理论在线a中文字幕| 亚洲大尺度网站| 欧美精品乱码久久久久久| 六月丁香婷婷综合| 亚洲成人精品一区| 九九热国产精品视频| 中文字幕一区在线观看视频| 亚洲区自拍偷拍| 26uuu亚洲综合色欧美| 激情av中文字幕| 国产精品自拍在线| 国产九九九视频| 久久99精品久久久久久国产越南| 成年人免费大片| 99热精品在线观看| 农民人伦一区二区三区| 欧美午夜一区| 国产片侵犯亲女视频播放| 99精品在线| 亚洲最大色综合成人av| 日韩欧美二区| 亚洲一卡二卡三卡| 97久久视频| 在线视频福利一区| 五月天激情综合网| 综合色婷婷一区二区亚洲欧美国产| 欧美丝袜一区| 欧美欧美一区二区| 亚洲激情播播| 日韩av大全| 91国产精品| 国产美女91呻吟求| 综合久久伊人| 99精品国产高清在线观看| 9l亚洲国产成人精品一区二三| 成人免费视频视频在| 给我免费播放日韩视频| 久久精品国产综合精品| 精品成av人一区二区三区| 亚洲国产婷婷香蕉久久久久久99| 日韩www.| 少妇高潮流白浆| 好吊日精品视频| 尤物av无码色av无码| 视频一区二区国产| 久久久精品高清| 国产成人超碰人人澡人人澡| 秘密基地免费观看完整版中文| 99久久精品国产一区二区三区| 久久精品老司机| 激情久久五月天| 一级日本黄色片| 成人黄色在线网站| 国产又爽又黄无码无遮挡在线观看| 国产三区在线成人av| 日本裸体美女视频| 一区二区三区四区乱视频| 国产午夜精品一区二区理论影院| 一本到三区不卡视频| 91国产精品一区| 精品免费一区二区三区| 久久天堂电影| 久久伊人色综合| 精精国产xxxx视频在线播放| 国产精品视频免费观看www| 91在线一区| 日韩高清av电影| 国产精品分类| 成人免费毛片播放| 国产福利一区在线| 亚洲一级中文字幕| jlzzjlzz国产精品久久| 国产中年熟女高潮大集合| 亚洲欧美激情一区二区| 黄色一级片免费在线观看| 欧美人成免费网站| 四虎影视精品成人| 欧美成人午夜免费视在线看片| 一区二区电影免费观看| 99国产超薄肉色丝袜交足的后果| 亚洲激情77| 精品国产av无码一区二区三区| 日本欧美大码aⅴ在线播放| www男人天堂| 中日韩免费视频中文字幕| 97人人澡人人爽人人模亚洲 | 天天干在线播放| 91精品国产美女浴室洗澡无遮挡| 欧美亚洲日本| 欧美国产精品va在线观看| 日本免费成人| 欧美中日韩免费视频| 亚洲性人人天天夜夜摸| 亚洲视频一二三四| 国产欧美视频在线观看| 尤物视频在线观看国产| 欧美成人一区二区三区在线观看 | 男人天堂新网址| 美女一区二区视频| 性高潮久久久久久久| 亚洲国产精品久久不卡毛片 | 精品一区二区三区免费毛片| 66久久国产| 性chinese极品按摩| 久久人人超碰精品| 在线观看亚洲欧美| 亚洲国产精品va在线| 欧美人与性动交α欧美精品济南到| 国产精品久久久久久亚洲影视| 伦理一区二区| 日韩欧美国产综合在线| 国产suv精品一区二区6| 青青草激情视频| 欧美一区二区三区四区久久 | 久久91精品国产91久久跳| 先锋影音一区二区| 亚洲欧洲国产精品久久| 奇米精品一区二区三区在线观看| 偷拍女澡堂一区二区三区| 精品久久久久久中文字幕一区奶水| 亚洲精品911| 久久69精品久久久久久久电影好 | 成都免费高清电影| 色综合久久99| 黄色片在线播放| 国产成人在线精品| 国产一区二区观看| 91视频免费版污| 中文字幕第一区第二区| wwwwww在线观看| 色青青草原桃花久久综合 | 欧美性高清videossexo| 成人黄色免费网| 一本久久综合亚洲鲁鲁| 国产精品亚洲一区二区三区在线观看 | 亚洲福利影院| 欧美一级二级三级| 日韩国产欧美在线播放| www.99r| 国产精品每日更新在线播放网址 | 欧美精品一区二区不卡 | 亚洲乱码精品一二三四区日韩在线| 国产一区二区三区在线观看| 精品国产一区二区三区在线观看| 亚洲精品自拍| 欧美日韩激情四射| 99国产欧美久久久精品| 亚洲中文一区二区| 俺去亚洲欧洲欧美日韩| 日韩精品免费视频一区二区三区| 2022中文字幕| 91片在线免费观看| 在线免费av片| 久久97精品久久久久久久不卡| 韩国精品福利一区二区三区| aⅴ在线免费观看| 国产精品视频免费| 丰满人妻一区二区三区免费| 欧洲亚洲免费视频| 久久精品国产68国产精品亚洲| 黄色一级片免费播放| 五月天欧美精品| 天天综合视频在线观看| 91传媒在线免费观看| 国产精品美女| 午夜国产小视频| 亚洲国产精品成人av| 黄色成人小视频| 久久精品国产sm调教网站演员| 久久精品视频一区二区| av在线资源观看| 日本欧美国产在线| 国产精品97| 在线国产视频一区| 日韩免费视频线观看| 国产一区二区主播在线|