精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

RAG新突破:塊狀注意力機(jī)制實(shí)現(xiàn)超低延遲檢索增強(qiáng)

人工智能 新聞
最近,論文《Block-Attention for Efficient RAG》為檢索增強(qiáng) (RAG) 場(chǎng)景實(shí)現(xiàn)了一種塊狀注意力機(jī)制,Block-Attention,通過分塊獨(dú)立編碼檢索到的文檔,使得模型無需重復(fù)編碼計(jì)算已經(jīng)在其他 query 中已經(jīng)見過的文檔,從而實(shí)現(xiàn)線上推理效率的有效提升。

在工業(yè)場(chǎng)景中,往往會(huì)利用檢索技術(shù)來為大語言模型添加一些來自外部數(shù)據(jù)庫的知識(shí)文檔,從而增強(qiáng)大語言模型的回復(fù)可信度。一般來說,RAG 被公認(rèn)是最有效的為 LLM 注入特定領(lǐng)域知識(shí)的方式。

然而,RAG 也有其不足之處。通常來說,在實(shí)際應(yīng)用中,為確保能召回包含正確知識(shí)的文檔,對(duì)于每個(gè)用戶的查詢,會(huì)檢索多個(gè)文檔(一般在 5 到 30 個(gè)之間),并把這些文檔整合到輸入提示中供大語言模型處理。這樣一來,輸入提示的序列長度增加,使得推理效率大幅降低。具體來講,以首次生成標(biāo)記的時(shí)間(TTFT)來衡量,RAG 大語言模型的推理延遲比非 RAG 大語言模型高很多。

由于數(shù)據(jù)庫中同一文檔經(jīng)常會(huì)被不同 query 召回,大家很自然的會(huì)想到:是否能夠把已經(jīng)算好的文檔表示(KV states)存在緩存中,以供二次使用?很遺憾, 由于自回歸注意力機(jī)制的限制,大語言模型中每個(gè)文檔的 KV States 都與上下文相關(guān),所以遇到新的 query 時(shí),模型必須重新編碼 KV states 才能確保準(zhǔn)確預(yù)測(cè)。

最近,論文《Block-Attention for Efficient RAG》為檢索增強(qiáng) (RAG) 場(chǎng)景實(shí)現(xiàn)了一種塊狀注意力機(jī)制,Block-Attention,通過分塊獨(dú)立編碼檢索到的文檔,使得模型無需重復(fù)編碼計(jì)算已經(jīng)在其他 query 中已經(jīng)見過的文檔,從而實(shí)現(xiàn)線上推理效率的有效提升。在實(shí)驗(yàn)中,該方法能夠讓使用 RAG 技術(shù)的模型與不使用 RAG 的模型有幾乎一樣的響應(yīng)速度。同時(shí),該方法甚至還能略微提升在 RAG 場(chǎng)景下的模型準(zhǔn)確率。

圖片

  • 論文標(biāo)題:Block-Attention for Efficient RAG
  • 論文地址:https://arxiv.org/pdf/2409.15355

如下圖所示,該方法把整個(gè)輸入序列分成若干個(gè) block,每個(gè) block 獨(dú)立計(jì)算其 KV States,只有最后一個(gè) block 能夠關(guān)注其他 blocks(在 RAG 場(chǎng)景中,最后一個(gè) block 即用戶的輸入)。在 RAG 場(chǎng)景中,block-attention 讓模型不再需要重復(fù)計(jì)算已經(jīng)在其他 query 中見過的文檔。

圖片

Block-Attention 的實(shí)現(xiàn)并不復(fù)雜:1)獨(dú)立編碼除最后一個(gè) block 以外的所有 blocks;2)為每個(gè) blocks 重新計(jì)算位置編碼;3)將所有 blocks 拼接在一起,并計(jì)算最后一個(gè) block 的 KV State。然而直接把模型不加任何修改的從 self-attention 切換到 block-attention 會(huì)導(dǎo)致大語言模型懵圈,畢竟模型在訓(xùn)練階段從來沒見過 block-attention 方式編碼的輸入。一個(gè)量化的對(duì)比是,直接切換為 block-attention 會(huì)讓 Llama3-8B 在四個(gè) RAG 數(shù)據(jù)集上的平均準(zhǔn)確率由 67.9% 下降至 48.0%。

為了讓模型適應(yīng) block-attention,作者們對(duì)模型進(jìn)行了進(jìn)一步微調(diào),作者們發(fā)現(xiàn)在 100-1000 步微調(diào)之后,模型就能快速適應(yīng) block-attention,在四個(gè) RAG 數(shù)據(jù)集上的平均準(zhǔn)確率恢復(fù)至 68.4%。另外,block-attention 方式的模型在 KV cache 技術(shù)的幫助下,能達(dá)到與無 RAG 模型相似的效率。在用戶輸入長度為 50 而 prompt 總長度為 32K 的極端情況下,block-attention model 的首字延時(shí)(Time To First Token, TTFT)和首字浮點(diǎn)運(yùn)算數(shù)(FLOPs To Frist Token, (FLOPs-TFT)分別能降低至 self-attention model 的 1.3% 和 0.2%,與無 RAG 模型的效率基本持平。

推理流程

關(guān)于 block-attention 的實(shí)現(xiàn)和詳細(xì)推導(dǎo),讀者們請(qǐng)移步原文,這里主要介紹 block-attention 模型的推理流程。如下圖所示,首先從緩存中查詢并提取前 K 個(gè) block 的 KV states。然后,根據(jù)每個(gè) block 在輸入序列中的位置,作者們對(duì)每個(gè) block 的位置編碼進(jìn)行了重新計(jì)算。具體的操作過程詳見論文的公式 3。最后,根據(jù)前 k-1 個(gè) KV States 計(jì)算最后一個(gè)數(shù)據(jù)塊的鍵值狀態(tài)以及模型的輸出。

圖片

實(shí)驗(yàn)結(jié)果

在實(shí)驗(yàn)中,作者們主要想探究兩個(gè)問題的答案:1)在 RAG 場(chǎng)景中,block-attention 模型能否達(dá)到與自 self-attention 相同的準(zhǔn)確率?2)block-attention 對(duì)效率的提升有多大?

圖片

對(duì)于問題一,上圖給出了答案。作者們根據(jù)實(shí)驗(yàn)結(jié)果給出了三個(gè)結(jié)論:

1. 直接從 self-attention 切換到 block-attention 是不可取的,因?yàn)檫@會(huì)導(dǎo)致準(zhǔn)確率急劇下降。例如,對(duì)于 Llama3-8B 和 Mistral-7B 模型,去除微調(diào)過程會(huì)導(dǎo)致在所有四個(gè)基準(zhǔn)上平均絕對(duì)性能下降 21.99%。

2. 然而,如果作者們?cè)谖⒄{(diào)階段使用塊注意力機(jī)制,那么得到的模型與自注意力模型的性能幾乎相同,甚至在某些數(shù)據(jù)集上略好。例如,Mistral-7B-block-ft 在四個(gè)基準(zhǔn)上的性能優(yōu)于自回歸方式訓(xùn)練的模型,平均準(zhǔn)確率由 59.6% 上升至 62.3%。

3. 位置重新編碼操作對(duì)于 block-attention 模型至關(guān)重要。去除它會(huì)導(dǎo)致性能顯著下降 —— 在四個(gè)數(shù)據(jù)集上準(zhǔn)確率平均下降 4%。

對(duì)于效率的提升,作者們也通過另一組實(shí)驗(yàn)進(jìn)行了驗(yàn)證。他們將用戶的問題長度固定在 50 個(gè) token,然后逐漸增加被召回文檔的數(shù)量,讓輸入序列總長度從 50 一直增加到 32K。模型在不同 prompt 長度下的首字延時(shí)(Time To First Token, TTFT)和首字浮點(diǎn)運(yùn)算數(shù)(FLOPs To Frist Token, (FLOPs-TFT)如下圖所示。顯然,加速效果令人滿意:當(dāng)輸入序列的長度為 512 時(shí),使用 block-attention 可以將 TTFT 減少 48%,將 FLOPs-TFT 減少 90.1%。隨著總長度的增加,block-attention 模型的 TTFT 和 FLOPs-TTF 保持基本不變的趨勢(shì)。當(dāng)總長度達(dá)到 32K 時(shí),加速效果可以達(dá)到驚人的 98.7%,F(xiàn)LOPs-TFT 的消耗甚至減少了 99.8%。作者們將此實(shí)驗(yàn)結(jié)果總結(jié)為:“文本越長,block-attention 越重要”。

圖片

作者們最后還指出,block-attention 在很多場(chǎng)景中都有著重要作用,并不局限于 RAG。由于一些保密原因,作者們暫時(shí)無法透露在其他工業(yè)應(yīng)用中是如何使用它的。作者們期待社區(qū)的研究人員能夠進(jìn)一步探索 block-attention 的潛力,并將其應(yīng)用于合適的場(chǎng)景。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2025-07-08 09:00:00

2018-08-26 22:25:36

自注意力機(jī)制神經(jīng)網(wǎng)絡(luò)算法

2024-09-19 10:07:41

2021-05-07 15:40:36

計(jì)算機(jī)互聯(lián)網(wǎng) 技術(shù)

2023-11-24 12:36:00

模型訓(xùn)練

2025-10-11 01:45:00

MANO多模態(tài)Swin

2025-09-29 18:51:01

2023-10-14 17:46:17

RAG提示工程GPT-3

2024-07-16 14:15:09

2024-10-31 10:00:39

注意力機(jī)制核心組件

2024-06-28 08:04:43

語言模型應(yīng)用

2025-02-27 10:55:44

2025-04-07 07:47:00

模型訓(xùn)練AI

2025-10-31 16:00:45

AI模型架構(gòu)

2025-04-29 09:15:49

AI數(shù)據(jù)模型

2025-04-01 09:25:09

2024-04-03 14:31:08

大型語言模型PytorchGQA

2024-05-20 08:31:33

檢索增強(qiáng)生成LLM大型語言模型

2024-12-09 00:00:10

2020-09-17 12:40:54

神經(jīng)網(wǎng)絡(luò)CNN機(jī)器學(xué)習(xí)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

99久久国产综合精品色伊| 欧美一区二区三区免费看| 好吊成人免视频| 日韩av在线电影观看| 一本色道久久综合亚洲| 亚洲视频精品| 亚洲色图日韩av| 天堂av.com| 男人最爱成人网| 亚洲男人天堂av| 欧美日韩综合精品| 成人av免费播放| 丝袜诱惑制服诱惑色一区在线观看| 国产香蕉一区二区三区在线视频 | 国产日韩欧美一区二区三区四区| 国产乱国产乱老熟| 你懂的亚洲视频| 国产亚洲欧洲黄色| 韩国三级hd两男一女| 九色成人搞黄网站| 午夜精品久久久久久久| 一区视频二区视频| 九色国产在线观看| 福利一区福利二区| 91网站在线免费观看| 男人天堂视频在线| 亚洲免费网站| 国外成人性视频| 成人免费毛片东京热| 日本不卡二三区| 亚洲欧美三级在线| 亚洲视频在线播放免费| 欧美三级一区| 欧美高清视频www夜色资源网| 日本黄色三级大片| 黄页网站在线观看免费| 自拍偷拍国产亚洲| 亚洲一区二区免费视频软件合集| 免费在线国产| a级高清视频欧美日韩| 亚洲最大的网站| 96日本xxxxxⅹxxx17| 欧美aaa在线| 日韩av123| 黄色在线免费观看| 久久不射中文字幕| 亚洲第一av网| 国产精品久久久久免费| 91theporn国产在线观看| 美女视频一区免费观看| 69久久夜色精品国产7777| 五月天丁香激情| 亚洲在线久久| 久久久91精品国产| av黄色免费在线观看| 日韩欧美成人精品| 国产精品尤物福利片在线观看| 国产午夜视频在线播放| 欧美色图麻豆| 欧美激情喷水视频| 久久影院一区二区| 在线国产日韩| 91tv亚洲精品香蕉国产一区7ujn| 粉嫩aⅴ一区二区三区| 亚洲激情精品| 欧美一级片在线播放| 久久精品视频5| 日韩精彩视频在线观看| 国产精彩精品视频| 在线免费看91| 国产精品主播直播| 国产一区高清视频| 欧洲亚洲在线| 国产精品三级视频| 特级黄色录像片| bl在线肉h视频大尺度| 欧美日韩亚洲系列| the porn av| 激情不卡一区二区三区视频在线 | 伊人久久亚洲综合| 精品夜夜嗨av一区二区三区| 91丨九色丨国产在线| 亚洲精品一级片| 久久久久国产精品免费免费搜索| 日韩在线电影一区| av色综合久久天堂av色综合在| 一区二区三区成人| avav在线看| 四虎影视成人精品国库在线观看| 精品少妇一区二区| 免费网站在线高清观看| 欧美 日韩 国产 一区| 97视频免费看| 中文字幕码精品视频网站| 国产精品影视网| 欧美精品一区二区三区在线四季| 中国日本在线视频中文字幕| 亚洲高清三级视频| 国产高潮免费视频| 果冻天美麻豆一区二区国产| 色先锋资源久久综合5566| 免费一级特黄特色大片| 日本午夜一区二区| 国产精品香蕉视屏| 在线观看黄av| 精品久久久久久久久久ntr影视| 怡红院亚洲色图| 精品国产一区二区三区成人影院| 色七七影院综合| 欧美三日本三级少妇99| 国产综合成人久久大片91| 久久综合伊人77777麻豆| 黄网页免费在线观看| 欧美色xxxx| zjzjzjzjzj亚洲女人| 99视频精品全部免费在线视频| 欧美亚洲国产日本| 亚洲精品视频网| 国产精品久久久久久久久搜平片| www.com毛片| 欧美成年网站| xvideos国产精品| 国产91精品看黄网站在线观看| 成人夜色视频网站在线观看| 亚洲免费精品视频| 亚洲www.| 亚洲老头同性xxxxx| 久久影院一区二区| 国产福利91精品| 亚洲欧美一二三| 999国产精品亚洲77777| 亚洲欧美福利视频| 日韩三级av在线| 成人国产一区二区三区精品| 永久免费看av| 亚洲成人五区| 久久av.com| 国产精品特级毛片一区二区三区| 国产精品无码永久免费888| 黑森林福利视频导航| 麻豆一区二区| 7m精品福利视频导航| 少妇又色又爽又黄的视频| 亚洲一区二区三区四区在线观看 | 久久久久久久久久成人| 91免费版在线看| 免费看一级大黄情大片| 欧美在线导航| 欧美亚洲另类制服自拍| 欧洲亚洲在线| 欧美在线观看禁18| 在线观看亚洲大片短视频| 日韩不卡一二三区| 涩涩日韩在线| 亚洲伦理网站| 久久久精品亚洲| 精品国产av一区二区| 亚洲自拍偷拍网站| 免费不卡的av| 国产精品一页| 亚洲春色在线视频| 亚洲男人在线| 欧美丰满少妇xxxxx| 天堂成人在线观看| 色综合久久中文字幕| 日本少妇高潮喷水xxxxxxx| 日韩专区一卡二卡| 小说区视频区图片区| 日韩精品视频中文字幕| 久久人人爽人人| 日本一本草久在线中文| 色综合久久天天| 潘金莲一级黄色片| 成人深夜在线观看| 少妇高清精品毛片在线视频 | 精品人妻一区二区色欲产成人| 久久久久久日产精品| wwwwxxxx日韩| 欧美日韩一区自拍| 欧美少妇一区| 精品国产不卡一区二区| 欧美精品videofree1080p| 天堂中文在线视频| 精品视频999| 国产精久久久久久| 国产农村妇女精品| 91亚洲一线产区二线产区| 嫩草成人www欧美| 一区二区日本伦理| 麻豆一区一区三区四区| 国产日本欧美一区| 九色porny丨国产首页在线| 色狠狠久久aa北条麻妃| 人妻无码中文字幕免费视频蜜桃| 欧美怡红院视频| 国产一级二级毛片| 国产精品日产欧美久久久久| 波多野结衣一二三区| 喷水一区二区三区| 成人性免费视频| 国产精品久久久久久麻豆一区软件 | 久久久久国产精品人| 色偷偷中文字幕| 日韩精品成人一区二区在线| 国产成a人亚洲精v品在线观看| 日韩免费久久| 久久精品女人的天堂av| 国产精品久久久久久av公交车 | 伊人亚洲精品| 日本最新高清不卡中文字幕| 搞黄网站在线看| 久久精品国产一区二区电影| 青青草观看免费视频在线| 羞羞视频在线观看免费| 制服丝袜中文字幕一区| 中文字幕视频网| 亚洲综合视频在线| 成人免费视频入口| 99久久久国产精品免费蜜臀| 午夜av中文字幕| 日本aⅴ精品一区二区三区| 蜜桃传媒一区二区三区| 91精品一区国产高清在线gif | 免费看三级黄色片| 激情五月婷婷综合网| 免费在线观看的毛片| 亚洲美女少妇无套啪啪呻吟| wwwjizzjizzcom| 亚洲精品二区三区| 99精品视频网站| 日韩精品免费| 丝袜美腿玉足3d专区一区| 精品一区三区| 免费成人av网站| 婷婷成人在线| 国内外成人免费视频| 澳门久久精品| 国产成人看片| 91精品啪在线观看国产爱臀| 亚洲一区二区三| 亚洲视频资源| 91欧美精品成人综合在线观看| 日韩欧美激情| 成人性生交xxxxx网站| 国产精品传媒麻豆hd| 国产精品久久久久久久av大片| 精品成人av| 国产精品久久久久久久久久三级 | 国产精品欧美亚洲777777 | 亚洲a在线播放| 成人国产精品一区二区网站| 91网站免费观看| 亚洲精品在线国产| 国产欧美一区二区视频 | 精品一区二区免费在线观看| 亚洲综合婷婷久久| 久久99精品久久久| 日日干日日操日日射| 国产酒店精品激情| 肉丝美足丝袜一区二区三区四| 国产成人在线视频网址| 久久无码专区国产精品s| 不卡的电视剧免费网站有什么| 亚洲制服丝袜在线播放| 26uuu成人网一区二区三区| 蜜桃精品一区二区| 国产精品欧美极品| 极品魔鬼身材女神啪啪精品| 亚洲国产精品麻豆| 日韩特级黄色片| 欧美性猛片xxxx免费看久爱| 国产精品一区二区免费视频| 日韩免费一区二区| 五十路在线视频| 在线看欧美日韩| 日本高清在线观看| 97国产精品人人爽人人做| 欧美最新精品| 91在线在线观看| 精品一区免费| 国产精品88久久久久久妇女| 亚洲黄色大片| 男人插女人下面免费视频| 精品一区二区久久久| 五月天丁香社区| 久久久精品国产免费观看同学| 黄色录像一级片| 精品欧美aⅴ在线网站| 中文字幕人妻一区二区三区视频| 日韩欧美国产综合一区| 国模精品一区二区| 色综合天天综合网国产成人网| 日韩电影网站| 99影视tv| 日韩国产一区二区三区| www插插插无码视频网站| 免费在线观看一区二区三区| 黄色在线免费播放| 国产精品美女久久久久久2018| 久久精品99国产精| 欧美三级一区二区| 五月婷婷伊人网| 美女扒开尿口让男人操亚洲视频网站| 欧美一级鲁丝片| 5566中文字幕一区二区| 国产调教一区二区三区| 欧美视频免费看欧美视频| 麻豆传媒一区二区三区| 日韩一级视频在线观看| 一区二区理论电影在线观看| 中文 欧美 日韩| 亚洲国产精品久久久| 黄色网页在线播放| 国产精品久久久久9999| 天堂在线精品| 国产精品裸体瑜伽视频| 国产一区久久久| 免费成人深夜天涯网站| 偷拍一区二区三区| www.色播.com| 久久精品视频一| 国产成人a视频高清在线观看| 欧美一区2区三区4区公司二百| 精品成人国产| 精品人妻一区二区三| 国产精品另类一区| 伊人网av在线| 国产亚洲在线播放| 亚洲欧洲自拍| 久久伦理网站| 国产一区二区精品| 国产精品300页| 精品久久久久久久中文字幕| 蜜桃视频污在线观看| 欧美大片在线免费观看| 日韩精品成人在线观看| 欧美 国产 精品| 国产高清无密码一区二区三区| 神马久久精品综合| 欧美精品日韩综合在线| 午夜免费福利在线观看| 国产精品一区久久久| 久久精品国产亚洲夜色av网站| www.涩涩涩| 中文字幕一区av| 国产精品日韩无码| 久久精品国产亚洲一区二区| 在线欧美激情| 亚洲色图都市激情| 国产精品99久久不卡二区| 国产高潮国产高潮久久久91| 日韩欧美国产综合| 黄色影院在线看| 看欧美日韩国产| 视频一区欧美日韩| 婷婷综合在线视频| 欧美男男青年gay1069videost| 在线免费观看黄色av| 91精品国产综合久久香蕉最新版| 亚洲综合小说| 亚洲欧美日韩偷拍| 色综合天天综合网天天看片| 黄色av网址在线免费观看| 国产精品极品在线| 99精品一区| 一二三区视频在线观看| 亚洲成国产人片在线观看| 无码精品在线观看| 国产精品激情av在线播放| 99久久这里只有精品| 日本wwww色| 欧美性猛交xxxx黑人猛交| 草碰在线视频| 91九色极品视频| 亚洲综合日本| 青花影视在线观看免费高清| 精品国产一区二区亚洲人成毛片| 激情国产在线| 亚洲精美视频| 丰满白嫩尤物一区二区| 国产一级片av| 欧美美最猛性xxxxxx| 日韩精品免费一区二区夜夜嗨| 亚洲精品怡红院| 亚洲一区二区视频在线观看| 国产福利片在线| 99精彩视频在线观看免费| 国产日韩高清一区二区三区在线| 91麻豆精品国产91久久综合| 日韩一级精品视频在线观看| 伊人久久国产| 91九色国产ts另类人妖| 久久久影视传媒| 精品久久久免费视频| 日本高清不卡在线| 国产在线不卡| 亚洲色图 激情小说| 亚洲成人免费网站| а天堂中文最新一区二区三区| 自慰无码一区二区三区|