精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

8B模型可以超過GPT-4o!并行KV Cache壓縮支持的128K長度外推方法ParallelComp

人工智能 新聞
我們提出了一種全新的訓練免調(Training-Free)長文本處理方案 ——ParallelComp,其核心包括并行 Attention 分塊、KV 緩存智能淘汰與注意力偏差校準三大技術創新。

作者熊璟,香港大學一年級博士生,師從黃毅教授和孔令鵬教授。已在 ICLR、ICML、NeurIPS、ACL、EMNLP、TMLR等頂級會議/期刊發表論文,研究方向為高效大語言模型推理與自動定理證明。擔任NAACL、EMNLP、ACL、ICML、ICLR、NeurIPS、COLING等會議審稿人。個人主頁: https://menik1126.github.io/

引言:大模型長文本推理的瓶頸與突破

隨著大語言模型(LLMs)能力日益提升,AI 對超長文本的理解和處理需求也變得前所未有地重要。然而,目前主流 LLM 雖然依賴旋轉位置編碼(RoPE)等機制,在訓練階段能高效處理 4K-8K tokens 級別的上下文,但一旦推理階段外推遇到如 128K 以上長度的長文本時,模型往往受到顯存瓶頸的限制和注意力下沉 (attention sink) 等問題影響,采用常規的文本截斷方案容易出現信息遺失,這極大限制了大模型在實際場景中的應用拓展。

業界目前嘗試的處理長文本的高效推理主要的瓶頸有兩個,  一個是位置編碼的長度外推, 再一個是長度外推中的內存瓶頸。     

目前的位置編碼包括兩類:一是基于頻率區分的 NTK 插值方法,為不同頻段位置編碼設計專屬策略以試圖拓展長度上限;二是各種分塊(chunking)方法,將文本切分、塊內復用位置編碼,避免重新訓練的高昂成本。 在處理超長上下文(>128K)外推時, 兩種方案的優劣仍是未知的。      

在解決顯存瓶頸時 , 普遍采用了KV cache壓縮的方案 , 并且一些方案發現在傳統自回歸場景下的注意力普遍遭遇了 “注意力下沉”(Attention Sink)現象影響 —— 模型的注意力極易集中在文本首尾  , 如果加以合理利用可以提升模型性能,但在并行注意力下的注意力下沉的機制是仍待探索的。

圖片

圖 1: 標準 Attention 和并行 Attention 機制下的注意力分布雖然有所不同,但都容易陷入這種 “塌縮” 狀態。而并行注意力機制在極長文本中產生的多峰新型 “sink” 現象,尚缺乏系統剖析與有效解決之道。

我們的創新:ParallelComp,高效超長文本推理新范式

針對上述問題,我們提出了一種全新的訓練免調(Training-Free)長文本處理方案 ——ParallelComp,其核心包括并行 Attention 分塊、KV 緩存智能淘汰與注意力偏差校準三大技術創新。

圖片

  • 論文標題:ParallelComp: Parallel Long-Context Compressor for Length Extrapolation
  • 論文鏈接: https://arxiv.org/abs/2502.14317
  • 代碼鏈接: https://github.com/menik1126/ParallelComp

圖片

圖 2:ParallelComp 整體流程示意圖

1. 并行分塊注意力,讓超長文本 “輕松分段消化”

首先,ParallelComp 借鑒并拓展了分塊思想,將輸入長文本按模型最大處理長度自動切分為若干塊(chunk),并與查詢一起并行輸入模型進行本地 Attention 計算。這樣不僅可以獲得塊內的注意力分布,還可以通過塊的位置編碼重用機制可以讓模型靈活外推至 128K 級別的序列長度而性能無明顯損失。(見圖 2)

2. 雙重淘汰機制,極致壓縮顯存消耗

  • 分塊淘汰(Chunk Eviction): 基于每個塊內部 token 對查詢的 “自信息量” 進行在線打分,僅保留信息量最高、對當前任務最相關的一部分文本塊,極大縮減內存開銷。
  • KV 緩存淘汰(Parallel KV Cache Eviction): 采用高效的 FlashAttention 推斷算法,動態評估每個 token 在 Attention 計算中的全局重要性,自動驅逐影響較小的 token,實現了分塊粒度的 KV 緩存智能壓縮。

通過這兩項機制,全流程推理所需顯存可以壓縮到 64G,且基于并行預填充過程即可完成高達 128K 長度推理任務,顯著提升 Batch inference 和多 GPU 設置下的推理效率。

圖片

圖 3:三類典型注意力偏置分布案例(U 型、山峰型、均勻型)

圖片

圖 4: 幾種 KV cache 驅逐策略后的模型的分布

3. 注意力偏差校準,攻克并行下的多峰 “sink” 現象

通過理論分析與大量可視化實證,我們發現并行分塊機制下,不同于經典的 U 型 Attention Sink,容易出現多峰、區域性異常(見圖 3、圖 4)。為此,我們提出在 Attention 分布中對異常高分 token 實施 “偏差校準”—— 分層驅逐被極端關注的 token,使 Attention 分布趨于平滑,極大降低了模型關注 “死角” 和信息遺漏風險。

進一步的分層實驗揭示,不同類型注意力偏差(“首段偏置”“尾段偏置”“中部塌縮”)可分別通過不同深度層的 token 淘汰策略加以緩解,為長文本推理設計提供了細致化的實操指引。

一個有趣的觀察是有些特定層的注意力偏差對模型的上下文學習能力和推理能力至關重要。

圖片

表 1 : 不同層的 bias token 對特定任務的影響

i) 淺層(第 1-8 層)的首段偏置對于檢索類任務至關重要。去除這些 token 會顯著削弱模型性能。

ii) 深層(第 9-16 層)的尾段偏置在模型推理能力中起到關鍵作用。淘汰這些 token 會導致編碼和數學任務的性能下降。

iii) 淺層的中部偏置(第 1-8 層)會損害模型的理解能力,淘汰這些 token 反而能夠提升模型表現。而深層的中部偏置(第 24-31 層)有助于模型在閱讀理解任務(如 En.MC)中的能力,去除它們會降低模型表現。

iv) 早期層(第 1-8 層)的尾段偏置對于模型的上下文學習能力同樣非常重要。

理論與實驗分析

我們的理論分析表明,并行 Attention 下 “稀疏性” 與 “有效信息量” 之間存在量化可控的門檻。隨著 chunk 數量增多和長度變長,Attention 大概率只會專注于極少數 token。合理選擇稀疏參數、分層校準策略,可在計算效率與信息保真度之間取得最優平衡。

圖片

表 2: 在 longbench 上的性能。

圖片

表 3: 在 infinitebench 上的性能。

圖片

表 4: PPL 的性能

圖片

表 5: 加速比和性能分析

大規模實驗顯示,ParallelComp 在 A100-80GB 單卡環境中,模型推理長度從 8K 無縫外推至 128K,prefilling 階段加速高達 23.5 倍;使用僅 8B 參數、且僅在 8K 上下文訓練的小模型即可在超長文本任務中整體性能達到 GPT-4o 性能的 91.17% , 在特定任務下可以超過GPT-4o的性能,甚至超過 Claude-2 和 Kimi-Chat 等高參數閉源大模型。這一成果充分證明,我們的方法不僅適用于算力受限場景,更為 LLM 實際落地部署帶來了嶄新范式。

結論與展望

ParallelComp 為長文本推理時代的 LLM 結構創新帶來了 “多快好省” 的系統級躍升 —— 無需新訓練、僅借助智能分塊和淘汰機制,即可極大提升處理長度、效率,并擺脫原有的注意力失衡難題。我們期待該方法未來在法律文檔、醫學文獻、長篇小說等需求復雜的產業應用中進一步開花結果。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-04-23 15:25:27

語言模型Eagle 2.5英偉達

2025-05-27 15:19:52

GPUMetaGPT-4o

2025-10-10 01:00:00

8B模型GPT-4oAgent

2024-12-02 14:20:00

模型訓練

2025-08-21 16:01:58

2025-01-16 16:39:44

2025-09-28 15:35:32

AI模型強化學習

2024-08-15 15:45:00

AI訓練

2023-12-06 13:59:00

數據訓練

2024-06-05 08:29:35

2024-06-17 18:04:38

2025-10-13 08:50:00

2024-04-01 00:00:00

馬斯克Grok 1.5HumanEval

2025-10-28 02:11:00

2024-07-02 01:09:02

2025-08-07 14:05:40

OpenAI大模型開源

2025-01-16 09:00:00

2025-04-16 09:15:00

AI模型數據

2024-05-21 12:23:17

2025-01-02 11:00:34

點贊
收藏

51CTO技術棧公眾號

中文字幕精品—区二区四季| 美女诱惑一区| 日韩免费看网站| av日韩一区二区三区| 飘雪影院手机免费高清版在线观看| 久久久久国产一区二区| 久久久999精品| 五十路六十路七十路熟婆| 三级成人在线| 一区二区三区日韩| 日韩欧美一区二区三区四区五区| 中文字幕一区二区免费| 亚洲电影av| 中文字幕av一区| 国产十八熟妇av成人一区| 欧美性www| 欧美日韩精品在线观看| 亚洲小说欧美另类激情| 国产系列在线观看| 丁香一区二区三区| 国产精品自拍偷拍视频| 天天操天天干视频| 欧美成人69av| 日韩在线播放一区| 国产人妻一区二区| 91精品国产自产在线丝袜啪| 欧美日韩一本到| 欧美三级一级片| 欧美videosex性极品hd| 国产精品丝袜久久久久久app| 黑人巨大精品欧美一区二区小视频| 一级成人免费视频| 久久综合影视| 欧美一级大片视频| 久久久久黄色片| 亚洲精品网址| 北条麻妃在线一区二区| 黄色片网站免费| 伊人久久大香线蕉无限次| 精品国产乱码久久久久久蜜臀 | 成全电影大全在线观看| 17c精品麻豆一区二区免费| 色女人综合av| 国产在线小视频| 久久久一区二区三区捆绑**| 精品乱码一区二区三区| 欧美一级免费片| 国产成都精品91一区二区三| 7777奇米亚洲综合久久| 91资源在线视频| 精品一区二区三区av| 国产精品色婷婷视频| 无码人妻熟妇av又粗又大| 欧美亚洲一区| 国产精品h在线观看| 天天综合天天干| 久久精品123| 日本中文字幕不卡免费| 国产又大又粗又爽| 视频一区二区中文字幕| 国产精品久久精品| 亚洲无码精品在线播放| 久久电影国产免费久久电影| 成人天堂噜噜噜| 99热这里只有精品1| 国产一区二区福利| 国产成人亚洲欧美| 五月婷婷丁香六月| 久久久久久一二三区| 日本一区二区在线视频| 在线视频91p| 亚洲激情网站免费观看| 国产性生活免费视频| 丰乳肥臀在线| 色综合久久久久久久久久久| 五月婷婷之综合激情| 日本免费成人| 日韩视频免费直播| 成人免费毛片日本片视频| 欧美美乳视频| 日韩亚洲欧美中文高清在线| 欧美精品一区二区蜜桃| 国产亚洲一级| 国产精品视频一区二区三区四| 国产精品无码一区二区桃花视频| 国产成人在线看| 欧美午夜精品久久久久免费视| youjizz在线播放| 亚洲精品成a人| 亚洲午夜无码av毛片久久| 福利一区视频| 亚洲高清一区二| 欧美日韩国产一二三区| 黄色另类av| 国产精品久久久久久久久久 | 国产精品综合二区| 狠狠色综合网站久久久久久久| 福利在线午夜| 亚洲国产一区二区在线播放| chinese少妇国语对白| 国产成人免费视频网站视频社区 | 欧美视频日韩视频| 亚洲成人av免费观看| 日本午夜精品久久久| 久久精品91久久久久久再现| 特一级黄色大片| 国产乱淫av一区二区三区| 免费精品视频一区| 日本成人不卡| 欧美性大战xxxxx久久久| 国产又粗又猛又爽又黄| 日韩a一区二区| 97人人做人人爱| 国产婷婷在线视频| 久久精品视频一区| 欧美中日韩在线| 国产精品美女午夜爽爽| 日韩精品免费综合视频在线播放| 三级黄色录像视频| 久久国产精品99国产| 91在线看网站| 欧美videos极品另类| 色综合夜色一区| 稀缺呦国内精品呦| 亚洲澳门在线| 国产精品一区二区女厕厕| 天天干,夜夜操| 亚洲欧美激情在线| 污网站免费在线| 一区二区小说| 2019中文字幕全在线观看| 国产成人精品一区二三区四区五区 | 国产情人节一区| 五月天久久久久久| 亚洲午夜精品17c| 人妻精油按摩bd高清中文字幕| 青青草国产成人a∨下载安卓| 欧美一区二区三区……| 欧美少妇bbw| 亚洲精品写真福利| 91福利免费观看| 久久精品高清| 国产精品视频免费观看www| 欧美黄色小说| 色综合咪咪久久| 草草影院第一页| 亚洲欧美成人| 久久综合福利| 另类激情视频| 亚洲欧洲一区二区三区在线观看| 国产毛片aaa| 久久综合久久鬼色中文字| 女人和拘做爰正片视频| 亚洲大片精品免费| 国产精品激情av电影在线观看| 免费a级毛片在线观看| 日本精品视频一区二区| av中文字幕免费观看| 日本亚洲一区二区| 天堂资源在线亚洲资源| 欧美黄色网络| 欧美猛交免费看| 亚洲国产精品suv| 午夜a成v人精品| 中文字幕在线看高清电影| 日韩精品一二三区| 中文字幕一区二区三区在线乱码| 国产乱码精品一区二区三区亚洲人 | 欧美日韩在线精品一区二区三区| 欧美极品影院| 色偷偷偷综合中文字幕;dd| 国产精品自产拍| 亚洲电影在线免费观看| 精品人妻一区二区三区视频| 日韩影院在线观看| 强开小嫩苞一区二区三区网站| 91精品啪在线观看国产爱臀 | 国产亚洲精品久久久| 亚洲一级特黄毛片| 亚洲一区二区偷拍精品| 精品久久久久久中文字幕人妻最新| 日韩av在线发布| 中文字幕中文字幕99| 精品久久ai电影| 日韩av理论片| 亚洲无线看天堂av| 日韩美女av在线| 在线观看中文字幕2021| 亚洲一二三四久久| 免费成人深夜天涯网站| 国产精品996| 久久久久久久久久久福利| 欧美激情偷拍自拍| 国产一区二区无遮挡| 色猫猫成人app| 久久人人看视频| 思思99re6国产在线播放| 亚洲精品一区二区三区精华液| 中文无码av一区二区三区| 亚洲午夜久久久久久久久电影院 | 国产精品免费一区二区三区都可以| av免费在线观看网站| 精品亚洲国产视频| 国产黄色一级大片| 欧美三区在线观看| 日韩精品在线不卡| 亚洲欧美偷拍另类a∨色屁股| 国产伦精品一区二区三区妓女| 国内精品伊人久久久久av影院| 免费在线激情视频| 国产精品草草| 宅男一区二区三区| 欧美理论在线播放| 国产一区福利视频| 色综合一区二区日本韩国亚洲| 欧美在线亚洲在线| 福利在线导航136| 欧美成人激情视频| 色综合久久影院| 亚洲片在线观看| 天天插天天干天天操| 日韩欧美第一区| 国产美女精品视频国产| 欧美视频在线观看一区二区| 国产免费一区二区三区四区五区| 婷婷成人综合网| 久久久精品国产sm调教网站| 中文字幕日韩精品一区| 欧美激情视频二区| 久久精品亚洲精品国产欧美| 特级西西人体wwwww| 不卡av电影在线播放| 日本人妻一区二区三区| 国产乱人伦精品一区二区在线观看 | 国产丝袜一区二区| 日韩有码第一页| 精品国内二区三区| 亚洲第一页视频| 精品欧美一区二区三区精品久久| 精品二区在线观看| 欧美一区二区三区免费在线看 | 日韩久久免费视频| 色视频在线看| 亚洲精品视频免费在线观看| 深夜视频在线免费| 亚洲欧美国产一区二区三区| 蜜桃视频在线播放| 在线观看国产精品91| 91涩漫在线观看| 日韩视频第一页| 成人福利在线观看视频| 美女视频久久黄| 毛片网站在线看| 午夜精品久久久久久久99热| www.youjizz.com在线| 国产69久久精品成人| 黑人精品一区| 国产精品96久久久久久又黄又硬| 日韩国产网站| 国产日韩在线播放| 欧美日本三级| 精品网站在线看| 国产精品三级| 中国成人亚色综合网站| 中文字幕一区二区精品区| www.欧美黄色| 午夜一区不卡| 亚洲免费黄色网| 国内成+人亚洲+欧美+综合在线| 被黑人猛躁10次高潮视频| 国产超碰在线一区| 双性尿奴穿贞c带憋尿| 国产无人区一区二区三区| 很污很黄的网站| 亚洲一区二区在线免费看| chinese国产精品| 91麻豆精品国产| 午夜激情小视频| 日日摸夜夜添一区| 不卡视频观看| 国产精品高精视频免费| 免费欧美网站| 欧美日韩一区二区视频在线观看| 91精品一区二区三区综合在线爱| 日韩欧美国产综合在线| 日本aⅴ亚洲精品中文乱码| 黑人无套内谢中国美女| 久久久亚洲精品石原莉奈| 成人免费视频国产免费观看| 五月婷婷综合激情| 一级做a爱片久久毛片| 亚洲福利在线看| 日本在线天堂| 欧美性视频网站| 9999在线精品视频| 开心色怡人综合网站| 一本精品一区二区三区| 各处沟厕大尺度偷拍女厕嘘嘘| 国产综合久久久久影院| 日韩av一二区| 一区二区三区久久| 亚洲一级特黄毛片| 亚洲美腿欧美激情另类| 99在线播放| 国产日韩欧美视频| 免费久久精品| 国产日韩欧美精品在线观看| 精品一区二区三区在线播放| 欧美一区二区三区成人精品| 亚洲欧美激情一区二区| 中日韩av在线| 亚洲色图国产精品| а√在线天堂官网| 亚洲自拍偷拍网址| 99re66热这里只有精品8| 欧美aⅴ在线观看| 成人午夜碰碰视频| 波多野结衣不卡视频| 欧美亚洲动漫精品| 日韩午夜影院| 亚州国产精品久久久| 日本在线一区二区三区| 久久免费看毛片| 免费成人在线影院| 免费视频91蜜桃| 欧美性开放视频| 香蕉视频黄色片| 欧美精品精品精品精品免费| 人人爱人人干婷婷丁香亚洲| 一本色道久久综合亚洲精品婷婷 | 丰满岳乱妇一区二区| 一区二区国产视频| www.蜜臀av.com| 欧美成人在线免费| 视频一区日韩| 成人一区二区av| 国产成人亚洲综合a∨婷婷| 成人免费精品动漫网站| 欧美另类videos死尸| 欧美黑人激情| 成人亲热视频网站| 中文在线日韩| 18禁一区二区三区| 夜夜亚洲天天久久| 亚洲精品视频专区| 久久久久久久999精品视频| 电影一区二区在线观看| av日韩一区二区三区| 91在线观看一区二区| 国产手机在线视频| 亚洲精品视频久久| 亚洲精品国产嫩草在线观看| 亚洲欧美日韩精品在线| 美国三级日本三级久久99| 国产精品精品软件男同| 日韩欧美在线影院| а√在线天堂官网| 日本不卡二区| 久久91精品久久久久久秒播| 丝袜美腿小色网| 亚洲国产欧美一区二区丝袜黑人| 中文字幕在线免费观看视频| 欧洲国产精品| 精品夜夜嗨av一区二区三区| 免费在线观看一级片| 亚洲成人精品视频在线观看| 在线观看v片| 亚洲v国产v| 国产**成人网毛片九色| 日本中文字幕免费观看| 亚洲欧美日韩另类| 日本成人一区二区| 日韩极品视频在线观看| 久久久久99精品一区| 一级黄色大片免费| 欧美黑人国产人伦爽爽爽| 日韩最新在线| 亚洲欧美自拍另类日韩| 亚洲一区在线免费观看| 免费在线黄色电影| 亚洲xxxx在线| 爽好久久久欧美精品| 农村黄色一级片| 亚洲色图第三页| 白嫩白嫩国产精品| 国内自拍视频网| 午夜精品久久久久久久| 日本在线视频网| 久久66热这里只有精品| 久久99久久久久久久久久久| 国产在线拍揄自揄拍无码视频| 亚洲一级黄色av| 久久国产精品免费精品3p| www.久久91| 欧美日韩亚洲国产一区| 国产成人l区| 日韩电影大全在线观看| 粉嫩在线一区二区三区视频| 成人黄色三级视频| 98精品国产高清在线xxxx天堂|