精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

單卡A100實現百萬token推理,速度快10倍,這是微軟官方的大模型推理加速

人工智能 新聞
微軟的這項研究讓開發者可以在單卡機器上以 10 倍的速度處理超過 1M 的輸入文本。

大型語言模型 (LLM) 已進入長上下文處理時代,其支持的上下文窗口從先前的 128K 猛增到 10M token 級別。

然而,由于注意力機制的二次復雜度,模型處理輸入提示(即預填充階段)并開始產生第一個 token 可能需要幾分鐘時間。導致首個 token 生成的時間過長,從而嚴重影響了用戶體驗,這也極大地限制了長上下文 LLM 的廣泛應用。 

舉例來說(如圖 2a 所示),在單臺裝有 A100 的機器上為 LLaMA-3-8B 提供服務時,如果提示有 30 萬個 token,模型需要 6 分鐘才能完成預填充( pre-filling)階段,如果提示增加到 100 萬個 token,這個數字將增加到 30 分鐘。

自注意力計算的開銷占到了總預填充延遲的 90% 以上,這使其成為 LLM 處理長上下文時的主要瓶頸。現有的加速預填充方法在應用于長上下文 LLM 時通常無法保持可接受的準確性或效率。

為了解決上述問題,來自微軟、薩里大學的研究者提出了一種旨在加速長序列處理預填充的稀疏計算方法:MInference( Milliontokens Inference )。

圖片

  • 論文地址:https://arxiv.org/pdf/2407.02490
  • 論文主頁:https://hqjiang.com/minference.html
  • 論文標題:MInference 1.0: Accelerating Pre-filling for Long-Context LLMs via Dynamic Sparse Attention

MInference 可以直接應用于現有 LLM,無需對預訓練設置進行修改或額外的微調。

通過對各種下游任務(包括 InfiniteBench、RULER、PG-19 和 Needle In A Haystack)以及模型(包括 LLaMA-3-1M、Yi-200K、GLM-4-1M、Phi-3-128K 和 Qwen2-128K)進行評估,實驗證明 MInference 可有效將 A100 上的預填充推理延遲降低多達 10 倍,同時保持準確性。

圖片

使用 MInference 1.0 ,長上下文 LLM(如 LLaMA-3-8B-1M、GLM-4-1M)在單個 A100 上的推理速度實現了 10 倍提升,并且準確度更高。

方法介紹

作者提出了 MInference,這個名字反映了他們希望在一臺 A100 機器上實現百萬(million)token 推理的雄心。

MInference 是一種無需訓練的高效方法,用于基于動態稀疏注意力的長上下文 LLM 的預填充階段。

研究者認為注意力,特別是在長上下文中,是稀疏和動態的,即在不同的輸入中,稀疏模式有很大的不同。這種動態稀疏性呈現出三種適用于所有輸入的獨特空間聚合模式:A 形(A-shape)、垂直 - 斜線(Vertical-Slash)和塊狀 - 稀疏(Block-Sparse)。

MInference 首先使用內核感知稀疏模式搜索算法為每個頭部離線確定最佳動態稀疏模式,如算法 1 所示。在推理過程中,它會根據頭部的模式動態逼近動態稀疏指數,如算法 2、3 所示。最后,作者使用優化后的 GPU 內核執行高效的動態稀疏注意力計算,大大減少了長上下文 LLM 的預填充階段延遲。

圖片

例如,對于「垂直 - 斜線」模式,作者首先利用最后一個 Q 和 K 之間的注意力計算來估計垂直線和斜線的最佳指數。然后,他們利用動態稀疏編譯器 PIT 和 Triton 構建垂直 - 斜線 FlashAttention 內核,加速注意力計算。對于 A 形、垂直 - 斜線和塊狀 - 稀疏模式,作者首先在注意力計算中使用 Q 和 K 的均值池。利用均值池和 MatMul 的交換屬性,可以估算出塊狀 - 稀疏指數。然后,他們使用 Triton 構建塊稀疏 FlashAttention 內核,加速注意力計算。有關內核的詳細實現,請參閱附錄 C.4 和代碼。

在長上下文基準中的評估結果

作者在一系列場景中測試了 MInference,包括 QA、編碼、基于檢索的任務、multi-hop QA、總結和數學任務。RULER 基準包括幾個復雜的 multi-hop 或 multi-needle 任務,有效地反映了 LLM 的實際上下文窗口大小。如表 1 所示,MInference 有效地保留了 LLM 的實際上下文窗口處理能力,甚至將實際上下文窗口大小略微擴展到 32K。

圖片

作者還使用平均 token 長度為 214K 的 InfiniteBench 在更廣泛的任務中測試了 MInference,如表 2 所示。與 SoTA 基線相比,MInference 在所有任務中都始終保持了良好的性能。值得注意的是,在更具挑戰性的檢索任務(如 KV 檢索任務)中,所有基線都無法做出準確預測,準確率低于 1.2%。但是,MInference 成功地保留了處理動態 KV 對檢索的能力。

圖片

為了進一步評估不同上下文長度和關鍵信息在提示中不同位置時的性能,作者使用「大海撈針」任務測試了各種模型和方法。如圖 1 所示,MInference 在不同的模型、上下文窗口和提示信息位置下都表現良好,與原始模型相比,其性能保持不變甚至略有提高。在 LLaMA-3-8B 和 GLM-4-9B-1M 的情況下,MInference 在高達 1M 的上下文窗口中實現了完全綠色的性能。相比之下,即使在 70K 上下文窗口中,StreamingLLM 和 InfLLM 在提示的中間段性能也會下降到 20% 以下。

圖片

作者還使用 PG-19 在語言模型任務中測試了 MInference,其中包括多達 100k 的 token。如圖 2 所示,MInference 有效地保持了 LLaMA-3-8B 和 Yi-9B-200K 的困惑度,而所有基線都出現了不同程度的困惑度下降。此外,與標準的 StreamingLLM 相比,使用膨脹和步長配置的 StreamingLLM 更好地保持了困惑度性能。

圖片

延遲和內核中的稀疏模式 

圖 3 展示了本文提出的三種注意力模式以及 FlashAttention 的微基準測試結果。可以看出,Vertical-Slash 是三種模式中最慢的,但在 1M 上下文窗口下,相比 FlashAttention 仍然實現了 13 倍的加速。

圖片

圖 4 展示了 Vertical-Slash 頭部內核中的稀疏索引。垂直線通過 PIT FlashAttention 使用 1x64 塊計算,而斜線通過塊級 FlashAttention 使用 64x64 塊計算。

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-06-11 14:39:50

AILLMMistral

2025-11-04 16:01:56

英偉達模型AI

2024-07-19 09:59:31

2023-12-22 09:32:13

引擎模型

2024-01-24 13:11:00

AI模型

2023-01-05 09:33:37

視覺模型訓練

2023-01-18 09:51:56

模型開源

2025-10-14 08:58:00

2023-12-11 15:40:32

PyTorch代碼大模型

2025-10-21 08:54:00

微軟LLM模型

2024-09-09 08:31:15

2024-01-10 17:13:42

模型數據

2023-11-30 18:25:57

數據訓練

2023-05-30 14:17:00

模型推理

2023-03-22 13:53:26

芯片英偉達

2025-01-08 13:15:02

2024-09-23 08:20:00

模型訓練

2023-01-05 13:11:20

模型

2023-01-08 13:22:03

模型

2025-06-16 14:41:07

模型開源AI
點贊
收藏

51CTO技術棧公眾號

欧美精品一区二区三区蜜桃| 中文字幕一区二区三区四区不卡 | 婷婷亚洲五月| 精品日韩一区二区三区免费视频| 国产中文字幕乱人伦在线观看| 亚洲 国产 欧美 日韩| 国产一区二区高清| 中文字幕亚洲综合久久| 少妇精品无码一区二区| 625成人欧美午夜电影| 国产精品久久福利| 精品免费日产一区一区三区免费| 在线免费一区二区| 国产一区二区三区自拍| 亚洲人成在线播放| 一区二区在线免费观看视频| 卡通欧美亚洲| 一区二区三区欧美日| 欧美精品亚洲| 成人午夜福利视频| 九色|91porny| 青青草精品毛片| 国产卡一卡二在线| 老司机午夜福利视频| 久久国产精品色| 26uuu另类亚洲欧美日本一| 天天色影综合网| 中国av一区| 精品国产91九色蝌蚪| 国产成人美女视频| 中文字幕 在线观看| 一区二区三区在线观看欧美 | 欧美成人精品一区二区三区在线看| 精品99久久久久久| 99999精品| 久久久久伊人| 欧美影视一区在线| 日韩精品一区二区三区久久| 免费电影网站在线视频观看福利| 中文字幕 久热精品 视频在线| 激情久久av| 性一交一乱一色一视频麻豆| 久久av资源网| 国产日韩中文在线| 无码人妻丰满熟妇区五十路| 99在线|亚洲一区二区| 久久久久久久久久久国产| 青青操视频在线播放| 日韩一区自拍| 中文字幕不卡在线视频极品| 亚洲永久精品ww.7491进入| 国产精品高潮呻吟久久久久 | 无码国产精品96久久久久| 国产一区二区精品久久| 成人自拍性视频| 国产精品久久久久久久成人午夜| 日韩电影免费一区| 国产精品高潮在线| 五月激情丁香网| 日韩av一级片| 国产欧美日韩亚洲精品| 国产精品视频一区二区三区,| 久久99精品久久久久婷婷| 国产精品视频免费观看www| 中文字幕无线码一区| 欧美电影一区| 色妞在线综合亚洲欧美| 亚洲欧美综合7777色婷婷| 色综合咪咪久久网| 美女啪啪无遮挡免费久久网站| 国语对白在线播放| 欧美日韩一区二区三区四区在线观看| 欧美极品第一页| 国产乱码久久久久久| 国产欧美在线| 国产精品成人在线| 亚洲怡红院av| 国产激情视频一区二区三区欧美 | 天天综合网91| 少妇精69xxtheporn| 美女av免费看| 亚洲成人三区| 91国内精品久久| 日本免费精品视频| 国产综合色产在线精品| 国产精品成人一区二区三区| 无码精品在线观看| 国产喷白浆一区二区三区| 亚洲一区二区三区色| 在线中文字幕电影| 精品欧美国产一区二区三区| 91蝌蚪视频在线观看| 成人黄色91| 亚洲精品国精品久久99热一| 亚洲午夜久久久久久久国产| 亚欧美无遮挡hd高清在线视频| 色综合导航网站| 亚洲影院在线播放| 国内成人精品2018免费看| 国语精品中文字幕| 天堂аⅴ在线地址8| 亚洲综合色噜噜狠狠| 欧美精品无码一区二区三区| 成人在线啊v| 亚洲乱码一区av黑人高潮| 一本一本久久a久久| 99国产精品视频免费观看一公开 | 精品久久国产一区| 亚洲开心激情网| 国产精品国产精品88| 亚洲综合欧美| 不卡一卡2卡3卡4卡精品在| 成人77777| 午夜精品福利一区二区蜜股av| 色噜噜狠狠一区二区| 视频福利一区| 欧美精品少妇videofree| 国产一区二区视频免费| 国产精品91xxx| 亚洲日本欧美在线| 亚洲一二三四| 精品99一区二区| www.av免费| 日韩和欧美一区二区三区| 国产精品乱码视频| 巨大荫蒂视频欧美另类大| 色综合天天综合狠狠| 三级视频网站在线观看| 午夜日韩在线| 国产日韩欧美在线看| 可以在线观看的av网站| 午夜精品久久久久久久| av电影中文字幕| 五月婷婷六月综合| 国产欧美日韩综合精品| 成人在线播放视频| 一本色道久久综合精品竹菊| 国产婷婷在线观看| 黄色一区二区三区四区| 91成人免费视频| 蜜桃视频网站在线| 欧美日韩你懂的| 永久免费毛片在线观看| 丝袜美腿成人在线| 日本免费高清一区二区| xx欧美xxx| 国产丝袜一区二区| www.国产一区二区| 久久久久久99精品| 粉嫩虎白女毛片人体| 亚洲综合图色| 国产精品国产三级国产aⅴ浪潮 | 久久精品亚洲热| 96日本xxxxxⅹxxx17| 国产精品久久夜| 狠狠操狠狠干视频| 久久久久久久久久久久久久久久久久 | 蜜桃av在线| 日韩av综合中文字幕| 日韩欧美激情视频| 91视频观看免费| 日韩一级在线免费观看| 精品理论电影| 91精品国产综合久久久久久蜜臀 | 亚洲欧美日韩中文字幕一区二区三区 | 成人免费福利在线| gogogo高清在线观看免费完整版| 在线看不卡av| 91香蕉国产视频| 狠狠色丁香久久婷婷综合丁香| 最新欧美日韩亚洲| 欧美高清hd| 欧美激情一区二区三区在线视频观看| 欧美一级在线免费观看 | 被灌满精子的波多野结衣| 韩国精品福利一区二区三区| 91a在线视频| 黄色国产在线| 在线不卡一区二区| 久久精品国产亚洲av麻豆色欲| 顶级嫩模精品视频在线看| 免费观看美女裸体网站| 国产欧美高清视频在线| 国产主播在线一区| 黑人极品ⅴideos精品欧美棵| 亚洲黄在线观看| 国产免费a视频| 亚洲天堂免费看| 国产精品久久AV无码| 日韩电影在线一区| 国产黄色激情视频| 国产精品片aa在线观看| 91嫩草免费看| 欧亚一区二区| 久久91亚洲人成电影网站| 亚洲aaaaaaa| 91精品国产一区二区三区| 日韩av黄色片| 亚洲视频综合在线| 中文字幕5566| 国产精品99久久久久久久女警| 久久久久久久中文| 91成人国产| 欧美一区二区影视| 日韩欧美高清一区二区三区| 国产91在线播放九色快色| 伊人福利在线| 中文字幕国内精品| 色一情一乱一乱一区91av| 欧美日韩精品久久久| 天天操天天干视频| 亚洲视频在线观看三级| 老熟妇一区二区| 成人av中文字幕| 亚洲男人天堂2021| 日韩中文欧美在线| 黄色一级在线视频| 一区二区三区在线观看免费| 麻豆91蜜桃| 都市激情亚洲| 成人乱色短篇合集| 国产在线|日韩| 欧美一区二区三区四区在线| 香蕉成人app免费看片| 色哟哟网站入口亚洲精品| 男人天堂网在线观看| 亚洲国产美女精品久久久久∴| 国产精品永久久久久久久久久| 一本大道久久a久久综合| www.av视频在线观看| 亚洲精选一二三| 国产午夜精品理论片| 中文字幕不卡一区| 久久丫精品忘忧草西安产品| 91丝袜美腿高跟国产极品老师| 在线看黄色的网站| 亚洲成在人线免费观看| 91精品国产综合久久蜜臀| 看黄色一级大片| 一本一道波多野结衣一区二区| 日韩高清免费av| 亚洲国产精品人人做人人爽| 欧美日韩大片在线观看| 亚洲日本在线a| 成人高潮免费视频| 中文字幕一区二区视频| 亚洲女同二女同志奶水| 国产精品麻豆一区二区| 1024在线看片| 中文字幕一区在线观看视频| 日韩av毛片在线观看| 亚洲欧洲日产国码二区| 国产男女猛烈无遮挡在线喷水| 国产精品毛片高清在线完整版| 丁香花五月婷婷| 国产精品不卡视频| wwwav国产| 亚洲一区二区偷拍精品| 国产无码精品在线观看| 偷拍与自拍一区| 无码一区二区三区| 欧美亚洲国产怡红院影院| 在线观看不卡的av| 欧美肥胖老妇做爰| www.热久久| 亚洲精品v欧美精品v日韩精品| 色视频在线观看| 中日韩美女免费视频网址在线观看 | 日韩av影院在线观看| 青青草在线播放| 中文在线资源观看视频网站免费不卡| 日本免费视频在线观看| 欧美成人久久久| 天堂网在线最新版www中文网| 日韩美女视频免费在线观看| 欧美爱爱视频| 国产精品一区二区你懂得| 欧美日韩一区二区三区四区不卡| 鲁丝一区二区三区免费| 日韩在线高清| 欧美中文字幕在线观看视频| 亚洲欧美网站| 岛国毛片在线播放| 成人午夜精品在线| 国产精品一二三区在线观看| 日韩毛片在线免费观看| 日本一二三区不卡| 欧美视频三区在线播放| 精品女同一区二区三区| 亚洲摸下面视频| 国产欧美黑人| 日本韩国在线不卡| 99精品美女视频在线观看热舞| 国产主播一区二区三区四区| 精品日韩欧美一区| 国产情侣第一页| 日韩不卡在线观看日韩不卡视频| 国模大尺度视频| 国产亚洲自拍一区| 免看一级a毛片一片成人不卡| 在线视频一区二区免费| 国产综合视频在线| 亚洲日韩欧美视频一区| 中中文字幕av在线| 国产精品激情自拍| 9999久久久久| 一区二区视频国产| 国产一区二区三区久久久久久久久| 中文字幕资源在线观看| 久久亚洲精品小早川怜子| 2021亚洲天堂| 欧美日韩在线三级| 性感美女福利视频| 欧美大片在线看免费观看| 草民电影神马电影一区二区| 久久资源亚洲| 亚洲成人直播| 妖精视频在线观看| 国产精品嫩草影院com| 免费看毛片网站| 亚洲国产高清高潮精品美女| 成人无遮挡免费网站视频在线观看| 国产成人一区二区| 日日天天久久| 九色自拍视频在线观看| 国产剧情一区二区| 波兰性xxxxx极品hd| 日本乱码高清不卡字幕| 天天摸夜夜添狠狠添婷婷| 色综合天天狠天天透天天伊人| 日韩一区二区三区四区五区| 日韩av一区二区三区美女毛片| 亚洲伊人观看| 少妇户外露出[11p]| 亚洲高清三级视频| 亚洲精品一区二区三区不卡| 欧美超级乱淫片喷水| 国产日韩在线观看视频| 手机福利在线视频| 久久99在线观看| 日本不卡一二区| 欧美精品xxxxbbbb| 伦xxxx在线| 成人美女av在线直播| 天天影视天天精品| 中文字幕乱妇无码av在线| 亚洲色图一区二区| a在线观看视频| 久久99久久99精品中文字幕| 欧美成人精品午夜一区二区| 亚洲av首页在线| 成人免费毛片高清视频| 日韩三级视频在线| 日韩精品视频中文在线观看| 天堂√中文最新版在线| 区一区二区三区中文字幕| 日本伊人午夜精品| 一本一本久久a久久| 欧美一区二区黄| 国产偷倩在线播放| 精品视频导航| 视频一区欧美日韩| 天天操天天摸天天舔| 欧美一级二级在线观看| 免费在线播放电影| 久久综合福利| 青青草一区二区三区| 91狠狠综合久久久| 欧美sm美女调教| 亚洲风情在线资源| 亚洲欧美日韩精品久久久| 国产一区二区精品久久99| 五月天婷婷丁香| 亚洲欧美在线第一页| 欧美激情福利| 国产xxxx振车| 国产日韩欧美不卡| 国产丝袜视频在线观看| 97婷婷大伊香蕉精品视频| 欧美一区二区三区高清视频| 国产又粗又猛大又黄又爽| 亚洲高清不卡在线观看| 国产色在线 com| 亚洲综合国产精品| 男人天堂欧美日韩| 亚洲欧美卡通动漫| 日韩av影视在线| gogo大尺度成人免费视频| 免费超爽大片黄| 国产精品丝袜在线| 国产自产一区二区| 国产日本欧美一区二区三区| 欧美午夜一区| 亚洲av毛片基地| 亚洲成人动漫在线播放| 国产91精品在线| 97在线国产视频| **欧美大码日韩| 男男激情在线| 国产91视觉|