精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Mamba核心作者新作:取代DeepSeek在用的注意力機制,專為推理打造

人工智能 新聞
在保持模型性能不變的情況下,將解碼速度和吞吐量最高提升2倍,大大優化了模型的長上下文推理能力。

曾撼動Transformer統治地位的Mamba作者之一Tri Dao,剛剛帶來新作——

提出兩種專為推理“量身定制”的注意力機制。

在保持模型性能不變的情況下,將解碼速度和吞吐量最高提升2倍,大大優化了模型的長上下文推理能力。

圖片

這項研究的三位作者均來自普林斯頓大學,論文主要有兩大貢獻:

其一,提出Grouped-Tied Attention(GTA),與已集成到LLaMA 3的注意力機制GQA質量相當,但KV緩存用量減少約50%。

其二,提出Grouped Latent Attention(GLA),與DeepSeek所使用的注意力機制MLA質量匹配,但解碼速度更快,某些情況下比FlashMLA快2倍。

按照作者之一Ted Zadouri的總結:

GTA是GQA的有效替代品,而GLA是MLA的實用替代品。

圖片

一言以蔽之,通過優化注意力機制的內存使用計算邏輯,在不犧牲模型生成質量的前提下,可顯著提升大語言模型的推理效率和硬件資源利用率,尤其在長上下文場景中優勢更為突出。

相關論文公布后,一眾研究者也趕來祝賀~

圖片

那么,這項研究具體講了些啥?

引入推理感知注意力機制

概括而言,論文核心引入了推理感知注意力機制,即針對模型推理階段的內存冗余、計算低效、長上下文瓶頸等問題,重新設計注意力機制。

據Tri Dao介紹,這項研究的起點始于一個想法:

在推理驅動AI發展的時代,“理想”架構應該是什么樣子?

尤其在涉及長上下文推理時,當前的大語言模型(LLM)面臨內存訪問瓶頸并行性限制兩大難題。

就是說,模型生成文字時,每次都要從內存里調取大量“歷史記錄”,不僅導致每個字生成變慢,而且只能按順序生成、沒法讓多個芯片同時干活。

對此,團隊打算從兩個方向重新設計注意力機制:

  • 更高的硬件效率:通過增加 “每字節內存加載的計算量”(算術強度),減少對內存帶寬的依賴;
  • 保持并行可擴展性:在不犧牲模型并行訓練 / 推理能力的前提下優化解碼速度。

而最終提出的GTA和GLA,在減少KV緩存用量的同時,模型質量保持與現有方案相當,且解碼速度顯著提升。

這里提到的“現有方案”,主要指早已聞名學術界的兩種方法:

一是分組查詢注意力(GQA)機制,它通過分組共享KV緩存減少內存占用,在視覺Transformer(ViT)等任務中表現良好,適用于大規模數據處理,目前已應用于Llama 3等開源模型。

二是多頭潛在注意力(MLA)機制,最早可追溯到《Attention Is All You Need》這篇論文,后被DeepSeek再次帶火。它關注的是在不同層之間如何融合注意力信息,能減少每一層的冗余計算。

不過,由于GQA仍需為每組查詢頭存儲獨立KV、MLA并行優化不足,故仍需進一步改進。

下面分別展開團隊提出的新方法GTA和GLA。

分組綁定注意力機制GTA

GTA的核心設計思路是:將不同查詢頭的鍵(Key)和值(Value)狀態進行組合與重用,減少內存傳輸次數。

具體而言(右圖),它將多頭注意力的頭分為若干組(Group),每組內的頭共享相同的Key和Value參數。計算時,同一組內的頭使用相同的KV緩存,僅查詢(Query)參數獨立。

相比之下,中間傳統的多頭注意力機制(MHA)每個查詢頭都有獨立的鍵和值,由于沒有共享,導致它需要更多的內存來存儲所有的鍵和值。

再對比GQA來看(左圖),GQA分組共享KV但每組仍獨立存儲,而GTA通過參數綁定實現了更徹底的KV重復利用。

圖片

分組潛在注意力機制GLA

而GLA的設計則采用了雙層結構

  • 潛在層(Latent Layer):引入固定數量的潛在Tokens,作為全局上下文的壓縮表示,替代部分原始Token的KV緩存;
  • 分組頭機制:將查詢頭分組,每組頭共享潛在Token的KV,同時保留與原始Token的交互。

在解碼過程中,對比MLA(左圖),GLA通過共享聯合潛在表示減少了每個設備需要加載的KV緩存量,從而減少了內存訪問量。

并且由于每個設備上的KV緩存量減少了,更多的請求也可以同時處理。

圖片

「GQA和MLA」的有效替代品

那么,GTA和GLA的效果究竟如何呢?

團隊在四種規模的模型上進行了實驗,包括小型(183M)、中型(433M)、大型(876M)和XL(1471M)。這些模型基于FineWeb-Edu-100B數據集訓練,采用GPT-3架構和Llama 3分詞器。

測試的指標主要分為兩大類:

  • 質量指標:困惑度(Perplexity)、下游任務準確率(Winogrande、SciQ等7個基準);
  • 效率指標:每Token解碼延遲、吞吐量、KV緩存占用量。

實驗對比了GQA、MLA、FlashMLA、傳統MHA等多種注意力機制。

困惑度實驗顯示,GTA在中大型模型上優于GQA,說明GTA可能更適合模型的進一步擴展;而GLA在多數場景下與MLA相當,說明GLA的設計是合理的,它能在并行計算和模型質量之間找到一個較好的平衡點。

圖片

幾種方案在下游任務中(涵蓋典型常識推理、邏輯推理和知識問答等場景)的整體表現差距不大。

但從變化趨勢來看(下圖為從中型到大型),GTA和GLA可以保持或提高從中型到XL尺寸的下游任務性能

圖片圖片

KV緩存方面,不犧牲模型質量的前提下,GTA相比GQA減少約50%的KV緩存,驗證了 “參數綁定+分組重用” 的有效性。

同時,針對查詢長度為1的情況,MLA已接近計算瓶頸(達到610 TFLOPS/s ),而GLA尚未使計算資源飽和(360 TFLOPS/s )。

且隨著序列長度從1K增加到64K ,GLA的解碼速度比FlashMLA快2倍。

此外,在實時服務器性能測試中,對于64個并發請求的輸出吞吐量(越高越好),相同并行方案下GLA的表現均優于MLA。

圖片

接下來,團隊還在DeepSeek Coder V2 Base (236B)模型上,當使用FP8精度時,對比了二者在不同預填充長度和解碼長度下的輸出吞吐量。

結果顯示,在預填充長度為32K和64K時,GLA-8的輸出吞吐量明顯高于MLA。這表明在處理長上下文時,GLA在吞吐量上優于MLA。

在處理不均衡負載時,GLA-8同樣展現出更高的輸出吞吐量。這表明GLA在處理不同長度的請求時,能夠更有效地利用資源,提高整體性能。

圖片

以上實驗均驗證了論文作者的說法,「GTA和GLA」是「GQA和MLA」的有效替代品。

圖片

論文作者均來自普林斯頓大學

論文作者包括Tri Dao在內一共三位,均來自普林斯頓大學。

圖片

Ted Zadouri,目前是普林斯頓大學博士生,研究方向為機器學習。

之前曾在英特爾有過兩段實習經歷(研究深度學習),還短暫在AI創企Cohere擔任研究員。

圖片

Hubert Strauss,普林斯頓大學研究工程師,研究方向為機器學習和模型深度學習。

本科畢業于法國知名工程學校Arts et Métiers,之后在佐治亞理工學院取得運籌學碩士學位。

畢業后曾有多段實習和工作經歷,成為普林斯頓大學工程師之前曾在一家公司擔任機器學習工程師,負責模型訓練和Transformer優化。

圖片

Tri Dao,目前是普林斯頓大學計算機科學助理教授,還是生成式AI初創公司Together AI的首席科學家。

他因提出一系列優化Transformer模型注意力機制的工作而聞名學界。

其中最有影響力的,是其作為作者之一提出了Mamba架構,這一架構在語言、音頻和基因組學等多種模態中都達到了SOTA性能。

尤其在語言建模方面,無論是預訓練還是下游評估,Mamba-3B模型都優于同等規模的Transformer模型,并能與兩倍于其規模的Transformer模型相媲美。

另外他還參與發表了FlashAttention1-3版本,FlashAttention被廣泛用于加速Transformers,已經使注意力速度提高了4-8倍。

圖片

Anyway,回到這項研究,論文作者Ted Zadouri直言:

這只是邁向test-time推理“理想”架構的第一步!

圖片

論文:
https://arxiv.org/abs/2505.21487
代碼:
https://github.com/Dao-AILab/grouped-latent-attention

責任編輯:張燕妮 來源: 量子位
相關推薦

2018-08-26 22:25:36

自注意力機制神經網絡算法

2025-02-25 10:21:15

2025-02-10 00:00:55

MHAValue向量

2025-02-14 11:22:34

2025-02-19 15:30:00

模型訓練數據

2023-11-24 12:36:00

模型訓練

2024-09-19 10:07:41

2023-06-12 09:57:22

AIChatGPT

2025-09-29 18:51:01

2025-02-26 14:32:51

2025-02-24 13:00:00

YOLOv12目標檢測Python

2024-10-31 10:00:39

注意力機制核心組件

2024-06-28 08:04:43

語言模型應用

2014-05-19 11:24:18

Teradata 大數據天睿

2024-09-02 08:45:00

模型生成

2025-08-26 15:31:35

英偉達模型架構

2023-12-11 14:21:00

模型訓練

2020-09-17 12:40:54

神經網絡CNN機器學習

2021-07-22 10:12:00

神經網絡數據圖形

2025-10-16 09:00:00

大模型
點贊
收藏

51CTO技術棧公眾號

永久看看免费大片| 亚洲最新在线| 中文字幕免费高清网站| 99久久婷婷这里只有精品 | 日本一区二区三区国色天香| 国产综合香蕉五月婷在线| 欧美人妻一区二区| 国产成人精品三级高清久久91| 欧美日韩国产在线播放网站| 亚洲理论电影在线观看| 成人一区二区不卡免费| 国产成人在线视频网站| 国产精品电影一区| 国产午夜精品一区二区理论影院| 国产综合久久久| 精品三级av在线| 三上悠亚在线一区| 欧美激情网站| 一区二区三区欧美| 亚洲精品9999| 日本一区视频| 风间由美性色一区二区三区| 国产精品久久久久久久久久ktv | 亚洲午夜福利在线观看| 国产精品成人**免费视频| 欧美小视频在线| 成人一级生活片| 免费a级毛片在线播放| 久久亚洲二区三区| 日韩欧美一二区| 欧美成人免费高清视频| 黑人精品视频| 亚洲欧洲韩国日本视频| 三区精品视频观看| 男人天堂av在线播放| 欧美日韩一区二区三区四区不卡| 欧美老女人在线| 免费在线观看毛片网站| 波多野结衣中文字幕久久| 综合电影一区二区三区| 台湾成人av| 国内在线精品| 蜜乳av一区二区| …久久精品99久久香蕉国产| 熟女俱乐部一区二区视频在线| 日本成人手机在线| 欧美人体做爰大胆视频| 国产一伦一伦一伦| 国产成人免费| 欧美色涩在线第一页| 成人久久久久久久久| 国产高潮在线| 精品国产福利视频| 国产 日韩 欧美在线| 天天操天天干天天干| 成人小视频在线| 成人黄动漫网站免费| www香蕉视频| 国产成人午夜视频| 丁香婷婷久久久综合精品国产| 精品人妻一区二区三区四区不卡 | 午夜免费一区| 久久久www成人免费精品张筱雨| 思思久久精品视频| 国内自拍亚洲| 日韩一区二区三| 粗大的内捧猛烈进出视频| 亚洲午夜精品| 亚洲精品黄网在线观看| 丰满少妇在线观看资源站| 亚洲婷婷伊人| 最近2019好看的中文字幕免费| 精品人妻一区二区乱码| 日韩在线观看中文字幕| 欧美不卡激情三级在线观看| 久久久久亚洲无码| 国产欧美亚洲精品a| 色婷婷久久av| 久久网免费视频| 国产农村妇女精品一区二区| 不用播放器成人网| www.av欧美| 99精品视频在线| 欧美精品亚州精品| 中日韩黄色大片| 青青草成人在线观看| 91色在线视频| 天天操天天插天天射| 欧美激情一区二区三区蜜桃视频| 国产精品av免费| 俺来俺也去www色在线观看| 欧美性猛交xxxx久久久| 中文字幕色网站| 女同另类激情重口| 日韩中文在线中文网三级| 国产亚洲小视频| 天堂午夜影视日韩欧美一区二区| 久久久久久12| 国产精品suv一区| 国产在线精品一区二区夜色| 国产视色精品亚洲一区二区| 成人免费高清在线播放| 亚洲欧美欧美一区二区三区| 日韩av片在线看| 91成人小视频| 亚洲欧美成人一区二区在线电影| 日韩欧美综合视频| 丝袜亚洲另类丝袜在线| 成人性色av| 98在线视频| 丁香五六月婷婷久久激情| 中文字幕日韩综合| 国产精品免费大片| 欧美夫妻性生活视频| 中文在线观看av| 不卡视频免费播放| 成人在线观看www| 成人国产一区二区三区精品麻豆| 亚洲高清在线观看| 久艹在线观看视频| 蜜桃av噜噜一区二区三区小说| 精品福利影视| 欧美另类tv| 在线播放日韩导航| 欧美激情 一区| 国产精品社区| 国产精品国产精品国产专区不卡| 免费观看成人高潮| 欧美午夜不卡在线观看免费| 欧美高清性xxxx| 精久久久久久| 国内精品在线一区| 国产人妖一区二区| 国产精品进线69影院| 亚洲成色www.777999| 亚洲理论电影| 欧洲亚洲免费视频| 婷婷在线免费观看| 一区二区不卡在线播放 | 日韩久久久久久久久久| 久久综合色天天久久综合图片| 国产精品videossex国产高清| 四虎精品永久免费| 日韩中文第一页| 在线观看毛片av| 国产精品免费观看视频| 秋霞在线一区二区| 91成人精品观看| 久热国产精品视频| 国产精品无码一区二区桃花视频| 粉嫩在线一区二区三区视频| 五月天综合婷婷| www 久久久| 欧美成人免费小视频| 国产夫妻性生活视频| 艳妇臀荡乳欲伦亚洲一区| 日韩av福利在线观看| 欧美韩国一区| 国产精品欧美久久| 日韩脚交footjobhd| 精品一区二区三区四区在线| 51国产偷自视频区视频| 国产日韩欧美综合一区| 中文字幕有码av| 波多野结衣在线一区二区| 色中色综合影院手机版在线观看| www毛片com| 国产欧美日韩在线观看| 中文字幕第38页| 亚洲欧美偷拍自拍| 国产精品亚洲综合| 日韩伦理在线一区| 在线电影欧美日韩一区二区私密| 亚洲一区二区激情| 一区二区三区中文字幕电影| 国产精品少妇在线视频| japanese国产精品| 91亚洲va在线va天堂va国| 手机av在线播放| 精品视频色一区| 午夜激情福利网| 日本视频在线一区| 在线一区亚洲| 久久精品亚洲成在人线av网址| 日韩中文字幕av| xxxwww在线观看| 富二代精品短视频| 久久av红桃一区二区禁漫| 成人自拍视频在线| 三级a在线观看| 欧美日韩视频一区二区三区| 欧美二区三区在线| 国产不卡精品| 欧美综合在线观看| 成人日韩欧美| 亚洲美女在线看| 国产夫妻自拍av| 在线观看亚洲成人| 国产一级片久久| 国产精品久久久久aaaa樱花| 91丨porny丨对白| 精品一区二区国语对白| 久久综合色视频| 亚洲视频电影在线| 欧洲亚洲一区二区三区四区五区| 日韩精品久久久久久久软件91| 国产精品成人播放| 岛国在线视频网站| 久久精品福利视频| 国产尤物视频在线| 亚洲国产黄色片| 精品人妻一区二区三区麻豆91 | 欧美一级大片在线观看| 国产一二区在线观看| 亚洲欧洲在线播放| 日本黄色三级视频| 欧美一区二区在线免费观看| 香蕉污视频在线观看| 亚瑟在线精品视频| 久久久久久福利| 亚洲欧美日韩人成在线播放| 亚洲精品国产精品国自产网站| www.亚洲色图.com| 三上悠亚 电影| 国产在线不卡一卡二卡三卡四卡| 污污视频网站免费观看| 99视频一区| 精品视频在线观看一区| 欧美午夜不卡| 小泽玛利亚av在线| 国产欧美视频在线| 国产精品久久久一区| 亚洲小少妇裸体bbw| 欧美极品第一页| 深夜国产在线播放| 欧美成人免费va影院高清| 黄色动漫在线| www.国产一区| 免费观看成人高潮| 久久久成人精品| 黄色av免费在线| 久久人人爽人人爽人人片亚洲 | 欧美成人一二三| 九七久久人人| 久久视频在线视频| 快射视频在线观看| 久久av在线看| 日韩另类在线| 欧美激情视频一区二区三区不卡| 在线观看男女av免费网址| 蜜月aⅴ免费一区二区三区| 1stkiss在线漫画| 色中色综合影院手机版在线观看| 欧美寡妇性猛交xxx免费| 欧美黑人又粗大| 麻豆免费在线| 国产成人在线一区| 日本免费成人| 96sao精品视频在线观看| 51vv免费精品视频一区二区| 国产乱子伦精品| 亚洲另类av| 亚洲成色www久久网站| 久久国产中文字幕| 欧美三级午夜理伦三级老人| 国产一区二区中文| 久久成人免费观看| 久久免费国产| 亚洲天堂一区二区在线观看| 成人短视频下载| 色婷婷在线影院| 中文字幕人成不卡一区| 九九视频免费在线观看| 欧美日韩国产限制| 一区两区小视频| 欧美一二三在线| 无码国产精品高潮久久99| 亚洲人成77777在线观看网| 天堂а√在线资源在线| 欧美高清在线观看| 二吊插入一穴一区二区| 97人人澡人人爽| 九色精品91| 成人手机视频在线| 国产精品久久777777毛茸茸| 五月天激情视频在线观看| 国产精品一区二区无线| 尤物视频最新网址| 亚洲精品国产精品乱码不99| 综合网在线观看| 制服丝袜亚洲网站| 蜜桃视频在线观看视频| 欧美成人免费全部| 国产一区二区主播在线| 91一区二区三区| 欧美日韩中字| 分分操这里只有精品| 久久97超碰国产精品超碰| 中文字幕乱码在线| 日韩码欧中文字| 天码人妻一区二区三区在线看 | 欧美一区二区少妇| 久久在线视频在线| 国产精品迅雷| caoporen国产精品| 91久久国产| 狠狠操精品视频| 成人免费黄色在线| 亚洲天堂网av在线| 91福利视频久久久久| 人妻精品一区二区三区| 久久亚洲电影天堂| jizz欧美| 四虎永久国产精品| 久久久噜噜噜久久狠狠50岁| 国产精品果冻传媒| 亚洲久本草在线中文字幕| 这里只有精品免费视频| 日韩电影中文字幕在线观看| 日本三级在线观看网站| 国产自摸综合网| av永久不卡| 国产美女三级视频| av在线这里只有精品| 国产乱国产乱老熟300| 欧美日韩三级视频| h视频在线观看免费| 国产经典一区二区| 要久久电视剧全集免费| 成人黄色av片| 成人av免费在线观看| 久久亚洲AV无码| 欧美成人a∨高清免费观看| 最新国产在线拍揄自揄视频| 成人午夜在线观看| 香蕉久久网站| 亚洲18在线看污www麻豆| 国产精品久久久久久福利一牛影视| 成人小视频在线播放| 亚洲日韩欧美视频| 国模冰冰炮一区二区| 欧美lavv| 老司机精品久久| 四季av中文字幕| 欧美日韩一区二区三区在线| aiai在线| 成人免费视频网址| 自拍视频亚洲| 国偷自产av一区二区三区麻豆| 亚洲精品国产高清久久伦理二区| 国产精品国产三级国产普通话对白 | 日韩一级中文字幕| 91av在线网站| 美日韩中文字幕| 在线观看国产一级片| 亚洲日本欧美天堂| 亚洲狼人综合网| 97超级碰碰碰久久久| 欧美人与牛zoz0性行为| 欧美精品性生活| 自拍偷拍亚洲激情| 亚洲产国偷v产偷v自拍涩爱| 国内精品久久影院| 国产欧美日韩在线观看视频| 色呦色呦色精品| 一区二区三区不卡在线观看| 日韩中文字幕影院| 人人爽久久涩噜噜噜网站| 第一会所亚洲原创| 亚洲热在线视频| 精品国产91久久久久久| 成年人视频在线免费观看| 91九色精品视频| 亚洲美女网站| 东方伊人免费在线观看| 欧美一激情一区二区三区| 日韩伦理福利| 制服丝袜综合日韩欧美| 成人精品一区二区三区中文字幕| 国产精品第5页| 欧美大胆a视频| 在线成人动漫av| 永久av免费在线观看| 精品福利视频导航| 性开放的欧美大片| 国产欧美一区二区三区另类精品| 日韩av二区在线播放| 黄色一级视频免费观看| 亚洲天堂成人在线| aiai久久| 无尽裸体动漫2d在线观看| 五月天激情小说综合| 黄色网页在线播放| 日本免费一区二区三区| 国产成人亚洲综合a∨婷婷图片| 91视频在线视频| 国内成人精品一区| 国产精品久久久乱弄| 三级网站在线免费观看| 精品久久99ma|