精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

?新一代注意力機制Lightning Attention-2:無限序列長度、恒定算力開銷、更高建模精度

人工智能 新聞
Lightning Attention-2 是一種新型的線性注意力機制,讓長序列的訓練和推理成本與 1K 序列長度的一致。

大語言模型序列長度的限制,極大地制約了其在人工智能領域的應用,比如多輪對話、長文本理解、多模態數據的處理與生成等。造成這一限制的根本原因在于當前大語言模型均采用的 Transformer 架構有著相對于序列長度的二次計算復雜度。這意味著隨著序列長度的增加,需要的計算資源成幾何倍數提升。如何高效地處理長序列一直是大語言模型的挑戰之一。

之前的方法往往集中在如何讓大語言模型在推理階段適應更長的序列。比如采用 Alibi 或者類似的相對位置編碼的方式來讓模型自適應不同的輸入序列長度,亦或采用對 RoPE 等類似的相對位置編碼進行差值的方式,在已經完成訓練的模型上再進行進一步的短暫精調來達到擴增序列長度的目的。這些方法只是讓大模型具有了一定的長序列建模能力,但實際訓練和推理的開銷并沒有減少。 

OpenNLPLab 團隊嘗試一勞永逸地解決大語言模型長序列問題。他們提出并開源了 Lightning Attention-2—— 一種新型的線性注意力機制,讓長序列的訓練和推理成本與 1K 序列長度的一致。在遇到顯存瓶頸之前,無限地增大序列長度并不會對于模型訓練速度產生負面影響。這讓無限長度預訓練成為了可能。同時,超長文本的推理成本也與 1K Tokens 的成本一致甚至更少,這將極大地減少當前大語言模型的推理成本。如下圖所示,在 400M、1B、3B 的模型大小下,隨著序列長度的增加,FlashAttention2 加持的 LLaMA 的訓練速度開始快速下降,然而 Lightning Attention-2 加持的 TansNormerLLM 的速度幾無變化。

圖 1

圖片

  • 論文:Lightning Attention-2: A Free Lunch for Handling Unlimited Sequence Lengths in Large Language Models
  • 論文地址:https://arxiv.org/pdf/2401.04658.pdf
  • 開源地址:https://github.com/OpenNLPLab/lightning-attention

Lightning Attention-2 簡介

讓大模型的預訓練速度在不同序列長度下保持一致,這聽起來是一個不可能的任務。事實上,如果一個注意力機制的計算復雜度相對于序列長度保持線性關系的話,就可以實現這一點。自 2020 年線性注意力【https://arxiv.org/abs/2006.16236】橫空出世以來,研究人員一直在為了線性注意力的實際效率符合它的理論線性計算復雜度而努力。在 2023 年之前,大多數的關于線性注意力的工作均集中在對齊它們與 Transformer 的精度上。終于在 2023 年中期,改進的線性注意力機制【https://arxiv.org/abs/2307.14995】在精度上可以與最先進的 Transformer 架構對齊。然而,線性注意力中將計算復雜度變成線性的最關鍵的 “左乘變右乘” 的計算 Trick (如下圖所示),在實際實現中遠慢于直接左乘的算法。其原因在于右乘的實現需要用到包含大量循環操作的累積求和(cumsum),大量的 IO 操作使得右乘的效率遠低于左乘。

圖片

圖 2

為了更好的理解 Lightning Attention-2 的思路,讓我們先回顧下傳統 softmax attention 的計算公式:O=softmax ((QK^T)⊙M_) V,其中 Q, K, V, M, O 分別為 query, key, value, mask 和輸出矩陣,這里的 M 在單向任務(如 GPT)中是一個下三角的全 1 矩陣,在雙向任務(如 Bert)中則可以忽略,即雙向任務沒有 mask 矩陣。

作者將 Lightning Attention-2 的整體思路總結為以下三點進行解釋:

1. Linear Attention 的核心思想之一就是去除了計算成本高昂的 softmax 算子,使 Attention 的計算公式可以寫為 O=((QK^T)⊙M_) V。但由于單向任務中 mask 矩陣 M 的存在,使得該形式依然只能進行左乘計算,從而不能獲得 O (N) 的復雜度。但對于雙向任務,由于沒有沒有 mask 矩陣,Linear Attention 的計算公式可以進一步簡化為 O=(QK^T) V。Linear Attention 的精妙之處在于,僅僅利用簡單的矩陣乘法結合律,其計算公式就可以進一步轉化為:O=Q (K^T V),這種計算形式被稱為右乘,相對應的前者為左乘。通過圖 2 可以直觀地理解到 Linear Attention 在雙向任務中可以達到誘人的 O (N) 復雜度!

2. 但是隨著 decoder-only 的 GPT 形式的模型逐漸成為 LLM 的事實標準,如何利用 Linear Attention 的右乘特性加速單向任務成為了亟待解決的難題。為了解決這個問題,本文作者提出了利用 “分而治之” 的思想,將注意力矩陣的計算分為對角陣和非對角陣兩種形式,并采用不同的方式對他們進行計算。如圖 3 所示,Linear Attention-2 利用計算機領域常用的 Tiling 思想,將 Q, K, V 矩陣分別切分為了相同數量的塊 (blocks)。其中 block 自身(intra-block)的計算由于 mask 矩陣的存在,依然保留左乘計算的方式,具有 O (N^2) 的復雜度;而 block 之間(inter-block)的計算由于沒有 mask 矩陣的存在,可以采用右乘計算方式,從而享受到 O (N) 的復雜度。兩者分別計算完成后,可以直接相加得到對應第 i 塊的 Linear Attention 輸出 Oi。同時,通過 cumsum 對 KV 的狀態進行累積以在下一個 block 的計算中使用。這樣就得到了整個 Lightning Attention-2 的算法復雜度為 intra-block 的 O (N^2) 和 inter-block 的 O (N) 的 Trade-off。怎么取得更好的 Trade-off 則是由 Tiling 的 block size 決定的。

3. 細心的讀者會發現,以上的過程只是 Lightning Attention-2 的算法部分,之所以取名 Lightning 是因為作者充分考慮了該算法過程在 GPU 硬件執行過程中的效率問題。受到 FlashAttention 系列工作的啟發,實際在 GPU 上進行計算的時候,作者將切分后的 Q_i, K_i, V_i 張量從 GPU 內部速度更慢容量更大的 HBM 搬運到速度更快容量更小的 SRAM 上進行計算,從而減少大量的 memory IO 開銷。當該 block 完成 Linear Attention 的計算之后,其輸出結果 O_i 又會被搬回至 HBM。重復這個過程直到所有 block 被處理完畢即可。

想要了解更多細節的讀者可以仔細閱讀本文中的 Algorithm 1 和 Algorithm 2,以及論文中的詳細推導過程。Algorithm 以及推導過程都對 Lightning Attention-2 的前向和反向過程進行了區分,可以幫助讀者有更深入的理解。

圖片

圖 3

圖片

圖片

Lightning Attention-2 精度對比

研究人員首先在小規模(400M)參數模型上對比了 Lightning Attention-2 與 Lightning Attention-1 的精度區別,如下圖所示,二者幾無差別。

圖片

隨后研究人員在 1B、3B 上將 Lightning Attention-2 加持的 TransNormerLLM(TNL-LA2)與其它先進的非 Transformer 架構的網絡以及 FlashAttention2 加持的 LLaMA 在相同的語料下做了對比。如下圖所示,TNL-LA2 與 LLaMA 保持了相似的趨勢,并且 loss 的表現更優。這個實驗表明,Lightning Attention-2 在語言建模方面有著不遜于最先進的 Transformer 架構的精度表現。

圖片

在大語言模型任務中,研究人員對比了 TNL-LA2 15B 與 Pythia 在類似大小下的大模型常見 Benchmark 的結果。如下表所示,在吃掉了相同 tokens 的條件下,TNL-LA2 在常識推理和多項選擇綜合能力上均略高于基于 Softmax 的注意力的 Pythia 模型。

圖片

Lightning Attention-2 速度對比

研究人員對 Lightning Attention-2 與 FlashAttention2 進行了單模塊速度與顯存占用對比。如下圖所示,相比于 Lightning Attention-1 和 FlashAttention2,在速度上,Lightning Attention-2 表現出了相比于序列長度的嚴格線性增長。在顯存占用上,三者均顯示出了類似的趨勢,但 Lightning Attention-2 的顯存占用更小。這個的原因是 FlashAttention2 和 Lightning Attention-1 的顯存占用也是近似線性的。

圖片

筆者注意到,這篇文章主要關注點在解決線性注意力網絡的訓練速度上,并實現了任意長度的長序列與 1K 序列相似的訓練速度。在推理速度上,并沒有過多的介紹。這是因為線性注意力在推理的時候可以無損地轉化為 RNN 模式,從而達到類似的效果,即推理單 token 的速度恒定。對于 Transformer 來說,當前 token 的推理速度與它之前的 token 數量相關。

筆者測試了 Lightning Attention-1 加持的 TransNormerLLM-7B 與常見的 7B 模型在推理速度上的對比。如下圖所示,在近似參數大小下,Lightning Attention-1 的吞吐速度是百川的 4 倍,ChatGLM 的 3.5 倍以上,顯示出了優異的推理速度優勢。

圖片

小結

Lightning Attention-2 代表了線性注意力機制的重大進步,使其無論在精度還是速度上均可以完美的替換傳統的 Softmax 注意力,為今后越來越大的模型提供了可持續擴展的能力,并提供了一條以更高效率處理無限長序列的途徑。OpenNLPLab 團隊在未來將研究基于線性注意力機制的序列并行算法,以解決當前遇到的顯存屏障問題。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-09-19 10:07:41

2018-08-26 22:25:36

自注意力機制神經網絡算法

2024-12-26 09:01:13

2025-01-13 08:23:07

LLMMHAMLP

2025-04-29 09:05:00

2023-04-14 14:42:07

騰訊人工智能

2017-08-03 11:06:52

2025-02-25 09:40:00

模型數據AI

2024-10-31 10:00:39

注意力機制核心組件

2024-06-28 08:04:43

語言模型應用

2024-12-09 00:00:10

2020-09-17 12:40:54

神經網絡CNN機器學習
點贊
收藏

51CTO技術棧公眾號

超碰97人人射妻| 日韩中文字幕av| 中文字幕一区二区三区四区五区人| 国产情侣呻吟对白高潮| 午夜影院欧美| 亚洲成人精品av| av一二三不卡影片| 久久成人精品视频| 国产一精品一aⅴ一免费| 校园春色亚洲| 综合久久久久综合| 久久人人九九| av免费观看在线| 久久精品日产第一区二区| 日韩最新av在线| 久久一区二区电影| 亚洲ww精品| 欧美视频在线免费看| 伊甸园精品99久久久久久| 欧美 中文字幕| 久久精品国产免费| 2019中文在线观看| 波多野结衣亚洲一区二区| 外国成人在线视频| 日韩欧美在线一区二区三区| 国产视频自拍一区| 毛片毛片毛片毛片毛片毛片毛片毛片毛片| www视频在线看| 国产色婷婷亚洲99精品小说| 肥熟一91porny丨九色丨| 老熟妇一区二区三区啪啪| 国产伊人精品| 久久久国产成人精品| 中文字幕被公侵犯的漂亮人妻| 凹凸av导航大全精品| 欧美喷水一区二区| 国产理论在线播放| 小h片在线观看| 亚洲一区av在线| 日本一区二区三区四区五区六区| a天堂在线资源| 久久综合视频网| 国产亚洲欧美另类一区二区三区| 最近中文字幕av| 国产成人l区| 99re66热这里只有精品3直播| 成人乱色短篇合集| 日韩不卡高清视频| 丝袜亚洲另类欧美综合| 欧美最猛性xxxx| 日韩精品1区2区| 亚洲毛片在线| 午夜精品理论片| 五月天综合激情| 女女互磨互喷水高潮les呻吟| 免费av在线网址| 国产亚洲一区二区三区在线观看| 免费成人在线观看av| 日韩一二三四| 久久网站最新地址| 欧美午夜精品理论片a级大开眼界| 污视频在线免费| 成人动漫中文字幕| 精品一区二区三区国产| 日韩电影在线观看完整版| 91久色porny| 亚洲日本护士毛茸茸| 国产尤物99| 无码国精品一区二区免费蜜桃| 99国产精品久久久久久久久久 | 亚洲免费电影一区| 亚洲一级av无码毛片精品| 欧美黑人做爰爽爽爽| 日韩av网站在线| 国产ts在线播放| 日韩一区二区在线免费| 久久精品一区中文字幕| 欧美日韩一级在线观看| 亚洲每日在线| 国产精品99久久久久久人 | 久久久久久国产免费a片| 成人影院在线| 欧美大码xxxx| 亚洲第一在线播放| 日韩电影一区二区三区四区| 国产欧美亚洲精品| 亚洲卡一卡二卡三| 久久综合色综合88| 综合视频免费看| 鲁鲁在线中文| 欧美日韩一区二区在线视频| 亚洲国产综合av| 麻豆成人入口| 俺去啦;欧美日韩| 精品人妻在线播放| 日韩精品欧美成人高清一区二区| 成人高h视频在线| 精品二区在线观看| 国产亚洲欧美中文| 成人在线视频一区二区三区| 免费观看成人性生生活片 | 久久婷婷蜜乳一本欲蜜臀| 欧美日韩999| 久久精品久久久久久久| 国产精品66部| 亚洲高清视频一区| 久久婷婷一区| 久久人人爽国产| 欧美在线视频精品| 成人永久免费视频| 四虎影院一区二区三区| 成年网站在线视频网站| 欧美午夜在线一二页| 在线xxxxx| 999久久久国产精品| 4444欧美成人kkkk| 国产免费不卡av| 久久久精品tv| 国产一线二线三线女| 久久青草视频| 亚洲另类欧美自拍| 国产乡下妇女做爰视频| 国产一区二区三区蝌蚪| 午夜精品亚洲一区二区三区嫩草 | 久久久久中文字幕2018| 一级特黄色大片| 久久久亚洲综合| 日韩五码在线观看| 日韩在线精品强乱中文字幕| 中文字幕久精品免费视频| 国产免费av一区| 岛国精品在线观看| 国产日韩第一页| 日韩一级视频| 在线看欧美日韩| 欧美黑人一区二区| 成人福利视频网站| www.日本在线视频| 日韩免费精品| 美女av一区二区| 国产黄色高清视频| 一区二区三区不卡视频在线观看| 精品久久久99| 天天揉久久久久亚洲精品| 国产精品影片在线观看| 国产露出视频在线观看| 色噜噜狠狠色综合中国| 黄色aaa视频| 久久精品成人| 日本一区二区三区视频免费看| 色偷偷偷在线视频播放| 精品久久国产97色综合| 精品无码黑人又粗又大又长| 国产精品一色哟哟哟| 在线观看18视频网站| 国产精品亚洲一区二区在线观看| 久久av.com| 亚洲在线免费观看视频| 日韩一区在线免费观看| 午夜天堂在线视频| 91精品国产91久久久久久黑人| 91亚洲精品在线| 色黄网站在线观看| 精品国产3级a| 在线精品免费视| 久久精品人人做人人综合| 成人免费在线观看视频网站| 国产一区二区亚洲| 国产精品欧美激情在线播放| 日本中文字幕在线看| 日韩一区二区免费视频| 久草视频精品在线| 久久综合九色综合97_久久久| 日本999视频| 99久久亚洲精品蜜臀| 99r国产精品视频| 欧美a级在线观看| 亚洲天堂av女优| 国产一区二区三区黄片| 亚洲一区av在线| 永久免费看mv网站入口78| 青椒成人免费视频| 福利在线小视频| 青青视频一区二区| 国产日本欧美一区二区三区| 欧美人与动牲性行为| 亚洲精品乱码久久久久久按摩观| 欧美成人一区二区三区四区| 亚洲三级免费电影| 中国一级特黄录像播放| 日韩国产精品大片| 加勒比海盗1在线观看免费国语版| 国产精品极品在线观看| 国产精品高清网站| 中文字幕在线观看播放| 日韩风俗一区 二区| 国产精品美女一区| 欧美视频裸体精品| 91高清免费观看| 91丨九色丨黑人外教| 午夜剧场在线免费观看| 亚洲美女啪啪| 天天操天天干天天玩| 亚洲第一论坛sis| 91一区二区三区| 亚洲成人av观看| 欧美激情aaaa| 久cao在线| 亚洲女人被黑人巨大进入al| 精品国产无码一区二区三区| 在线视频你懂得一区| 欧美久久久久久久久久久久| 中文字幕国产一区二区| 精品视频站长推荐| 国产在线精品免费av| 精品少妇无遮挡毛片| aa亚洲婷婷| 国产一级大片免费看| 日韩欧美在线中字| 欧美精品一区二区三区久久| 在线播放一区二区精品视频| 国产日韩视频在线观看| 小黄鸭精品aⅴ导航网站入口| 欧美高清激情视频| 国产三区视频在线观看| 色av吧综合网| yiren22亚洲综合伊人22| 亚洲精品理论电影| 日本美女一级视频| 欧美v国产在线一区二区三区| 一卡二卡三卡在线| 欧美在线免费观看亚洲| 97视频在线观看网址| www.涩涩爱| 91麻豆国产自产在线观看| 奇米777在线视频| 日本aⅴ免费视频一区二区三区| 国产资源在线视频| 亚洲手机视频| www.九色.com| 欧美视频一区| 黄黄视频在线观看| 婷婷久久一区| 国产精品美女在线播放| 久久中文字幕av一区二区不卡| 日本不卡一区二区三区视频| 亚洲第一二三区| 久久亚洲免费| 亚洲国产国产| 久久综合九色99| 西野翔中文久久精品字幕| 久久五月天婷婷| 偷拍精品福利视频导航| 久久手机视频| 国产精品三级| 色乱码一区二区三在线看| 精品一区二区三| 亚洲精品国产精品国自产观看| 欧美理论电影大全| 一本色道久久99精品综合| 日韩欧美不卡| 麻豆中文字幕在线观看| 欧美啪啪一区| 日韩一级性生活片| 一区二区三区成人精品| 欧洲黄色一级视频| 久久一区欧美| 亚洲综合婷婷久久| 国内精品视频666| 色悠悠在线视频| 99久久精品免费看国产免费软件| 中出视频在线观看| 久久久国产精品不卡| 三级黄色片在线观看| 亚洲女厕所小便bbb| 国产一级视频在线播放| 黄色精品在线看| 波多野结衣视频观看| 欧美日韩精品一区二区| 成人激情四射网| 日韩电影中文字幕| 91精品国产综合久久久久久豆腐| 久久精彩免费视频| 麻豆av在线免费观看| 91高清视频免费| 国产一区二区精品调教| 91超碰在线电影| 狠狠综合久久av一区二区蜜桃 | 亚洲女同志亚洲女同女播放| 亚洲国产美女久久久久| av大片在线播放| 欧美激情videos| 亚洲wwww| 亚洲电影二区| 欧美一区二区三区四区视频| 精品国产va久久久久久久| 欧美精品一区二区三区蜜桃视频 | 热久久国产精品| 男插女视频网站| 久久综合久久鬼色| 蜜臀av午夜精品久久| 婷婷激情综合网| 亚洲一级黄色大片| 亚洲二区在线播放视频| av播放在线| 91精品国产免费久久久久久| 国产精品.xx视频.xxtv| 国产欧美在线一区二区| 色男人天堂综合再现| av免费观看大全| 精品一区免费av| 亚洲一级中文字幕| 一区二区三区四区激情 | 日韩午夜av一区| 韩国三级在线观看久| 欧美激情乱人伦| 亚洲成人高清| 视频一区二区三区在线观看| 在线播放亚洲| 精品国产乱码久久久久久1区2区| 日韩在线观看视频一区| 日韩中文字幕第一页| 成人爱爱网址| 国产精品一区二区三区四区五区| 日韩精品影视| 中文字幕乱码人妻综合二区三区| 国产suv精品一区二区6| jizzjizz日本少妇| 色一情一伦一子一伦一区| 欧美视频在线观看一区二区三区| 久久精品2019中文字幕| av免费在线一区| 欧美影视一区二区| 999亚洲国产精| 中文字幕无人区二| 亚洲欧美日韩成人高清在线一区| 这里只有精品国产| 亚洲欧美国产精品久久久久久久| 爱情岛亚洲播放路线| 91一区二区三区| 欧美激情日韩| 久久久久亚洲av片无码v| 1000部国产精品成人观看| 中文字幕 自拍偷拍| 亚洲丝袜在线视频| 日韩三级影视| 日韩av一区二区三区在线| 模特精品在线| 国产全是老熟女太爽了| 欧美色另类天堂2015| 青青青草原在线| 欧美性在线视频| 一区二区三区视频免费观看| 亚洲午夜无码av毛片久久| 99久久99久久综合| 偷偷操不一样的久久| 亚洲精品乱码久久久久久按摩观| 久草在线中文最新视频| 久久亚洲综合网| 日韩专区一卡二卡| 粉嫩精品久久99综合一区| 欧美日韩一区国产| av在线播放观看| 国产精品乱码| 国产日韩综合| www.av天天| 欧美猛男男办公室激情| 黄在线免费看| 国产一区二区三区四区hd| 国产精品美女久久久| 成人免费无遮挡无码黄漫视频| 日本高清无吗v一区| 欧美一区二区三区| 99re国产视频| 亚洲一区欧美激情| 亚洲精品成人无码| 欧美顶级少妇做爰| 牛牛精品在线视频| 欧美精品一区在线| 久草在线在线精品观看| 久久久久亚洲av无码专区 | 人成在线免费视频| 国产精品久久久久久亚洲调教| 欧美独立站高清久久| 国产乱国产乱老熟300部视频| 午夜精品久久久久久久99樱桃| 九色在线免费| 91中文字幕在线| 国产亚洲精品久久久久婷婷瑜伽| 摸摸摸bbb毛毛毛片| 日韩一卡二卡三卡国产欧美| 深夜av在线| 中文字幕不卡每日更新1区2区| 成人少妇影院yyyy| 中国一区二区视频| 久久久视频在线| 久久国产成人精品| 久久久久国产精品区片区无码| 欧美人伦禁忌dvd放荡欲情| 黄色aa久久|