精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍

發布于 2024-4-3 12:26
瀏覽
0收藏

基于 Transformer 架構的大語言模型在 NLP 領域取得了令人驚艷的效果,然而,Transformer 中自注意力帶來的二次復雜度使得大模型的推理成本和內存占用十分巨大,特別是在長序列的場景中。


此前,研究者們提出了線性 Transformer、Mamba、RetNet 等。這些方案可以大幅降低 Transformer 計算成本,并且取得媲美原有模型的精度,但是由于架構更換,模型重訓練帶來的巨大成本令人望而卻步。


為了解決這一問題,最近的一篇論文提出了一種基于頻域的大語言模型架構 — 帝江(源于山海經的一種神話生物,以跑得快而聞名),同時解決了現有大模型的兩大痛點:推理成本和訓練成本。


華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區


  • 論文地址:https://arxiv.org/abs/2403.19928
  • 開源鏈接:https://github.com/YuchuanTian/DiJiang


該論文基于頻域自注意力變換核,尋找到一種原始自注意力的線性逼近,使得原有的 Transformer 模型可以經過少量數據(1/10-1/50)的微調,可以近乎無損地變形為論文提出的帝江模型。具體來說,在 LLaMA2-7B 上僅僅需要使用 40B 左右的訓練數據,就可以取得最多 5 倍的推理加速,且在各個評測集上取得相當的精度。


華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區

DiJIang-7B 模型和 LLaMA-7B 的精度對比


華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區

DiJIang-7B 模型和 LLaMA-7B 的速度對比

研究背景

Transformer 架構自從推出以來,徹底革新了自然語言處理(NLP)領域,并在多種任務中取得了杰出成果。這一成功導致了大型語言模型(LLMs)主導的時代的到來,在這個時代中,Transformer 結構被放大以處理越來越復雜的任務。然而,這種規模的擴大也帶來了巨大的計算需求,特別是由于需要每個 token 之間的計算的自注意力機制。


面對更高效 Transformer 模型的迫切需求,研究者們提出了線性 Transformer、Mamba、RetNet 等方案,雖然這些方案可以大幅降低 Transformer 計算成本,并且取得媲美原有模型的精度,但是由于架構更換,模型重訓練帶來的巨大成本令人望而卻步。


然而,大多數現有的優化 Transformers 方法,特別是與優化注意力機制有關的,需要對模型從頭重新訓練。這一重新訓練過程是一個巨大的挑戰,特別是對于參數龐大的模型,需要大量的計算資源和時間投入。例如,像 LLaMA-7B 這樣的大型模型的訓練需要大約 8 萬多 GPU hours。盡管有部分研究如 Performer 努力尋找注意力機制的快速近似方法,但這些方法在大型語言模型中還沒有得到徹底的驗證。


為了解決大型語言模型中快速注意力近似的問題,論文對現有的線性注意力方案和自注意力近似方案進行了徹底的分析。論文發現,這些方法中近似誤差的主要來源是基于蒙特卡洛方法的采樣。因此,論文提出采用加權擬蒙特卡洛采樣來代替蒙特卡洛采樣進行映射,論文進一步引入頻域離散余弦變換(DCT)來作為擬蒙特卡洛采樣的值,從而高效且準確地將 Transformer 的 query 和 key 映射到頻域。使得注意力機制中的 softmax 操作可以被去除,達到線性的計算復雜度。論文還從理論上證明了,這種頻域映射是與原始注意力機制的一個近似等效,從而使得帝江模型可以不需要從頭開始訓練,只需要少量數據就可以從 Transformer 的參數中進行微調繼承。論文的實驗表明,論文的方法達到了與原始 Transformer 相當的性能,但訓練成本大大減少(<1/10),同時也受益于更快的推理速度(在不同模型上最高約 10 倍)。

方法介紹

論文首先回顧了 Attention 的計算方式:


華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區


其中是一句話中 token 的數目,d 是隱藏層的維度,傳統的 Attention 計算復雜度是

華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區。

為了減少 Attention 的計算復雜度,線性 Attention 方案希望將 softmax 函數去掉,這樣 K 和 V 的計算可以提前進行,從而使得計算復雜度變為華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區

,由于 n 通常要遠大于 d,因此在變化后計算復雜度可以被大幅減小。例如,Performer 采用了 PRF 核來逼近原始 Attention 的計算,具體為:

華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區


然而,由于蒙特卡洛方案存在的近似誤差,Performer 等方案常常要將隱藏層從維度映射為更大的維度,這導致了線性注意力帶來的計算復雜度變為,使得計算加速的收益減少。


為了解決這個問題,論文首先提出一種基于加權擬蒙特卡洛的方案,具體的,論文提出了一種新的 WPFF 核映射:


和 PRF 映射不同,WPFF 核映射在兩點上進行了改進:1. 將原有的隨機映射 w 變為給定的均勻正交變換 v 和其模長部分 t ,即使用擬蒙特卡洛變換來代替蒙特卡洛變換,減少逼近誤差從華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區。2. 使用加權矩陣 D 來對映射進行加權求和,減少蒙特卡洛映射的誤差。


論文提供了理論證明,來表明提出的 WPFF 映射核是一種更優的映射方式,具體的證明內容詳見論文附錄:


華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區


基于 WPFF 核,論文又進一步對其進行改進,由于給定的均勻正交變換 v 可以使用任意的均勻正交變換,論文提出使用頻域 DCT 變換來進行計算,由于 DCT 變換具有特殊的形式,其計算復雜度僅為

華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區,相比其他的正交變換華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區要來的更低,最終,論文使用的 WDCF 映射為:


華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區


最終,帝江模型的自注意力計算被代替為:


華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區


華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區

帝江模型和傳統自注意力計算的區別


上圖展示了帝江模型和傳統自注意力計算的區別,在 Transformer 的注意力機制中,key 和 value 的計算通過快速離散余弦變換(DCT)高效地映射到頻域。這種映射有效地消除了 softmax 操作,從而顯著降低了 Transformer 的計算復雜度。

實驗結果

華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區

不同模型大小的對比


上表展示了提出的帝江模型在不同大小的 scale 上的結果,可以看到,提出的帝江模型可以取得和原始模型基本相同的精度,并且擁有更快的推理速度和更低的訓練成本,顯著解決了現有 LLM 遇到的訓推成本過大的問題。此外,模型在 1B 的模型量級上超越了 1.3B 大小的 Mamba 模型。需要注意的是,盡管傳統 Transformer 可以通過 Flash Attention 的方式進行進一步加速,但由于針對帝江模型的加速框架尚未開發,為了公平對比模型本身的速度,推理速度的測試都是在模型都不使用加速框架的前提下進行的。


華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區

與不同 Transformer 改進方案精度對比


論文還展示了帝江和其他 Transformer 模型的改進方案進行了進一步的對比,可以發現,帝江模型具有比其他模型更好的效果,這得益于其通過更好的核映射近似了原始的 Transformer 模型計算。


華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區

華為諾亞頻域LLM「帝江」:僅需1/50訓練成本,7B模型媲美LLaMA,推理加速5倍-AI.x社區


論文還同時提供了帝江 - 7B 模型的續寫樣例展示,可以看到,帝江 - 7B 的續寫結果,和 LLaMA2-7B 相比毫不遜色,甚至條理性上要略勝一籌。

總結

論文提出了一種新的 LLM 架構:帝江,在 7B 以下的模型量級,所提出的模型可以大幅降低 LLM 所需的訓練和計算成本,為未來 LLM 的高效部署提出了一種新的思路。帝江架構是否會在更大的模型與多模態 VLM 等其他 Transformer 的應用領域中大放光彩,讓我們拭目以待。


本文轉自 機器之心 ,作者:機器之心


原文鏈接:??https://mp.weixin.qq.com/s/3zdfuhNr_HjvcJAy8REayA??

標簽
收藏
回復
舉報
回復
相關推薦
热久久精品免费视频| 91在线视频成人| 日韩精品卡通动漫网站| 日韩精品影院| 亚洲日本丝袜连裤袜办公室| 成人永久免费| 久久精品五月天| 亚洲高清资源在线观看| 亚洲精品久久久久国产| 一区二区xxx| 污的网站在线观看| 久久久精品中文字幕麻豆发布| 91精品久久久久久久久中文字幕| 中文在线观看免费网站| 成人精品天堂一区二区三区| 精品久久久久久久久久久久久久久| 国产免费一区二区三区视频| а√天堂在线官网| 久久九九99视频| 99久久伊人精品影院| 国产精品无码粉嫩小泬| 亚洲二区在线| 久久躁狠狠躁夜夜爽| 自拍偷拍中文字幕| av成人app永久免费| 欧美日韩激情在线| 国内精品视频久久| 久久久久久久久电影| 亚洲精品鲁一鲁一区二区三区| 制服诱惑亚洲| 午夜视频在线观看一区| 老汉色影院首页| 婷婷在线视频观看| 久久精品在这里| 国产伦精品一区二区三区视频孕妇 | 波多野结衣影片| 一区二区毛片| 国产69精品久久久久9| 欧美激情图片小说| 亚洲精品tv久久久久久久久久| 影音先锋日韩有码| 91激情视频在线观看| 米奇777超碰欧美日韩亚洲| 亚洲电影av在线| 99riav国产精品视频| 日本高清精品| 日韩一区二区免费在线观看| 亚洲免费黄色网| 久久女人天堂| 欧美日高清视频| 91亚洲免费视频| 91在线成人| 欧美人与禽zozo性伦| 国产区二区三区| 日韩欧美少妇| 91久久免费观看| 人人干人人视频| 色综合一本到久久亚洲91| 色综合天天在线| 成人一级片网站| 成人日韩在线| 欧美视频你懂的| 日本中文字幕高清| 久久精品资源| 91精品国产综合久久精品图片| the porn av| 欧美视频免费看| 91精品国产综合久久精品性色| 波多野结衣三级视频| 国产精东传媒成人av电影| 亚洲第一色中文字幕| 欧美日韩一区二区三区四区五区六区| 国产成人av毛片| 日韩美女av在线| avhd101老司机| 永久91嫩草亚洲精品人人| 欧美激情日韩图片| 免费黄色网址在线| 日本不卡一区二区三区高清视频| 91精品久久久久久久久久久久久 | 韩国v欧美v亚洲v日本v| 岛国一区二区三区高清视频| 天堂网在线观看视频| 国产午夜精品一区二区| 性欧美18一19内谢| 丁香花在线电影| 色乱码一区二区三区88| 色悠悠久久综合网| 中文字幕日韩高清在线| 国产婷婷色综合av蜜臀av| 五月天免费网站| 精品电影一区| 国产精品免费视频xxxx| 亚洲精品久久久久久无码色欲四季| 99久久久国产精品免费蜜臀| 亚洲高清视频一区| 超碰中文在线| 欧美亚洲日本国产| 国产一线在线观看| 久久精品高清| 91精品国产沙发| 国产又粗又黄又爽的视频| av午夜精品一区二区三区| 亚洲v国产v在线观看| 欧美野外wwwxxx| 欧美午夜电影网| 国模私拍在线观看| 亚洲精品网址| 国产精品成人免费视频| 懂色av一区二区三区四区| 欧美经典三级视频一区二区三区| 日韩视频免费播放| 男女啪啪999亚洲精品| 日韩av在线不卡| 中文字幕无码日韩专区免费| 亚洲免费网站| 国产精品国产精品| 巨大荫蒂视频欧美大片| 日韩欧美极品在线观看| 欧美激情国内自拍| 欧美日韩在线播放视频| 97视频在线观看免费高清完整版在线观看| 伊人成人在线观看| 国产亚洲精品中文字幕| 精品无码国模私拍视频| 精品视频成人| 色av中文字幕一区| 日本丰满少妇做爰爽爽| 91视频观看视频| 又大又硬又爽免费视频| 国产精品视频一区二区三区综合| 国产午夜精品美女视频明星a级| 久久久久无码精品国产| 国产一区二区美女诱惑| 91久久香蕉国产日韩欧美9色| 亚洲在线观看视频| 毛片免费在线观看| 亚洲国产综合91精品麻豆| 亚洲娇小娇小娇小| 久久不见久久见国语| 91国内免费在线视频| 亚洲AV无码国产精品午夜字幕| 国产日韩三级在线| 国产精品后入内射日本在线观看| 视频在线观看免费影院欧美meiju| 色偷偷9999www| 中文av免费观看| 国产午夜精品美女毛片视频| 日韩欧美精品在线观看视频| 国产精品tv| 午夜精品理论片| 欧美一级淫片aaaaaa| 一区二区三区在线影院| 亚洲天堂小视频| 真实国产乱子伦精品一区二区三区| 国产精品一区二区久久久| 大地资源中文在线观看免费版| 欧美性高跟鞋xxxxhd| a视频免费观看| 午夜一区在线| 日本一区二区三区在线视频| 精品亚洲美女网站| 中文字幕久热精品视频在线| 亚洲在线观看av| 中文字幕一区二区三| 国产精品久久久久久9999| 91成人观看| 国产欧美综合精品一区二区| 欧产日产国产精品视频| 亚洲欧美日韩直播| 中文字幕日韩经典| 亚洲欧美国产77777| 麻豆av免费看| 国产精品丝袜xxxxxxx| 少妇精品久久久久久久久久| 亚洲精品无播放器在线播放| 九九热这里只有精品6| 农村少妇久久久久久久| 天天操天天综合网| 久久久久亚洲av成人无码电影| 日本麻豆一区二区三区视频| 国产精品夜夜夜爽张柏芝| 久久久久亚洲精品中文字幕| 国模私拍视频一区| 国产一二三在线观看| 在线成人小视频| 中文字幕乱妇无码av在线| 欧美成人基地| 国产精品一二三在线| 国内老司机av在线| 亚洲天堂av高清| 无码一区二区三区在线观看| 日韩一区中文字幕| 欧亚乱熟女一区二区在线| 日韩高清不卡在线| 欧美美女黄色网| 久草成人资源| 国产精品12| 国产精品99| 午夜精品一区二区三区视频免费看 | 日本三级在线视频| 精品国产青草久久久久福利| 国产一级精品毛片| 亚洲成人av中文| 成人做爰视频网站| 久久久天堂av| 久草视频福利在线| 久久66热re国产| 欧美性久久久久| 综合视频在线| 亚洲欧洲国产日韩精品| 午夜精品福利影院| 国产精品 日韩| 亚洲ww精品| 国产成人在线一区| 久热在线观看视频| 色综合久久精品亚洲国产| av网站在线免费观看| 亚洲精品不卡在线| www.我爱av| 9191国产精品| 国内av在线播放| 日韩欧美中文在线| 日韩 欧美 亚洲| 一区二区在线观看视频| 欧美色视频一区二区三区在线观看 | 91视频国产精品| 日韩在线观看不卡| 国产91色在线| 在线能看的av网址| 羞羞色国产精品| 高h视频在线播放| 欧美成人小视频| 黄色网址在线免费播放| 亚洲视频777| 青青操视频在线| 亚洲精品中文字幕av| 日韩一级片免费| 精品国产网站在线观看| 亚洲美女性生活| 精品少妇一区二区三区免费观看 | 国产大陆a不卡| 天天av天天操| 国产一区二三区好的| 国产三级精品三级在线| 精品在线播放免费| 亚洲成人手机在线观看| 韩国v欧美v亚洲v日本v| 制服下的诱惑暮生| 国产成人免费视| 少妇精品无码一区二区三区| 成人激情校园春色| 岛国精品资源网站| 91一区二区三区在线观看| 亚洲av无码一区二区三区观看| 成人avav影音| 国产交换配乱淫视频免费| 国产日韩三级在线| 永久免费看片直接| 亚洲精品一二三| 日本一区二区欧美| 狠狠躁天天躁日日躁欧美| 日韩在线播放中文字幕| 欧美色区777第一页| 国产精品伊人久久| 日韩精品一区二区三区在线观看 | 丝袜人妻一区二区三区| 欧美精品网站| 久久久亚洲精品无码| 成人资源www网在线最新版| 93久久精品日日躁夜夜躁欧美| 野战少妇38p| 久久久久久一二三区| 日韩一级片在线免费观看| 亚洲摸摸操操av| 亚洲综合一二三| 欧美中文字幕一区| 99久久久国产精品无码免费| 欧美成人一区二区三区在线观看| 天堂中文字幕av| 中文字幕精品在线| 丁香花在线观看完整版电影| 国产成人综合av| 欧美高清一级片| 欧美大香线蕉线伊人久久| 99国产精品一区二区| 日本欧美黄色片| 免费观看30秒视频久久| 亚洲欧洲日韩综合| 日本一区二区三区四区| 久久精品第一页| 欧美丝袜丝交足nylons图片| 精品人妻一区二区三区蜜桃| 亚洲欧美激情另类校园| 在线观看中文字幕的网站| 欧洲亚洲在线视频| 日韩高清一区| 日韩av高清在线播放| 亚洲日本国产| 女同激情久久av久久| 久久日一线二线三线suv| 成人免费精品动漫网站| 色婷婷一区二区| 亚洲毛片欧洲毛片国产一品色| 色婷婷av一区二区三区在线观看| av3级在线| 亚洲aⅴ日韩av电影在线观看 | 成人精品gif动图一区| 亚洲第一综合网| 婷婷六月综合亚洲| 国产超碰人人模人人爽人人添| 国产亚洲欧洲黄色| 国产福利电影在线播放| 国产专区欧美专区| 教室别恋欧美无删减版| av免费观看大全| 国产精品自拍av| 国产无遮挡在线观看| 色狠狠av一区二区三区| 日韩一级片免费在线观看| 久久国产精品免费视频 | 欧美日韩国产高清一区二区三区| 香蕉视频黄色片| 欧美大片免费观看| 不卡的国产精品| 亚洲国产日韩欧美| 日韩一区欧美二区| 久久国产精品影院| 精品久久久一区| 四虎在线视频免费观看| 欧美极品美女电影一区| 麻豆国产精品| 色一情一乱一乱一区91| 国产在线播放一区| 欧美性猛交xxxx乱大交少妇| 欧美性色黄大片| h网站在线免费观看| 国产精品美女主播| 红桃成人av在线播放| 精品视频无码一区二区三区| 99久久久久免费精品国产| 91视频免费网址| 精品亚洲男同gayvideo网站| 亚洲插插视频| 品久久久久久久久久96高清| 久久精品九九| 精品日韩在线视频| 欧美另类变人与禽xxxxx| 麻豆视频网站在线观看| 亚洲aⅴ男人的天堂在线观看| 牛牛国产精品| 97精品人人妻人人| 精品欧美aⅴ在线网站| 五月婷婷六月丁香| 欧美孕妇性xx| 精品色999| 玖玖爱视频在线| 亚洲激情av在线| 成人久久久精品国产乱码一区二区| 久久久欧美一区二区| 久久久久观看| 91av在线免费播放| 国产精品久久一级| 99热这里只有精品1| 欧美—级a级欧美特级ar全黄 | 亚洲国产一区二区精品视频 | 老鸭窝毛片一区二区三区| 一级黄色片大全| 欧美日韩成人综合天天影院| a级网站在线播放| 国产综合欧美在线看| 日韩电影在线一区二区| 久久精品一区二区三区四区五区| 日韩欧美综合在线| 免费v片在线观看| 水蜜桃亚洲精品| 国产精品18久久久久久久网站| 国产精品久久久免费视频| 国产一区二区三区三区在线观看| 成人国产精品一区二区网站| 欧美午夜小视频| 国产精品美女久久久久久久久久久| www.av导航| 国产999在线| 欧美激情一级片一区二区| 天天躁日日躁aaaxxⅹ| 欧美日韩高清一区二区三区| 韩国成人免费视频| 亚洲v国产v| 99re这里只有精品首页| 亚洲中文字幕在线一区| 久久久视频在线| 日本女优一区| 亚洲精品乱码久久| 制服丝袜亚洲色图| 制服丝袜专区在线| 欧美另类videos| 欧美激情在线看| 日本毛片在线观看| 91久久久在线|