精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

上海AI Lab最新推出Mixture-of-Memories:線性注意力也有稀疏記憶了

人工智能 新聞
DeepSeek NSA 通過三種方式壓縮 “KV” 實現 sparse attention,但這只是一種可以工作但不優雅的折中方案。因為它在壓縮 Transfromer 的記憶能力,以換取效率。

回顧 AGI 的爆發,從最初的 pre-training (model/data) scaling,到 post-training (SFT/RLHF) scaling,再到 reasoning (RL) scaling,找到正確的 scaling 維度始終是問題的本質。2017 年發布的 Transformer 架構沿用至今,離不開 Transformer 強大的 “無損記憶” 能力,當然也需要付出巨大的 KV 緩存代價。換句話說,Transformer 架構具有強大的 memory scaling 能力。

DeepSeek NSA 通過三種方式壓縮 “KV” 實現 sparse attention,但這只是一種可以工作但不優雅的折中方案。因為它在壓縮 Transfromer 的記憶能力,以換取效率。

另一方面,大概從 2023 年火到今天的線性序列建模方法(包括 linear attention 類,Mamba 系列,RWKV 系列)則是另一個極端,只維護一份固定大小 dxd 的 RNN memory state,然后加 gate,改更新規則,但這種方式始終面臨較低的性能上限,所以才會有各種混合架構的同樣可以工作但不優雅的折中方案。

我們認為,未來的模型架構一定具有兩點特性:強大的 memory scaling 能力 + 關于序列長度的低復雜度。后者可以通過高效注意力機制實現,比如:linear 或者 sparse attention,是實現長序列建模的必備性質。而前者仍然是一個有待探索的重要課題,我們把給出的方案稱為 “sparse memory”。

這促使我們設計了 MoM: Mixture-of-Memories,它讓我們從目前主流線性序列建模方法改 gate 和 RNN 更新規則的套路中跳脫出來,稀疏且無限制地擴大 memory 大小。MoM 通過 router 分發 token(靈感來自 MoE)維護多個 KV memory,實現 memory 維度 scaling。每個 memory 又可以進行 RNN-style 計算,所以整體具有關于序列長度線性的訓練復雜度,推理又是常數級復雜度。此外,我們又設計了 shared memory 和 local memory 合作分別處理全局和局部信息。實驗表現相當驚艷,尤其是在目前 linear 類方法效果不好的 recall-instensive 任務上表現格外好,甚至在 1.3B 模型上已經和 Transformer 架構旗鼓相當。

圖片

  • 論文地址:https://arxiv.org/abs/2502.13685
  • 代碼地址:https://github.com/OpenSparseLLMs/MoM
  • 未來還會集成在:https://github.com/OpenSparseLLMs/Linear-MoE
  • 模型權重開源在:https://huggingface.co/linear-moe-hub

方法細節

Linear Recurrent Memory

對于這部分內容,熟悉線性序列建模的小伙伴可以跳過了。

輸入 圖片經過 query key value proj 得到圖片

圖片

最簡潔的 recurrent 形式線性序列建模方法(對標最基礎的 linear attention)按照下面公式做 RNN 更新:

圖片

這里,我們不得不提一下,各種各樣的 Gate 形式(圖片前面的)和更新規則(  右邊的)就是在魔改上面的一行公式,各種具體形式如下表:

(各種方法本身有不同的符號,像 Mamba, HGRN 就不用 q k v,這里為了統一對比全部對標到 linear attention 形式。其中Titans的形式,把 memory update rule 看作 optimzier update 的話,最核心的還是 SGD 形式,暫時忽略momentum/weight decay ,只一個公式表達的話寫成這種梯度更新的形式是合理的。)

圖片

其實這些方法又可以進一步細分為不同類別(很多地方都粗略的統一稱為 linear RNN 或者 RNN),這里論文暫時沒提:

  • Linear Attention, Lightning Attention, RetNet, GLA, DeltaNet, Gated DeltaNet 屬于 linear attention 類
  • Mamba2 屬于 SSM 類,HGRN2 屬于 linear RNN 類
  • TTT, Titans 屬于 Test-Time Training 類

Mixture-of-Memories

MoM 思路非常簡單,和 MoE 一樣按照 token 分發,通過 router 為每個 token 選擇 topk 的 memories 并計算各自權重:

圖片

所有激活的 topk memories 按照各自權重加權求和得到一份混合記憶:

圖片

然后就又回到了 linear 類方法一貫的輸出計算:

圖片

另外,這里我們額外引入了 shared memory 的概念,即每個 token 都會經過這個永遠激活的 memory,有利于模型獲取全局信息。相對而言,其他稀疏激活的 memory 更擅長獲取局部信息。消融實驗表明,shared memory 的存在對模型效果有明確的積極作用。

圖片

硬件高效實現

MoM的硬件高效Triton算子可以很方便地實現,其輸出的計算可以簡單寫作:

圖片

也就是說 MoM 中每個 memory 的計算過程可以復用現有的單個算子,再把所有 memory 的輸出加權求和起來。和直接在算子內先求和再算輸出是數學等價的。

實驗結果

in-context recall-instensive tasks

一直以來,線性序列建模方法因為自身非常有限的 memory 大小,在這類 in-context recall-intensive 任務上表現不好。同時 Transformer 模型得益于其強大的無損記憶能力,非常擅長這類任務。所以已經出現了各種層間 hybrid 的模型,來提升 linear 類模型在這類任務上的效果。

我們首先重點測試了這類任務(結果見下表),使用 Gated DeltaNet 作為 MoM 的 memory 計算形式(在 Memory 更新過程中,每個 memory 都使用 Gated DeltaNet 的 gate 和更新規則),總共 4 個 local sparse memory,激活 2 個,還有一個 shared memory。其中標 ? 的模型來自開源項目(https://huggingface.co/fla-hub),沒標 ?的是我們從頭預訓練的模型。

結果還算相當不錯,在沒有數據污染或任何套路的情況下,結果顯示 MoM 就是單純地效果好。這也和預期一致,翻倍擴展 memory 大小,效果好過其他 linear 類方法。有一些意外的是,在 1.3B 的結果里,MoM 基本可以和 Transformer 相媲美。

圖片

其他評測效果

其他評測結果效果也不錯:

圖片

圖片

推理效率

推理效率是線性序列建模方法的重點,結果顯示 MoM 在常數級復雜度推理速度和顯存占用方面,表現出強大的優勢。

圖片

消融實驗

圖片

圖片

Loss 曲線

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-02-25 09:40:00

模型數據AI

2025-11-11 08:50:00

2024-11-08 15:00:00

AI模型

2025-10-16 09:00:00

大模型

2025-10-31 16:00:45

AI模型架構

2025-02-07 16:15:27

2025-09-30 08:36:09

2022-02-21 09:25:57

VR研究Nature

2024-07-04 12:18:21

2025-09-29 18:51:01

2024-09-19 10:07:41

2025-05-30 09:06:00

2018-08-26 22:25:36

自注意力機制神經網絡算法

2018-05-03 16:27:29

RNN神經網絡ResNet

2025-10-14 13:54:01

AI模型測試

2025-10-22 09:00:00

2025-07-16 09:05:00

AI評測模型

2023-11-24 12:36:00

模型訓練

2021-05-06 15:55:01

谷歌Android開發

2023-07-29 13:26:51

模型AI
點贊
收藏

51CTO技術棧公眾號

国产精品国产av| 屁屁影院国产第一页| 免费a在线看| 国产成人av影院| 欧美一级成年大片在线观看| 潮喷失禁大喷水aⅴ无码| 免费欧美网站| 欧美性受极品xxxx喷水| 欧妇女乱妇女乱视频| 国产精品二线| jlzzjlzz亚洲日本少妇| 国产欧美日韩专区发布| 日韩特级黄色片| 欧美国内亚洲| 最近2019中文字幕大全第二页| 丰满人妻一区二区三区大胸| 黑人一区二区三区| 天天做天天摸天天爽国产一区| 亚洲啪啪av| 婷婷国产在线| 国产成人99久久亚洲综合精品| 国产高清视频一区三区| 日本熟妇毛耸耸xxxxxx| 国产精品99久久精品| 亚洲色图美腿丝袜| 在线视频 日韩| 日韩一区二区三区精品| 欧美日韩一区二区三区视频| 国产成人久久777777| 99riav视频在线观看| 亚洲欧洲制服丝袜| 亚洲精品一区二区三区av| 欧美色综合一区二区三区| 粉嫩13p一区二区三区| 91网站在线免费观看| 精品无码一区二区三区的天堂| 99精品免费| 久久久中精品2020中文| 欧美日韩中文视频| 欧美日韩中文| www.xxxx精品| 免费成人深夜夜行网站| 日韩欧美视频专区| 在线日韩第一页| 亚洲一级理论片| 日韩精品免费| 中文字幕欧美视频在线| 谁有免费的黄色网址| 国产欧美日韩| 国产亚洲欧洲在线| 免费看污片的网站| japanese国产精品| 在线观看国产成人av片| 久久久久无码精品国产sm果冻| 国内精品久久久久久久影视简单| 亚洲人成欧美中文字幕| 亚洲精品国产精品国自产网站| 狠狠做深爱婷婷综合一区| 亚洲视频在线观看| 亚洲a∨无码无在线观看| 欧美成人自拍| 久久伊人精品天天| 久草福利资源在线观看| 亚洲国产午夜| 日韩av免费在线观看| 亚洲精品一区二区二区| 麻豆精品久久精品色综合| 成人国产在线视频| 亚洲av无码一区二区乱子伦| 成人avav在线| 欧美日韩亚洲一区二区三区四区| 福利在线午夜| 亚洲三级理论片| 东北少妇不带套对白| 在线观看欧美日韩电影| 欧美日韩免费在线视频| 男人添女人荫蒂国产| 懂色av一区二区| 国产视频精品久久久| 免费看黄色三级| 亚洲精品网址| 91精品国产乱码久久久久久蜜臀| 国产一级一级国产| 国产专区综合网| 精品无人乱码一区二区三区的优势 | 91一区在线| 欧美富婆性猛交| 人人爽人人爽人人片av| 国产在线视频一区二区三区| 精品卡一卡二| 在线观看免费黄视频| 亚洲综合图片区| 激情综合网婷婷| 欧美欧美在线| 亚洲性生活视频| 久久久久久av无码免费网站| 久久九九免费| 国产成人精品日本亚洲11| 国产一区精品| 亚洲福中文字幕伊人影院| 亚洲成色www.777999| 亚洲福利视频网站| 日韩精品视频无播放器在线看| 在线观看日韩av电影| 欧美一级电影在线| 亚洲综合一区中| av一二三不卡影片| 一个色的综合| 26uuu亚洲电影| 日韩一区二区三区在线视频| 成年人网站免费在线观看| 亚洲深深色噜噜狠狠爱网站| 国产精品2018| 天天操天天插天天射| **欧美大码日韩| 国产成人无码av在线播放dvd| 福利一区三区| 中文字幕日韩欧美| 日产亚洲一区二区三区| 国产精品夜夜嗨| 神马影院我不卡午夜| 蜜桃麻豆av在线| 精品少妇一区二区三区日产乱码| 亚洲色图欧美色| 国产精品一区毛片| 国产一区二区三区av在线| 麻豆视频网站在线观看| 日本精品一级二级| 免费的av网站| 亚洲国产mv| 97欧洲一区二区精品免费| 日本福利专区在线观看| 日本韩国欧美国产| 日本免费福利视频| 亚洲人成人一区二区三区| 91精品网站| av色综合久久天堂av色综合在| 欧美日韩情趣电影| 性の欲びの女javhd| 丝袜诱惑亚洲看片| 欧美激情导航| 久久uomeier| 亚洲天堂免费视频| 无码人妻一区二区三区免费| wwwwxxxxx欧美| 日韩欧美精品在线观看视频| 欧美aaaaa级| 欧美在线视频导航| 女人天堂在线| 在线免费视频一区二区| 伊人网在线视频观看| 久久婷婷麻豆| 亚洲不卡1区| 日韩不卡在线| 日韩亚洲精品电影| 国产男女裸体做爰爽爽| 亚洲精品国产视频| 欧美大喷水吹潮合集在线观看| 99精品免费视频| 日本一区不卡| 国产极品一区| 欧美猛男性生活免费| 成人小说亚洲一区二区三区| 精品久久在线播放| 亚洲精品成人无码| 久久精品国产99国产| 日韩中文字幕亚洲精品欧美| 一区二区在线视频观看| 69国产精品成人在线播放| 日韩在线免费看| 欧美午夜电影一区| 欧洲猛交xxxx乱大交3| 成人免费高清视频在线观看| 欧美日韩国产精品激情在线播放| 国产亚洲一区二区三区啪| 国产欧美日韩视频| 美足av综合网| 亚洲欧美三级在线| 91麻豆一区二区| 亚洲国产精品麻豆| 免费看黄色av| 国产成人免费视| 日本一极黄色片| 欧美1区视频| 欧美视频1区| 免费看一区二区三区| 日本久久亚洲电影| a视频在线播放| 国产丝袜精品第一页| 在线观看亚洲一区二区| 亚洲综合久久av| 免费一级黄色录像| 高清国产午夜精品久久久久久| 成人精品视频一区二区| 欧美一区二区三区另类| 欧美综合激情| silk一区二区三区精品视频| 国产精品夜间视频香蕉| www.综合网.com| 日韩在线国产精品| 性感美女视频一二三| 91麻豆精品国产91久久久久久久久| 日本免费观看视| 中文字幕欧美一| 人妻体内射精一区二区| 丁香六月久久综合狠狠色| 天天爽人人爽夜夜爽| 99精品国产在热久久下载| 欧美性受黑人性爽| 波多野结衣在线观看一区二区三区| 国产99在线免费| 色综合久久久| 日韩av成人在线| 国产激情在线播放| 久久99久国产精品黄毛片入口| 北条麻妃在线| 亚洲剧情一区二区| 蜜桃视频污在线观看| 91精品国产欧美一区二区| 日韩av免费播放| 欧美午夜性色大片在线观看| 精品无码人妻一区二区三| 日韩理论片中文av| 国产日产精品一区二区三区的介绍| 久久久亚洲综合| 野花社区视频在线观看| 成人妖精视频yjsp地址| 992tv人人草| 国产一区三区三区| wwwwwxxxx日本| 麻豆精品视频在线观看免费| 亚洲不卡视频在线| 日韩电影一二三区| 亚欧在线免费观看| 肉丝袜脚交视频一区二区| 欧洲黄色一级视频| 国产欧美成人| 黄色一级片播放| 亚洲欧美bt| 国产高清精品在线观看| 国产精品综合| 国产精品99久久免费黑人人妻| 亚洲欧美日韩一区在线观看| 免费看一级大黄情大片| 亚洲人成免费| 国产av无码专区亚洲精品| 久久精品官网| 精品久久久久久中文字幕2017| 三级欧美在线一区| 手机在线看福利| 久国产精品韩国三级视频| 男生操女生视频在线观看| 久久97超碰国产精品超碰| www.污网站| 国产成人精品免费在线| 秘密基地免费观看完整版中文| 成人久久久精品乱码一区二区三区 | 国产精品一区二区三| 97人人做人人爽香蕉精品| 国产精品中文在线| 精品国产亚洲一区二区三区在线| 91亚洲精品一区二区| 亚洲大奶少妇| 免费观看国产成人| 欧美限制电影| 香蕉视频免费版| 在线观看一区| 黄色一级免费大片| 国产在线麻豆精品观看| 91人人澡人人爽| 久久女同性恋中文字幕| 欧美精品日韩在线| 又紧又大又爽精品一区二区| 免费在线不卡视频| 欧美亚洲自拍偷拍| www.午夜激情| 亚洲欧洲在线视频| 黄色免费网站在线观看| 国内精品久久久| 91精品店在线| 99久久国产免费免费| 在线观看欧美理论a影院| 中文字幕久久一区| 一本色道久久| 污视频网址在线观看| av中文一区二区三区| 天天干天天舔天天操| 亚洲高清久久久| 中文字幕免费高清在线观看| 日韩精品专区在线| 毛片免费在线| 欧美极度另类性三渗透| 成人啊v在线| 国产精品三区www17con| 日韩欧美大片| 欧美变态另类刺激| 国内精品久久久久影院薰衣草| 中文字幕精品视频在线| 一区免费观看视频| 欧美日韩乱国产| 日韩一级成人av| 国产黄色免费在线观看| 国模视频一区二区| а天堂中文最新一区二区三区| 精品无人区一区二区三区| 91精品国产福利在线观看麻豆| 青青草原成人网| 国产99精品在线观看| 九九热免费在线| 日韩欧美在线网址| 亚洲老妇色熟女老太| 按摩亚洲人久久| 澳门av一区二区三区| 国产欧美日韩综合精品二区| 亚洲女同另类| 日韩av在线中文| 26uuu久久天堂性欧美| 黄色激情视频在线观看| 欧美一区二区三区免费大片| 在线观看a视频| 国产91在线播放九色快色| 精品视频自拍| 日韩精品在线视频免费观看| 国产真实乱子伦精品视频| 2017亚洲天堂| 在线观看免费成人| 蝌蚪视频在线播放| 欧美在线性视频| 日韩欧美影院| 国产精品专区在线| 不卡大黄网站免费看| 久久免费精彩视频| 日韩精品中文字幕在线不卡尤物 | 国产高潮在线观看| 欧美成aaa人片免费看| 99国内精品久久久久| 亚洲一区二区三区精品在线观看| 日本aⅴ精品一区二区三区| 性高潮久久久久久久| 色综合天天在线| 男人的天堂在线免费视频| 热久久视久久精品18亚洲精品| 外国成人在线视频| 国产日韩一区二区在线观看| 久久日一线二线三线suv| 日本中文字幕在线| 亚洲色图五月天| 久久天堂av| 亚洲欧洲精品在线| 国产在线播精品第三| 国产盗摄x88av| 精品美女被调教视频大全网站| xxxx成人| 久久99精品久久久久久秒播放器| 亚洲美女黄网| 91视频免费观看网站| 欧美亚洲禁片免费| 日本亚洲精品| 97netav| 夜夜嗨网站十八久久| 西西444www无码大胆| 在线电影一区二区三区| 性欧美ⅴideo另类hd| 精品国产乱码久久久久软件| 美女日韩在线中文字幕| a天堂中文字幕| 欧美另类videos死尸| 日韩免费影院| 麻豆精品传媒视频| 久久成人av少妇免费| 麻豆成人在线视频| 精品亚洲男同gayvideo网站| yw.尤物在线精品视频| 神马午夜伦理影院| jlzzjlzz国产精品久久| 国产偷人爽久久久久久老妇app | 丁香六月综合激情| 综合激情网五月| 日韩中文字幕第一页| 日韩在线网址| 国产真实乱子伦| 最好看的中文字幕久久| 天天操天天射天天舔| 国产欧美中文字幕| 影音先锋久久久| 蜜桃av免费观看| 精品88久久久久88久久久 | 91人人爽人人爽人人精88v| 精品电影一区| 国产精品夜夜夜爽阿娇| 亚洲精品国产精品国产自| 久久av日韩| 国产精品自拍片| 亚洲欧美日韩综合aⅴ视频| 三级视频网站在线| 97人人模人人爽人人少妇| 久久久久中文| 国产中文字字幕乱码无限| 一区二区三区在线播放欧美| 精品按摩偷拍|