精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Kimi新論文再次“撞車”DeepSeek,都談到了長文注意力機制

人工智能 新聞
MoBA將MoE(專家混合)應用于注意力機制,通過遵循一種“less structure” 原則,允許模型自主決定關注哪些區域或位置。

Kimi背后的長上下文處理機制曝光了!

這項名為MoBA的新型注意力機制,能將處理1M長文本的速度一下子提升6.5倍,而且還是經過Kimi平臺實際驗證的那種。

概括而言,這項耗時一年半的工作主要看點在:

  • 把完整上下文劃分成,讓每個查詢token自動去關注最相關的KV塊,這樣就能高效處理長序列數據;
  • 提出一種新的參數無關的top-k門控機制,它能給每個查詢token挑選出最相關的塊,保證模型只聚焦在最有用信息的塊上;
  • 支持在全注意力和稀疏注意力模式之間輕松切換;

一言以蔽之,MoBA將MoE(專家混合)應用于注意力機制,通過遵循一種“less structure” 原則,允許模型自主決定關注哪些區域或位置。

最終結果是,在保持模型性能不變的前提下,將處理1M10M長文本的速度分別提升了6.5倍16倍

而且按照論文得出的結論:

MoBA開箱即用,它能輕松融入現有模型,無需高昂訓練成本。

另外,在深扒論文細節的同時,我們也在作者名單中發現了楊植麟本人的身影。

與此同時,再次令人感到戲劇的是,Kimi的這項研究又又又和DeepSeek撞車了??

差不多只比Kimi早5個小時,DeepSeek也公開了自己的注意力機制NSA(量子位今日另一篇文章有詳細介紹)

好家伙,誰能想到這熟悉的一幕也才剛過去不久!(先賣個關子)

將MoE原理應用于注意力機制

還是先來看論文細節。

首先,團隊回答了為什么要開展這項研究?

隨著大語言模型(LLMs)向AGI發展,處理長文本的能力將更加關鍵。然而,傳統注意力機制的計算復雜度隨著序列長度的增加而呈平方級增長,這一特性嚴重阻礙了模型對長序列的高效處理。

而且,一些現有方法都存在或多或少的局限性

  • 像滑動窗口注意力機制,通過限制模型關注窗口內局部信息來減少計算量,但窗口設定依賴特定任務,缺乏通用性,嚴重限制模型泛化能力;
  • 再如Quest、Minference和RetrievalAttention等動態稀疏注意力機制,推理時可減少計算量,但訓練長上下文模型時,因仍需處理大量上下文信息,訓練成本未實質降低,阻礙LLMs擴展到長上下文場景;
  • 而以Mamba、RWKV和RetNet為代表的線性注意力模型,用線性近似降低長序列計算開銷,但與傳統Transformer模型差異大,轉換成本高昂,甚至需重新訓練模型,且在復雜推理任務中的性能缺乏足夠驗證,限制其實際應用。

基于以上種種因素,一種新型注意力機制——MoBA架構應運而生。

顯而易見,不像傳統那樣關注全部鍵值(key),MoBA通過僅關注部分鍵值來提升效率。

它會把上下文按照一定規則分成n個塊。這就像處理一篇長文章時,把文章按段落分成不同部分。

然后每個塊都包含一部分鍵值信息。

之后,利用MoE的top-k門控機制來為每個查詢token挑選相關塊。

這就好比從所有段落中找出與當前問題最相關的幾個段落。它會計算查詢token和每個塊之間的相關性分數,然后選擇分數最高的k個塊,這樣查詢token就能聚焦在最有用的信息上。

上述過程用公式表示如下:

此外,為了保證基于前文預測下一個token的準確性,MoBA還采用了兩項關鍵設計:

  • 不關注未來塊:在語言生成任務中,為防止當前token依賴未來token信息,MoBA規定查詢token只能關注之前或當前位置的塊,不關注未來塊,避免信息提前泄露。
  • 當前塊因果掩碼處理:查詢token所在當前塊計算時可能涉及未來token信息,MoBA用因果掩碼 “遮擋” 這些信息,計算注意力時只關注已出現的信息。

與此同時,論文還公開了其他關鍵設計選擇。

比如更細粒度的塊分割。研究發現,把上下文劃分成更細的塊,能讓模型更好地捕捉信息。

再比如MoBA與全注意力混合。即讓MoBA可以和全注意力模式相互切換,在剛開始訓練或者處理復雜問題時,可以用全注意力模式,讓模型全面了解信息;而在處理長文本,對效率要求高時,就切換到MoBA模式,節省計算資源。

到了具體實現上,MoBA還結合了Flash Attention(能讓注意力計算更高效)和MoE的優化手段。 

完整過程小結如下:

第一步:確定查詢token到KV塊的分配,就像是給每個問題分配對應的 “答案段落”;

第二步:排序查詢token,比如把問相同主題問題的查詢token放在一起,方便統一處理;

第三步:計算每個KV塊的注意力輸出,用Flash Attention技術,讓模型去 “理解” 對應塊里的信息,得出相關結果;

第四步:重排注意力輸出并合并結果,把計算出的注意力輸出按原來順序重排,再用在線Softmax合并,將不同來源的結果整合得到綜合結果。就像把不同 “答案段落” 的信息整合,最終得出一個結論。

經過Kimi 1M長上下文驗證

實驗階段,研究還得出了幾個值得關注的發現。

首先,對比全注意力(使用Flash Attention實現)和MoBA訓練的語言模型,發現二者縮放趨勢相似,MoBA在高達75%稀疏度下性能與全注意力相當。

在長上下文實驗中,盡管MoBA最后塊損失略高,但差距逐漸縮小,表明其長上下文可擴展性。

消融實驗表明,細粒度塊分割確實對MoBA性能提升明顯

其次,如果將MoBA與全注意力混合訓練,其模型在位置LM損失上接近全注意力模型,證明該訓練方法能平衡效率和性能。

在監督微調(SFT)中,層混合策略(部分層用全注意力,其余用MoBA)可顯著降低SFT損失。

以Llama 3.1 8B模型為基礎,對MoBA在多種長上下文基準測試中評估,結果顯示其性能與全注意力模型相當,在RULER基準測試中二者得分接近,在1M上下文長度的 “大海撈針” 基準測試中也表現良好。

總之,MoBA的計算復雜度隨著上下文長度增加而優勢明顯。

在1M token的測試中,MoBA比全注意力快了6.5倍;到10M token時,則提速16倍。

OMT:又和DeepSeek撞車了

回到一開頭提到的,事實上,Kimi這篇論文一發,就有網友在底下惋惜:

而且還有人當面提起了“傷心事”:

原來,就在上個月(1月20日),也是在DeepSeek發了號稱比肩OpenAI-o1正式版的DeepSeek-R1之后,前后僅相隔僅2小時,Kimi才發布了追平OpenAI-o1滿血版的多模態思考模型k1.5。

好家伙,連續兩次“撞車”,妥妥的宿命感這不就來了!(doge)

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-02-19 15:47:48

2025-02-19 09:18:04

2018-08-26 22:25:36

自注意力機制神經網絡算法

2025-10-14 09:00:48

DeepSeek人工智能性能

2025-10-31 16:00:45

AI模型架構

2024-09-19 10:07:41

2025-02-10 00:00:55

MHAValue向量

2025-05-19 09:12:16

2025-02-14 11:22:34

2025-06-03 08:43:00

2025-09-29 18:51:01

2025-05-21 14:01:22

AIDeepSeek-V硬件

2023-07-30 15:42:45

圖神經網絡PyTorch

2021-08-04 10:17:19

開發技能代碼

2025-02-24 13:00:00

YOLOv12目標檢測Python

2024-10-31 10:00:39

注意力機制核心組件

2024-06-28 08:04:43

語言模型應用

2025-02-26 14:32:51

2021-06-04 15:39:03

深度學習編程人工智能

2024-12-09 00:00:10

點贊
收藏

51CTO技術棧公眾號

欧美二区观看| 国产黄色免费在线观看| 亚洲一级影院| 精品无人区乱码1区2区3区在线| 免费超爽大片黄| 男人的天堂在线免费视频| 免费人成在线不卡| 久久69精品久久久久久国产越南| 国产黑丝在线观看| 日本.亚洲电影| 亚洲美女淫视频| 麻豆成人在线播放| 91久久国语露脸精品国产高跟| 日韩精品首页| 亚洲精品福利视频| 九九精品久久久| 黄视频网站在线观看| 国产精品三级电影| 国产一区二区三区四区hd| 一区二区乱子伦在线播放| 欧美精品大片| 在线国产精品视频| www.日本高清| 精品国产麻豆| 在线观看免费一区| 成年女人18级毛片毛片免费| 日本欧美在线视频免费观看| 91麻豆国产香蕉久久精品| 91九色视频在线| 亚洲成熟少妇视频在线观看| 欧美激情91| 中文字幕成人精品久久不卡| 99久久免费看精品国产一区| 日韩电影免费观看高清完整版在线观看| 亚洲妇熟xx妇色黄| 国产成年人在线观看| 国模精品一区二区| av亚洲精华国产精华精华| 成人欧美一区二区三区在线| 免费视频久久久| 一区二区三区国产在线| 久久99久久亚洲国产| 九九九视频在线观看| 亚洲激情播播| 日韩精品极品视频免费观看| 少妇极品熟妇人妻无码| 高清久久精品| 欧美日韩电影在线| 91小视频网站| se69色成人网wwwsex| 在线一区二区三区做爰视频网站| 精品久久一二三| sm性调教片在线观看| 亚洲影视在线观看| 少妇一晚三次一区二区三区| 很黄的网站在线观看| 国产精品久线观看视频| 午夜精品一区二区在线观看| 国产51人人成人人人人爽色哟哟| 91免费视频大全| 狠狠色噜噜狠狠狠狠色吗综合| 亚洲欧美另类综合| 成人手机电影网| 国产一区二区三区无遮挡| 亚洲精品18在线观看| 懂色av中文一区二区三区| 成人动漫视频在线观看免费| 亚洲av永久纯肉无码精品动漫| 丁香婷婷综合色啪| 国产亚洲欧美一区二区| 视频一区二区三区国产| 久久精品一区二区| 色狠狠久久av五月综合| 在线播放麻豆| 亚洲免费视频中文字幕| 欧美a级免费视频| free性欧美| 精品国产1区2区| 欧美日韩亚洲一二三| 久久亚洲精品爱爱| 91精品免费观看| 精品伦一区二区三区| 另类春色校园亚洲| 国产一区二区三区中文| 三上悠亚作品在线观看| 国模 一区 二区 三区| 午夜精品在线视频| 国产午夜麻豆影院在线观看| 久久国产婷婷国产香蕉| 波多野结衣成人在线| 四虎在线观看| 一区在线中文字幕| 日b视频免费观看| 国偷自产一区二区免费视频| 欧美日韩国产美女| 中文字幕99页| 日韩国产专区| 久久久久久亚洲精品不卡| 久久精品视频1| 国产一区高清在线| 国产一区免费在线| 1769视频在线播放免费观看| 夜夜爽夜夜爽精品视频| 大肉大捧一进一出好爽动态图| 久久国产三级| 亚洲国产精品久久精品怡红院| 受虐m奴xxx在线观看| 91精品综合久久久久久久久久久 | 91亚洲精品久久久久久久久久久久| 性欧美8khd高清极品| 中文字幕精品—区二区四季| 久草免费福利在线| 欧洲亚洲精品久久久久| 日韩国产精品亚洲а∨天堂免| 肉色超薄丝袜脚交69xx图片 | 精品国产精品国产偷麻豆| 欧美成人精品不卡视频在线观看| 精品国产xxx| 国产成人精品亚洲日本在线桃色| 日韩福利在线| 免费影视亚洲| 欧美精选一区二区| 91视频免费观看网站| 狠狠干成人综合网| 成人激情视频在线| 国产在线视频福利| 欧美日韩激情小视频| 丰满人妻一区二区三区53视频| jiujiure精品视频播放| 欧美在线视频一区| 深爱激情五月婷婷| 一区二区三区精品| 日本一二三区在线| 欧美大黑bbbbbbbbb在线| 26uuu另类亚洲欧美日本老年| 性生交大片免费看女人按摩| 亚洲欧洲在线观看av| 国产超碰在线播放| 妖精视频一区二区三区免费观看| 97精品国产97久久久久久春色| a视频免费在线观看| 中文字幕一区二区三中文字幕| 日本爱爱免费视频| 自拍亚洲一区| 欧美一区二区.| 天堂中文网在线| 亚洲mv在线观看| wwwxx日本| 亚洲区欧美区| 国产原创精品| 美女91在线看| 亚洲精品一区二区在线| 日韩av一区二区在线播放| 国产999精品久久久久久| 日本在线视频www色| 欧美成年网站| 欧美国产日本在线| 国产 日韩 欧美 精品| 亚洲国产视频网站| 精品一区二区三区四区五区六区| 欧美另类综合| 国产欧美一区二区视频| 极品在线视频| 亚洲欧美日韩精品久久亚洲区 | 国内精品卡一卡二卡三| 日韩专区一卡二卡| 亚洲图片都市激情| 偷拍自拍亚洲| 久久6免费高清热精品| 亚洲av色香蕉一区二区三区| 亚洲h精品动漫在线观看| 超碰97在线资源站| 国产精品久久777777毛茸茸 | 欧美日韩伦理片| 91电影在线观看| 制服丨自拍丨欧美丨动漫丨| 国产呦精品一区二区三区网站| 欧美 日韩 国产精品| 国偷自产视频一区二区久| 日韩av色综合| 欧美成人性生活视频| 日韩欧美中文字幕公布| 国产乱码久久久久久| 久久久国产午夜精品| 日韩va在线观看| 国产精品草草| 日韩wuma| 一级毛片精品毛片| 国产成人精品午夜| 97影院秋霞午夜在线观看| 亚洲第一精品自拍| 奴色虐av一区二区三区| 一区二区三区在线观看欧美| 日本丰满少妇裸体自慰| 蓝色福利精品导航| av免费观看大全| 成久久久网站| 国产欧美一区二区三区不卡高清| 国产福利亚洲| 97色在线视频观看| 黄色动漫在线| 亚洲欧洲日产国码av系列天堂| 91中文字幕在线播放| 精品久久香蕉国产线看观看亚洲| 91无套直看片红桃在线观看| 成年人国产精品| 在线观看免费污视频| 国产欧美日韩亚洲一区二区三区| 亚洲一区三区电影在线观看| 日韩精品免费一区二区三区竹菊| 国产在线观看一区二区三区| 美女高潮在线观看| 美女性感视频久久久| 成人福利在线| 亚洲国内精品在线| 国产wwwxxx| 欧美日韩aaa| 国产成人a v| 天天操天天色综合| 全程偷拍露脸中年夫妇| 国产精品乱码一区二区三区软件| 爱爱的免费视频| 成人av午夜电影| 国产成人精品综合久久久久99| 久久狠狠婷婷| 欧美变态另类刺激| 激情视频一区| 久无码久无码av无码| 久久久久午夜电影| 亚洲视频电影| 欧美色爱综合| 日韩欧美三级一区二区| 杨幂一区二区三区免费看视频| 国产一区二区三区免费不卡| 99re91这里只有精品| 91青青草免费观看| 999精品嫩草久久久久久99| 国产精品吹潮在线观看| 伊人色综合一区二区三区影院视频| 欧美xxxx18性欧美| 国产在线观看免费麻豆| 色先锋资源久久综合5566| 国产在线视频资源| 亚洲午夜色婷婷在线| 欧洲毛片在线| 亚洲人成啪啪网站| 国产视频三级在线观看播放| 亚洲图片在区色| 黄色在线网站| 亚洲偷熟乱区亚洲香蕉av| 国产玉足榨精视频在线观看| 亚洲人成在线电影| 国产视频三级在线观看播放| 伊人久久男人天堂| shkd中文字幕久久在线观看| 中文字幕精品一区久久久久| 网友自拍视频在线| 久久久国产视频91| а天堂中文在线官网| 欧美美最猛性xxxxxx| 肉体视频在线| 欧美性视频精品| 免费电影日韩网站| 国产精品免费久久久久影院| 日本欧美在线| 114国产精品久久免费观看| 无码国模国产在线观看| 国产精品二区在线| 欧美交a欧美精品喷水| 快播亚洲色图| 青青草97国产精品麻豆| 这里只有精品66| 欧美精品国产一区二区| 国产精品专区在线| 日韩主播视频在线| 国产精品嫩草影院8vv8| 高清在线观看日韩| 在线免费看黄视频| 中文字幕在线不卡一区 | 亚洲一区 二区 三区| 免费人成在线观看视频播放| 国产精品日韩| 五月婷婷之综合激情| 国产成人午夜99999| 污污内射在线观看一区二区少妇| 国产亚洲欧美色| 极品久久久久久| 婷婷综合另类小说色区| 中文av免费观看| 日韩写真欧美这视频| 飘雪影院手机免费高清版在线观看 | 亚洲制服丝袜av| 亚洲黄色小说图片| 欧美美女一区二区| 台湾av在线二三区观看| 久久手机免费视频| 国产盗摄——sm在线视频| 国产精品网站入口| 福利欧美精品在线| 亚洲欧美日韩精品久久久| 在线观看视频免费一区二区三区| 免费在线观看毛片网站| 国产成人精品免费在线| 色婷婷国产精品免| 午夜私人影院久久久久| 96日本xxxxxⅹxxx17| 亚洲精品小视频| av黄色在线| 国产精品久久久久免费a∨| 136导航精品福利| 一本色道久久综合亚洲精品婷婷| 一本色道久久综合| 香蕉视频色在线观看| 国产色一区二区| 日本熟妇一区二区| 日韩一区二区三区四区| 91福利在线视频| 2018日韩中文字幕| 蜜桃在线一区| 亚洲一区二区高清视频| 奶水喷射视频一区| 亚洲av成人精品一区二区三区| 国产精品福利电影一区二区三区四区| 91av在线免费视频| 精品久久久久久久久久久院品网| 伦xxxx在线| 国产精品视频导航| 国产一区二区精品久| 男女猛烈激情xx00免费视频| 国产麻豆视频精品| frxxee中国xxx麻豆hd| 欧美性大战久久久久久久| 黄上黄在线观看| 日本sm极度另类视频| 欧美激情15p| 亚洲国产精品无码观看久久| 国产精品888| 日韩欧美综合视频| 欧美一区午夜精品| 免费在线看黄| 成人激情免费在线| 一本精品一区二区三区| 中文字幕在线观看日| 中文字幕中文字幕一区| 一区二区小视频| 中文字幕一区电影| 福利一区二区免费视频| 先锋影音网一区| 麻豆精品久久精品色综合| 国产破处视频在线观看| 精品污污网站免费看| av基地在线| 国产在线精品播放| 天天精品视频| 亚洲丝袜在线观看| 亚洲午夜久久久久久久久电影院| 欧美亚洲精品在线观看| 91精品国产91久久久久福利| 日韩mv欧美mv国产网站| 亚洲国产精品久久久久爰色欲| 久久久久久99久久久精品网站| 黄色污污视频软件| 日韩在线播放视频| 国产精品视频一区视频二区 | 另类天堂av| 国产精品国产三级国产专业不| 欧美视频三区在线播放| 免费高清完整在线观看| 成人看片在线| 国产精品一页| 国产7777777| 欧美一激情一区二区三区| 第一av在线| 欧美aaaaa喷水| 久久av老司机精品网站导航| 欧美一区二区三区爽爽爽| 亚洲第一视频在线观看| 亚洲淫成人影院| av不卡在线免费观看| 成人精品小蝌蚪| 午夜久久久久久久久久影院| zzijzzij亚洲日本成熟少妇| 最新精品在线| 亚洲乱码国产一区三区| 亚洲视频图片小说| 亚洲欧美色视频| 成人福利网站在线观看| 亚洲免费激情| 亚洲综合第一区| 亚洲国产成人在线视频| 日韩一区二区三区免费视频| 中文字幕日韩精品无码内射| 久久久久久久性| 精品久久久无码中文字幕| 国产成人高潮免费观看精品| 欧美日本免费| 女人黄色一级片| 亚洲成色www8888| 综合久久伊人| 黑鬼大战白妞高潮喷白浆|