精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Transformer挑戰(zhàn)者出現(xiàn)!斯坦福CMU聯(lián)合團(tuán)隊(duì),開源模型及代碼,公司已創(chuàng)辦

人工智能
Mamba是第一個真正實(shí)現(xiàn)匹配Transformer性能的線性時間序列模型,無論是在預(yù)訓(xùn)練困惑度還是下游任務(wù)評估方面。并且在音頻和DNA序列建模上也優(yōu)于之前的SOTA模型,表現(xiàn)出一定的通用性。

現(xiàn)在ChatGPT等大模型一大痛點(diǎn):

處理長文本算力消耗巨大,背后原因是Transformer架構(gòu)中注意力機(jī)制的二次復(fù)雜度。

FlashAttention作者Tri Dao參與提出的新架構(gòu),成為有力挑戰(zhàn)者,引起大量關(guān)注:

Mamba(曼巴,一種蛇),在語言任務(wù)上擊敗/匹配Transformer性能,具有線性復(fù)雜度和5倍推理吞吐量。

圖片圖片

具體來說,Mamba在語言、音頻、DNA序列模態(tài)上都實(shí)現(xiàn)SOTA。

在最受關(guān)注的語言任務(wù)上,Mamba-3B超越同等規(guī)模的Transformer,與兩倍大的Transformer匹敵。

并且相關(guān)代碼、預(yù)訓(xùn)練模型checkpoint都已開源。

兩位作者的解讀都獲得大量轉(zhuǎn)發(fā)。

圖片圖片

有網(wǎng)友發(fā)現(xiàn),連在線預(yù)測平臺上的“Transformer在2027年還是SOTA嗎?”都在這一天出現(xiàn)明顯下降。

圖片圖片

有選擇處理信息+硬件感知算法。

Mamba是一種狀態(tài)空間模型(SSM,State Space Model)。

建立在更現(xiàn)代的適用于深度學(xué)習(xí)的結(jié)構(gòu)化SSM(S4, Structured SSM)基礎(chǔ)上,與經(jīng)典架構(gòu)RNN有相似之處。

圖片圖片

在先前研究的Mamba主要有三點(diǎn)創(chuàng)新:

  • 對輸入信息有選擇性處理
  • 硬件感知的算法
  • 更簡單的架構(gòu)

選擇性狀態(tài)空間模型

作者認(rèn)為,序列建模的一個基礎(chǔ)問題是把上下文壓縮成更小的狀態(tài)。

從這個角度來看,注意力機(jī)制雖然高性能但低效率,需要顯式地存儲整個上下文(也就是KV緩存),直接導(dǎo)致訓(xùn)練和推理消耗算力大。

類RNN的循環(huán)神經(jīng)網(wǎng)絡(luò)具有有限的狀態(tài),高效,但性能受到對上下文壓縮程度的限制。

Mamba的解決辦法,是讓模型對信息有選擇性處理,可以關(guān)注或忽略傳入的內(nèi)容,即使?fàn)顟B(tài)大小固定也能壓縮上下文。

一個直觀的類比:

Transformer就像人類每寫一個字之前,都把前面的所有字+輸入都復(fù)習(xí)一遍,所以寫的慢。

RNN每次只參考前面固定的字?jǐn)?shù),寫的快,但容易忘掉更前面的內(nèi)容。

Mamba每次參考前面所有內(nèi)容的一個概括,越往后寫對前面內(nèi)容概括得越狠,丟掉細(xì)節(jié)保留大意。

在其前身結(jié)構(gòu)化狀態(tài)空間模型(S4)中,四個參數(shù)A、B、C、?都是固定的,不隨輸入變化。

在Mamaba中,作者讓這些參數(shù)B、C、?成為輸入的函數(shù),讓模型能夠根據(jù)輸入內(nèi)容自適應(yīng)地調(diào)整其行為。

圖片圖片

硬件感知的狀態(tài)擴(kuò)展

為了讓古老的SSM在現(xiàn)代GPU上也能高效計(jì)算,Mamba中使用了FlashAttention同款技術(shù)。

核心思想是利用內(nèi)存的不同層級結(jié)構(gòu)處理SSM的狀態(tài),減少高帶寬但慢速的HBM內(nèi)存反復(fù)讀寫這個瓶頸,具體來說:

  • 在更高速的SRAM內(nèi)存中執(zhí)行離散化和遞歸操作,再將輸出寫回HBM。
  • 通過并行掃描算法實(shí)現(xiàn)并行化。
  • 當(dāng)輸入從HBM加載到SRAM時,中間狀態(tài)不被保存,而是在反向傳播中重新計(jì)算。

圖片圖片

簡化的SSM架構(gòu)

將大多數(shù)SSM架構(gòu)的基礎(chǔ)塊,與現(xiàn)代神經(jīng)網(wǎng)絡(luò)中普遍存在的門控MLP相結(jié)合,組成新的Mamba塊。

重復(fù)這個塊,與歸一化和殘差連接結(jié)合,構(gòu)成Mamba架構(gòu)。

圖片圖片

實(shí)驗(yàn)結(jié)果

Mamba在Chinchilla縮放定律下預(yù)訓(xùn)練時,語言任務(wù)優(yōu)于同類開源模型。

對比對象中的Transformer++為標(biāo)準(zhǔn)GPT-3架構(gòu)加上谷歌PaLM和Meta Llama中的改進(jìn)方案,也就是已知最強(qiáng)Transformer配方。

圖片圖片

下游任務(wù)上,每個規(guī)模尺寸的Mamba都是同類最佳,并且通常與兩倍規(guī)模的基線性能匹配。

圖片圖片

特別是當(dāng)序列長度增加到512k時,相比使用FlashAttention-2的Transformer快幾個數(shù)量級,而且不會內(nèi)存不足。

圖片圖片

Transformer的下一步?

最終,Mamba是第一個真正實(shí)現(xiàn)匹配Transformer性能的線性時間序列模型,無論是在預(yù)訓(xùn)練困惑度還是下游任務(wù)評估方面。

并且在音頻和DNA序列建模上也優(yōu)于之前的SOTA模型,表現(xiàn)出一定的通用性。

作者在結(jié)論中提出,Mamba是通用序列模型骨干的有力候選者。

Stability AI創(chuàng)始人當(dāng)即表示關(guān)注。

圖片圖片

英偉達(dá)科學(xué)家Jim Fan也對Transformer的挑戰(zhàn)者出現(xiàn)感到興奮。

圖片圖片

論文兩位作者Albert Gu和Tri Dao,博士都畢業(yè)于斯坦福大學(xué),導(dǎo)師為Christopher Ré。

Albert Gu現(xiàn)在是CMU助理教授,多年來一直推動SSM架構(gòu)發(fā)展。

他曾在DeepMind 工作,目前是Cartesia AI的聯(lián)合創(chuàng)始人及首席科學(xué)家。

圖片圖片

Tri Dao,以FlashAttention、FlashDecoding系列工作聞名,現(xiàn)在是普林斯頓助理教授,和Together AI首席科學(xué)家,也在Cartesia AI擔(dān)任顧問。

圖片圖片

Cartesia AI公司介紹中提到致力于基于新架構(gòu)構(gòu)建下一代基礎(chǔ)模型,現(xiàn)在看來主要就是指創(chuàng)新的SSM架構(gòu)。

聯(lián)創(chuàng)及CEO Karan Goel同為斯坦福博士畢業(yè),也是Mamba的前身S4論文作者之一。

圖片圖片

對于Mamba的下一步,在論文中有提到“探索新架構(gòu)是否能適用于Transformer已建立起的豐富大模型生態(tài)”。

其中包括微調(diào)、自適應(yīng)、提示學(xué)習(xí)、上下文學(xué)習(xí)、指令微調(diào)、RLHF、量化……也就是要把基礎(chǔ)模型發(fā)展成GPT-3.5、Llama同類的助手模型了。

圖片圖片

但作者也提到,目前的實(shí)驗(yàn)規(guī)模較小,要全面評估SSM是否能與Transformer和其他架構(gòu)如RWKV、微軟RetNet競爭,至少還需要驗(yàn)證7B規(guī)模。

圖片圖片

在擴(kuò)展SSM的過程中,還會遇到新的工程挑戰(zhàn)和對模型的調(diào)整,論文中沒有涉及。

最后,Albert Gu還分享了為什么把新架構(gòu)起名為一種毒蛇的名字:

速度快、對序列建模問題很致命、前身S4是SSSS(嘶嘶嘶嘶)。

圖片圖片

論文:https://arxiv.org/abs/2312.00752

參考鏈接:
[1]https://twitter.com/_albertgu/status/1731727672286294400
[2]https://twitter.com/_albertgu/status/1731727672286294400

責(zé)任編輯:武曉燕 來源: 量子位
相關(guān)推薦

2022-10-08 12:38:23

模型開源

2023-04-04 13:17:00

GPUCMU開源

2024-11-26 10:44:18

2023-03-22 15:14:00

數(shù)據(jù)模型

2025-01-17 10:26:19

模型開發(fā)ChatGPT

2022-07-14 15:08:23

AI模型

2023-12-08 13:22:00

數(shù)據(jù)模型

2024-06-04 14:09:00

2023-03-15 10:26:00

模型開源

2024-09-11 14:59:00

2023-06-25 13:28:21

2025-05-06 00:45:00

2025-10-11 08:52:06

2025-07-21 11:51:12

模型AI工具

2023-07-03 13:23:47

OpenChatOpenLLMChatGPT

2023-03-31 13:55:00

模型智能

2021-04-02 15:02:42

開源技術(shù) 工具

2024-04-24 09:47:36

2012-03-21 21:38:27

蘋果
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

亚洲精品在线观看网站| 91捆绑美女网站| 欧美大片免费观看| 完美搭档在线观看| 国产成人精品亚洲日本在线观看| 国产精品成人免费| 精品综合久久| 国产老妇伦国产熟女老妇视频| 亚洲视频狠狠| 中文字幕久久精品| 无码精品一区二区三区在线播放 | 国内揄拍国内精品| 久久婷婷五月综合| 国产毛片久久久| 欧美精三区欧美精三区| 高清在线观看免费| 性欧美高清come| 国产免费久久精品| 精品久久sese| jizz国产视频| 蜜臀av国产精品久久久久| 国语自产精品视频在线看一大j8| 男女全黄做爰文章| 免费看成人哺乳视频网站| 精品久久五月天| 五月天中文字幕在线| 在线看欧美视频| 欧美日韩在线视频观看| 屁屁影院ccyy国产第一页| 日本中文字幕在线观看| 久久精品一区二区三区av| 精品久久精品久久| 老牛影视av牛牛影视av| 国产一区二区调教| 国产精品一区二区三| 黄色片视频免费| 亚洲欧美日韩专区| 高清欧美一区二区三区| 国产女人18水真多毛片18精品| 日本电影一区二区| 夜夜嗨av一区二区三区免费区 | 国产精品欧美极品| 日韩电影大全在线观看| 男人的天堂在线视频| 99久久精品99国产精品| 国产一区二区视频在线免费观看| 精品国产18久久久久久| 国产精品一级在线| 91精品国产高清久久久久久91裸体| 亚洲性生活大片| 蜜桃91丨九色丨蝌蚪91桃色| 国产精品久久一区主播| 精品一区二三区| 丝袜美腿亚洲色图| 国产精品老牛影院在线观看| 国模私拍一区二区| 麻豆精品一二三| 国产日韩中文字幕在线| 91福利在线观看视频| 精品一区二区三区免费| 成人性生交xxxxx网站| 国产裸体无遮挡| 国产精品影视在线| 国产福利久久| 无码精品黑人一区二区三区| 91麻豆国产自产在线观看| 免费一区二区三区| av电影在线网| 亚洲男人电影天堂| 国产美女在线一区| 电影一区二区三区| 欧美日韩中字一区| 91香蕉视频免费看| 91麻豆精品激情在线观看最新| 精品久久久久久久人人人人传媒| 中国一级特黄录像播放| 国产精品一线天粉嫩av| 日韩在线视频二区| 强乱中文字幕av一区乱码| 亚洲精品极品| 国产精品久久91| 国产999久久久| 99re这里只有精品首页| 日韩中文字幕一区二区| av网址在线免费观看| 亚洲va天堂va国产va久| 手机看片福利盒子久久| 韩国三级成人在线| 日韩精品亚洲元码| 日韩精品久久久久久久的张开腿让| 女主播福利一区| 4p变态网欧美系列| 国产精品一级视频| 91免费在线播放| 中文字幕av日韩精品| 人妖欧美1区| 欧洲在线/亚洲| 91porn在线| 不卡日本视频| 国内免费久久久久久久久久久| 成人黄色片在线观看| 国产999精品久久| 亚洲丰满在线| 第一福利在线视频| 91精品久久久久久久91蜜桃| 亚洲第一香蕉网| 国内自拍一区| 国产精品揄拍一区二区| 天堂影院在线| 亚洲一区在线看| 小泽玛利亚视频在线观看| 国产精品毛片视频| 久久精品国产96久久久香蕉| 亚洲av无码精品一区二区| 高清成人在线观看| 欧美 日韩 国产 在线观看| jizz内谢中国亚洲jizz| 精品欧美黑人一区二区三区| 中文乱码字幕高清一区二区| 久久久久久久欧美精品| 国产福利一区二区三区在线观看| 日本最新在线视频| 欧美视频在线一区| 粉嫩av蜜桃av蜜臀av| 亚洲国产高清视频| 亚洲综合日韩中文字幕v在线| 成人欧美一区| 91久久精品午夜一区二区| 亚洲一区二区三区四区五区六区| 国产综合久久| 成人做爰66片免费看网站| 成人欧美在线| 欧美乱妇15p| 日本女人性生活视频| 美美哒免费高清在线观看视频一区二区| 久久香蕉综合色| 成年男女免费视频网站不卡| 亚洲成人教育av| 精品无码免费视频| 成人精品电影在线观看| 97视频在线免费| 成人av综合网| 久久久久久久久中文字幕| 精品国产伦一区二区三区| 亚洲色图.com| 国产在线观看中文字幕| 亚洲不卡av不卡一区二区| 国产精品人成电影| 成年人在线观看| 欧美一a一片一级一片| 国产又粗又硬视频| 美国十次了思思久久精品导航 | 欧美理论电影在线| 在线观看美女av| 国产成人一级电影| 国产www免费| 香蕉久久99| 日韩免费观看高清| 91在线品视觉盛宴免费| 欧美日韩一区成人| 精品国产视频一区二区三区| 国产一区91精品张津瑜| 波多野结衣与黑人| 欧美91在线| 国产精品爱啪在线线免费观看| 懂色av中文在线| 91精品欧美一区二区三区综合在| 国外成人在线视频网站| 操你啦视频在线| 日韩视频一区二区三区在线播放 | 综合激情在线| 国产精品日韩一区二区三区| 神马久久午夜| 色婷婷久久av| 丰满少妇被猛烈进入| 午夜精彩视频在线观看不卡| brazzers精品成人一区| 久久99国产精品久久99果冻传媒| 久久精品在线免费视频| 日韩欧美天堂| 国产欧美日韩中文| 成人影音在线| 伊人男人综合视频网| av 一区二区三区| 婷婷一区二区三区| 18精品爽国产三级网站| 成人免费毛片片v| 爆乳熟妇一区二区三区霸乳| 欧美xxx在线观看| 久久久久久久免费| 自拍偷拍亚洲图片| 91产国在线观看动作片喷水| 永久免费在线观看视频| 亚洲精品大尺度| 91theporn国产在线观看| 天天综合色天天综合| 国产在视频线精品视频| 不卡电影一区二区三区| 中文字幕亚洲欧洲| 国产精品女主播一区二区三区| 一区二区三区的久久的视频| 国产精品玖玖玖在线资源| 国产在线a不卡| 在线免费看h| 久久6免费高清热精品| av在线天堂| 日韩成人久久久| 亚洲av无码一区二区乱子伦| 欧美日韩亚洲综合在线 欧美亚洲特黄一级| 久久久久久免费观看| 国产精品毛片大码女人| 无码人妻aⅴ一区二区三区| 国产乱人伦偷精品视频免下载| 九九热免费精品视频| 国产欧美综合一区二区三区| 日韩一二区视频| 日韩久久电影| 日韩电影免费观看高清完整| 婷婷综合成人| 国产日韩一区欧美| 日本在线成人| 91在线观看免费| 久久亚洲精品人成综合网| 欧美做受高潮电影o| av中文在线资源库| 欧美美女15p| 成人福利网站| 久久精品国产一区二区电影| 成人一区二区不卡免费| 亚洲午夜小视频| 国产视频网站在线| 亚洲毛片一区二区| 色视频在线观看| 亚洲国产精品国自产拍av秋霞| 国产精选久久久| 欧美美女喷水视频| 国产女无套免费视频| 欧美精选午夜久久久乱码6080| 91午夜交换视频| 欧美日韩国产免费一区二区| 在线免费a视频| 欧美日韩国产综合视频在线观看| 中文字幕二区三区| 欧美精品在线一区二区三区| 国产精品一区二区av白丝下载 | 日韩欧美亚洲成人| 国产精品男女视频| 欧美日韩国产中文字幕 | 国产最新精品免费| 国产无遮挡猛进猛出免费软件 | 91福利国产成人精品照片| 亚洲AV无码成人精品区东京热| 欧美午夜女人视频在线| jizz国产在线观看| 在线免费观看日本欧美| 中文字幕乱码人妻无码久久| 欧美日韩国产一二三| 99国产在线播放| 亚洲精品一区二区三区精华液 | 懂色av蜜臀av粉嫩av分享吧| 精品久久久久久久久久久院品网| 亚洲老妇色熟女老太| 日韩精品高清在线观看| 青草久久伊人| 日韩中文字幕网| 国产精品一品| 欧美夜福利tv在线| 福利一区二区免费视频| 91久久精品国产91久久| 91精品入口| 欧美精品成人一区二区在线观看| 日韩精品一区二区久久| 国产精品第157页| 午夜一区在线| 久久久精品高清| 成人福利电影精品一区二区在线观看| 欧美成人午夜精品免费| 亚洲欧洲国产日本综合| 日韩成人在线免费视频| 欧美三级三级三级爽爽爽| www.久久久久久| 亚洲欧美中文日韩在线| a黄色片在线观看| 国产传媒在线观看| 亚洲丁香婷深爱综合| 欧美777四色影视在线| 最近2019中文字幕mv免费看 | 国产精品永久免费观看| 日韩视频在线直播| 欧洲亚洲一区二区| 中文字幕亚洲综合久久五月天色无吗''| 免费高清一区二区三区| 快she精品国产999| 欧美成人精品一区二区综合免费| 91老师国产黑色丝袜在线| 粉嫩av性色av蜜臀av网站| 午夜欧美视频在线观看| 91免费视频播放| 亚洲另类xxxx| 久久不射影院| 国产精品一香蕉国产线看观看| 红杏视频成人| 免费成人深夜夜行网站视频| 蜜乳av另类精品一区二区| 成年人网站av| 日本一区二区动态图| 久久久久久久久久影院| 91精品国产一区二区三区| 久热av在线| 91高清免费视频| 精品国产麻豆| 一区二区精品视频| 日日夜夜精品视频天天综合网| 日韩www视频| 一区二区三区资源| 一区二区三区精| 亚洲天堂成人在线| 桃色av一区二区| 国产精品一区二区三区在线 | 一级淫片在线观看| 中文字幕av一区二区三区| 日日夜夜操视频| 精品亚洲一区二区三区在线播放| 青青在线视频| 92福利视频午夜1000合集在线观看 | 黄色av网站在线播放| 国产精品日韩一区| 你懂的视频欧美| 免费毛片小视频| 成人sese在线| 69精品久久久| 亚洲成成品网站| 98色花堂精品视频在线观看| 成人黄色在线免费观看| 午夜久久tv| 中文字幕久久久久久久| 一区二区视频在线| www.爱爱.com| 欧美激情一区二区三区久久久 | 精品国产乱码久久久久久蜜臀 | 亚欧美无遮挡hd高清在线视频| 激情五月婷婷久久| 中文字幕免费不卡在线| 在线观看国产精品视频| 色偷偷噜噜噜亚洲男人的天堂| 欧美97人人模人人爽人人喊视频| 亚洲一区二区不卡视频| 精彩视频一区二区| 波多野结衣家庭教师| 日韩精品一区二区三区老鸭窝| 日本精品600av| 国产欧美日韩一区| 翔田千里一区二区| 亚洲一区视频在线播放| 欧美午夜一区二区| 国产成人高清精品| 粉嫩av免费一区二区三区| 在线日本高清免费不卡| 国产精品毛片一区二区| 欧美手机在线视频| bt在线麻豆视频| 国产一区免费在线| 久久xxxx| 天堂网av2018| 日韩视频123| 免费毛片b在线观看| 欧美日韩一区在线播放| 蜜臀久久99精品久久久久久9| 九九精品视频免费| 精品国精品国产尤物美女| 亚洲性色av| 亚洲欧洲久久| 国产盗摄一区二区三区| 亚洲天堂一区在线| 久久精品国产亚洲| 日韩av不卡一区| 欧美特黄aaa| 亚洲va国产va欧美va观看| 免费在线视频你懂得| 成人美女免费网站视频| 日韩午夜av| 日韩在线不卡av| 日韩国产在线播放| 日韩毛片免费视频一级特黄| 91九色丨porny丨国产jk| 国产喷白浆一区二区三区| 精品国产999久久久免费| 欧美在线免费视频| 亚洲国产精品成人| 欧美做受xxxxxⅹ性视频| 欧美一三区三区四区免费在线看| 国产拍在线视频| 日本特级黄色大片| 久久一二三国产| 午夜精品久久久久久久爽 | 国产成人久久| 伊人影院在线观看视频| 91精品福利视频| 免费v片在线观看| 欧美日韩视频免费|