精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

xLSTM:拳打Transformer,腳踢M(jìn)amba?! 原創(chuàng)

發(fā)布于 2025-2-17 07:53
瀏覽
0收藏

xLSTM:拳打Transformer,腳踢M(jìn)amba?!-AI.x社區(qū)

大模型技術(shù)論文不斷,每個(gè)月總會(huì)新增上千篇。本專欄精選論文重點(diǎn)解讀,主題還是圍繞著行業(yè)實(shí)踐和工程量產(chǎn)。若在閱讀過程中有些知識(shí)點(diǎn)存在盲區(qū),可以回到如何優(yōu)雅的談?wù)摯竽P椭匦麻喿x。另外斯坦福2024人工智能報(bào)告解讀為通識(shí)性讀物。若對(duì)于如果構(gòu)建生成級(jí)別的AI架構(gòu)則可以關(guān)注AI架構(gòu)設(shè)計(jì)。

記得在《重新審視神經(jīng)網(wǎng)絡(luò)》這篇文章中提及,任何人都可以構(gòu)建自己心目中的神經(jīng)網(wǎng)絡(luò)。在Transformers、Mamba、KAN之后,長(zhǎng)短期記憶 (LSTM) 架構(gòu)的發(fā)明者Sepp Hochreiter和他在NXAI的團(tuán)隊(duì)推出了一種稱為擴(kuò)展LSTM (xLSTM) 的新變體。

1.xLSTM的背景

LSTM在自然語音處理的領(lǐng)域影響巨大,但它也有局限性。在一些特殊的任務(wù)上,比如最臨近鄰搜索的時(shí)候,在記憶細(xì)胞的更新方面就頗有壓力。來自ELLIS、LIT AI實(shí)驗(yàn)室、奧地利林茨NXAI實(shí)驗(yàn)室的研究人員希望通過解決LSTM語言模型的局限性來增強(qiáng)LSTM。

改進(jìn)點(diǎn)有不少,小編認(rèn)為沒有LSTM的基礎(chǔ)很難完全看得明白。因此決定初看改進(jìn)點(diǎn)之后,將一些基本的知識(shí)點(diǎn)做回顧,否則只會(huì)走馬觀花。xLSTM的改進(jìn)點(diǎn):

引入具有適當(dāng)歸一化和穩(wěn)定技術(shù)的指數(shù)門控(可以理解為激活函數(shù))。

修改LSTM記憶結(jié)構(gòu),推出兩種記憶細(xì)胞。第一種是sLSTM,它具有標(biāo)量記憶、標(biāo)量更新和新記憶混合的能力,第二種是mLSTM,它擁有矩陣記憶,而且這些記憶可以通過協(xié)方差更新且全部具備并行運(yùn)算

將上面的LSTM擴(kuò)展體結(jié)合殘差網(wǎng)絡(luò)設(shè)計(jì)模式產(chǎn)生xLSTM塊,然后將這些塊堆疊到xLSTM架構(gòu)。

xLSTM:拳打Transformer,腳踢M(jìn)amba?!-AI.x社區(qū)

和Transformer和狀態(tài)空間模型相比,指數(shù)門控和修改后的記憶結(jié)構(gòu)增強(qiáng)了xLSTM的性能,無論是在性能還是擴(kuò)展方面表現(xiàn)尚可。這些突破讓LSTM長(zhǎng)期在大語言模型上的瓶頸得到解決,也許未來可能會(huì)成為新的大語言技術(shù)巨頭。

Transformer只是一種大語言模型的架構(gòu),核心還是注意力機(jī)制,然而計(jì)算的復(fù)雜度還是擺在那兒。有不少的競(jìng)爭(zhēng)者例如Synthesizer、Linformer、Linear Transformer和Performer專注于線性開銷的注意力技術(shù)。狀態(tài)空間模型 (SSM) 因其上下文長(zhǎng)度的線性也備受關(guān)注,S4、DSS、BiGS和Mamba異軍突起。具有線性單元和門控機(jī)制的循環(huán)神經(jīng)網(wǎng)絡(luò) (RNN) 也在掙扎,HGRN和RWKV。xLSTM則利用協(xié)方差更新規(guī)則、記憶混合和殘差堆疊架構(gòu)進(jìn)行關(guān)鍵組件的增強(qiáng),不容小覷。

在xLSTM用于語言建模的實(shí)驗(yàn)評(píng)估中,xLSTM的功能在形式語言、聯(lián)想回憶任務(wù)和遠(yuǎn)程競(jìng)技場(chǎng)場(chǎng)景上進(jìn)行了測(cè)試。與現(xiàn)有方法的比較揭示了xLSTM 在驗(yàn)證困惑度方面的優(yōu)越性。

消融研究強(qiáng)調(diào)了指數(shù)門控和矩陣記憶在xLSTM性能中的重要性。對(duì)300B 個(gè)token進(jìn)行的大語言建模驗(yàn)證了xLSTM的有效性,顯示了其在處理長(zhǎng)上下文、下游任務(wù)和多樣化文本域方面的魯棒性??s放行為分析表明,隨著規(guī)模的增加,xLSTM與其他模型相比具有良好的性能。隨著序列長(zhǎng)度的增加,xLSTM架構(gòu)的時(shí)間復(fù)雜度為O(N),內(nèi)存復(fù)雜度為O(1),這點(diǎn)比Transformer更加高效。

2.指數(shù)門控

xLSTM論文中引入的指數(shù)門控機(jī)制是對(duì)LSTM中使用的傳統(tǒng)sigmoid門控的重大改進(jìn)。這里要給大家科普一下,模型輸出數(shù)值一般會(huì)經(jīng)過激活函數(shù),sigmoid是其中的一種,任何輸入都會(huì)得到0~1期間的數(shù)值。一般在LSTM中,0就代表著不通過,1代表允許通過。那么門控的意思大白話就是門閥,它決定著信息的穿透度。




xLSTM:拳打Transformer,腳踢M(jìn)amba?!-AI.x社區(qū)







xLSTM:拳打Transformer,腳踢M(jìn)amba?!-AI.x社區(qū)




上圖就對(duì)比了原來LSTM和sLSTM的運(yùn)算公式,新的里面由σ函數(shù)被替代為exp函數(shù)。原論文對(duì)于替換的解釋是由此增強(qiáng)了模型在處理新信息時(shí)能有效修改和更新其記憶的能力。

在傳統(tǒng)的 LSTM 中,sigmoid函數(shù)限制了模型對(duì)記憶單元狀態(tài)進(jìn)行實(shí)質(zhì)性改變的能力,特別是當(dāng)門值接近0或1時(shí)。這種限制阻礙了LSTM快速適應(yīng)新數(shù)據(jù),并可能導(dǎo)致低效的記憶更新。

xLSTM通過用指數(shù)激活函數(shù)替換sigmoid激活函數(shù)來解決此問題。指數(shù)門控允許記憶細(xì)胞狀態(tài)發(fā)生更明顯的變化,(指數(shù)函數(shù)的取值范圍0~+∞)使模型能夠快速整合新信息并相應(yīng)地調(diào)整其記憶。歸一化器有助于穩(wěn)定指數(shù)門控并維持輸入門和遺忘門之間的平衡。

3.矩陣記憶

xLSTM論文的另關(guān)鍵貢獻(xiàn)是引入了矩陣記憶體(內(nèi)存,或者稱之存儲(chǔ)器),它取代了傳統(tǒng) LSTM中使用的標(biāo)量存儲(chǔ)單元。在LSTM中,存儲(chǔ)單元由單個(gè)標(biāo)量表示,約束了每個(gè)時(shí)間步可以存儲(chǔ)和處理的信息量。這種局限性可能會(huì)阻礙模型捕獲和保留復(fù)雜依賴關(guān)系和長(zhǎng)期信息的能力。

xLSTM通過采用矩陣存儲(chǔ)器突破這一限制,其中每個(gè)存儲(chǔ)器單元由矩陣而不是標(biāo)量表示。從標(biāo)量?jī)?nèi)存到矩陣內(nèi)存的轉(zhuǎn)變顯著增強(qiáng)了模型存儲(chǔ)和處理豐富的高維信息的能力。

矩陣內(nèi)存允許xLSTM捕獲輸入數(shù)據(jù)中更復(fù)雜的關(guān)系和依賴關(guān)系。它使模型能夠更全面地表示上下文和長(zhǎng)期依賴性,從而提高需要理解和生成復(fù)雜序列的任務(wù)的性能。

4.可并行架構(gòu)

xLSTM最重要的進(jìn)步是引入了可并行架構(gòu),它解決了傳統(tǒng)LSTM的主要限制。在傳統(tǒng)的LSTM中,令牌的處理是按順序執(zhí)行的,其中每個(gè)令牌一次處理一個(gè),這限制了模型利用并行性的能力,并導(dǎo)致訓(xùn)練和推理時(shí)間變慢。xLSTM 架構(gòu)引入了mLSTM(矩陣內(nèi)存LSTM)和sLSTM(標(biāo)量 LSTM)塊的靈活組合,從而實(shí)現(xiàn)令牌的并行處理。



xLSTM:拳打Transformer,腳踢M(jìn)amba?!-AI.x社區(qū)





xLSTM:拳打Transformer,腳踢M(jìn)amba?!-AI.x社區(qū)



mLSTM塊

sLSTM塊

mLSTM被設(shè)計(jì)為同時(shí)對(duì)整個(gè)令牌序列進(jìn)行操作,從而實(shí)現(xiàn)類似于 Transformer 模型實(shí)現(xiàn)的并行性的高效并行計(jì)算。主要還是利用矩陣存儲(chǔ)機(jī)制,使它們能夠并行捕獲和處理所有令牌的豐富、高維信息。這種并行處理能力顯著加快了訓(xùn)練和推理過程,使 xLSTM 比傳統(tǒng) LSTM 的計(jì)算效率更高。

另一方面,sLSTM 則被設(shè)計(jì)為保留了傳統(tǒng)LSTM的順序處理性質(zhì),允許模型捕獲對(duì)于特定任務(wù)可能很重要的某些順序依賴性。在 xLSTM 架構(gòu)中可以靈活的以不同比例堆疊mLSTM和sLSTM塊,提供了并行性和順序建模之間的平衡,從而能夠適應(yīng)各種語言建模任務(wù)。

本文轉(zhuǎn)載自 ??魯班模錘??,作者: 龐德公



?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
標(biāo)簽
已于2025-2-17 10:26:30修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
紧身裙女教师波多野结衣| 日本精品www| 丰满大乳国产精品| 一本色道久久综合| 国产亚洲欧美aaaa| 国产精品久久久久久久av福利| 色图在线观看| 91一区在线观看| 91精品国产综合久久香蕉| 久久精品国产亚洲av无码娇色| 九九综合九九| 日韩一区和二区| 成人小视频在线看| 日韩伦理电影网站| 中文字幕成人在线观看| 国产精品乱码| 亚洲中文字幕在线观看| 日韩视频在线一区二区三区| 中文字幕亚洲精品| 久久久久国产精品区片区无码| 曰本一区二区| 欧美日韩午夜视频在线观看| 精品久久免费观看| 国产在线视频网| www.日韩大片| 91黄色精品| 亚洲在线视频播放| 丝袜美腿高跟呻吟高潮一区| 久久偷看各类女兵18女厕嘘嘘| 日本三级日本三级日本三级极| 日韩免费在线电影| 色哟哟国产精品免费观看| 少妇熟女一区二区| 国产一级免费在线观看| 99久久国产综合精品女不卡| 成人中心免费视频| 一区二区三区视频免费| 国产手机视频在线观看| 欧美日韩影视| 91一区二区三区在线播放| 99久久无色码| 99久久久国产精品无码免费| 久久99精品久久久久久动态图| 日韩av观看网址| 欧美一区二区三区四| 在线欧美一区| 97欧美精品一区二区三区| 91视频免费在线看| 牛牛国产精品| 欧美另类69精品久久久久9999| 中文字幕美女视频| 日韩av免费大片| 在线播放日韩欧美| 精品少妇一区二区三区密爱| 日韩av在线中文字幕| 最近2019中文字幕一页二页| 少妇无套高潮一二三区| 精品久久美女| 日韩亚洲欧美中文高清在线| 亚洲不卡的av| 91精品国产福利在线观看麻豆| 久久精品国产久精国产一老狼| sm捆绑调教视频| 国产精品伦理久久久久久| 精品国产区一区二区三区在线观看 | 欧美日韩欧美一区二区| 国产熟人av一二三区| 怡红院成人在线| 欧美性videosxxxxx| 三上悠亚av一区二区三区| 亚洲免费看片| 精品剧情v国产在线观看在线| 中文字幕天堂av| 天堂网av成人| 尤物tv国产一区| 国产jizz18女人高潮| 亚洲精品va| 久久久免费在线观看| 国产一区二区99| 日本成人中文字幕在线视频 | 男人添女人下部高潮视频在观看| 91吃瓜在线观看| 一本大道久久a久久精二百| 欧美性猛交xxx乱久交| 免费亚洲电影| 欧美夫妻性生活| 99久久久无码国产精品性波多| 香蕉久久精品日日躁夜夜躁| 伊人av综合网| 强行糟蹋人妻hd中文| 亚洲深夜影院| 91精品久久久久久久久中文字幕 | 丁香啪啪综合成人亚洲小说| 久久福利电影| 午夜激情视频在线观看| 亚洲一区二区三区在线播放| 99热成人精品热久久66| www.成人| 亚洲欧洲偷拍精品| 岛国毛片在线观看| 乱码第一页成人| 亚洲一区二区少妇| 免费在线一级视频| 亚洲精品免费电影| 欧美日韩在线免费播放| 97久久亚洲| 夜夜嗨av色综合久久久综合网| 久久久久久久久久久97| 热久久国产精品| 精品视频一区在线| 99热国产在线| 欧美影院精品一区| 亚洲视频在线播放免费| 999精品在线| 日韩av电影免费观看高清| 蜜桃久久一区二区三区| 亚洲欧洲另类国产综合| 日本成人中文字幕在线| 久久久精品国产**网站| 欧美裸体xxxx极品少妇| 这里只有精品国产| 久久一区二区视频| 亚洲色成人www永久在线观看| 亚洲精品毛片| 亚洲色图色老头| 日韩精品手机在线| 成人免费三级在线| 欧美三级午夜理伦三级老人| 国产成人a视频高清在线观看| 日韩av在线一区| 国产一级一片免费播放放a| 国产一区二区精品久久| 亚洲综合首页| 国产在视频一区二区三区吞精| 日韩精品视频免费| 日韩高清精品免费观看| 高清国产一区二区三区| 国内自拍中文字幕| 精品成人18| 久热国产精品视频| 国产精品一区二区三区在线免费观看| 国产欧美一区二区精品忘忧草| 91传媒久久久| 免费av一区二区三区四区| 97精品在线观看| 色呦呦免费观看| 精品久久久久久久大神国产| 亚洲自拍偷拍精品| 99精品99| 久久久影院一区二区三区| 理论片午夜视频在线观看| 欧美成人bangbros| 国产真人真事毛片| www.激情成人| 凹凸国产熟女精品视频| 欧美亚洲tv| 日本成人免费在线| 国产美女性感在线观看懂色av| 欧美专区日韩专区| 男人天堂资源网| 国产一区二区三区黄视频| 今天免费高清在线观看国语| av综合网站| 97在线看免费观看视频在线观看| 偷拍25位美女撒尿视频在线观看| 亚洲大片在线观看| 亚洲成人av免费在线观看| 久久一二三四| 三年中文高清在线观看第6集| 国产精品国产亚洲精品| 久久久久久综合网天天| 欧美精品少妇| 欧美军同video69gay| 久草成人在线视频| 91免费视频网| xxxx在线免费观看| 欧美精品二区| 鲁丝片一区二区三区| 婷婷激情成人| 韩国欧美亚洲国产| 福利视频在线看| 日韩欧美黄色影院| 中文字幕国产在线观看| 亚洲视频你懂的| 欧美成人三级伦在线观看| 日本强好片久久久久久aaa| 国产成人精品免费看在线播放| 国产区精品视频在线观看豆花| 国产精品69av| 青草在线视频| 亚洲香蕉成人av网站在线观看 | 色999日韩欧美国产| www香蕉视频| 91成人在线精品| 特级片在线观看| 国产日韩欧美不卡| 中文字幕一区二区人妻电影丶| 欧美aaa在线| 人人妻人人做人人爽| 久久五月天小说| 精品免费一区二区三区蜜桃| 福利一区三区| 国产精品91视频| www欧美xxxx| av自拍一区| 欧美精品福利在线| 日本精品一区二区三区在线播放| 亚洲风情亚aⅴ在线发布| 亚洲熟妇av乱码在线观看| 亚洲国产aⅴ天堂久久| 99久久精品久久亚洲精品| wwwwww.欧美系列| 欧美69精品久久久久久不卡| 日本麻豆一区二区三区视频| 五十路熟女丰满大屁股| 欧美一区二区| 亚洲欧美精品在线观看| 久久男人av| 亚洲自拍偷拍区| 欧美91在线|欧美| 欧洲成人在线观看| 麻豆视频在线看| 欧美精品videos| 91在线中字| 久久精品电影网| shkd中文字幕久久在线观看| 精品一区二区电影| 少妇av在线播放| 日韩欧美国产午夜精品| 91麻豆国产在线| 欧美群妇大交群中文字幕| 精品一区二三区| 91搞黄在线观看| 中文字幕第四页| 岛国视频午夜一区免费在线观看| 久久久精品视频在线| 亚洲精品综合在线| 91精品国产高清一区二区三蜜臀| 国产精品国产a级| 免费一级suv好看的国产网站| 国产亚洲精久久久久久| 国产ts在线播放| 国产日韩精品久久久| www.99热| 国产精品全国免费观看高清| 日本高清黄色片| 国产精品久久久久久久久免费桃花 | 国产亚洲天堂网| 香蕉亚洲视频| 欧美精品无码一区二区三区| 蜜臀av性久久久久蜜臀aⅴ四虎| 91视频免费版污| 蜜桃av噜噜一区| 亚洲18在线看污www麻豆 | 欧洲激情一区二区| 亚洲国产无线乱码在线观看| 欧美区在线观看| 国产xxxxxx| 日韩欧美综合在线| 欧美在线精品一区二区三区| 精品视频在线观看日韩| 国外av在线| 神马久久桃色视频| 中文字幕资源网在线观看| 欧美黑人性视频| 中文字幕成在线观看| 国产精品久久久久久五月尺| 国语自产精品视频在线看抢先版结局| 成人在线播放av| 国内自拍欧美| 日韩亚洲视频| 影视一区二区| 国产91在线免费| 蜜桃免费网站一区二区三区| 亚洲天堂小视频| 91美女在线观看| 欧美视频一区二区在线| 亚洲一区二区精品久久av| 日韩精品在线观看免费| 欧美精品久久一区二区三区| 刘亦菲久久免费一区二区| 亚洲热线99精品视频| 国产福利在线播放麻豆| 91精品国产777在线观看| 国产精品一区二区免费福利视频| 99re国产在线播放| 蜜桃精品wwwmitaows| 国产 国语对白 露脸 | 午夜久久福利视频| 丁香六月久久综合狠狠色| 国产综合精品久久久久成人av| 亚洲久草在线视频| 久久久久精彩视频| 亚洲国产精品嫩草影院久久| 三区四区在线视频| 69国产精品成人在线播放| 欧美一级做一级爱a做片性| 国产在线视频欧美一区二区三区| 99热国内精品永久免费观看| 一区二区传媒有限公司| 激情深爱一区二区| 实拍女处破www免费看| 一区二区三区在线观看网站| 最近中文字幕在线观看视频| 日韩风俗一区 二区| 高清免费电影在线观看| 国产精品成人va在线观看| 红杏aⅴ成人免费视频| 日韩视频在线观看视频| 日韩中文字幕1| 免费a v网站| 亚洲三级久久久| 五月婷婷丁香在线| 日韩电影中文 亚洲精品乱码| 91一区二区三区在线| 国产精品久久在线观看| 婷婷综合电影| 欧美视频在线观看视频| 国产精品一区二区果冻传媒| 亚洲激情图片网| 在线观看日产精品| 毛片免费在线| 国产91精品不卡视频| japanese色系久久精品| 400部精品国偷自产在线观看| 免费看欧美美女黄的网站| 亚洲国产欧美视频| 欧美日韩色婷婷| 欧美日本网站| 欧美孕妇性xx| 伊人久久大香线蕉av不卡| 黄色一级在线视频| caoporn国产一区二区| www.99re7.com| 亚洲精品一线二线三线无人区| 3d玉蒲团在线观看| 91深夜福利视频| 中文字幕亚洲综合久久五月天色无吗''| 污污的视频免费| 中文字幕一区二区三区四区 | 久久99久久久久| 亚洲色图100p| 在线不卡的av| 国产91在线视频蝌蚪| 亚洲综合社区网| 亚洲小说欧美另类婷婷| 欧美日韩一区二区三区四区五区六区| 亚洲一区二区三区四区在线观看| 亚洲国产综合网| 国内精品小视频| 日本一区福利在线| 青青草原成人网| 亚洲国产精品二十页| 在线亚洲欧美日韩| 欧美成人在线免费| 成人免费在线电影网| 免费av手机在线观看| 久久久久久久久一| 中文字幕日韩国产| 欧美成人一区二区三区电影| 给我免费播放日韩视频| 337p粉嫩大胆噜噜噜鲁| 国产精品素人视频| 99久久久国产精品无码网爆| 久久久噜噜噜久久| 一道在线中文一区二区三区| 色婷婷狠狠18| 一区二区三区四区在线| 特黄aaaaaaaaa真人毛片| 国产99视频在线观看| 欧美wwwww| 日韩无码精品一区二区| 色噜噜狠狠成人网p站| 免费看a在线观看| 国产原创精品| 日产国产欧美视频一区精品| 天天鲁一鲁摸一摸爽一爽| 精品国精品自拍自在线| 欧美日韩123区| 免费看av软件| 91丨九色porny丨蝌蚪| 亚洲天天综合网| 久久久免费在线观看| 日产午夜精品一线二线三线| 无码国产精品一区二区高潮| 欧美性少妇18aaaa视频| 精品麻豆一区二区三区| 国新精品乱码一区二区三区18| 日韩中文字幕一区二区三区| 一区视频免费观看 | 日本a在线播放| 国产伦理一区二区三区| 蜜臀国产一区二区三区在线播放| 国产在线欧美在线| 国产亚洲精品久久久久久777| 亚洲91网站| 中文字幕第38页| 色综合久久久久综合99| 中文字幕在线观看播放| 欧洲精品一区色|