精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

最小化的遞歸神經(jīng)網(wǎng)絡(luò)RNN為Transformer提供了快速高效的替代方案 原創(chuàng)

發(fā)布于 2024-11-11 08:08
瀏覽
0收藏

本文介紹了長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)和門控循環(huán)單元(GRU)這兩種流行的RNN變體的最小化版本——minLSTM和minGRU,這兩個(gè)模型在訓(xùn)練期間可以完全并行,并且使用的參數(shù)顯著減少,使它們成為Tansformer的快速和有效的替代方案。

Transformer如今已經(jīng)成為大型語(yǔ)言模型(LLM)和其他序列處理應(yīng)用程序的主要架構(gòu)。然而,它們固有的二次方計(jì)算復(fù)雜性成為了將Transformer擴(kuò)展至超長(zhǎng)序列時(shí)的巨大障礙,顯著增加了成本。這引發(fā)了人們對(duì)具有線性復(fù)雜性和恒定內(nèi)存需求的架構(gòu)的興趣。

Mila公司和Borealis AI的研究人員重新審視了遞歸神經(jīng)網(wǎng)絡(luò)(RNN)作為Transformer架構(gòu)的潛在替代方案。他們?cè)诎l(fā)布的一篇論文中,介紹了長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)和門控循環(huán)單元(GRU)這兩種流行的RNN變體的最小化版本——minLSTM和minGRU,這兩個(gè)模型在訓(xùn)練期間可以完全并行,并且使用的參數(shù)顯著減少,使它們成為Transformer的快速和有效的替代方案。

Transformer的局限性和RNN的復(fù)興

每當(dāng)Transformer模型接收的輸入序列長(zhǎng)度翻倍時(shí),就需要四倍的內(nèi)存和計(jì)算量。這種二次方計(jì)算復(fù)雜性使得Transformer在處理長(zhǎng)序列來(lái)說(shuō)成本高昂,在資源受限的環(huán)境中尤為棘手。

另一方面,RNN按順序處理輸入數(shù)據(jù),并且相對(duì)于序列長(zhǎng)度具有線性計(jì)算復(fù)雜度。它們?cè)谕评磉^(guò)程中還需要恒定的內(nèi)存,這使得它們適合于非常長(zhǎng)的序列。然而,傳統(tǒng)的RNN存在梯度消失和梯度爆炸的問題。當(dāng)用于更新神經(jīng)網(wǎng)絡(luò)權(quán)值的梯度過(guò)小或過(guò)大,阻礙有效學(xué)習(xí)時(shí),就會(huì)出現(xiàn)梯度消失和梯度爆炸。從而嚴(yán)重影響學(xué)習(xí)效果。這一局限性制約了RNN學(xué)習(xí)長(zhǎng)期依賴關(guān)系的能力。為了解決這一問題,LSTM和GRU引入了創(chuàng)新的門控機(jī)制,以精確調(diào)控信息在網(wǎng)絡(luò)中的傳遞。

盡管傳統(tǒng)的LSTM和GRU具有優(yōu)勢(shì),但它們有一個(gè)關(guān)鍵的限制:只能按順序計(jì)算。這意味著它們必須在訓(xùn)練期間使用時(shí)間反向傳播(BPTT),這是一個(gè)緩慢的過(guò)程,極大地限制了它們擴(kuò)展到長(zhǎng)場(chǎng)景的能力。

Transformer的局限性重新引起了人們對(duì)循環(huán)模型的興趣。在過(guò)去的一年,引入了新的循環(huán)架構(gòu),例如S4和Mamba,這些架構(gòu)有望在實(shí)現(xiàn)可比性能的同時(shí)解決Transformers的可擴(kuò)展性問題。這些模型使用“并行前綴掃描”等算法,通過(guò)并行化輸入序列上的計(jì)算來(lái)加快訓(xùn)練速度。

重新審視LSTM和GRU

受到最近提出的序列模型之間算法相似性的啟發(fā),研究人員重新審視了LSTM和GRU。他們發(fā)現(xiàn),通過(guò)從門控機(jī)制中消除對(duì)先前隱藏狀態(tài)的依賴,這些模型可以使用并行掃描算法進(jìn)行高效訓(xùn)練。

傳統(tǒng)的LSTM和GRU有多個(gè)門來(lái)控制網(wǎng)絡(luò)中的信息流。這些門依賴于之前的隱藏狀態(tài)來(lái)確定保留或丟棄多少當(dāng)前輸入和之前的內(nèi)存。這創(chuàng)建了一個(gè)順序依賴關(guān)系,要求模型一次處理一個(gè)令牌。

最小化的遞歸神經(jīng)網(wǎng)絡(luò)RNN為Transformer提供了快速高效的替代方案-AI.x社區(qū)

圖1 minGRU通過(guò)刪除組件和計(jì)算簡(jiǎn)化了GRU

研究人員發(fā)現(xiàn),他們可以消除對(duì)先前隱藏狀態(tài)的依賴,同時(shí)保持計(jì)算中的時(shí)間一致性。這使得能夠通過(guò)并行掃描算法訓(xùn)練模型。他們通過(guò)刪除一些不必要的計(jì)算進(jìn)一步簡(jiǎn)化了架構(gòu),生成了最小化的LSTM(minLSTM)和最小化的GRU(minGRU),這兩種模型不僅使用的參數(shù)大幅減少,而且訓(xùn)練速度也得到了顯著提升。

minGRU和minLSTM通過(guò)實(shí)現(xiàn)并行計(jì)算解決了傳統(tǒng)RNN的訓(xùn)練瓶頸。在T4 GPU上,與傳統(tǒng)的序列長(zhǎng)度為512個(gè)令牌相比,這一變化使得minGRU的速度提高了175倍,minLSTM的速度提高了235倍。隨著序列的延長(zhǎng),這種改善變得更加顯著。對(duì)于長(zhǎng)度為4096的序列,minGRU和minLSTM的速度比傳統(tǒng)版本快1300倍以上。

最小化的遞歸神經(jīng)網(wǎng)絡(luò)RNN為Transformer提供了快速高效的替代方案-AI.x社區(qū)

圖2 minLSTM通過(guò)刪除不必要的組件和計(jì)算來(lái)簡(jiǎn)化LSTM

研究人員寫道:“因此,在minGRU需要一天的時(shí)間來(lái)完成固定次數(shù)的訓(xùn)練的情況下,傳統(tǒng)的GRU可能需要3年以上的時(shí)間。”

與傳統(tǒng)GRU相比,minGRU將所需參數(shù)的數(shù)量減少了87%,與傳統(tǒng)LSTM相比,minLSTM將所需參數(shù)的數(shù)量減少了85%。

最小化RNN與SOTA循環(huán)模型

研究人員將minLSTM和minGRU的性能與最先進(jìn)的循環(huán)序列模型Mamba進(jìn)行了比較。他們測(cè)量了訓(xùn)練時(shí)間、內(nèi)存使用情況和多項(xiàng)任務(wù)的表現(xiàn),包括選擇性復(fù)制、強(qiáng)化學(xué)習(xí)(RL)和語(yǔ)言建模。

在運(yùn)行時(shí)間方面,minLSTM和minGRU取得了與Mamba相似的結(jié)果。雖然它們比傳統(tǒng)的RNN使用更多的內(nèi)存,但它們的內(nèi)存效率仍然比Mamba高。

最小化的遞歸神經(jīng)網(wǎng)絡(luò)RNN為Transformer提供了快速高效的替代方案-AI.x社區(qū)

圖3 訓(xùn)練最小化 RNN 模型(橙色和藍(lán)色實(shí)線)比傳統(tǒng) RNN(虛線)更快,并且比 Mamba使用更少的內(nèi)存

在選擇性復(fù)制(需要內(nèi)容感知推理和記憶的任務(wù))方面,minLSTM和minGRU的表現(xiàn)與Mamba相當(dāng)。

在D4RL基準(zhǔn)的RL實(shí)驗(yàn)中,minLSTM和minGRU的性能優(yōu)于除Decision Mamba之外的所有基線,其中差異很小。

在語(yǔ)言建模任務(wù)中,minLSTM和minGRU在訓(xùn)練過(guò)程中達(dá)到峰值性能的速度略慢于Mamba,但最終收斂的損失更低。值得注意的是,它們比Transformer的效率高得多,Transformer需要2.5倍的時(shí)間才能達(dá)到最佳性能。

最小化的遞歸神經(jīng)網(wǎng)絡(luò)RNN為Transformer提供了快速高效的替代方案-AI.x社區(qū)

圖4 在語(yǔ)言建模任務(wù)中,最小化的RNN(橙色和藍(lán)色實(shí)線)的損失低于Mamba,收斂速度至少是Transformers的2.5倍

與其他研究Transformer替代方案的類似工作一樣,最小化RNN研究的局限性之一是實(shí)驗(yàn)的規(guī)模。這些架構(gòu)是否能夠在非常大的模型和場(chǎng)景窗口下提供類似的結(jié)果還有待觀察。

盡管如此,這項(xiàng)研究的結(jié)果意義重大,因?yàn)檠芯勘砻鳎S著新信息的出現(xiàn),重新審視原有的想法是值得的。

研究人員在文章中寫道:“鑒于這些簡(jiǎn)化的RNN在實(shí)際應(yīng)用中所展現(xiàn)出的卓越性能,并且它們與眾多最新提出的循環(huán)序列方法存在著本質(zhì)上的相似之處,我們不禁反思并提出疑問,‘我們是否僅僅依靠RNN就足以滿足需求?’。”

原文標(biāo)題:??Minimized RNNs offer a fast and efficient alternative to Transformers??,作者:Ben Dickson

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
欧美深夜福利视频| 痴汉一区二区三区| 乱h高h女3p含苞待放| 9国产精品午夜| 色天使色偷偷av一区二区| 亚洲欧美电影在线观看| xxxx国产精品| 日韩中文字幕不卡| 欧美裸体男粗大视频在线观看| 日韩黄色片在线| 视频一区二区三区在线看免费看| 五月激情久久久| 亚洲成人免费网站| 爆乳熟妇一区二区三区霸乳| bestiality新另类大全| 93久久精品日日躁夜夜躁欧美| 欧美肥婆姓交大片| 国产免费无遮挡吸奶头视频| 精品国产亚洲一区二区三区| 色综合久久综合网97色综合| 麻豆传媒网站在线观看| 日韩a级作爱片一二三区免费观看| 国色天香一区二区| 中文日韩电影网站| 亚洲啪av永久无码精品放毛片 | 不卡一区在线观看| 国产精品久久久亚洲| 欧美成人片在线观看| 日本久久黄色| 亚洲欧美另类国产| 这里只有精品在线观看视频| 久久久国产精品入口麻豆| 91传媒视频在线播放| 欧美美女黄色网| 日本不卡视频| 国产精品婷婷午夜在线观看| 久久久久久久久一区二区| 性欧美18一19性猛交| 精品一区二区影视| 国产精品亚洲精品| 日韩av免费播放| 久久久蜜桃一区二区人| 97视频免费看| 日韩 国产 在线| 亚洲国产日韩在线| 欧美激情欧美激情| 久久精品视频8| 亚洲一本视频| 欧美激情在线狂野欧美精品| 免费又黄又爽又色的视频| 天天影视综合| 久久成人国产精品| 91视频免费在线看| 午夜欧美视频| 欧美高清在线视频观看不卡| 欧美成人免费观看视频| 欧美午夜电影在线观看 | 欧美午夜精品一区| 999精品网站| 777午夜精品电影免费看| 一本色道久久加勒比精品| 国产免费黄视频| 亚洲午夜天堂| 欧美在线视频你懂得| 五月婷婷之综合激情| 精品美女一区| 日韩欧美视频一区| 无码成人精品区在线观看| 久久精品亚洲成在人线av网址| 欧美午夜寂寞影院| 99视频在线视频| 欧美成人毛片| 日韩精品一区二区三区四区| 欧美xxxxx少妇| 日韩欧美国产大片| 中文字幕在线精品| 久草视频免费在线播放| 亚洲一级在线| 国产精品爽爽爽| 国产丝袜视频在线观看 | 国产不卡的av| www.爱久久| 亚洲欧美自拍一区| 极品色av影院| 伊人久久亚洲影院| 国产成人精品久久| 国产免费黄色网址| 91色婷婷久久久久合中文| 国产一区欧美一区| 国产成人精品午夜| 99草在线视频| 久久综合五月天婷婷伊人| 日本在线视频不卡| 日本动漫同人动漫在线观看| 欧美日韩一区二区免费视频| 亚欧在线免费观看| 伊色综合久久之综合久久| 亚洲欧美日韩一区二区在线| 亚洲综合视频网站| 美女久久网站| 亚洲最大成人网色| 国产精品久久一区二区三区不卡| 99精品视频在线观看| 日韩欧美一区二区三区四区五区| 手机av免费在线观看| 中文无字幕一区二区三区| 久久天天东北熟女毛茸茸| 亚洲欧洲高清| 精品日韩一区二区| 日韩精品久久久久久久的张开腿让 | 88国产精品视频一区二区三区| 亚洲欧洲偷拍精品| 国产性猛交普通话对白| 日本在线不卡视频一二三区| 国产精品日韩一区二区| 一区二区三区视频网站| 黑人狂躁日本妞一区二区三区| 欧美激情 国产精品| 成人网av.com/| 尤物yw午夜国产精品视频明星| 欧美xxxx精品| 久久福利一区| 国产在线精品一区二区三区》| 午夜在线视频免费| 一区二区三区在线视频观看58 | 免费看91的网站| 国产精品videossex久久发布| 久久露脸国产精品| 国产又大又黑又粗| 国产精品久久久久久久久快鸭 | 精品久久久久一区| 国产日韩精品中文字无码| 久久久蜜桃一区二区人| 久久久久一区二区| 高清视频在线观看三级| 欧美一区二区在线视频| 久久久久久久麻豆| 久久精品99国产精品| 中文字幕欧美区| 亚洲人体一区| 91p九色成人| 国产一区二区三区在线看| 青青国产在线观看| 99久久精品免费精品国产| 日韩在线观看a| 超碰97久久| 久久久视频精品| 秋霞网一区二区| 亚洲mv在线观看| 五月天激情小说| 一区二区三区国产在线| 久久艹中文字幕| 蜜桃视频在线观看免费视频| 日韩成人高清在线| 一级片中文字幕| 久久久久九九视频| 人人爽人人av| 希岛爱理一区二区三区| 91免费视频网站| 在线āv视频| 亚洲成成品网站| 精品91久久久| 国产日韩欧美精品电影三级在线| 男插女免费视频| 精品一区二区三区免费看| 精品中文字幕在线观看| 色香蕉在线视频| 色综合久久88色综合天天 | 欧美一区二区在线| 345成人影院| 亚洲一二在线观看| 亚洲一区二区天堂| 亚洲欧美偷拍三级| 催眠调教后宫乱淫校园| 99精品福利视频| 日韩精品欧美一区二区三区| 日韩城人网站| 性欧美办公室18xxxxhd| 国产一级片在线| 欧美区视频在线观看| 免费在线黄色片| 久久久久亚洲蜜桃| 欧美成人乱码一二三四区免费| 午夜精品福利影院| 国产欧美亚洲视频| 欧美卡一卡二| 亚洲一区二区久久久| 国产精品伦理一区| 欧美日韩国产麻豆| 一级黄色片日本| 91首页免费视频| 亚洲国产综合av| 中日韩视频在线观看| 亚洲精品中文字幕乱码三区不卡| 日韩电影免费观| 美乳少妇欧美精品| 精品三级久久久久久久电影聊斋| 性做久久久久久久久| 亚洲精品国产精品国自| 成人深夜福利app| 色噜噜狠狠一区二区| 欧美天天视频| 在线国产精品网| 制服丝袜日韩| 国产美女99p| 亚洲精品无播放器在线播放| 97视频免费看| 欧美xxxx视频| 色视频www在线播放国产成人| 中文字幕在线一| 性欧美疯狂xxxxbbbb| 中文字幕电影av| 国产亚洲美州欧州综合国| 国产一线在线观看| 国产精品综合二区| 在线观看av网页| 久久久久国产一区二区| 日韩中文字幕在线免费| 欧美精品黄色| 日韩video| 999久久久91| 视频一区二区三区在线观看| 偷拍一区二区| 国产一区视频观看| 大奶在线精品| 超碰97在线资源| 精品三级国产| 91精品视频播放| 亚洲午夜剧场| 国产欧美中文字幕| 日韩电影大全网站| 欧洲精品久久久| 国产高清不卡| 国产91精品青草社区| ririsao久久精品一区| 色综合五月天导航| 性xxxfreexxxx性欧美| 久久精品视频导航| 91在线直播| 日韩资源在线观看| 欧美jizzhd69巨大| 社区色欧美激情 | 日本不卡不卡| 欧美成人激情视频| 怡红院av在线| 久久久最新网址| 91豆花视频在线播放| 91国内产香蕉| 手机在线理论片| 欧美最猛黑人xxxx黑人猛叫黄| 97视频精彩视频在线观看| 中文字幕av一区二区| a√资源在线| 久久综合伊人77777蜜臀| 先锋成人av| 欧美激情亚洲视频| 91美女精品| 欧美制服第一页| 亚洲成人va| 成人国内精品久久久久一区| 二区三区精品| 国产精品日韩二区| 欧美男男gaytwinkfreevideos| 91麻豆国产语对白在线观看| 疯狂欧洲av久久成人av电影| 91欧美激情另类亚洲| 成人在线tv视频| 欧洲亚洲一区二区三区四区五区| 91成人在线精品视频| 精品久久精品久久| 国产精品日韩精品中文字幕| 一区精品视频| 国产精品xvideos88| av动漫在线观看| 美女一区二区视频| 亚洲欧美激情一区二区三区| 99精品一区二区三区| 九一在线免费观看| 一区二区三区国产| 久久草视频在线| 色狠狠一区二区| av官网在线观看| 亚洲色图第一页| 麻豆tv入口在线看| 97国产在线视频| 成人欧美大片| 91日本在线观看| 一本色道久久综合亚洲精品酒店| 国外成人在线视频网站| 精品国产成人| 欧美黑人在线观看| 久久看片网站| 丰满少妇一区二区三区专区 | 91精品国产高清91久久久久久| 蜜桃av噜噜一区| 免费不卡的av| 欧美激情中文字幕| 日韩熟女精品一区二区三区| 欧美日韩精品免费| 十九岁完整版在线观看好看云免费| 亚洲高清久久久久久| 91社区在线观看播放| 久久久日本电影| 精品国模一区二区三区欧美| 欧美三级网色| 黄色亚洲精品| 亚洲理论中文字幕| 久久一区二区三区国产精品| 免费在线观看黄视频| 欧美性xxxxxxxx| 日韩欧美电影在线观看| 欧美高清自拍一区| 99久久久成人国产精品| 欧美系列一区| 一区二区三区四区五区在线| 国产在线视频三区| 日韩一区欧美小说| 国产亚洲欧美日韩高清| 日韩av网址在线观看| 91小视频xxxx网站在线| 国产日韩欧美在线播放| 伊人春色精品| 能在线观看的av| www.性欧美| 久久精品免费在线| 精品少妇一区二区三区| av毛片在线| 成人欧美一区二区三区黑人| 大色综合视频网站在线播放| 国产欧美高清在线| 久久婷婷国产综合精品青草| 国产午夜福利精品| 欧美成人艳星乳罩| 性欧美ⅴideo另类hd| 91精品久久久久久蜜桃| 亚洲电影在线一区二区三区| 伊人网在线综合| 最新日韩av在线| 国产精品久久久久久免费| 日日狠狠久久偷偷四色综合免费 | 亚洲va欧美va天堂v国产综合| 久久国产视频精品| 日韩av在线播放资源| av漫画网站在线观看| 国产精品一区在线观看| 亚洲经典在线| 亚洲av成人片色在线观看高潮 | 中文字幕亚洲欧美日韩| 欧美日韩久久一区| 亚洲1卡2卡3卡4卡乱码精品| 91精品久久久久久久久久久| 日产精品一区二区| 九九热免费在线观看| 亚洲品质自拍视频网站| www.国产欧美| 97在线视频免费播放| 神马午夜久久| 999精品网站| 国产精品国产自产拍高清av王其| 日本学生初尝黑人巨免费视频| 欧美主播一区二区三区| 精品亚洲综合| 91精品视频免费| 亚洲小说欧美另类社区| 三级黄色片网站| 欧美性猛片aaaaaaa做受| 日本免费在线视频| 国产98在线|日韩| 国产精品日本| 国产一区二区三区视频播放| 日韩一级黄色大片| yellow字幕网在线| 久久riav二区三区| 蜜臀精品一区二区三区在线观看| 色呦呦一区二区| 欧美在线三级电影| dy888亚洲精品一区二区三区| 国产精品久久久久久久天堂| 日韩精品午夜| 午夜剧场免费看| 精品视频一区三区九区| 色www永久免费视频首页在线| 亚洲资源在线看| 亚洲一区成人| 国产成人自拍网站| 日韩精品中文字幕在线| 色婷婷成人网| 久草视频国产在线| 国产精品私房写真福利视频| 丰满少妇高潮在线观看| 国产精品爱久久久久久久| 欧美三级小说| 亚洲а∨天堂久久精品2021| 欧美mv日韩mv国产| 日韩电影精品| 成人在线观看黄| 亚洲国产wwwccc36天堂| 日韩精品毛片| 美国av一区二区三区| 国产成人在线视频免费播放|