精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LSTM之父重提30年前的「快速權(quán)重存儲(chǔ)系統(tǒng)」:線性Transformer只是它的一種變體

新聞
來(lái)自瑞士人工智能實(shí)驗(yàn)室、亞琛工業(yè)大學(xué)的研究者建立了線性(核)注意力與快速權(quán)重存儲(chǔ)系統(tǒng)之間的內(nèi)在聯(lián)系,并提出更新規(guī)則,在合成檢索問(wèn)題、機(jī)器翻譯、語(yǔ)言模型等實(shí)驗(yàn)上性能優(yōu)越。

[[388901]]

 Transformer 在深度學(xué)習(xí)中占據(jù)主導(dǎo)地位,但二次存儲(chǔ)和計(jì)算需求使得 Transformer 的訓(xùn)練成本很高,而且很難使用。許多研究都嘗試線性化核心模塊:以 Performer 為例,使用帶核的注意力機(jī)制。然而,這種方法還存在很多缺點(diǎn),例如它們依賴(lài)于隨機(jī)特征。

本文中,來(lái)自瑞士人工智能實(shí)驗(yàn)室(IDSIA)、亞琛工業(yè)大學(xué)的研究者建立起了線性(核)注意力與 90 年代深度學(xué)習(xí)之父 Jürgen Schmidhuber 推廣的更古老的快速權(quán)重存儲(chǔ)系統(tǒng)之間的內(nèi)在聯(lián)系,不僅指出了這些算法的基本局限性,還提出了新的更新規(guī)則和新的核來(lái)解決這些問(wèn)題。在關(guān)鍵的綜合實(shí)驗(yàn)和實(shí)際任務(wù)中,所得到的模型優(yōu)于 Performers。

  • 論文鏈接:https://arxiv.org/abs/2102.11174
  • 代碼地址:https://github.com/ischlag/fast-weight-transformers

具體而言,該研究推測(cè)線性化的 softmax 注意力變量存在存儲(chǔ)容量限制。在有限存儲(chǔ)的情況下,快速權(quán)重存儲(chǔ)模型的一個(gè)理想行為是操縱存儲(chǔ)的內(nèi)容并與之動(dòng)態(tài)交互。

受過(guò)去對(duì)快速權(quán)重研究的啟發(fā),研究者建議用產(chǎn)生這種行為的替代規(guī)則替換更新規(guī)則。此外,該研究還提出了一個(gè)新的核函數(shù)來(lái)線性化注意力,平衡簡(jiǎn)單性和有效性。他們進(jìn)行了大量的實(shí)驗(yàn),實(shí)驗(yàn)內(nèi)容包括合成檢索問(wèn)題、標(biāo)準(zhǔn)機(jī)器翻譯以及語(yǔ)言建模。實(shí)驗(yàn)結(jié)果證明了該研究方法的益處。

將線性 Transformer 作為快速權(quán)重系統(tǒng)進(jìn)行分析和改進(jìn)

將線性 Transformer 變量視為快速權(quán)重系統(tǒng),研究者給出了兩個(gè)見(jiàn)解:作為關(guān)聯(lián)存儲(chǔ)容量的限制;無(wú)法編輯以前存儲(chǔ)的關(guān)聯(lián)內(nèi)容。

容量限制

不斷地將新的關(guān)聯(lián)添加到有限大小的存儲(chǔ)中,如下公式 17 所示,這樣不可避免地會(huì)達(dá)到極限。在線性注意力中,信息存儲(chǔ)在矩陣中,并使用矩陣乘法進(jìn)行檢索(如下公式 19)。因此,為了防止關(guān)聯(lián)在檢索時(shí)相互干擾,各個(gè)鍵(keys)需要正交。否則,點(diǎn)積將處理多個(gè)鍵并返回值的線性組合。對(duì)于嵌入在 d_dot 空間中的鍵,則不能有多余 d_dot 正交向量。

也就是說(shuō),存儲(chǔ)多個(gè) d_dot 關(guān)聯(lián)將導(dǎo)致檢索誤差。在線性 Transformer 中,當(dāng)序列長(zhǎng)度大于 d_dot 時(shí),模型可能處于這樣一種容量過(guò)剩狀態(tài)。

改進(jìn)與更新

受快速權(quán)重存儲(chǔ)研究(Schlag 等人,2021 年)的啟發(fā),研究者提出了以下存儲(chǔ)更新規(guī)則。

給定新的輸入鍵 - 值對(duì) (k^ (i) , v ^(i) ),模型首先訪問(wèn)存儲(chǔ)的當(dāng)前狀態(tài) W^(i−1),并檢索當(dāng)前與鍵 k^(i) 配對(duì)的值圖片。然后,該模型存儲(chǔ)檢索值圖片和輸入 v^(i) 的凸組合圖片,使用插值權(quán)重 0≤β^(i)≤1 的輸入 v ^(i) 也由該模型生成。因此,該模型按順序?qū)⑤斎胄蛄袌D片轉(zhuǎn)化為輸出序列圖片,如下所示:

歸一化:在以上等式中,檢索的值沒(méi)有應(yīng)用歸一化。通過(guò)推導(dǎo)可以得到一個(gè)簡(jiǎn)單的歸一化,即通過(guò)引入累加器(accumulator):

將公式 20、25 分別替換為:

然而,這種方法也有缺陷。首先,公式 26 中正值的累積總是隨著步數(shù)的增加而增加,并且可能導(dǎo)致不穩(wěn)定;其次,特別是對(duì)于該研究提出的更新規(guī)則,這種歸一化不足以平衡公式 23 中寫(xiě)入和刪除運(yùn)算之間的權(quán)重(參見(jiàn)附錄 A.2 中的推導(dǎo))。

在這里,研究者提出了一種基于簡(jiǎn)單歸一化的更好方法,將有效值和查詢(xún)向量φ(k^(i))、φ(q^(i)) 除以其分量之和。例如,對(duì)于查詢(xún):

線性注意力函數(shù)

Katharopoulos 線性注意力

Katharopoulos 等人提出使用簡(jiǎn)單的逐元素 ELU + 1 函數(shù)(Clevert 等人, 2016):

選擇 ELU 而不是 ReLU 的動(dòng)機(jī)是因?yàn)樨?fù)數(shù)部分的非零梯度。重要的是,作為一個(gè)簡(jiǎn)單的函數(shù),這個(gè)Φ函數(shù)保留了輸入鍵向量(d_key=d_dot)的維數(shù),而不需要修改第 4.1 節(jié)中討論的存儲(chǔ)容量。

DPFP

前面兩小節(jié)強(qiáng)調(diào)了現(xiàn)有Φ函數(shù)的次優(yōu)性。采樣會(huì)給 FAVOR + 增加額外的復(fù)雜度,而線性 Transformer 缺乏投影點(diǎn)積維數(shù)的能力。因此,研究者提出了一種稱(chēng)為確定性無(wú)參數(shù)投影(deterministic parameter-free projection, DPFP) 的替代方法。它是確定性的,并像線性 Transformer 一樣易于計(jì)算,同時(shí)增加點(diǎn)積維數(shù),而不需要 FAVOR + 的隨機(jī)特性。

下圖中四維空間的元素被顯示為四個(gè)彩色表面的 z 分量,以及 2d 平面中的每個(gè)向量如何在 4d 空間中具有單個(gè)非零分量,并將輸入空間平均分割為在投影空間中正交的四個(gè)區(qū)域。

實(shí)驗(yàn)

該研究從三個(gè)方面進(jìn)行了實(shí)驗(yàn):合成檢索問(wèn)題、機(jī)器翻譯和語(yǔ)言模型。

合成檢索問(wèn)題

所有模型都以最小批次 32 進(jìn)行訓(xùn)練,直到評(píng)估損失降到 0.001 以下,或者進(jìn)行了 1000 訓(xùn)練步。下圖 2 展示了模型的最佳驗(yàn)證集性能以及對(duì)不同 S 的顯示。唯一鍵的數(shù)量初始值 S=20,然后每次遞增 20,直到 S=600 為止。實(shí)驗(yàn)對(duì)以下模型進(jìn)行對(duì)比:Softmax、線性注意力、具有 64、128 和 512 個(gè)隨機(jī)特征的 FAVOR + 以及ν∈{1、2、3} 的 DPFP-ν。

下圖 3 展示了學(xué)習(xí)曲線。實(shí)驗(yàn)結(jié)果表明,該研究提出的更新規(guī)則優(yōu)于其他變體。正如預(yù)期的那樣,基線總和更新規(guī)則失敗。

機(jī)器翻譯

下表 1 顯示了 BLEU 得分結(jié)果。當(dāng)樣本數(shù) m 足夠大時(shí)(當(dāng) d_dot=512,m=256),Performer 與基礎(chǔ) Transformer 性能相當(dāng)。實(shí)際上,當(dāng) d_key=64 時(shí),m 的推薦值是 d_dot log(d_dot)=266。當(dāng) d_dot 相對(duì)較小時(shí),該研究的 DPFP 模型優(yōu)于線性 Transformer 和 Performer;在簡(jiǎn)單性和性能之間提供了一個(gè)很好的折衷。

語(yǔ)言模型

該研究使用標(biāo)準(zhǔn) WikiText-103(Merity 等,2017)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。WikiText-103 數(shù)據(jù)集由維基百科的長(zhǎng)文組成;訓(xùn)練集包含大約 28K 篇文章、總共 103M 個(gè)單詞。這將產(chǎn)生約 3600 個(gè)單詞的上下文文本塊。驗(yàn)證集和測(cè)試集也包含類(lèi)似的長(zhǎng)依賴(lài)關(guān)系,分別有 218K 和 246K 個(gè)運(yùn)行單詞,對(duì)應(yīng) 60 篇文章,詞匯量約為 268K 個(gè)單詞。下表 2 展示了在該研究更新規(guī)則下,WikiText-103 語(yǔ)言模型的困惑度結(jié)果。

 

在下表 3 中,使用該研究更新規(guī)則下的 Transformer(medium 配置),在 WikiText-103 語(yǔ)言模型的困惑度結(jié)果。

在下表 4 中,WikiText-103 語(yǔ)言模型在沒(méi)有截?cái)嗌舷挛牡那闆r下訓(xùn)練和評(píng)估模型的困惑度,這與上表 2 中上下文窗口受到限制的情況相反。medium 配置既不用于位置編碼,也不用于注意力標(biāo)準(zhǔn)化。

 

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2017-10-25 08:44:03

NVMe SSD數(shù)據(jù)存儲(chǔ)

2022-09-26 08:00:00

存儲(chǔ)Apache Pul數(shù)據(jù)

2015-04-17 10:21:37

云存儲(chǔ)附加存儲(chǔ)

2017-02-20 07:57:42

Kudu快速分析Hadoop

2023-07-26 13:22:54

模式LSTMLlama 2

2015-07-29 13:59:02

2016-08-02 13:47:01

蘋(píng)果IOS操作系統(tǒng)iPhone

2020-07-31 16:54:52

戴爾

2023-05-11 07:30:10

KV存儲(chǔ)GC優(yōu)化

2011-06-21 09:22:39

網(wǎng)站

2024-07-05 11:05:47

2023-09-12 14:46:24

人工智能自然語(yǔ)言

2011-07-04 17:53:48

快速測(cè)試

2021-03-24 15:17:13

編程語(yǔ)言C語(yǔ)言OS

2011-07-21 14:17:15

Ceylon

2024-07-29 07:30:00

計(jì)算機(jī)機(jī)器

2020-03-04 17:37:09

存儲(chǔ)系統(tǒng)硬件層

2025-06-03 09:14:00

2018-09-29 14:08:04

存儲(chǔ)系統(tǒng)分布式

2018-12-03 09:03:18

SANNAS存儲(chǔ)系統(tǒng)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

99久久99久久| 久久影院资源网| 日韩av片网站| 国产三区视频在线观看| 国产成人亚洲综合a∨婷婷图片| 美女扒开尿口让男人操亚洲视频网站 | 番号在线播放| 国产高清视频一区| 日韩免费在线视频| 青青草原在线免费观看| 牛牛影视一区二区三区免费看| 色综合视频在线观看| 亚洲国产精品久久久久婷婷老年| 国产av无码专区亚洲a∨毛片| 中文精品在线| 精品国偷自产在线视频99| 国产51自产区| 欧美网站免费| 午夜激情久久久| 亚洲欧美日韩精品综合在线观看| 亚洲黄色一级大片| 日本不卡的三区四区五区| 欧美男插女视频| a毛片毛片av永久免费| 精品国产一区二区三区性色av | 国产欧美1区2区3区| 都市激情久久久久久久久久久| 欧美一区二区三区久久久| 午夜日本精品| 在线观看91久久久久久| 人体私拍套图hdxxxx| 国产精品亚洲一区二区在线观看| 色哟哟亚洲精品| 国产免费一区二区视频| 国内精品不卡| 中文字幕欧美三区| 久久久久久久免费| 天堂在线视频免费| 国产成人免费在线视频| 成人精品久久av网站| 波多野结衣在线电影| 免费日韩av片| 17婷婷久久www| 国产一级在线播放| 欧美88av| 欧美日本高清视频| www.超碰在线观看| 日韩精品免费一区二区三区| 亚洲免费伊人电影在线观看av| 深夜视频在线观看| 99精品美女视频在线观看热舞| 欧美中文字幕一区二区三区亚洲| 97av视频在线观看| 国产高清不卡| 精品久久久久久国产91| www.99热这里只有精品| 69av成人| 福利二区91精品bt7086| 日本精品久久久久久久久久| 羞羞的网站在线观看| 悠悠色在线精品| 男人天堂新网址| 免费影视亚洲| 亚洲国产欧美日韩另类综合| 波多野结衣av一区二区全免费观看| 黄色的网站在线观看| 亚洲少妇中出一区| 91视频成人免费| 好吊日av在线| 欧美日韩加勒比精品一区| 免费无码毛片一区二三区| heyzo在线| 一本大道久久a久久精品综合| av之家在线观看| 免费亚洲电影| 欧美日韩中文精品| 四川一级毛毛片| 久久动漫网址| 亚洲无亚洲人成网站77777| 中文字幕成人动漫| 婷婷综合视频| 欧美精品videos性欧美| 日本中文字幕第一页| 视频精品一区二区| 91香蕉亚洲精品| 天堂av手机版| 国产精品久久久久久一区二区三区 | www.99r| 中文字幕日韩高清在线| 日韩精品丝袜在线| 青青青视频在线免费观看| 欧美一区二区三区久久精品茉莉花| 久久久久久国产精品久久| av一级在线观看| 国产美女视频一区| 欧美一区2区三区4区公司二百| 色网站在线看| 大荫蒂欧美视频另类xxxx| 一个色综合久久| 国产精品美女在线观看直播| 日韩久久免费电影| 黑鬼狂亚洲人videos| 欧美精品xxxxx| 日韩黄色三级| 亚洲精品久久7777777| 快灬快灬一下爽蜜桃在线观看| 欧美激情91| 国产精品视频一区二区高潮| 日本韩国在线观看| 日韩理论片网站| 久久久久久久久久久久久国产精品 | 亚洲日本黄色片| 亚洲黄页网站| 欧美黄色成人网| 中文字幕 亚洲视频| 国产不卡一区视频| 欧美久久综合性欧美| 超碰在线网址| 欧美艳星brazzers| 亚洲一区二区三区四区av| 欧美日中文字幕| 欧美激情视频一区| 中文字幕一二三四| 国产宾馆实践打屁股91| 日韩欧美99| 嗯啊主人调教在线播放视频| 欧美日韩激情一区二区三区| 黄色av网址在线观看| 91精品国产成人观看| 欧美交受高潮1| 国产农村妇女毛片精品久久| 久久奇米777| 成人国产在线看| 欧美综合影院| 伊人成人开心激情综合网| 日本三级视频在线| 另类综合日韩欧美亚洲| 日韩精品欧美专区| 激情国产在线| 日韩一区二区三区视频| 中文字幕免费在线看线人动作大片| 亚洲午夜久久久久久尤物| 国产剧情久久久久久| 你懂的好爽在线观看| 欧美日在线观看| www国产视频| 欧美日韩精品| 91福利入口| 免费在线观看av网站| 欧美性淫爽ww久久久久无| 亚洲国产日韩一区无码精品久久久| 亚洲精品影院在线观看| 成人xxxxx色| 午夜dj在线观看高清视频完整版| 在线成人av网站| 精品亚洲乱码一区二区| 日本中文字幕一区| 日本一区视频在线| 欧美片第一页| 国产午夜精品全部视频播放| 亚洲va在线观看| 国产亚洲欧洲997久久综合 | 国产写真视频在线观看| 在线91免费看| 成年人午夜剧场| 国产美女视频一区| 狠狠干视频网站| 51社区在线成人免费视频| 欧美日本高清一区| 欧洲一级在线观看| 亚洲va国产天堂va久久en| youjizz.com国产| 国产精品久久久久久模特 | 精品国产乱码| 国产日韩视频在线观看| 老司机99精品99| 日韩一区二区免费高清| 久久成人在线观看| 99久久免费精品| 日韩精品无码一区二区三区免费| 日韩av有码| 亚洲永久在线观看| brazzers在线观看| 亚洲女人天堂网| 在线免费一级片| 一区二区三区精品视频在线| 黄色片视频免费观看| 久久久久看片| 尤物一区二区三区| 精品成人自拍视频| 日韩美女视频免费看| 亚乱亚乱亚洲乱妇| 日韩女优av电影| 黄色片视频网站| 日本一区二区三区国色天香| 亚洲综合伊人久久| 一本久道久久综合婷婷鲸鱼| 日本不卡一区| 日韩三级精品| 奇米四色中文综合久久| 一级日本在线| 亚洲国产天堂网精品网站| 中文字幕在线欧美| 亚洲欧美另类久久久精品2019| 一起草在线视频| 久久国产三级精品| 91九色丨porny丨国产jk| 欧美丝袜激情| 国产成人看片| 福利一区和二区| 国产91精品高潮白浆喷水| 1769在线观看| 亚洲精品成人久久久| 国产又黄又粗又猛又爽| 精品国产户外野外| 国产aaaaaaaaa| 久久综合久久综合久久综合| 中文字幕亚洲影院| 久久久久国内| 欧美又粗又长又爽做受| 久久国产成人精品| 天堂av一区二区| 乱亲女h秽乱长久久久| 成人动漫网站在线观看| 欧美黑人巨大xxxxx| 午夜精品久久久久久久久久久久久| 蜜芽在线免费观看| 亚洲深夜福利在线| 亚洲精品国产精| 在线播放/欧美激情| 91麻豆精品在线| 欧美日韩亚洲一区二区三区| 国语对白一区二区| **性色生活片久久毛片| 在线免费观看麻豆| 成人免费看的视频| 丰满少妇中文字幕| 国产精品中文字幕一区二区三区| 青青青国产在线视频| 在线综合欧美| 国产一区二区三区小说| 综合激情在线| 亚洲精品一区二区毛豆| 郴州新闻综合频道在线直播| 鲁丝一区二区三区免费| 好吊妞视频这里有精品| 91在线观看网站| 狂野欧美xxxx韩国少妇| 成人久久18免费网站图片| 88xx成人永久免费观看| 国产成人高潮免费观看精品| 中文字幕成在线观看| 97超级碰碰碰| 麻豆视频在线看| 午夜精品免费视频| 青青青草视频在线| 欧美裸体xxxx极品少妇| 午夜dj在线观看高清视频完整版| 另类天堂视频在线观看| 精品国产白色丝袜高跟鞋| 久久久国产视频91| 国产日产一区二区| 久热国产精品视频| 成人国产免费电影| 欧美成人精品在线观看| 欧美色图天堂| 久久久亚洲欧洲日产国码aⅴ| 色老头在线观看| 久久久久久久999| a√中文在线观看| 国内精品国产三级国产在线专| 国内激情视频在线观看| 日本韩国欧美精品大片卡二| 日韩精品一区二区三区| 国产精品黄页免费高清在线观看| 精品免费av在线| 91久久精品国产91久久性色tv| 亚洲高清999| 国产日本一区二区三区| 亚洲欧美日本伦理| 亚洲ai欧洲av| 一区二区中文字| 欧美日韩不卡在线视频| 国产欧美高清| 99sesese| 成人免费视频一区二区| 亚洲午夜久久久久久久久红桃| 国产日韩影视精品| 999精品久久久| 亚洲国产日韩a在线播放| 久久精品国产成人av| 在线亚洲高清视频| 国产99视频在线| 亚洲午夜女主播在线直播| 搞黄网站在线观看| 欧美激情国产精品| 粉嫩一区二区三区| 亚洲自拍偷拍福利| 亚洲人成伊人成综合图片| 亚洲精品一品区二品区三品区| 黑丝一区二区| 欧美成人黄色网址| 成人午夜视频网站| 久久国产柳州莫菁门| 亚洲日本电影在线| 国产精品100| 欧美一区二视频| 日韩美女一级视频| 中文字幕日韩免费视频| 日本黄色免费在线| 成人久久久久爱| 自拍欧美一区| 成人在线免费观看视频网站| 日韩av午夜在线观看| 91传媒理伦片在线观看| 中文字幕高清不卡| 日韩黄色精品视频| 欧美喷潮久久久xxxxx| 色呦呦免费观看| 久久精品99久久久香蕉| 在线亚洲人成| 亚洲va欧美va国产综合久久| 欧洲杯足球赛直播| 免费无码毛片一区二三区| 精品在线播放午夜| 国产中年熟女高潮大集合| 偷拍亚洲欧洲综合| a级片在线免费看| 在线观看久久久久久| а√天堂中文在线资源8| 99国产高清| 午夜精品毛片| 天天色综合天天色| 久久久久国产一区二区三区四区| 国产一二三四区| 9191久久久久久久久久久| 黄色片在线看| 欧美一区二三区| 成人另类视频| 成人在线国产视频| 国产精品一区二区久久精品爱涩 | 91精品国产99久久久久久| 动漫一区二区三区| 翔田千里亚洲一二三区| 日本欧美在线看| 亚洲日本精品视频| 欧美视频中文字幕在线| 少妇高潮久久久| 91精品国产91久久久久久吃药| 国产一区调教| 91午夜在线观看| 成人综合婷婷国产精品久久免费| 九九热视频精品| 日韩一区二区电影网| 免费黄色在线观看| 国产美女搞久久| 欧美精选视频在线观看| 久久婷五月综合| 亚洲天天做日日做天天谢日日欢| 亚洲视频在线观看免费视频| 色悠悠久久88| 成人影院网站ww555久久精品| 亚洲一区三区视频在线观看| 捆绑变态av一区二区三区| 亚洲视频重口味| 欧美一级一级性生活免费录像| 久草免费在线| 亚洲综合社区网| 国产精品成人av| www.久久com| 亚洲一区二区三区自拍| 农村少妇久久久久久久| 久久久免费av| 久久国产精品色av免费看| 欧美 日韩 国产一区| 国产精品欧美久久久久无广告| 国产成人精品无码高潮| 久久免费国产视频| 男男gay无套免费视频欧美 | 免费在线观看一区二区三区| 国产又粗又猛又爽又黄的视频小说 | 国产一区二区激情| 成人一区视频| mm131午夜| 成人国产精品免费观看| 免费的毛片视频| 中文字幕av一区二区| 亚洲91在线| 欧美日韩不卡在线视频| 久久久国产精品午夜一区ai换脸| 国产又黄又大又粗的视频| 久久久久久久久久久免费精品 | 久久久久综合| 国产麻豆视频在线观看| 亚洲国产日韩欧美在线动漫| 日韩av超清在线观看| 在线观看一区二区三区三州| 91在线一区二区三区| 一区二区三区在线免费观看视频| 欧美xxxx做受欧美.88|