精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

田淵棟新作:打開1層Transformer黑盒,注意力機制沒那么神秘

人工智能 新聞
最近田淵棟博士公布了團隊的最新研究成果,以數學嚴格方式,分析了1層Transformer(一個自注意力層加一個解碼器層)在下一個token預測任務上的SGD訓練動態。

Transformer架構已經橫掃了包括自然語言處理、計算機視覺、語音、多模態等多個領域,不過目前只是實驗效果非常驚艷,對Transformer工作原理的相關研究仍然十分有限。

其中最大謎團在于,Transformer為什么僅依靠一個「簡單的預測損失」就能從梯度訓練動態(gradient training dynamics)中涌現出高效的表征?

最近田淵棟博士公布了團隊的最新研究成果,以數學嚴格方式,分析了1層Transformer(一個自注意力層加一個解碼器層)在下一個token預測任務上的SGD訓練動態。

圖片

論文鏈接:https://arxiv.org/abs/2305.16380

這篇論文打開了自注意力層如何組合輸入token動態過程的黑盒子,并揭示了潛在的歸納偏見的性質。

具體來說,在沒有位置編碼、長輸入序列、以及解碼器層比自注意力層學習更快的假設下,研究人員證明了自注意力就是一個判別式掃描算法(discriminative scanning algorithm)

從均勻分布的注意力(uniform attention)開始,對于要預測的特定下一個token,模型逐漸關注不同的key token,而較少關注那些出現在多個next token窗口中的常見token

對于不同的token,模型會逐漸降低注意力權重,遵循訓練集中的key token和query token之間從低到高共現的順序。

有趣的是,這個過程不會導致贏家通吃,而是由兩層學習率控制的相變而減速,最后變成(幾乎)固定的token組合,在合成和真實世界的數據上也驗證了這種動態。

田淵棟博士是Meta人工智能研究院研究員、研究經理,圍棋AI項目負責人,其研究方向為深度增強學習及其在游戲中的應用,以及深度學習模型的理論分析。先后于2005年及2008年獲得上海交通大學本碩學位,2013年獲得美國卡耐基梅隆大學機器人研究所博士學位。

曾獲得2013年國際計算機視覺大會(ICCV)馬爾獎提名(Marr Prize Honorable Mentions),ICML2021杰出論文榮譽提名獎。

曾在博士畢業后發布《博士五年總結》系列,從研究方向選擇、閱讀積累、時間管理、工作態度、收入和可持續的職業發展等方面對博士生涯總結心得和體會。

揭秘1層Transformer

基于Transformer架構的預訓練模型通常只包括非常簡單的監督任務,比如預測下一個單詞、填空等,但卻可以為下游任務提供非常豐富的表征,實在是令人費解。

之前的工作雖然已經證明了Transformer本質上就是一個通用近似器(universal approximator),但之前常用的機器學習模型,比如kNN、核SVM、多層感知機等其實也是通用近似器,這種理論無法解釋這兩類模型在性能上的巨大差距。

圖片

研究人員認為,了解Transformer的訓練動態(training dynamics)是很重要的,也就是說,在訓練過程中,可學習參數是如何隨時間變化的。

文章首先以嚴謹數學定義的方式,形式化描述了1層無位置編碼Transformer的SGD在下一個token預測(GPT系列模型常用的訓練范式)上的訓練動態。

1層的Transformer包含一個softmax自注意力層和預測下一個token的解碼器層。

圖片

在假設序列很長,而且解碼器的學習速度比自注意力層快的情況下,證明了訓練期間自注意力的動態行為:

1. 頻率偏差Frequency Bias

模型會逐漸關注那些與query token大量共現的key token,而對那些共現較少的token降低注意力。

2. 判別偏差Discrimitive Bias

模型更關注那些在下一個要預測的token中唯一出現的獨特token,而對那些在多個下一個token中出現的通用token失去興趣。

這兩個特性表明,自注意力隱式地運行著一種判別式掃描(discriminative scanning)的算法,并存在歸納偏差(inductive bias),即偏向于經常與query token共同出現的獨特的key token

此外,雖然自注意力層在訓練過程中趨向于變得更加稀疏,但正如頻率偏差所暗示的,模型因為訓練動態中的相變(phase transition),所以不會崩潰為獨熱(one hot)。

圖片

學習的最后階段并沒有收斂到任何梯度為零的鞍點,而是進入了一個注意力變化緩慢的區域(即隨時間變化的對數),并出現參數凍結和學會(learned)。

研究結果進一步表明,相變的開始是由學習率控制的:大的學習率會產生稀疏的注意力模式,而在固定的自注意力學習率下,大的解碼器學習率會導致更快的相變和密集的注意力模式。

研究人員將工作中發現的SGD動態命名為掃描(scan)和snap:

掃描階段:自注意力集中在key tokens上,即不同的、經常與下一個預測token同時出現的token;其他所有token的注意力都下降。

snap階段:注意力全中幾乎凍結,token組合固定。

圖片

這一現象在簡單的真實世界數據實驗中也得到驗證,使用SGD在WikiText上訓練的1層和3層Transformer的最低自注意力層進行觀察,可以發現即使在整個訓練過程中學習率保持不變,注意力也會在訓練過程中的某一時刻凍結,并變得稀疏。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-12-19 09:48:07

2024-02-26 00:20:00

AI模型

2024-10-31 10:00:39

注意力機制核心組件

2024-10-28 08:50:00

2025-10-08 10:19:29

2024-12-04 09:25:00

2018-08-26 22:25:36

自注意力機制神經網絡算法

2024-12-17 14:39:16

2023-11-24 12:36:00

模型訓練

2022-07-03 14:06:27

元宇宙交互技術AR

2025-02-17 09:30:00

AI訓練模型

2025-06-03 08:43:00

2024-09-19 10:07:41

2023-03-17 08:28:17

GPT-4AI

2024-03-08 12:35:41

模型數據

2024-12-12 09:00:00

2024-10-16 13:50:00

模型AI

2012-08-16 12:50:29

2023-07-25 13:57:28

模型AI

2025-10-23 08:25:08

點贊
收藏

51CTO技術棧公眾號

牛夜精品久久久久久久| 久久精品一区二区三区不卡免费视频| 天堂网avav| 9l视频自拍蝌蚪9l视频成人| 狠狠色狠色综合曰曰| 午夜欧美性电影| 亚洲av无码一区二区乱子伦| 欧美专区在线| 欧美xxxx做受欧美| 精品无人区无码乱码毛片国产| 激情视频亚洲| 在线观看中文字幕不卡| 成人污网站在线观看| 青青操视频在线| 国产一区二区导航在线播放| 欧洲永久精品大片ww免费漫画| 久草视频手机在线| 亚洲精品合集| 日韩精品一区二| 亚洲污视频在线观看| 国产自产自拍视频在线观看| 亚洲欧洲av另类| 久久国产精品-国产精品| 国产理论片在线观看| 日韩视频精品在线观看| 久久久国产一区二区| 欧美特级黄色录像| 欧美电影在线观看完整版| 宅男在线国产精品| 色多多视频在线播放| 日韩电影毛片| 亚洲一区二区三区自拍| 二级片在线观看| 黄网站在线观看| 91免费视频观看| 国产精品亚洲综合| 4444亚洲人成无码网在线观看| 天堂av2020| 在线观看福利电影| 亚洲福利一二三区| 久久免费一级片| 男人在线资源站| 欧美国产精品中文字幕| 欧美日韩国产免费一区二区三区| 亚洲黄色a级片| 国产乱妇无码大片在线观看| 国产一区玩具在线观看| 日本成人一级片| 老司机午夜精品视频| 欧美做受高潮1| 国产精品免费精品一区| 美女久久一区| 欧美综合第一页| 亚洲av无码精品一区二区| 亚洲一区欧美二区| 日本aⅴ大伊香蕉精品视频| 天天做天天爱夜夜爽| 夜夜爽av福利精品导航| 51久久精品夜色国产麻豆| 成人免费看片98欧美| 99成人在线| 欧美专区在线播放| 欧美一级做a爰片免费视频| 日韩精品一二三四| 国产精品视频久久久| 亚洲一卡二卡在线观看| 久久成人久久鬼色| 亚洲精品日韩av| 亚洲国产www| 99久久免费国产| 欧美一区二区三区在线免费观看| 久草在线网址| 国产精品国产自产拍高清av| 国产又粗又硬又长| 国产蜜臀av在线播放| 精品久久香蕉国产线看观看亚洲| 国产日产欧美视频| 四虎成人在线| 制服丝袜亚洲网站| 久久久久无码国产精品一区李宗瑞 | 欧美天堂一区| 日韩一二三区不卡| 日本xxx在线播放| 日韩欧美午夜| 欧美激情一区二区三区成人| 久久久精品免费看| 久久精品国产亚洲一区二区三区 | 66精品视频在线观看| 日韩成人网免费视频| 中文字幕第20页| 亚洲精品一二三区区别| 97色在线观看免费视频| 中文字幕在线播放日韩| 成人h动漫精品| 水蜜桃一区二区| 欧美1—12sexvideos| 色噜噜偷拍精品综合在线| 中文字幕在线视频精品| 欧美调教网站| 日韩中文字幕免费| 久久久久久久久久久久久久av| 日本sm残虐另类| 成人h视频在线观看| 国产视频网站在线| 亚洲一区二区综合| 精品久久久99| 一区二区美女| 欧美国产日韩免费| 中文无码av一区二区三区| 成人av影院在线| 99re99热| jizz亚洲女人高潮大叫| 亚洲电影av在线| 黄视频网站免费看| 视频一区国产视频| 黑人另类av| 色操视频在线| 51精品久久久久久久蜜臀| 熟女人妻在线视频| 欧美日韩国产精品一区二区亚洲| 国产精品旅馆在线| 欧美色视频免费| 亚洲一区免费在线观看| 国产高清999| 男人网站在线观看| 春暖花开亚洲一区二区三区| 亚洲精品一区在线观看| 欧美一区免费观看| 老司机精品视频在线| 欧美日韩国产不卡在线看| sm在线观看| 日韩欧美国产综合一区| 国产精品夜夜夜爽阿娇| 青青青爽久久午夜综合久久午夜| 精品一区二区日本| 国产美女精品写真福利视频| 精品久久久久久无| 久久免费在线观看视频| 国产高清在线精品| 2021国产视频| 在线观看欧美| 久久久精品国产| 一区二区美女视频| 国产精品美女久久久久aⅴ国产馆| 人妻内射一区二区在线视频 | 日韩三级中文字幕| 色偷偷www8888| 精品一区二区三区久久久| 色播亚洲婷婷| 久久国内精品| 日韩在线播放av| 国产精品无码久久av| 亚洲欧洲精品天堂一级| 深爱五月综合网| 亚洲综合色站| 国产精品大全| 毛片在线网站| 亚洲免费一级电影| 精品国产xxx| 欧美激情一区二区三区不卡| xxx国产在线观看| 99免费精品| 亚洲精品免费一区二区三区| 国模私拍视频在线播放| 亚洲国产精彩中文乱码av在线播放| 国产系列精品av| www成人在线观看| 超碰在线人人爱| 久久久久久久久久久9不雅视频| 亚洲在线免费视频| 欧美6一10sex性hd| 精品调教chinesegay| 欧美一区免费看| 国产精品久99| 人妻av一区二区| 久久久亚洲人| 不卡中文字幕在线| 97色成人综合网站| 全球成人中文在线| 老司机在线永久免费观看| 日韩欧美国产午夜精品| 男人的天堂一区二区| 国产日韩三级在线| 无套内谢丰满少妇中文字幕| 亚洲福利一区| 日韩福利在线| 97青娱国产盛宴精品视频| 日本高清久久天堂| 国产福利视频在线| 亚洲欧美一区二区三区情侣bbw | 美女视频黄 久久| 国产精品国产三级国产专区51| 天堂一区二区三区四区| 国产日韩欧美中文| 999福利在线视频| 在线播放精品一区二区三区 | 亚洲欧美综合v| 99视频在线观看免费| 欧美日韩国产综合新一区| 中国1级黄色片| aaa亚洲精品一二三区| 亚洲福利精品视频| 99视频一区| 天堂v在线视频| 亚洲电影男人天堂| 97se亚洲综合| 粉嫩av一区二区三区四区五区| 国内精品模特av私拍在线观看| 日本中文字幕电影在线免费观看| 亚洲黄色在线观看| 国产xxxx在线观看| 欧美吻胸吃奶大尺度电影| 日本高清www免费视频| 亚洲人一二三区| 国产精品美女高潮无套| gogo大胆日本视频一区| 韩国三级丰满少妇高潮| 青青国产91久久久久久| 国产日韩一区二区在线观看| 亚洲狠狠婷婷| 久久99久久99精品| 91精品久久久久久久久久不卡| 欧美高清视频一区| 老司机凹凸av亚洲导航| 91福利视频导航| 高清一区二区三区av| 国产精品视频免费在线| 欧洲亚洲两性| 欧美综合在线第二页| a在线视频v视频| 欧美激情中文字幕在线| av毛片在线看| 久久精品国产综合| 日本免费视频在线观看| 日韩最新av在线| 爱久久·www| 亚洲一二三在线| 国产精品视频一区二区久久| 亚洲欧美中文日韩在线v日本| 天天插天天干天天操| 亚洲精品一区二区三区精华液| 精品人妻伦一二三区久久 | 日韩精品免费一区二区三区| 欧美日韩三区四区| 欧洲vs亚洲vs国产| 久久99精品久久久久久久青青日本| 国产精品调教视频| 精品国产免费人成电影在线观... 精品国产免费久久久久久尖叫 | 成人福利视频网| 91精品福利观看| 亚洲在线观看视频| www.神马久久| 国产原创精品| 亚洲人成网亚洲欧洲无码| 欧美日韩精品一区| 日本不卡电影| 天天爱天天做天天操| 国模一区二区三区| 人妻av中文系列| 裸体素人女欧美日韩| mm1313亚洲国产精品无码试看| 奇米一区二区三区| 777一区二区| 国产99久久久国产精品潘金 | 亚洲欧洲色图| 日韩精品最新在线观看| 日韩精品一卡| 久久免费视频2| 国内精品美女在线观看| 欧洲黄色一级视频| 蜜臀av亚洲一区中文字幕| 午夜一级免费视频| 成人国产精品免费| 爱爱免费小视频| 最新国产成人在线观看| 久久网中文字幕| 日本久久一区二区三区| 国产精品综合在线| 日韩精品在线观| 午夜在线视频| 久久久久免费精品国产| 午夜欧美激情| 成人久久一区二区三区| 久久男人av| 亚洲欧美日韩国产yyy| 欧美午夜在线| a在线观看免费视频| 成人中文字幕电影| 国产精品av久久久久久无| 亚洲人一二三区| 日日夜夜操视频| 日韩免费观看高清完整版在线观看| 欧美女子与性| 久久久精品国产一区二区| 天堂8中文在线最新版在线| 国产色综合天天综合网| 日韩大胆成人| 潘金莲一级淫片aaaaaa播放1| 国产精品视区| 国产成人av免费观看| 久久久不卡网国产精品二区| 九九热视频精品| 欧美日韩中文字幕一区二区| 蜜臀久久精品久久久久| 中文字幕亚洲无线码a| 美女高潮视频在线看| 91在线视频免费| 精品日本12videosex| 免费成人午夜视频| 国产一区二区视频在线播放| 四虎国产精品成人免费入口| 亚洲电影一级黄| 91久久精品无码一区二区| 亚洲精品中文字幕女同| heyzo高清国产精品| 一区二区三区.www| 欧美午夜精品理论片| 久久久久久久久久久久久久久99 | 亚洲精品激情视频| 国产精品国产三级国产普通话蜜臀| 黄色在线视频网址| 亚洲精品在线观看网站| 丝袜美腿av在线| 成人免费看片视频| 北条麻妃国产九九九精品小说| 欧美亚洲国产成人| www.欧美精品一二区| 久久精品波多野结衣| 91精品国产综合久久婷婷香蕉 | 国产aaaaa毛片| 2022国产精品视频| 中日韩黄色大片| 亚洲第一区中文99精品| 人人超在线公开视频| 99re视频| 欧美日韩ab| 韩国av中国字幕| 亚洲综合在线观看视频| 99在线小视频| 另类色图亚洲色图| 视频二区欧美| 国产精品国三级国产av| 国产v综合v亚洲欧| 国产在线视频卡一卡二| 亚洲国产精久久久久久久| 9999精品成人免费毛片在线看| 国产欧美日韩一区二区三区| 亚洲高清资源| 中文在线永久免费观看| 精品国产31久久久久久| 青青草在线免费观看| 国产成人鲁鲁免费视频a| 欧美精选视频在线观看| 欧美自拍小视频| 国产精品网站在线| 国产乱人乱偷精品视频a人人澡| 久久国产视频网站| av成人资源网| 欧美三级一级片| 国产日韩精品久久久| 在线中文字幕网站| 欧美大片va欧美在线播放| 哺乳一区二区三区中文视频| 成人在线免费观看av| 中文字幕精品综合| 国产麻豆一精品一男同| 久久久久久久久久久av| 日韩精品导航| 尤蜜粉嫩av国产一区二区三区| 亚洲视频资源在线| 黄色一级a毛片| 国产精品1234| 亚洲精品网址| 在线观看国产免费视频| 91成人看片片| 国产二区三区在线| 久久99蜜桃综合影院免费观看| 日韩中文字幕不卡| 日本福利片在线观看| 亚洲精品久久7777777| 激情都市亚洲| 桥本有菜av在线| 99久久精品99国产精品| 中文字幕av久久爽| 欧美国产极速在线| 欧美少妇xxxx| 日本一区二区免费视频| 欧美亚洲国产怡红院影院| 丝袜在线视频| 日韩欧美亚洲在线| 国产成人日日夜夜| 无码人妻精品一区二区三区9厂| 精品精品国产国产自在线| 久久狠狠久久| 天堂在线精品视频| 在线亚洲+欧美+日本专区| 激情网站在线| 在线观看欧美激情| 97久久精品人人澡人人爽| 99热这里只有精品99|