精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ViT作者飛機上也要讀的改進版Transformer論文,花2個小時詳細批注解讀分享出來

人工智能 新聞
這篇論文被他簡寫為DiffTranformer,不過不是Sora底層架構的那個Diffusion Transformer,而是不久前來自微軟的Differencial Transformer。

ViT核心作者Lucas Beyer,長文分析了一篇改進Transformer架構的論文,引起推薦圍觀。

他前不久從谷歌跳槽到OpenAI,這次是在飛機上閱讀論文并寫下了分析。

圖片

這篇論文被他簡寫為DiffTranformer,不過不是Sora底層架構的那個Diffusion Transformer,而是不久前來自微軟的Differencial Transformer。

論文中介紹,整體思路類似差分放大電路或降噪耳機,用兩個信號的差值來濾除共模噪聲,解決Transformer模型信噪比低的問題。

這篇論文發布時引起大量關注,但也面對一些質疑,在彈幕版alphaXiv上作者與讀者進行了很多討論。

圖片

Beyer起初也對這篇文章持保留態度,覺得“難道MHA中的兩個注意力頭不能學習到這些嗎?”。

但經過近期和同行的一些互動,覺得不應該輕易下定論,重新看了一遍論文后,他改變了看法圖片

我的最初印象被團隊的實驗徹底打破了,他們的實驗非常公平和謹慎。

圖片

此外還有一個彩蛋:

大佬通常會用坐飛機的時間來打4把Dota 2游戲快速模式。

現在寫這個帖子也不能當論文評審工作寫進簡歷,是純純的貢獻個人時間了,以后也不會常寫。

總之先給大佬點贊。

圖片

大佬解讀熱點論文

Beyer評價這篇論文的核心創新非常simple和nice,可以用一句話概括。

將兩個注意力頭配對,然后執行(softmax(Q1K1) - λ*softmax(Q2K2)) V,其中λ是一個可學習的標量。
圖片

他認為這項研究的動機非常充分:隨著上下文變長,(微小的)對不相關token的注意力之和可能超過對少數相關token的注意力,從而淹沒它們。

這一洞見表明,隨著輸入長度的增加,經典Transformer可能越來越難以捕捉到關鍵信息。DIFF Transformer試圖解決這一問題。

但他仍不確定對于訓練充分的模型來說這是個多大的問題,希望在DIFF Transformer論文中有一些關于attention分布/熵的圖表,以實際證明這個插圖的合理性。

圖片

接下來,他指出了幾個容易被忽視的細節:

  • 與Figure1不同,DiffAttn實際上并沒有對差值重新歸一化。那么它究竟如何放大”相關”的分數呢?

Beyer建議論文中能提供更多實際訓練的DIFF Transformer的分析圖表。

圖片

  • λ的計算相當復雜,涉及兩個可學習的指數函數之差,加上一些基線λ_init,在早期的層是0.1,后面又是0.8。

Beyer認為λ不一定需要是正值,并建議提供更多對可學習λ參數的分析。

  • 每個注意力頭的輸出都經過了層歸一化并乘以(1-λ_init),然后再concat并乘以WO,這里也需要更多圖表來證明。

圖片

接下來看論文中大量的實驗。研究者基本上分叉了了StableLM-3B-4E1T,稱之為Diff-3B,作為基線模型進行比較。

可惜的是,基線模型只在其中3個數據集上報告了結果,其中2個Diff-3B的表現都相當好。

Beyer懷疑這個StableLM-3B是否真的是一個強基線。
圖片

在參數量和token數的縮放曲線上,DIFF Transformer乍一看很有前景。但仔細觀察后,Beyer提出了兩點質疑:

  • 縮放曲線明顯分為兩組,在它們之間畫一條線有點牽強。查看附錄可知,研究者為較大的兩個模型降低了學習率。這是否意味著他們遇到了不穩定性問題?

圖片

  • 每次實驗只用了10B個token訓練,這個數量非常小。Beyer理解其中的計算資源限制,但仍然感到有點不安。

圖片

這些實驗表明,在相同大小的情況下,DIFF Transformer性能會更好一些,并且訓練時間相同。

然而,它的的推理速度也會慢一些(慢5-10%)。

Beyer提出最好能看到以計算量或實際時間為橫軸的縮放曲線。

圖片

在長文本評測和對輸入樣本順序的魯棒性方面,DIFF Transformer表現出了明顯的優勢。

特別是在上下文學習的魯棒性實驗中,DIFF Transformer在不同的樣本排列順序下,性能方差遠小于經典Transformer。

這表明它更不容易被輸入的細微變化擾亂,而經典Transformer容易受到樣本順序的影響,在最好和最壞情況下表現相差很大。

總的來說,Beyer對這篇論文的看法有所改觀:

研究者的實驗非常全面和謹慎,的確展現了DIFF Transformer比單純的”兩個注意力頭相減”更多的潛力

這項工作展現了一些有前景的火花。它在其他人的訓練任務中能否很好地復現、或帶來幫助,還有待進一步觀察。

Lucas Beyer是誰

12月初,Lucas Beyer與Xiaohua Zhai、Alexander Kolesnikov集體從谷歌被挖到OpenAI。

他們曾共同提出Vision Transformer,開創了Transformer在CV領域應用的先河。

圖片

據他個人官網中介紹,他在比利時長大,曾夢想制作電子游戲以及從事AI研究。

他在德國亞琛工業大學學習機械工程,并在那里獲得了機器人感知和計算機視覺博士學位,2018年加入谷歌。

圖片

除了這次長文分析DIFF Transformer之外,他還經常對新研究發表一些短的評論,比如最近火爆的DeepSeek v3,他也提出自己的建議。

圖片

總之是一位非常值得關注的學者。

DIFF Transformer論文:https://arxiv.org/abs/2410.05258

責任編輯:張燕妮 來源: 量子位
相關推薦

2022-09-06 08:31:09

線程池工具系統

2012-07-31 13:31:34

Windows 8鼠標鍵盤

2012-07-31 09:47:22

微軟Windows 8

2023-09-26 08:39:28

限流方式滑動窗口計數器

2023-11-28 12:49:01

AI訓練

2024-11-21 16:06:02

2025-01-07 12:43:14

2021-01-07 13:08:27

AI 數據人工智能

2014-07-01 10:15:52

2023-12-25 15:11:16

AI模型

2017-11-16 08:15:26

程序員Java程序

2024-03-25 12:39:00

AI數據

2022-02-08 15:43:08

AITransforme模型

2025-07-14 08:50:00

語言模型AI論文

2021-11-23 09:30:34

架構AI技術

2022-07-07 08:30:50

類型注解原生JS

2023-12-17 13:02:10

AI模型

2024-12-18 08:00:00

2024-11-12 06:23:50

ViTCIFAR10模型

2015-06-19 09:39:35

點贊
收藏

51CTO技術棧公眾號

韩国亚洲精品| 欧美日韩一区二区三区免费| 久久久久久久久久久久久国产| 91丝袜在线观看| 香蕉视频在线看| 女厕嘘嘘一区二区在线播放 | 91精品久久久久久久久久久久久久| 亚洲色欲综合一区二区三区| 国产999久久久| 久久综合电影| 欧美日韩在线播放一区| 日本不卡一二三区| 亚洲精品男人的天堂| 精品国产一区二区三区不卡蜜臂| 中文字幕中文字幕中文字幕亚洲无线| 日本sm极度另类视频| 无码人妻aⅴ一区二区三区| 国内在线免费视频| 成人不卡免费av| 欧美激情奇米色| 涩视频在线观看| 国产在线xxx| 亚洲国产成人在线| 国产精品精品视频| av资源在线免费观看| www.国产精品| 中文字幕中文字幕在线一区 | 国产情人节一区| 制服.丝袜.亚洲.中文.综合懂色| 国产精品45p| 亚洲自拍欧美精品| 国产精品初高中精品久久| 久久久久久久久久99| 北条麻妃在线一区二区免费播放 | 日韩中文字幕精品| 九九九九九国产| 黄色视屏免费在线观看| 国产一区二区三区黄视频 | 黄网站色视频免费观看| 亚洲国产精彩视频| 亚洲精选成人| 亚洲欧美国产一区二区三区| 国产性生交xxxxx免费| 在线看的av网站| 国产精品亚洲专一区二区三区| 欧美国产中文字幕| 色欲人妻综合网| 欧美成人基地| 在线观看亚洲成人| 精品一区二区成人免费视频| 国产 欧美 精品| 久久久久久夜| 久久av资源网站| 真人bbbbbbbbb毛片| 成人午夜大片| 日韩欧美在线观看一区二区三区| 中文字幕综合在线观看| seseavlu视频在线| 国产高清不卡二三区| 17婷婷久久www| 亚洲女人毛茸茸高潮| 日韩午夜电影网| 亚洲成人精品久久| 国产又大又黄又粗又爽| 日本高清成人vr专区| av不卡免费电影| 国产专区欧美专区| 国产精品一区二区黑人巨大| 最新亚洲激情| 欧美性在线观看| 欧美日韩免费一区二区| 国产a久久精品一区二区三区| 777奇米四色成人影色区| 少妇高潮喷水在线观看| 免费在线观看黄色网| www.色综合.com| 久久精品午夜一区二区福利| 国产美女精品视频国产| 久久精品国语| 国产精品久久久久久久久久东京 | 亚洲免费影院| 久久久999国产精品| av网站免费在线播放| 日韩成人在线观看视频| 欧美日韩在线观看一区二区| 欧美色图校园春色| 黑人一区二区三区| 色婷婷久久久亚洲一区二区三区| 男女激情免费视频| 欧美性videos| 亚洲午夜在线视频| 艳母动漫在线免费观看| 国产精品偷拍| 欧美在线观看视频在线| 免费无码国产v片在线观看| 乱插在线www| 一本一道综合狠狠老| 99re精彩视频| 懂色aⅴ精品一区二区三区| 日韩午夜av一区| 久久精品无码一区| 要久久电视剧全集免费| 亚洲黄色有码视频| 性农村xxxxx小树林| 日韩高清一区| 亚洲欧洲在线观看| 国产美女免费无遮挡| 台湾佬综合网| 日韩电影大片中文字幕| 欧美一级片黄色| 久久要要av| 国产97色在线| 中文字幕视频一区二区| 日韩中文字幕1| 国产精品99蜜臀久久不卡二区| wwwxxx亚洲| 极品美女销魂一区二区三区免费 | 给我免费播放片在线观看| 最新av在线播放| 亚洲一区二区三区影院| 午夜免费福利在线| 日韩一级电影| 久久久久久com| 久久久精品视频在线| 日本va欧美va瓶| 成人激情视频在线观看| 久草在现在线| 国产精品欧美久久久久一区二区| 亚洲成人av动漫| 国产美女av在线| 欧美日韩在线精品一区二区三区激情| 一区二区三区少妇| 亚洲片区在线| 国产v亚洲v天堂无码| 成人影院在线看| 亚洲大片免费看| 欧美日韩黄色一级片| 欧洲av一区二区| 欧美日韩精品电影| 人妻体体内射精一区二区| 日韩a一区二区| 国产精品嫩草视频| 136福利视频导航| 成人午夜激情片| 日韩免费电影一区二区三区| 国产网友自拍视频导航网站在线观看 | 亚洲第一精品久久忘忧草社区| 超碰手机在线观看| 国产精品99久久久久久久vr | 亚洲一区 欧美| 婷婷综合伊人| 26uuu亚洲伊人春色| 日本精品久久久久| 中文字幕精品一区二区三区精品| 少妇高清精品毛片在线视频 | 欧美蜜桃一区二区三区| 久久久无码人妻精品无码| 国产成人3p视频免费观看| 97超级碰碰人国产在线观看| 日韩精品系列| 亚洲欧美激情插| 91视频最新入口| 亚洲精品aaaaa| 国产精品www网站| 日本免费在线视频| 精品国产免费人成在线观看| 黄色国产在线播放| 99视频一区| 91精品久久久久久久久久入口 | 少妇精品久久久久久久久久| 亚洲av成人无码久久精品老人 | 狠狠人妻久久久久久综合| 久草精品在线观看| 黄色99视频| 国产美女在线观看| 日韩精品综合一本久道在线视频| 久操免费在线视频| 麻豆精品新av中文字幕| 精品一区久久久久久| 老司机成人影院| 亚洲激情国产精品| 99成人精品视频| 99久久精品99国产精品| 日本中文字幕一级片| 国产乱论精品| 国产精品高潮呻吟视频| 国产成人在线视频免费观看| 亚洲国语精品自产拍在线观看| 日本黄色中文字幕| 91农村精品一区二区在线| 欧美精品在欧美一区二区| 亚洲97av| 亚洲在线免费看| 黄网站视频在线观看| 欧美成人一区二区三区| 日本午夜精品视频| 给我免费播放日韩视频| 久久av偷拍| 国产精品久久久久久福利| 91福利在线免费| 在线āv视频| 色999久久久精品人人澡69| 少妇一区视频| 免费观看久久av| 精品福利av| 美女久久久久久| 黑人巨大精品| 亚洲男人在线| 97成人在线观看| 欧美三级特黄| 国产极品精品在线观看| 欧美精品电影| 亚洲美女久久久| 精品人妻一区二区三区四区不卡| 国产精品久久三| 欧产日产国产精品98| 国产九色精品成人porny| 久久久久久三级| 不卡中文一二三区| 国产一区二区三区四区五区传媒| 日韩一区二区久久| 久久精品日产第一区二区三区高清版| 国产午夜精品一区二区| 亚洲精品人成| 亚洲制服一区| 久久国产精品 国产精品| www久久久| 国产精品免费观看在线| 性欧美videohd高精| 日韩精品欧美国产精品忘忧草| 在线中文字幕网站| 日韩欧美精品一区二区综合视频| 91精品久久久久久久91蜜桃| 中文字幕一区二区人妻视频| 国产无遮挡又黄又爽又色视频| hitomi一区二区三区精品| 中国黄色片一级| 美女视频黄 久久| 黄色网址在线免费看| 超碰成人福利| 7777精品伊久久久大香线蕉语言| 少妇视频在线| 久久综合亚洲社区| 国内精品久久久久久野外| 色香阁99久久精品久久久| 国产偷拍一区二区| 欧美精选午夜久久久乱码6080| 日韩乱码一区二区三区| 成人97人人超碰人人99| 亚洲一区精品在线| 三级在线免费观看| 亚洲一区二区| 国产一区二区视频在线观看| 国产日韩电影| 国产成人精品电影| 国产不卡网站| 国产精品视频久久久久| 欧美日韩视频免费看| 国产欧美精品久久久| 影音先锋中文在线视频| 久久中文字幕在线| 在线观看操人| 26uuu久久噜噜噜噜| 日本成人伦理电影| 国产精品中文字幕在线观看| 24小时成人在线视频| 99在线影院| 久久国内精品| 亚洲a成v人在线观看| 911亚洲精品| 91色精品视频在线| 网友自拍亚洲| 成人网在线免费看| 91嫩草精品| 欧美激情第六页| 91久久电影| 国产综合久久久久久| 综合操久久久| 国产真人真事毛片视频| 91色综合久久久久婷婷| 国产交换配乱淫视频免费| 国产日韩欧美一区二区三区综合 | 自拍偷拍欧美视频| 欧美整片在线观看| 日韩免费大片| 国产亚洲欧美另类一区二区三区| 日韩成人高清| 国产欧亚日韩视频| 里番精品3d一二三区| 日韩一区不卡| 精品成人久久| 国产成人无码av在线播放dvd| 久久97超碰色| 精品无码在线视频| 综合av第一页| 欧美日韩国产一二三区| 一区二区三区日本| 日本污视频网站| 亚洲午夜久久久久久久久电影网| 国产一级淫片a视频免费观看| 5月丁香婷婷综合| 精品资源在线看| 久久久久久午夜| 日韩一级特黄| 欧美日韩一区在线观看视频| 欧美成人综合| 草草草视频在线观看| 蜜桃av综合| 国产精品无码自拍| 国产精品久久久一区麻豆最新章节| 日本a在线观看| 天天av天天翘天天综合网| 国产精品第108页| 亚洲成人免费看| 亚洲一区二区视频在线播放| 日韩电影网在线| 2021国产在线| 国产女同一区二区| 国产99精品一区| 福利视频一二区| 国产成人免费在线观看| 91av手机在线| 欧美三级蜜桃2在线观看| 水莓100在线视频| 一区二区三区日韩在线| 午夜国产福利在线| 国产精品1234| 亚洲大片精品免费| 亚洲不卡中文字幕无码| 成人一区二区三区| 91成人福利视频| 91精品欧美福利在线观看| eeuss影院在线播放| 国产成人午夜视频网址| 亚洲va久久| 99色精品视频| 久久综合色综合88| av在线播放中文字幕| 欧美专区日韩专区| 国产在线中文字幕| 国产不卡在线观看| 国产免费久久| 国产av人人夜夜澡人人爽| 国产亚洲精品福利| 波多野结衣家庭主妇| 一区二区亚洲欧洲国产日韩| 精品国模一区二区三区| 亚洲精品国产精品国自产| 日本不卡中文字幕| 国产主播av在线| 9191成人精品久久| √天堂8在线网| 国产精品裸体一区二区三区| 伊人春色之综合网| 妺妺窝人体色www在线小说| 99久久精品费精品国产一区二区| 色呦呦网站入口| 中文在线日韩| 日本精品一二三| 偷窥少妇高潮呻吟av久久免费| 网站一区二区三区| 一区二区三区亚洲变态调教大结局| 中文字幕在线中文字幕日亚韩一区| 激情成人综合网| 久久久全国免费视频| 亚洲第一黄色网| 欧美gay囗交囗交| 亚洲精品人成| 国产成人综合在线| 日韩欧美国产亚洲| 欧美在线观看你懂的| 自拍视频在线网| 91免费看网站| 亚洲一区日韩在线| 国产又粗又猛又爽又黄的视频四季| 欧美丝袜丝交足nylons图片| 成人av福利| 精品久久久久久中文字幕动漫| 久久久久国产精品一区三寸| 国产精品丝袜一区二区| 欧美午夜精品理论片a级按摩| 日本视频在线| 国产二区不卡| 男男视频亚洲欧美| 久久久久久久久精| 中日韩美女免费视频网站在线观看 | 免费一级特黄毛片| 久久久国产精品麻豆| 国产精品1234区| 亚洲天堂av在线免费| 国产日韩中文在线中文字幕| 先锋影音一区二区三区| 国产一区二区三区国产| 久久久久女人精品毛片九一| 日韩视频精品在线| 麻豆一区一区三区四区| 国产无色aaa| 欧美日韩免费在线| 天堂v视频永久在线播放| 国产精品中文在线|