精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

微軟清華改進Transformer:用降噪耳機原理升級注意力,一作在線答疑

人工智能 新聞
新架構(gòu)在長上下文建模、關(guān)鍵信息檢索、減少幻覺、提高上下文學(xué)習(xí)能力以及減少激活異常值等各項指標(biāo)中,普遍優(yōu)于Transformer架構(gòu)。

Transformer自問世后就大放異彩,但有個小毛病一直沒解決:

總愛把注意力放在不相關(guān)的內(nèi)容上,也就是信噪比低

現(xiàn)在微軟亞研院、清華團隊出手,提出全新改進版Differential Transformer,專治這個老毛病,引起熱議。

圖片

論文中介紹,整體思路類似差分放大電路或降噪耳機,用兩個信號的差值來濾除共模噪聲。

圖片

具體到在語言模型中,如果句子很長,只有少數(shù)token會真正影響當(dāng)前token的含義。而注意力機制允許每兩個詞之間產(chǎn)生交互,其中就包含大量噪聲了。

團隊提出的方法是在注意力層中增加一個Softmax,然后兩個Softmax做減法。

這一減,噪音信息就被大幅抵消,讓注意力更集中在相關(guān)內(nèi)容上。

圖片

語言建模任務(wù)上的一系列實驗結(jié)果顯示,僅需約65%的模型大小或訓(xùn)練tokens,DIFF Transformer就能達到與傳統(tǒng)Transformer相當(dāng)?shù)男阅堋?/p>

新架構(gòu)在長上下文建模、關(guān)鍵信息檢索、減少幻覺、提高上下文學(xué)習(xí)能力以及減少激活異常值等各項指標(biāo)中,普遍優(yōu)于Transformer架構(gòu)。

圖片

論文上傳到arXiv平臺后,有不少學(xué)者到彈幕版alphaXiv劃線提問。一作Tianzhu Ye正絕贊在線答疑中。

圖片

差分Transformer

與傳統(tǒng)Tranformer相比,DIFF Transformer保持宏觀架構(gòu)不變,主要區(qū)別在于用差分注意力替換傳統(tǒng)softmax注意力。

此外還采用了LLaMA系列中的一些改進,如pre-RMSNorm歸一化和SwiGLU激活函數(shù)。

在差分注意力模塊中,需要先給Q和K分成兩個組,然后分別計算softmax。

第二組乘了一個標(biāo)量λ,是可學(xué)習(xí)的參數(shù),在同一層的注意力頭之間共享。

λ的引入是為了在差分操作中平衡兩組注意力的貢獻,使得差分注意力機制能夠更好地適應(yīng)不同的任務(wù)需求和數(shù)據(jù)分布。
圖片

接下來是一系列實驗結(jié)果。

語言建模評估

在1T tokens上訓(xùn)練3B大小的DIFF Transformer,遵循 StableLM-3B-4E1T的配方,在各種下游任務(wù)中與以前訓(xùn)練良好的Transformer模型相比表現(xiàn)出優(yōu)勢。
圖片

可擴展性評估

只需約65%的模型參數(shù)或訓(xùn)練tokens來匹配Transformer的性能。

圖片

長上下文能力評估

在額外1.5B tokens上訓(xùn)練3B大小的DIFF Transformer,擴展上下文長度至64k。

隨著上下文長度增加,累計平均負對數(shù)似然(NLL)持續(xù)降低,并且比傳統(tǒng)Transformer的NLL值更低。

表明DIFF Transformer可以有效利用不斷增加的上下文。

圖片

關(guān)鍵信息檢索能力評估

也就是多個“針”的大海撈針試驗,設(shè)置不同的上下文長度(4K和64K)來模擬不同復(fù)雜程度的信息檢索場景。

在4K上下文長度下,隨著插入 “針” 數(shù)量和查詢數(shù)量的增加,DIFF Transformer的準(zhǔn)確率保持穩(wěn)定,而Transformer 的準(zhǔn)確率顯著下降。

圖片

在64K上下文長度下,DIFF Transformer在不同答案針深度(即關(guān)鍵信息在長上下文中的位置)和上下文長度下都能保持穩(wěn)定性能,且在關(guān)鍵信息位于上下文前半部分時優(yōu)勢明顯。

特別是當(dāng)關(guān)鍵信息位于25%深度時,DIFF Transformer比Transformer的準(zhǔn)確率提高了 76%。

圖片

上下文學(xué)習(xí)能力評估

分為兩個角度來評估,分別是多樣本分類和上下文學(xué)習(xí)的穩(wěn)健性。

多樣本分類任務(wù),同樣使用64K上下文長度的3B參數(shù)模型,DIFF Transformer的準(zhǔn)確率始終高于Transformer,提升幅度從5.2%到21.6%不等

圖片

上下文學(xué)習(xí)穩(wěn)健性采用排列順序任務(wù),DIFF Transformer的結(jié)果方差遠小于傳統(tǒng)Transformer。
圖片

上下文幻覺評估

主要關(guān)注輸入中包含正確事實,但模型仍然無法產(chǎn)生準(zhǔn)確輸出的情況。

將模型輸出與ground-truth一起發(fā)給GPT-4o,讓GPT-4o來判斷是否存在幻覺,此前試驗表明GPT-4o與人類評判結(jié)果一致率較高,相對可靠。

在不同數(shù)據(jù)集上DIFF Transformer的準(zhǔn)確率更高,幻覺更少。
圖片

激活異常值分析

Transformer中的激活異常值,導(dǎo)致模型在訓(xùn)練和推理過程中難以量化。

試驗比較了注意力logits和隱藏狀態(tài)兩種激活類型下的最大激活值,DIFF Transformer都表現(xiàn)出更低的頂部激活值,即產(chǎn)生更少的激活異常值。

在對注意力logits進行量化實驗時,DIFF Transformer在降低比特寬度量化時仍能保持較高性能,而Transformer在6-bi 量化時準(zhǔn)確性顯著下降。

4-bit的DIFF Transformer能達到與6-bit的Transformer相當(dāng)?shù)臏?zhǔn)確性,且比4-bit的Transformer準(zhǔn)確率提高約 25%。

圖片

代碼已開源, 降噪耳機類比引熱議

對于目前讀者的疑問,作者已做出幾點答復(fù)

問題1:Diff Transformer與每個注意力頭溫度可學(xué)習(xí)的方法有什么不同?與門控注意力對比如何?

作者回應(yīng)在實驗中,可學(xué)習(xí)溫度效果不大。而本文方法是門控注意力的改進。

圖片

問題2:差分注意力是否意味著將標(biāo)準(zhǔn)注意力矩陣參數(shù)翻倍?

作者澄清,單個注意力頭維度翻倍,但是注意力頭數(shù)量減半,總體在參數(shù)和FLOPS上都是對齊的。

圖片

問題3:第二組Softmax乘可學(xué)習(xí)參數(shù)lambda的研究思路。

作者也做出詳細回應(yīng)。

圖片

DIFF Transformer在純學(xué)術(shù)圈之外也引起非常多的討論,有不少人困惑論文中將方法與降噪耳機的類比。

降噪耳機采集環(huán)境噪聲并生成相反的信號,在這種情況下哪些信號屬于噪聲是已知的,但差分注意力中并不能事先確定哪些是噪聲。

圖片

一種解釋是,低注意力分數(shù)的噪聲也有很低的梯度,因此模型其實已知哪些是噪聲,只是單個Softmax無法輸出0,所以噪聲很難去除。

圖片

也有人提出,比起降噪耳機,其實專業(yè)音頻中“平衡線”,或者USB、網(wǎng)卡等傳輸方式更適合一些。

使用兩條信號線傳輸正負信號,接收器只對比他們之間的差異,由于在空間中離得很近,受到的干擾是相同的。

有用的正負信號相減會被放大,相同的噪聲相減卻被抵消,大大增強抗干擾能力。

圖片

總之,DIFF Transformer代碼已開源在微軟unilm項目下,其中還包含魔改版支持差分注意力的FlashAttention-2的代碼。

感興趣的可以試起來了。

圖片

論文:https://arxiv.org/abs/2410.05258

代碼:https://aka.ms/Diff-Transformer

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2024-10-09 15:30:00

2024-10-09 13:22:10

2025-10-22 08:52:23

2024-02-19 00:12:00

模型數(shù)據(jù)

2024-10-31 10:00:39

注意力機制核心組件

2022-02-08 15:43:08

AITransforme模型

2024-09-19 10:07:41

2025-06-09 08:52:00

2024-12-04 09:25:00

2011-07-07 13:12:58

移動設(shè)備端設(shè)計注意力

2025-02-25 09:40:00

模型數(shù)據(jù)AI

2024-07-01 12:17:54

2024-12-17 14:39:16

2023-11-24 12:36:00

模型訓(xùn)練

2018-08-26 22:25:36

自注意力機制神經(jīng)網(wǎng)絡(luò)算法

2021-02-02 14:47:58

微軟PyTorch可視化

2025-04-07 07:47:00

模型訓(xùn)練AI

2023-05-05 13:11:16

2023-06-12 09:57:22

AIChatGPT

2023-07-29 13:26:51

模型AI
點贊
收藏

51CTO技術(shù)棧公眾號

www黄色在线| 久久久精品免费| 黄色高清无遮挡| 国产最新在线| jlzzjlzz国产精品久久| 国产999精品| 国产一二三四区| 亚洲日本三级| 日韩三级av在线播放| 缅甸午夜性猛交xxxx| 91caoporm在线视频| 波多野结衣视频一区| 国产啪精品视频| 日韩精品国产一区二区| 午夜精品视频一区二区三区在线看| 亚洲国产成人精品久久| 国产福利精品一区二区三区| 中国字幕a在线看韩国电影| 亚洲人吸女人奶水| 日本欧美色综合网站免费| 国产黄色av片| 久久精品国产一区二区三| 午夜欧美大片免费观看| 极品盗摄国产盗摄合集| 日韩欧美国产精品综合嫩v| 欧美精品一区二区三区在线| 在线看免费毛片| 婷婷激情一区| 狠狠色噜噜狠狠狠狠97| www.国产在线播放| av网站大全在线| 国产精品欧美综合在线| 日本不卡在线观看| 四虎永久在线观看| 懂色av中文字幕一区二区三区| 国产人妖伪娘一区91| 欧美三日本三级少妇99| 午夜精品久久| 久久av在线看| 日韩欧美在线视频播放| 精品午夜久久| 国产一区二区三区四区福利| 国产色视频一区二区三区qq号| 加勒比视频一区| 精品成人一区二区| 亚洲精品乱码久久久久久蜜桃欧美| 成人在线视频区| 在线播放亚洲一区| 三级黄色片免费看| 亚洲超碰在线观看| 精品久久人人做人人爱| 久久国产免费视频| 国产人妖ts一区二区| 精品国产一区二区三区四区四 | 日韩精品视频在线观看免费| 日本精品一二三区| 久久人人爽人人爽人人片av不| 精品国产乱码久久久久久蜜臀| av免费观看不卡| 国产66精品| 日韩av中文在线| 成人精品在线观看视频| 精品国产91久久久久久浪潮蜜月| 亚洲天堂视频在线观看| 俄罗斯毛片基地| 久久精品影视| 久久久久久高潮国产精品视| 日本一区二区网站| 久久九九99| 国产精品视频午夜| 国产强被迫伦姧在线观看无码| 国产一区二区成人久久免费影院| 国产传媒一区| 免费在线视频你懂得| 日本一区二区三区国色天香 | 免费一区二区视频| 91网站在线免费观看| 99久久精品日本一区二区免费| 成人深夜福利app| 欧美日韩在线观看一区二区三区| 91caoporn在线| 亚洲一区二区三区视频在线| 99999精品视频| 日本久久一区| 亚洲精品一区二区三区在线观看| 久久成人激情视频| 欧美日韩国产在线一区| 欧美一级淫片丝袜脚交| 91精品国产色综合久久不8| 成人激情小说网站| 亚洲欧洲日本国产| 亚洲美女尤物影院| 欧美精品乱码久久久久久按摩| 99精品一区二区三区无码吞精| 国产成人黄色| 欧美黄色片免费观看| 无码免费一区二区三区| 国产黑丝在线一区二区三区| 热舞福利精品大尺度视频| 操你啦视频在线| 色就色 综合激情| 99热这里只有精品2| 亚洲电影男人天堂| 久久91精品国产| 中文字幕日韩第一页| 成人永久免费视频| 亚洲精品欧洲精品| 午夜影院在线播放| 精品国产乱子伦一区| 美女视频久久久| 快she精品国产999| 国产在线一区二区三区欧美 | 成人情趣视频网站| 4438全国成人免费| 亚洲成人一级片| 国产精品的网站| 蜜臀久久99精品久久久酒店新书 | 日韩欧美一区二区在线观看| av最新在线| 日韩一级完整毛片| 2025国产精品自拍| 久久激五月天综合精品| 人偷久久久久久久偷女厕| 精品三级久久| 亚洲精品一线二线三线| 久草国产在线视频| 国产精品自拍av| 黄色污污在线观看| 成人黄色理论片| 日韩有码在线观看| 中文字幕av无码一区二区三区| 91麻豆6部合集magnet| 欧美中文字幕在线观看视频| 蜜桃精品视频| 久久在线免费观看视频| 国产精品视频在线观看免费| 国产精品三级av| 91最新在线观看| 精品国产一区二区三区噜噜噜 | 国产亚洲欧美日韩在线观看一区二区 | 中文成人在线| 精品精品国产国产自在线| 最近中文字幕免费在线观看| 欧美国产精品劲爆| 蜜臀av免费观看| 欧美一级精品片在线看| 国产精品一区专区欧美日韩| 成年人视频网站在线| 欧美天堂亚洲电影院在线播放| 91成人在线免费视频| 日韩激情一区二区| 亚洲人成网站在线观看播放| 青青伊人久久| 欧美区二区三区| 亚洲国产www| 午夜激情一区二区三区| 法国伦理少妇愉情| 日韩电影在线观看网站| 亚洲自拍的二区三区| 中文字幕日韩亚洲| 久久久免费av| 青青青草原在线| 欧美视频一区在线| 精品国产视频在线观看| 成人三级在线视频| 日韩av播放器| 希岛爱理av一区二区三区| 成人动漫视频在线观看免费| 精品丝袜在线| 自拍偷拍亚洲在线| www天堂在线| 精品久久久一区| 永久免费毛片在线观看| 精品一区二区三区在线观看| 日韩成人三级视频| 男男gay无套免费视频欧美| 国产精品久久久久久久久久新婚| 成人黄色网址| 日韩精品极品在线观看| 一区二区国产欧美| 亚洲高清一区二区三区| 欧美做受高潮6| 高清在线观看日韩| 国产精彩免费视频| 欧美日韩国产免费观看| 日本高清一区| 日韩在线观看一区二区三区| 欧美在线视频免费播放| 黄视频网站在线看| 亚洲欧美中文日韩在线v日本| ,亚洲人成毛片在线播放| 婷婷久久综合九色综合绿巨人 | 亚洲国产一区二区三区青草影视| 日本高清www| 国产精品一区二区视频| 凹凸日日摸日日碰夜夜爽1| 欧美88av| 五月天色一区| 欧美日韩一区二区三区不卡视频| 91精品视频观看| 亚洲承认视频| 久久久爽爽爽美女图片| 国内外激情在线| 在线视频国产日韩| 性感美女福利视频| 日韩欧美一区在线观看| 中文资源在线播放| 欧美日韩性视频在线| 国产乱国产乱老熟300| 国产精品网站在线观看| 91精品人妻一区二区| 粉嫩蜜臀av国产精品网站| 亚洲免费成人在线视频| 日日夜夜免费精品| 日韩小视频在线播放| 午夜欧美精品| 午夜啪啪免费视频| 国产一区二区三区天码| 久久国产精品一区二区三区| 综合激情网...| 91久久久久久久久久| 成人国产精品| 国产精品白嫩初高中害羞小美女| 欧洲一区精品| 欧美一级大片视频| 白浆在线视频| 8050国产精品久久久久久| 岛国片av在线| 欧美激情一区二区三区高清视频| 成人福利网站| 免费av一区二区| 国产美女福利在线| 久久激情视频免费观看| 免费在线观看黄色| www.亚洲男人天堂| 日本在线观看视频| 日韩中文在线不卡| 中文字幕在线播放| 色偷偷噜噜噜亚洲男人的天堂| 91精品国产综合久久久久久豆腐| 中日韩美女免费视频网站在线观看 | 欧美美女18p| 日本理论片午伦夜理片在线观看| 久久国产精品久久国产精品| 成人日韩欧美| 欧美激情一级欧美精品| 大菠萝精品导航| 欧美一区深夜视频| 第84页国产精品| 国产精品国产三级国产专播精品人| 全球最大av网站久久| 国产精品一区久久| 欧美午夜在线播放| 成人资源av| 亚洲精华一区二区三区| 欧美日韩综合另类| 99久久夜色精品国产亚洲狼| 在线观看成人免费| 日韩天天综合| 五月婷婷狠狠操| 国产精品系列在线播放| 国产伦精品一区二区免费| 96av麻豆蜜桃一区二区| 怡红院一区二区三区| 日韩美女视频一区二区 | 综合久久2019| 国内精品国产三级国产在线专 | 成人免费视频在线观看超级碰| 欧美黄色一级| 久久亚洲一区二区| 日韩欧美大片| 国产69精品久久久久999小说| 久久精品卡一| 小日子的在线观看免费第8集| 成人自拍视频在线观看| 国产亚洲精品熟女国产成人| 亚洲色图19p| 欧美h在线观看| 8x8x8国产精品| 天天综合网天天综合| 色午夜这里只有精品| 欧美人体视频xxxxx| 国产精国产精品| 6080亚洲理论片在线观看| 欧美日韩精品免费在线观看视频| 亚洲国产一区二区在线观看 | 婷婷午夜社区一区| 亚洲www在线| 国产亚洲精品美女久久久久久久久久| 9191国产视频| 老司机精品视频导航| 伊人网综合视频| 亚洲欧美日韩国产综合| 欧美一级淫片免费视频黄| 日韩欧美国产1| av在线免费观看网| 91成人精品网站| 欧美午夜在线播放| 亚洲图片小说在线| 亚洲在线黄色| 国产情侣久久久久aⅴ免费| 国产精品网友自拍| 国产又粗又爽视频| 精品国产成人在线影院 | 日韩精品一区二区三区免费观影| 久操网在线观看| 免费在线看一区| 美女爆乳18禁www久久久久久 | 国产乱色精品成人免费视频| 亚洲欧洲偷拍精品| 高清视频在线观看三级| 亚洲伊人一本大道中文字幕| 国产精品一区二区av交换| 国产av天堂无码一区二区三区| 精品一二线国产| 538精品视频| 色诱视频网站一区| 五月激情六月婷婷| 午夜精品免费视频| 99国产精品免费网站| 久久久久亚洲av无码专区喷水| 麻豆91在线播放| 亚洲一二三精品| 91福利资源站| 极品白浆推特女神在线观看| 欧美亚州一区二区三区| 色老板在线视频一区二区| 国产日韩欧美精品在线观看| 国产suv精品一区二区883| 农村黄色一级片| 日韩欧美国产综合在线一区二区三区 | 亚洲怡红院av| 中文字幕日韩综合av| 亚洲天堂1区| 一区二区三区电影| 精品无人码麻豆乱码1区2区| 亚洲欧美另类日本| 欧美精品在线观看播放| 国产人成网在线播放va免费| 成人免费激情视频| 欧美高清一区| 久久久久久久久久影视| 黄色精品一区二区| 深夜福利视频在线免费观看| 538国产精品一区二区免费视频| 婷婷国产精品| 国产免费视频传媒| 国产精品素人一区二区| 91成年人视频| 免费不卡在线观看av| eeuss鲁片一区二区三区| 成人在线播放网址| 91丨九色porny丨蝌蚪| 91丨九色丨海角社区| 色综合影院在线| 免费观看亚洲天堂| av日韩一区二区三区| 2023国产精品自拍| 最好看的日本字幕mv视频大全| 日韩中文字幕亚洲| 亚洲第一二区| 欧美 日韩精品| 国产精品剧情在线亚洲| 国产黄色大片网站| 青青草一区二区| 99久久www免费| 无码成人精品区在线观看| 日韩欧美亚洲国产一区| 调教视频免费在线观看| 超碰97在线播放| 久久国产88| 免费在线观看a级片| 亚洲国产成人爱av在线播放| 97欧美成人| 欧美中文字幕在线观看视频| 国产性天天综合网| a网站在线观看| 欧美做爰性生交视频| 国产精品久久久久久久久久10秀 | 国内精品小视频在线观看| 久久综合色占| 日本美女久久久| 色一区在线观看| 四虎亚洲精品| 青青成人在线| 大桥未久av一区二区三区中文| 99re国产在线| 欧美黑人性视频| 欧美色就是色| 中文字幕在线永久| 91精品啪在线观看国产60岁| 一个人看的www视频在线免费观看| 亚洲三级一区| 97国产精品videossex| 国产超碰人人模人人爽人人添| 国产成人综合一区二区三区| 伊人狠狠色j香婷婷综合| 美国黄色片视频| 亚洲欧美日韩中文在线制服| 超碰精品在线观看|