精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

八問八答搞懂Transformer內部運作原理

人工智能 新聞
該研究對預訓練 LLM 進行了一系列實驗,其中包括試驗標準 transformer 執行策略的變化,并在僅解碼器 (Llama) 和僅編碼器 (BERT) 模型的各種基準上測量這些變化對模型性能的影響。

七年前,論文《Attention is all you need》提出了 transformer 架構,顛覆了整個深度學習領域。

如今,各家大模型都以 transformer 架構為基礎,但 transformer 內部運作原理,仍是一個未解之謎。

去年,transformer 論文作者之一 Llion Jones 宣布創立人工智能公司 Sakana AI。近期,Sakana AI 發表了一篇題為《Transformer Layers as Painters》的論文,探究了預訓練 transformer 中的信息流,并針對僅解碼器和僅編碼器凍結 transformer 模型進行了一系列實驗。請注意,該研究沒有對預訓練模型進行任何類型的微調。

圖片

論文地址:https://arxiv.org/pdf/2407.09298v1

該研究認為 transformer 的內部機制(特別是中間層)可以類比畫家作畫流水線來理解。

作畫流水線通常是將畫布(輸入)傳遞給一系列畫家。有些畫家擅長畫鳥類,而另一些畫家則擅長畫輪子。每個畫家從其下一級畫家那里收到畫布,然后其決定是否給畫作添加一些筆畫,或者只是將其傳遞給其上一級畫家(使用剩余連接)。

這個類比并不是一個嚴格的理論,而是一個思考 transformer 層的工具。受這個類比的啟發,該研究測試驗證了一些假設:

  • 各層是否都在使用相同的表征空間? 
  • 所有層都是必要的嗎?
  • 中間層都執行相同的功能嗎? 
  • 層的順序重要嗎?
  • 這些層可以并行運行嗎?
  • 對于某些任務來說,順序是否比其他因素更重要?
  • 循環有助于層并行嗎?
  • 哪些變體對模型性能影響最小?

該研究對預訓練 LLM 進行了一系列實驗,其中包括試驗標準 transformer 執行策略的變化,并在僅解碼器 (Llama) 和僅編碼器 (BERT) 模型的各種基準上測量這些變化對模型性能的影響。

各層是否都在使用相同的表征空間?

為了回答不同層是否使用相同的表征空間,作者測試了 Transformer 在跳過特定層或切換相鄰層的順序時是否具有穩健性。例如,在 Llama2-7B 中,第 6 層通常期望接收第 5 層的輸出。如果給第 6 層以第 4 層的輸出,它是否會出現「災難性」的行為?

在圖 2 中,我們可以看到,除了第一層和最后幾層之外,Llama2-7B 的各層對跳層或切換層都相當穩健。

圖片

該實驗表明,中間層共享一個表征空間,且與「外圍層」(第一層和最后幾層)擁有不同的表征空間。為了進一步驗證這一假設,作者效仿之前的研究,測量了基準中模型(Llama2-7B、Llama2-13B 和 BERT-Large)不同層的隱藏狀態激活之間的平均余弦相似度。圖 3 顯示了所有中間層之間的一致性。

這表明該模型可能具有「開始」、「中間」和「結束」層的三個不同的表征空間。回答問題 1:是的,中間層似乎共享一個共同的表征空間。

所有層都是必要的嗎?

為了進一步測試中間層的重定向空間是否真正共享(除了具有接近的余弦相似度之外),該研究嘗試了「跳過層」,即將第 N 層的輸出直接發送到第 N + M 層(其中 M > 1)的輸入中,從而「跳過」M ? 1 層,如圖 1a 所示。該實驗是為了看看第 N + M 層是否可以理解第 N 層的激活,盡管它僅根據從第 N + M ? 1 層發來的輸入進行訓練。圖 4 顯示,Llama2-7B 和 BERT-Large 在許多基準測試上性能均出現適度下降。回答問題 2,是否所有層都是必要的:

不,至少可以刪除一些中間層而不會發生災難性故障。

圖片

中間層都執行相同的功能嗎?

如果中間層都共享一個共同的表征空間,這是否意味著除此之外的中間層是多余的呢?為了測試這一點,研究者們重新運行了前一子節中的「跳過」實驗,他們將中間層的權重替換為中心層的權重,有效地在被替換的每一層上循環 T - 2N + 1 次,其中 T 是總層數(Llama2-7B 為 32 層,BERT-Large 為 24 層)。

圖片

如圖 5 所示,可以觀察到,隨著被替換層數的增加,模型在基準測試的得分迅速下降。從后文的圖 11 看來,這種替換層的做法比研究者們嘗試的其他方法都更糟糕。因此,研究者得出結論:中間層執行的是不同的功能,讓中間層之間共享權重并不可行。

圖片

層的順序重要嗎?

之前的實驗表明,中間層共享一個表示空間,但在該空間中負責不同的功能。下一個需要解決的問題是,這些功能的順序有何意義。為了解決這個問題,研究者們設計了兩組實驗。首先,以與訓練時相反的順序來運行中間層。具體來說,取第 T - N 層的輸出,將其輸入到第 T - N - 1 層,然后將這一層的輸出輸入到第 T - N - 2 層,依此類推,一直到第 N 層,再將這一層的輸出發送到后面的 T - N 層。在第二組實驗中,研究者采用隨機順序運行中間層,并在 10 個種子值上取平均值。

圖 6 和圖 7 分別顯示了反向和以隨機順序運行中間層的結果,模型在所有基礎測試集中都顯示出了逐漸下降的趨勢。這也表明雖然層的順序對模型來說有一定的重要性,但即使改變了順序,這些層仍然能夠發揮作用。

更有趣的是,隨機打亂層的順序比完全反過來效果更好。這可能是因為,隨機打亂的順序在某些方面保留了層之間的一些原有關系(即層 i 在層 j 之后,其中 i > j),而完全反過來則完全打破了這些關系。

這些層可以并行運行嗎?

為了驗證層本身存在比執行的順序更重要,研究者們設計了一個實驗,并行運行中間層,將它們的平均結果發送給最終的 N 層。

如圖 8 所示,模型在所有基準測試中的表現均呈現了一種平緩下降趨勢,然而,這種趨勢并不適用于 GSM8K 中的數學應用題。

實驗結果顯示,大部分情況下這種方法都是有效的,只是一些復雜的數學題處理得不太好。這種并行處理方法相比直接跳過一些層,效果更好,但不如按反向順序運行層的效果出色。基于此,研究者得出結論:并行運行層在一般情況下是可行的,但對于需要順序邏輯理解的數學問題,這種方法可能不太適用。

圖片

對于某些任務來說,順序是否比其他因素更重要? 

對于大多數經過「改造」的模型,在面對抽象推理(ARC)或數學推理(GSM8K)基準測試時,它們往往顯示出最陡峭的下降趨勢。這一現象可能源于逐步推理任務對于模型層級順序的敏感度遠高于那些主要依賴語義理解的常識性任務。與那些僅通過理解語義便能完成的任務不同,推理任務要求模型同時把握結構與含義。這種觀察與模型在單次處理過程中可能進行一定程度的順序依賴性推理的假設相吻合。

研究者使用了一個比喻來說明:如果畫一幅由許多不同元素組成的拼貼畫,那么畫的順序可能不那么重要;但如果是要畫一幅精確的建筑場景,那么每一筆的順序就變得非常重要了。據此,研究者得出了結論:數學和推理任務對模型層的順序具有更高的依賴性,而對于那些主要依賴語義理解的任務,順序的影響則相對較小。

循環有助于層之間并行嗎?

沿用上一節中畫畫的的比喻,當畫家在畫一幅畫時,不是一開始就畫所有東西,而是先畫一部分,比如車身,然后再根據這部分來添加其他的東西,比如車輪。在 AI 模型中,層就是所謂的畫家,處理信息就是在畫畫,如果先得到了正確的信息,也就先畫出了所謂的車身,那么它們就能更好地完成自己的工作,為畫作添加車輪。

對于 transformer 而言,當給予適當的輸入時,層可能只在前向傳播中做出貢獻,并非通過殘差連接「傳遞」輸入。如果情況確實如此,那么迭代上一個實驗中的并行層應該比單次執行并行層更能提高模型的性能。基于此,研究者通過將并行層的平均輸出反饋到同一層中進行固定次數的迭代來測試這一點。

圖 9 展示了將并行層循環 3 次的結果。循環并行 3 次的結果顯著優于單次迭代(并行層)。起始層 N 設定為 15(針對 Llama2-7B 模型)或 11(針對 BERT 模型)時,即處于每種情況的極左端點,僅有單一的層級受到影響。在這種特定情況下,三次循環并行的效果等同于單純地將中間層重復三次。與此同時,對于這一點上的并行層而言,其性能與完整模型無異。

圖片

研究者們還針對不同的迭代次數重復了相同的實驗。圖 10 展示了 Llama2-7B 的性能隨并行化層數 M 和迭代次數的變化情況。每個 M 的最高性能迭代次數用紅框標出。除了 M=29 和 M=31(幾乎并行化所有層)外,最佳迭代次數大致與并行化層數成線性比例。因此,研究者得出的結論是:最佳迭代次數與并行化層數成正比。

圖片

如何調整層,對模型性能的影響最小?

最后,在圖 11 中,研究者們將所有實驗中對 Transformer 的「改造」進行了比較,在一個圖表上顯示了所有基準測試的中位數或平均性 。 

圖片

中間重復 —— 用相同數量的中間層副本替換中間層 —— 表現最差, 很快就降到了隨機基線的性能。相反,循環并行和隨機層順序的影響最小。因此,研究者得出的結論是:重復單一層的影響最嚴重。隨機化層順序和循環并行的影響最小。 

這些實驗整體上顯示出平緩的性能下降,但研究者仍然不清楚為什么這些層在大多數擾動下還能保持一定的穩健性,這個問題還需在未來的研究中進一步探討。 

更多細節請參見原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2021-11-09 09:30:52

OkHttp面試Android

2010-10-26 16:07:43

虛擬化災難恢復

2009-11-12 08:46:46

Windows 7系統安裝

2021-01-11 08:30:02

Dubbo服務

2012-02-24 10:28:32

2012-02-23 14:45:45

Linkedin運作原理

2010-05-28 15:47:16

雙絞線

2022-04-01 08:37:07

SpringAPI前端

2012-10-31 09:41:47

WAN優化SSLHTTPS

2014-12-15 11:16:34

vCenter SRM

2021-06-28 05:59:17

Webpack 前端打包與工程化

2022-02-14 08:25:50

Go語言面試

2024-10-16 07:58:48

2025-10-24 12:11:38

MetaAI模型

2011-08-05 11:06:33

VMware vSph虛擬化

2023-11-06 11:13:58

Bean占位符標記

2011-11-03 09:29:32

2016-12-12 14:55:01

AndroidAndroid Vie

2011-12-08 09:47:08

虛擬化應用虛擬化
點贊
收藏

51CTO技術棧公眾號

国产欧美日韩精品a在线观看| 手机亚洲手机国产手机日韩| 天天综合网 天天综合色| 国产综合18久久久久久| www.色国产| 小说区亚洲自拍另类图片专区| 日韩欧美一级二级| koreanbj精品视频一区| 91啦中文在线| 成人精品鲁一区一区二区| 欧美一级在线播放| 久久久久久久久久97| 高清日韩中文字幕| 欧美亚洲国产一区二区三区| 青青在线免费视频| 日本v片在线免费观看| 免费观看成人av| 欧美精品精品精品精品免费| 极品蜜桃臀肥臀-x88av| 99精品在免费线中文字幕网站一区 | 在线免费观看视频一区| 日本大片免费看| www日韩tube| 97久久久精品综合88久久| 国产欧美精品xxxx另类| 青青草成人av| 欧美69视频| 最近2019中文字幕mv免费看| 亚洲第九十七页| 日本一区二区乱| 欧美三电影在线| 久久久久久久久久久福利| 色老头在线观看| 国产精品国产馆在线真实露脸| 久久久99国产精品免费| 亚洲AV无码成人片在线观看| 卡一卡二国产精品| 日韩男女性生活视频| 免费一级全黄少妇性色生活片| 日韩免费高清| 永久免费毛片在线播放不卡| 懂色av粉嫩av蜜乳av| 中文字幕一区日韩精品| 欧美精品久久久久久久多人混战| 激情五月开心婷婷| 黄色激情在线播放| 亚洲一区二区三区免费视频| 国产免费xxx| 免费观看久久久久| 国产精品久久久久久久久免费桃花 | 福利网址在线观看| 亚洲午夜激情在线| 欧美激情高清视频| 久久久精品一区二区涩爱| 香蕉精品视频在线观看| 色婷婷综合久久久久| аⅴ天堂中文在线网| 精品久久视频| 在线观看视频亚洲| 国产视频123区| 青青草国产免费一区二区下载| 亚洲美腿欧美激情另类| 爱爱免费小视频| 亚洲三级网页| 亚洲图片欧美午夜| www成人啪啪18软件| 成人嫩草影院| www.亚洲免费视频| 欧美偷拍第一页| 欧美日韩一卡| 高清欧美性猛交xxxx| 国产极品美女高潮无套嗷嗷叫酒店| 欧美日韩亚洲三区| 性欧美激情精品| 久久国产视频一区| 久久午夜精品| 国产欧美精品日韩精品| 夜夜躁狠狠躁日日躁av| 国产精品中文字幕日韩精品| 国产乱码精品一区二区三区中文| 天天操天天干天天爽| 久久嫩草精品久久久精品| 日韩av影视| 日本在线免费| 亚洲午夜在线观看视频在线| 玩弄中年熟妇正在播放| 一呦二呦三呦精品国产| 欧美精品一二三四| 丰满熟女人妻一区二区三区| 日韩美女精品| 尤物yw午夜国产精品视频| 黄色录像二级片| 亚洲黄色免费| 国产精选久久久久久| 亚洲av永久无码国产精品久久| proumb性欧美在线观看| 日韩欧美一区二区三区四区| 最爽无遮挡行房视频在线| 图片区日韩欧美亚洲| 国产成人av影视| 国产视频一区二| 日韩经典一区二区三区| 成年人免费视频播放| 狠狠综合久久| 国产精品久久久久久久av大片| 亚洲大尺度网站| 国产欧美日韩一区二区三区在线观看| 91成人在线视频观看| 88xx成人永久免费观看| 日韩欧美国产精品| 日韩欧美亚洲一区二区| 日韩黄色短视频| 免费视频观看成人| 亚洲精品国产品国语在线 | 中文成人av在线| 热99这里只有精品| 亚洲我射av| 亚洲人成电影网站| 国产一级片免费| 精品一区在线看| 欧美中日韩免费视频| 青草在线视频| 欧美一区二区三区四区在线观看| 五月激情四射婷婷| 99热这里只有精品8| 91麻豆精品秘密入口| 国产一区电影| 日韩欧美中文字幕在线观看 | 国产精品一区二区三区av| 一区二区三区国产视频| 91久久国产视频| 国产成人综合网| 国产手机视频在线观看| 97精品国产综合久久久动漫日韩| 日韩av在线免播放器| 久久久久99精品| 国产成人午夜电影网| www.亚洲一区二区| 美女视频一区| 日韩在线视频线视频免费网站| 无码一区二区三区| 久久久久亚洲蜜桃| 久久国产乱子伦免费精品| 图片婷婷一区| 国产91精品久久久久久久| 日本黄色不卡视频| 午夜一区二区三区视频| 四虎精品一区二区| 亚洲九九精品| 久久大片网站| 在线精品亚洲欧美日韩国产| 精品五月天久久| av黄色在线看| 91美女在线视频| 97xxxxx| 国产亚洲精品美女久久久久久久久久| 日本精品一区二区三区在线| 欧美日本网站| 欧美羞羞免费网站| 黄色激情小视频| 国产一区在线观看麻豆| 成人手机在线播放| 99久久人爽人人添人人澡| 欧美精品第一页在线播放| 亚洲欧美综合在线观看| 精品美女永久免费视频| a级大片在线观看| 日本午夜一区二区| 一区二区精品国产| 国产精品亚洲综合在线观看 | 欧美xnxx| 日韩在线中文字幕| 亚洲精品视频网| 精品日本高清在线播放| 精品人妻互换一区二区三区| 蜜臀91精品一区二区三区| 99热这里只有精品7| 一区二区三区四区精品视频 | 伊人久久婷婷色综合98网| 国产精品一区二区三区av| 国内精品伊人久久| 国产主播福利在线| 51午夜精品国产| 日本在线观看中文字幕| 国产婷婷色一区二区三区| 久久6免费视频| 国内综合精品午夜久久资源| 欧美日韩免费观看一区| 亚洲影视资源| 97色在线视频| 日本在线免费中文字幕| 亚洲精品91美女久久久久久久| 四虎影院在线免费播放| 亚洲精品老司机| 成人免费av片| 久久超级碰视频| 欧美午夜性视频| 日韩欧美网址| 国产伦精品一区二区三区视频免费| 亚洲精品一级二级| 欧美激情久久久久| 国产天堂素人系列在线视频| 日韩午夜激情av| 中文字幕精品三级久久久| 成人免费一区二区三区视频| 欧美熟妇精品黑人巨大一二三区| 国产乱码精品一区二区三区av| 国产乱子夫妻xx黑人xyx真爽| 香蕉久久网站| 日韩中文字幕av在线| 黄色免费大全亚洲| 91精品国产综合久久香蕉922| 亚洲精品福利电影| 欧美贵妇videos办公室| 自拍视频在线免费观看| 日韩精品久久久久久福利| 99在线小视频| 欧美色综合网站| aaa人片在线| 亚洲成人动漫在线观看| 成人高潮免费视频| 国产精品美女一区二区| 黄色性生活一级片| 成人网在线免费视频| 99999精品| 精品制服美女久久| 欧美日韩一区二区三区69堂| 性欧美videos另类喷潮| 久久国产精品视频在线观看| 欧美日本二区| 看全色黄大色大片| 永久91嫩草亚洲精品人人| 天堂精品一区二区三区| 国产一区二区三区四区二区| 久久久久久九九九九| 精品三级av| 国产精品一区在线观看| 91精品入口| 成人免费观看网站| 亚洲啊v在线免费视频| 91老司机在线| 欧美a在线观看| 91亚洲精品在线| 国产aⅴ精品一区二区四区| 成人国产精品色哟哟| 日韩大陆av| 国产精品亚洲综合天堂夜夜| 成人亚洲免费| 91精品中文在线| 国产精品日韩精品在线播放| 亚洲精品日韩激情在线电影| 成人污污视频| 国产成人免费观看| 哺乳一区二区三区中文视频| 国产精品中出一区二区三区| 久久亚州av| 欧美日韩大片一区二区三区| 欧美极品中文字幕| 亚洲国产精品一区二区第四页av| 欧美理论在线播放| 在线观看一区欧美| 亚洲最新色图| www..com日韩| 久久久一二三| 亚欧美在线观看| 国产成人在线观看| 中文字幕在线观看网址| 国产免费成人在线视频| 永久免费看mv网站入口| 亚洲精品中文在线观看| 五月天婷婷网站| 欧美日韩性视频在线| 日韩欧美国产另类| 欧美精品在线视频| 欧美一级免费片| 亚洲女人天堂av| 黄色视屏免费在线观看| 久久久久久久久国产| sis001欧美| 成人激情视频免费在线| 国产精品毛片久久久| 欧美成人在线免费观看| 亚洲91视频| 黄色网页免费在线观看| 奇米亚洲午夜久久精品| 中文字幕乱妇无码av在线| 91小视频在线观看| 国精产品一区一区| 亚洲一区二区高清| 成人毛片一区二区三区| 日韩一区二区三| 免费在线看v| 久久99精品久久久久久青青91 | 欧美在线播放| 国产偷人视频免费| 国产乱码精品1区2区3区| 免费在线观看你懂的| 18欧美亚洲精品| 久久久久女人精品毛片九一| 制服丝袜亚洲网站| 男人久久精品| 欧美激情亚洲一区| 国产福利亚洲| 欧美福利一区二区三区| 欧美日韩亚洲国产精品| 日本xxxx黄色| 91首页免费视频| 欧美成人精品激情在线视频| 91福利国产成人精品照片| 成人午夜免费福利| 日韩中文视频免费在线观看| 丁香六月综合| 国产精品免费一区二区| 天堂网在线观看国产精品| 成人在线看视频| 波多野结衣中文字幕一区二区三区| 日韩一区二区三区四区视频| 一本色道**综合亚洲精品蜜桃冫 | 亚洲人成电影网站色xx| segui88久久综合9999| 91久热免费在线视频| 欧美日韩中文字幕一区二区三区| 精品久久一二三| 成人午夜短视频| 久草资源在线视频| 51午夜精品国产| 免费大片黄在线观看视频网站| 国产精品久久久久国产a级| 香蕉久久精品| 国产毛片视频网站| 丰满放荡岳乱妇91ww| 国产女人18水真多毛片18精品| 色偷偷88欧美精品久久久| 午夜在线视频免费| 韩国国内大量揄拍精品视频| 成人福利一区| 18禁裸男晨勃露j毛免费观看 | 91精品国产99久久久久久红楼| 日韩欧美视频| 天天摸天天舔天天操| 国产精品久久久久天堂| 亚洲中文一区二区三区| 中文字幕亚洲天堂| 国产三级一区| 一区二区三区偷拍| 麻豆精品一二三| 992在线观看| 56国语精品自产拍在线观看| 免费超碰在线| 99re视频| 精品不卡视频| www.免费av| 在线精品视频小说1| jyzzz在线观看视频| 国产日韩欧美夫妻视频在线观看 | 激情成人开心网| 成人性视频免费网站| 国产午夜精品无码| 亚洲精品久久久久中文字幕欢迎你 | 丝袜美腿一区二区三区动态图| 国产主播在线看| 国产视频在线观看一区二区三区| 亚洲av综合一区| 日韩中文理论片| 日韩激情综合| www在线观看免费| 久久精品无码一区二区三区| 波多野结衣电车| xxx一区二区| 91精品入口| 国产精品亚洲二区在线观看| 欧美激情在线看| aa视频在线免费观看| 97视频在线观看视频免费视频 | 日韩精品一区二区三区国语自制| 亚洲精品久久在线| 国产小视频免费在线观看| av一区二区三区四区| 99国产在线视频| 欧美日韩伦理片| 亚洲在线视频免费观看| 男女高潮又爽又黄又无遮挡| 国产精品毛片久久| 中国男女全黄大片| 亚洲成人av资源| 成年在线观看免费人视频| 国产精品亚洲自拍| 狠狠综合久久| 亚洲av熟女国产一区二区性色| 717成人午夜免费福利电影| 久久亚洲资源| 午夜精品福利一区二区| 国产精品一区在线观看乱码| 欧美啪啪小视频| 久久久国产一区二区三区| 国产精品网站在线看| 日韩av影视在线| 一区二区三区精彩视频| 国内揄拍国内精品| 99re6这里只有精品|