精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

字節豆包大模型團隊突破殘差連接局限!預訓練收斂最快加速80%

人工智能 新聞
字節跳動豆包大模型團隊于近日提出超連接(Hyper-Connections),一種簡單有效的殘差連接替代方案。面向殘差連接的主要變體的局限問題,超連接可通過動態調整不同層之間的連接權重,解決梯度消失和表示崩潰(Representation Collapse)之間的權衡困境。在 Dense 模型和 MoE 模型預訓練中,超連接方案展示出顯著的性能提升效果,使收斂速度最高可加速 80%。

自從 ResNet 提出后,殘差連接已成為深度學習模型的基礎組成部分。其主要作用是 —— 緩解梯度消失問題,使得網絡的訓練更加穩定。

但是,現有殘差連接變體在梯度消失和表示崩潰之間存在一種 “蹺蹺板式” 的權衡,無法同時解決。

為此,字節豆包大模型 Foundation 團隊于近日提出超連接(Hyper-Connections),針對上述 “蹺蹺板式” 困境,實現了顯著提升。

該方法適用于大規模語言模型(LLMs)的預訓練,在面向 Dense 模型和 MoE 模型的實驗中,展示了顯著性能提升效果,使預訓練收斂速度最高可加速 80%。

圖片

研究團隊還發現,超連接在兩個小型的視覺任務中表現同樣優異,這表明,該方法在多個領域有廣泛的應用前景。

圖片

  • 論文標題:Hyper-Connections
  • 論文鏈接:https://arxiv.org/pdf/2409.19606

1. 超連接的核心思想

前文提及,殘差連接的兩種主要變體 Pre-Norm 和 Post-Norm 各自都有其局限性,具體體現如下:

  • Pre-Norm:在每個殘差塊之前進行歸一化操作,可有效減少梯度消失問題。然而,Pre-Norm 在較深網絡中容易導致表示崩潰,即深層隱藏表示過于相似,從而削弱了模型學習能力。
  • Post-Norm:在殘差塊之后進行歸一化操作,有助于減少表示崩潰問題,但也重新引入梯度消失問題。在 LLM 中,通常不會采用此方法。

超連接的核心思路在于 —— 引入可學習的深度連接(Depth-connections)和寬度連接(Width-connections)。

從理論上,這使得模型不僅能夠動態調整不同層之間的連接強度,甚至能重新排列網絡層次結構,彌補了殘差連接在梯度消失和表示崩潰(Representation Collapse)之間的權衡困境。

深度連接與寬度連接

起初,該方法會將網絡輸入擴展為 n 個隱向量(n 稱作 Expansion rate)。之后每一層的輸入都會是 n 個隱向量,超連接會對這些隱向量建立以下兩類連接:

  • 深度連接(Depth-Connections):這些連接類似于殘差連接,只為輸入與輸出之間的連接分配權重,允許網絡學習不同層之間的連接強度。
  • 寬度連接(Width-Connections):這些連接使得每一層多個隱藏向量之間可進行信息交換,從而提高模型表示能力。

靜態與動態超連接

超連接可以是靜態的,也可以是動態的。

其中,靜態超連接(Static Hyper-Connections, SHC)意味著連接權重在訓練結束后固定不變。而動態超連接(Dynamic Hyper-Connections, DHC)則對應連接權重可根據輸入動態調整。實驗表明,動態超連接效果更好。

2. 技術細節

超連接(Hyper-connections)

首先,考慮第 層的輸入隱藏向量圖片,網絡的初始輸入為圖片,并將其復制 n 次,形成初始的超隱藏矩陣(Hyper Hidden Matrix):

圖片

這里,n 稱為擴展率(Expansion Rate)。在第 k 層,輸入是上一層的超隱藏矩陣圖片,即:

圖片

對最后一層的超隱藏矩陣逐行求和,得到所需的隱藏向量,并通過一個投影層輸出網絡最終的結果(在 Transformer 中即為歸一化層和解嵌入層)。

為了簡化后續分析的符號表示,作者省略層索引,直接將超隱藏矩陣表示為:

圖片

超連接可以用一個矩陣來表示,對于擴展率為 n 的情況,超連接矩陣 HC 如下:

圖片

考慮一層網絡圖片,它可能是 Transformer 中的 attention 層或者是 FFN 層。超連接的輸出 圖片可以簡單地表示為:

圖片

也就是說,用 圖片作為權重對輸入 圖片進行加權求和,得到當前層的輸入圖片

圖片

同時,圖片用于將 圖片映射到殘差超隱藏矩陣圖片,表示如下:

圖片

最終的輸出表達式為:

圖片

偽代碼如下:

圖片

動態超連接的實現

超連接矩陣 圖片的元素可以動態依賴于輸入 圖片,動態超連接的矩陣表示為:

圖片

同樣,給定層 圖片和輸入圖片,可以得到動態超連接的輸出:

圖片

在實際操作中,團隊結合了靜態和動態矩陣來實現動態超連接,動態參數通過線性變換獲得。

為了穩定訓練過程,團隊在線性變換前引入歸一化,并在其后應用 tanh 激活函數,通過一個可學習的小因子進行縮放。動態參數的計算公式如下:

圖片

實驗表明,動態超連接在語言建模任務中優于靜態超連接。

3. 為什么使用超連接(Hyper-Connections)

研究團隊認為,殘差連接的兩種變體,即前歸一化(Pre-Norm)和后歸一化(Post-Norm),可以被視為不可訓練的超連接。

隨后,團隊引入了順序 - 并行二象性概念,展示了超連接如何動態優化層的排列以提升網絡性能。

殘差連接是不可訓練的超連接

前歸一化和后歸一化的殘差連接可以表示為以下擴展率為 圖片的超連接矩陣:

圖片

其中,圖片和 圖片 分別表示神經網絡層輸入和輸出的標準差,圖片表示它們之間的協方差。

對于 Pre-Norm,其超連接矩陣是一個 圖片的矩陣,右下三角部分填充為 1,其余部分為占位符 0。對于 Post-Norm,權重依賴于輸入和輸出的方差及協方差,形成一個 圖片的矩陣。因此,它們的超連接矩陣是不可訓練的。

而本工作提出的方法的超連接矩陣是 圖片矩陣,且權重是可訓練的,甚至可以基于輸入進行動態預測。

順序 - 并行二象性

給定一系列神經網絡模塊,我們可以將它們順序排列或并行排列。作者認為,超連接可以學習如何將這些層重新排列,形成順序和并行配置的混合。

圖片

在不失一般性的情況下,可以將擴展率設置為 n=2。如果超連接以如下矩陣形式學習,神經網絡將被順序排列:

圖片

在這種情況下,深度連接退化為殘差連接,如圖 (a) 所示。

當奇數層和偶數層的超連接矩陣分別定義為以下形式時,神經網絡每兩層將被并行排列,類似于 Transformer 中的 parallel transformer block 的排列方式,如圖 (b) 所示。

圖片

因此,通過學習不同形式的超連接矩陣,網絡層的排列可以超越傳統的順序和并行配置,形成軟混合甚至動態排列。對于靜態超連接,網絡中的層排列在訓練后保持固定;而對于動態超連接,排列可以根據每個輸入動態調整。

4. 實驗結果

實驗主要集中在大規模語言模型的預訓練上,涵蓋了 Dense 模型和 MoE 模型。

實驗結果表明,使用超連接的模型顯著優于使用殘差連接的模型。

1B Dense 模型實驗

圖片

只要擴展率 > 1,效果就十分顯著,且訓練更穩定,消掉了訓練 loss 的 spikes。

7B Dense 模型實驗

團隊甚至 Scale 到了 7B 模型,效果也十分亮眼,同時可以看到有超連接的網絡訓練更穩定。

7B 候選激活 1.3B 的 MoE 模型實驗

圖片

可以看到,下游指標全漲,在 ARC-Challenge 上甚至漲了 6 個百分點。

圖片

綜上,研究團隊介紹了超連接(Hyper-Connections),它解決了殘差連接在梯度消失和表示崩潰之間的權衡問題。實驗結果表明,超連接在大規模語言模型的預訓練以及視覺任務中都表現出顯著的性能提升。

值得注意的是,超連接的引入幾乎不增加額外的計算開銷或參數量,團隊認為,該成果具有廣泛的應用潛力,可以推廣到文音視圖模態的不同任務上,包括多模態理解、生成基座模型等。

5. 寫在最后

團隊關注底層問題,尤其在 LLMs 和多模態方面,期望實現更多突破。

更多團隊技術研究進展,可以進入「豆包大模型團隊」技術解讀欄目了解。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-02-29 11:56:10

AI模型

2025-04-29 09:10:00

2024-11-02 10:28:03

2024-08-08 17:48:56

2023-01-05 09:33:37

視覺模型訓練

2025-03-18 08:00:00

豆包文生圖技術Seedream

2025-11-04 16:02:42

模型訓練AI

2024-05-15 10:59:40

火山引擎豆包扣子

2025-05-26 09:00:00

2025-08-24 09:24:07

2024-11-08 14:10:00

模型視頻生成

2025-11-05 08:53:45

語言模型訓練AI

2024-11-04 00:24:56

2025-06-19 10:09:55

2025-08-13 01:00:00

2024-11-01 20:25:28

2023-07-18 15:05:00

開源大模型

2024-10-23 08:24:13

2025-06-11 17:31:28

點贊
收藏

51CTO技術棧公眾號

国产精品va| 国产精品久久久久久久久免费高清| 国产成人h网站| 97视频在线播放| 中国女人特级毛片| 国产成人免费av一区二区午夜| 亚洲制服丝袜在线| 色综合电影网| 高潮一区二区三区乱码| 男人的天堂成人在线| 色婷婷久久一区二区| 成人在线观看一区二区| 日本免费久久| 亚洲一区二三区| 色噜噜狠狠色综合网| 国产黄色av网站| 强制捆绑调教一区二区| 欧美黑人性猛交| 久久久久久久久福利| 天堂久久av| 欧美色精品在线视频| 欧美在线观看黄| a视频网址在线观看| 成人激情小说网站| 成人一区二区电影| 波多野结衣视频观看| 一区在线视频| 美日韩精品视频免费看| 亚洲第一综合网| 欧美国产极品| 精品国产免费视频| 午夜影院免费观看视频| 国产精品99| 日韩欧美极品在线观看| 男人天堂手机在线视频| 菠萝菠萝蜜在线视频免费观看| 日本一区二区成人| 欧美大香线蕉线伊人久久国产精品 | 中文字幕精品一区二区精| 精品电影一区| 欧美国产中文字幕| 欧美日韩国产精品综合| 91tv精品福利国产在线观看| 国产小视频91| 超碰97人人干| 亚洲盗摄视频| 亚洲精品美女久久| 欲求不满的岳中文字幕| 国产福利资源一区| 亚洲成人aaa| 污污免费在线观看| 精品成人自拍视频| 亚洲精品www久久久久久广东| 亚洲熟女一区二区三区| 日韩三级精品| 欧美变态tickle挠乳网站| 一级日本黄色片| 久久gogo国模啪啪裸体| 91精品欧美久久久久久动漫 | 亚洲精品黄网在线观看| 黑人玩弄人妻一区二区三区| 少妇精品在线| 欧美精品一区二区精品网| 日本不卡视频一区| 欧美日日夜夜| 国产丝袜一区视频在线观看 | 伦理一区二区| 亚洲精品电影在线观看| 美女又爽又黄免费| 亚洲宅男网av| 色琪琪综合男人的天堂aⅴ视频| 无码人中文字幕| 93在线视频精品免费观看| 久久精品久久久久久| www欧美com| 欧美午夜在线| 91国内在线视频| 五月天视频在线观看| 久久99国产综合精品免费| 激情欧美国产欧美| 91国内在线视频| 91视频在线视频| 六月丁香婷婷色狠狠久久| 国产啪精品视频| av中文字幕免费在线观看| 国产91对白在线观看九色| 精品国产一区二区三区四区精华| 头脑特工队2在线播放| 国产视频一区在线观看| 国产福利片一区二区| www在线看| 色一情一乱一乱一91av| 国产美女18xxxx免费视频| 秋霞午夜一区二区三区视频| 亚洲精品美女久久久| 国产3级在线观看| 欧美激情性爽国产精品17p| 97精品国产97久久久久久免费| 糖心vlog精品一区二区| 国产精品18久久久| 免费看污久久久| 国产在线看片| 色综合久久久久综合| 国内自拍第二页| 特黄特色欧美大片| 久久在线精品视频| 无码人妻久久一区二区三区不卡| 国产麻豆91精品| 欧美日韩国产高清视频| www.久久ai| 在线看不卡av| 第一页在线视频| 日韩精品四区| 26uuu久久噜噜噜噜| 97在线视频人妻无码| 久久亚洲一区二区三区明星换脸| 国产专区在线视频| 黄页免费欧美| 亚洲毛茸茸少妇高潮呻吟| 天天干中文字幕| 久久精品国产精品亚洲红杏| 久久国产精品亚洲va麻豆| 含羞草www国产在线视频| 一本色道久久综合狠狠躁的推荐| 亚洲欧洲日韩综合| 68国产成人综合久久精品| 日韩av电影院| 午夜成人免费影院| 亚洲第一福利一区| xxxx国产视频| 综合精品久久| 91影视免费在线观看| avtt在线播放| 91国偷自产一区二区开放时间 | 一区二区亚洲精品国产| 99精品视频99| av一区二区久久| www.国产在线播放| 亚洲天堂中文字幕在线观看| 久久综合伊人77777蜜臀| 中文字幕在线视频第一页| 国产欧美一区二区在线观看| 国产91美女视频| 日韩av不卡一区| 国内精品久久久久| 男人天堂网在线视频| 亚洲国产精品尤物yw在线观看| 国内av免费观看| 亚洲综合专区| 91沈先生播放一区二区| 日韩成人伦理| 精品久久久久99| 久久精品久久国产| 成人午夜免费电影| 国产日韩欧美精品在线观看| 动漫av一区| 538国产精品一区二区在线| 天天综合在线视频| 欧美日韩综合视频| 久久久久久国产精品无码| 日本不卡视频一二三区| 水蜜桃亚洲精品| 青青在线精品| 大胆人体色综合| 亚洲av无码国产综合专区| 亚洲一区二区三区三| jlzzjizz在线播放观看| 久久国产88| 天天综合色天天综合色hd| 素人啪啪色综合| 久久综合免费视频| 色偷偷在线观看| 色综合久久综合网| 中文字幕求饶的少妇| 国产精品白丝av| 国产极品在线视频| 日韩久久精品| 亚洲最大的网站| 国产ktv在线视频| 国产一区二区成人| 超碰在线人人干| 精品国产鲁一鲁一区二区张丽 | 色哟哟精品视频| 国产精品国产三级国产在线观看| 亚洲伊人久久大香线蕉av| 超碰在线最新网址| 在线成人激情黄色| 精品国产av 无码一区二区三区| 午夜久久久影院| 色欲AV无码精品一区二区久久 | 漂亮人妻被黑人久久精品| 久久经典综合| 午夜啪啪福利视频| 色婷婷狠狠五月综合天色拍| 91精品久久久久| 爱啪啪综合导航| 中文字幕国产日韩| 人妻精品无码一区二区| 欧美综合一区二区三区| 久久亚洲AV无码| 中文字幕av一区二区三区免费看| 9.1在线观看免费| 奇米影视在线99精品| 免费看欧美黑人毛片| 欧美日中文字幕| 激情视频一区二区| 无码人妻久久一区二区三区 | 最新黄网在线观看| 日韩电影大片中文字幕| 国产内射老熟女aaaa∵| 色综合久久综合网欧美综合网 | 美女欧美视频在线观看免费 | 日本不卡免费播放| 日韩一区二区三区视频| 波多野结衣二区三区| 午夜电影网一区| 久久国产高清视频| 国产日韩亚洲欧美综合| 影音先锋人妻啪啪av资源网站| 精品无人区卡一卡二卡三乱码免费卡| 97国产在线播放| 欧美黄色精品| 亚洲国产精品一区二区第一页 | 国产在线一区观看| 激情五月开心婷婷| 亚洲电影成人| 日本道在线视频| 欧美成人精品一区二区三区在线看| 九色综合日本| 波多野结衣欧美| 97伦理在线四区| 高清一区二区三区av| 国产精品视频久久| 日韩精品影院| 日本精品免费观看| 91超碰在线播放| 欧美国产日韩在线| 超碰在线观看免费| 久久精品在线视频| 黄视频网站在线| 久久精品国产一区| 午夜国产福利在线| 最好看的2019的中文字幕视频| 青青青草原在线| 亚洲精品电影在线观看| 色婷婷av一区二区三| 亚洲成人av在线| 三级小视频在线观看| 精品国产伦一区二区三区观看方式| 国产强被迫伦姧在线观看无码| 欧美高清一级片在线| 97超碰人人草| 91麻豆精品国产91久久久| 一区二区三区精彩视频| 欧美日韩国产中文| 国产农村老头老太视频| 欧美一级一区二区| 亚洲a视频在线观看| 日韩美女视频一区二区在线观看| 亚洲福利在线观看视频| 精品国产露脸精彩对白| 亚洲欧美一区二区三| 亚洲欧洲自拍偷拍| 超碰在线影院| 久久夜色精品国产亚洲aⅴ| а天堂中文在线官网| 欧美俄罗斯性视频| 蜜桃视频在线网站| 日本一本a高清免费不卡| 黄瓜视频成人app免费| 国产精品永久免费| 日韩黄色av| 精品伦精品一区二区三区视频| 亚洲欧洲av| 亚洲制服中文| 国产一区二区中文| 久久无码高潮喷水| 久久国产日韩欧美精品| 性一交一黄一片| 久久综合一区二区| 亚洲毛片亚洲毛片亚洲毛片| 一区二区三区四区五区视频在线观看| 国产无码精品视频| 色婷婷综合久久久久中文一区二区| 国产乡下妇女三片| 欧美成人一区二区三区在线观看| 午夜视频1000| 日韩在线精品视频| 午夜小视频福利在线观看| 日本精品中文字幕| 99久久999| 久久综合毛片| 91精品国产乱码久久久久久久| 国产精品第157页| 日韩二区在线观看| 美女被爆操网站| 国产欧美日韩视频一区二区| 欧美黑吊大战白妞| 一本到高清视频免费精品| www.久久成人| 亚洲一区av在线播放| 成人av影院在线观看| 国产日韩欧美在线观看| 欧美a大片欧美片| 懂色av一区二区三区四区五区| 亚洲三级影院| 日韩av福利在线观看| 国产亚洲精品中文字幕| 久久精品这里只有精品| 欧美视频中文一区二区三区在线观看| 亚洲毛片欧洲毛片国产一品色| 在线日韩日本国产亚洲| 国产理论在线| 97在线电影| 久久国产电影| 激情婷婷综合网| av影院午夜一区| 久久久91视频| 欧美肥妇毛茸茸| 国产女主播在线直播| 91精品国产91久久久| 麻豆一区在线| 亚洲综合欧美日韩| 久久国产精品99国产| 国产大尺度视频| 亚洲欧美国产三级| 瑟瑟视频在线免费观看| 国产午夜精品麻豆| 丁香花在线高清完整版视频| 亚洲字幕一区二区| 四季av一区二区凹凸精品| 欧美日韩在线免费播放| 91小视频免费看| 国产又黄又爽又色| 精品久久久久久久久久久久久久久久久 | 亚洲色图欧美制服丝袜另类第一页| xxxx视频在线| 国产精品久久久久久久久婷婷| 午夜精品免费| aaaaaaaa毛片| 樱花影视一区二区| 国产免费不卡视频| 久久九九免费视频| 亚洲综合资源| 亚洲一区二区在线看| 欧美a一区二区| 天堂久久精品忘忧草| 色综合久久66| 精品久久久久一区二区三区| 日本欧美黄网站| 国内亚洲精品| 成人亚洲精品777777大片| 国产欧美日韩不卡| 伊人色综合久久久| 日韩一中文字幕| 3d动漫一区二区三区在线观看| 一级黄色免费在线观看| 国产精品18久久久| 国产无遮无挡120秒| 亚洲精品乱码久久久久久金桔影视 | 久久全球大尺度高清视频| 国产福利资源一区| 久久久噜噜噜www成人网| 国产视频911| 在线免费观看av片| 精品国内亚洲在观看18黄| 欧洲一区在线| 成人免费aaa| 久久久久久久久免费| 亚洲一区二区色| 欧美乱大交xxxxx| 国产精品对白| av动漫免费看| 久草视频一区二区| 最近2019中文字幕在线高清| 99精品美女视频在线观看热舞| 久青草视频在线播放| 99re成人精品视频| 天天干天天插天天射| 精品激情国产视频| 久久超级碰碰| 日韩免费高清在线| 亚洲精品老司机| 亚洲三级中文字幕| 国产欧美日韩综合精品| 欧美区一区二| 中文字幕网站在线观看| 欧美一区午夜视频在线观看| yellow字幕网在线| 亚洲巨乳在线观看| www.成人在线| 91麻豆成人精品国产| 668精品在线视频| 日韩三级在线| 免费不卡的av| 欧美在线观看你懂的| 里番在线播放| 制服国产精品| 93久久精品日日躁夜夜躁欧美| 97免费观看视频|