精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

MIT斯坦福Transformer最新研究:過度訓練讓中度模型「涌現」結構泛化能力

人工智能 新聞
雖然Transformer架構存在一些明顯的限制(例如無法實現無限遞歸),但研究人員的結果表明它可能具有比以前認為的更強的歸納偏好:通過充分的訓練,Transformer能夠表示分層的句子結構并利用這種結構進行正確的泛化。

對于人類來說,句子是分層的。

句子的層次結構對于表達和理解都相當重要。

但是在自然語言處理中,之前的研究認為,在泛化到新的結構輸入時,以Transformer為代表的神經序列模型似乎很難有效地捕捉到這種句子的層級結構。

但是斯坦福和MIT的研究人員在最近的研究中發現。

如果對Transformer類的模型進行長時間的訓練之后,它能獲得這種結構性的泛化能力。

研究人員將這種現象稱為:結構頓悟(Structural Grokking,SG)

Grokking這個詞是一個作家在書中造出來的詞,中文大概翻譯成「頓悟」。

微博網友木遙老師把這個詞解釋為:一個高度復雜的神經網絡在漫長的訓練期內一直只能記住訓練樣本的信息,幾乎沒有泛化能力,但到了某一刻,它的泛化水平忽然跳了出來,而且非常完美。

可以想象成一個神經網絡經歷了一個「aha moment」,像是內部的某個齒輪忽然對上了一樣。

論文地址:https://arxiv.org/abs/2305.18741

研究人員在不同的數據集中發現,SG在模型的深度(Model Depth)上呈現倒U縮放。

中深度模型的泛化能力比非常深和非常淺的模型都要好。

總體上看,如果能對模型進行更多的擴展訓練,普通的Transformer能夠展現出層級結構。

背景

在之前的類似研究中,研究人員認為Transformer在分層級泛化測試中是失敗的。

Transformer模型中的分層級結構

為了了解給定的模型是否對獲取層次結構有偏見,斯坦福的研究人員按照之前的實驗流程,評估了模糊任務上訓練的模型的泛化性。

在這些任務中,訓練數據與“層次規則”和“非層次規則”相一致的。

為測試是否獲得了分層規則,研究人員在一個單獨的分布外測試集上測試泛化性。

頓悟(Grokking)

之前的研究表明,在小型算法數據集上會出現頓悟現象,他們發現在訓練性能飽和后的很長時間里,模型測試性能繼續提高。

因此研究人員就假設存在一個類似的結構頓悟,在域內驗證性能飽和后很長時間內,模型對于分層結構依然可以繼續頓悟。

因此,分層泛化可以通過擴展訓練繼續提高。

實驗

數據集

研究人員的目標是理解transformer中的分層泛化 , 使用了來自之前研究中的兩個數據集,并在一個簡單的括號跟蹤任務上進行了評估。

我們評估了Dyck20,10中結構上未觀察到的字符串的泛化能力,以下圖為例。

模型

研究人員訓練了有{2,4,6,8,10}層的transformer語言模型。

對于每個深度,研究人員用10個隨機種子來訓練模型,300k steps。(Dyck為400k)

給定輸入句子(或在Dyck的情況下前綴),研究人員在測試時從模型中解碼。

對于Dyck,研究人員報告準確性是通過在給定語言的輸入前綴的情況下,通過對右括號進行排名來生成正確的右括號類型。

和之前已經進行的研究類似,對于Question-Formation,研究人員報告解碼問題的第一個單詞的準確性。

對于Tense-Inflection,研究人員報告的是目標動詞詞形變化正確的測試輸入的分數。

主要結果

Transformers展現出了結構頓悟。

研究人員在下圖中展示了在所有數據集上使用最佳模型深度所獲得的結果。

他們發現了明確的結構頓悟證據:在各個數據集上,在分布內準確率飽和之后的訓練步驟中,泛化性能得到改善,有時甚至接近完美的準確率。

提前停止是有害的

接下來,研究人員將通過在域內驗證準確率上進行提前停止而獲得的泛化準確率,與更長的訓練流程(如下圖)的泛化準確性進行了比較。

提前停止會導致泛化性能被嚴重低估。

例如,在Question-Formation和Tense-Inflection兩個任務上,平均泛化性能從不到40%、不到50%提高到分別不到90%、不到80%。

倒U形分布

在Question-Formation和Tense-Inflection任務中,研究人員從2層到10層逐漸增加深度進行模型訓練。

對于每個深度,在下圖中報告了最終泛化準確率超過80%的種子數(10個種子中的比例)。

他們發現了一個倒U形的分布狀態——非常淺和非常深的模型效果不佳,而大多數種子在中等深度的模型中表現出較好的泛化性能。

這也可以解釋為什么之前的研究要么使用非常淺的模型(1-3層的Transformer),要么使用非常深的模型(Mueller等人論文中的12層Transformer),都無法很好地泛化。

分析

鑒于結構頓悟僅在一部分模型架構中發生,研究人員能否確定它何時發生(或預測何時會發生)?

幾個模型內部屬性與結構性理解或Transformer中出現的新興分層結構或許有關。

Weight Norms

最近的研究將認為參數權重的L2 norm是結構頓悟的重要量。

但總體上來說,訓練過程中范數(Norms)增長被作為神經網絡泛化的關鍵因素之一進行了研究。

注意力稀疏性

Merrill等人(2021年)證明了Transformer中的范數增長導致了注意力的飽和,這是新興語言結構的重要特性(Merrill等人,2022年)。為了衡量fLθ的注意力稀疏性,我們計算了所有分布{apk}的負均熵。

樹結構

之前有研究展示了樹結構編碼器表現出接近完美的分層泛化。

雖然Transformer相對較為自由,但最近的證據表明,當在語言數據上進行訓練時,它們隱含地實現了(近似)樹結構計算。

而且,之前研究中樹投影方法精確地描述了Transformer對輸入進行的內部計算可以用樹結構神經編碼近似的程度,為任何Transformer提供了樹結構度量分數(tscore),并提供了一個在輸入字符串上最佳近似其計算的二叉樹。

為了評估這些樹是否與人類的句法概念相對應,我們還將恢復的樹與黃金標準樹進行比較。

結果

在Question-Formation和Tense-Inflection任務中,研究人員通過每隔3k steps更新計算一次這些量的方式來描述權重范數(通過層數統一化來比較不同模型深度)、注意力稀疏性和樹結構性的動態變化情況。

對于依賴于數據的屬性,如注意力稀疏性和樹結構性,我們從訓練數據中隨機抽取了10k個樣例。

研究人員在下圖中繪制了這些量在最小模型、最大模型(其中至少有一個運行顯示成功的結構頓悟)以及最佳模型深度的情況。

樹形結構是最佳的模型

在兩個數據集的所有模型設置中,權重范數和注意力稀疏性都會增長。

然而,僅憑這些屬性本身無法預測淺層和深層模型的失敗 - 淺層模型學習到了最稀疏的解以及具有最大權重范數的解,但從未進行分層泛化。

正如之前的研究中所指出的,tscore隨時間的推移對于所有模型都有所改善,表明隨著時間的推移,樹結構性增加。

對于這兩個數據集,與深層和淺層模型相比,“最佳”模型學習到了最多的樹結構解。

在算法任務中,結構性理解“與嵌入中結構的出現相吻合”。

類似地,在語言任務中,我們發現結構性理解與樹狀內部計算的出現相吻合。

Transformer在誘導結構方面表現出驚人的效果

從下圖的tparseval的動態變化中,研究人員注意到所有模型,無論它們是否進行泛化,都學習到了接近于真實句法的結構,有時表現優于右分支基線。

之前的研究認為,只有樹結構編碼器根據正確的句法分析樹進行結構化時才能進行泛化。

研究人員發現所有Transformer都學習到了正確的樹結構,但只有最具樹結構性的模型表現出最好的泛化能力。

結論

這項研究表明,通過結構頓悟機制,Transformer能夠展現出對結構敏感的“分層泛化”。

它們的整體學習行為逐漸從記憶(領域內高準確率,領域外準確率較差)向泛化(領域內和領域外準確率高)轉變。

雖然研究人員在相對較小的數據集和小型模型上展示了這種行為,但這些結果可能具有更廣泛的意義。

因為已經證明長時間的訓練即使對于規模龐大的語言建模和組合泛化任務也有幫助。

結構頓悟在“中等規模”的模型深度最常發生,而非常淺和非常深的模型則無法展現出這種行為。

雖然以往與Transformer中的語言泛化相關的屬性,如權重范數和注意力稀疏性,不能區分好的架構和壞的架構,但Transformer的功能性樹結構可以很好地預測最佳模型深度。

雖然Transformer架構存在一些明顯的限制(例如無法實現無限遞歸),但研究人員的結果表明它可能具有比以前認為的更強的歸納偏好:通過充分的訓練,Transformer能夠表示分層的句子結構并利用這種結構進行正確的泛化。

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-05-04 12:32:28

模型研究

2024-11-21 08:39:08

2023-07-21 14:47:24

AI訓練

2023-10-20 12:17:57

AI數據

2023-06-25 13:28:21

2023-02-14 09:45:11

模型測試

2025-10-28 15:46:19

AIChatGPT算法

2025-01-17 10:26:19

模型開發ChatGPT

2025-05-06 00:45:00

2017-11-28 14:18:29

2022-02-23 14:36:31

AI數據研究

2018-12-03 09:35:26

互聯網

2025-01-20 13:08:25

2023-12-05 13:38:11

架構模型

2023-09-06 13:34:31

2025-10-31 16:06:19

AI參數微調

2022-10-08 12:38:23

模型開源

2018-12-17 11:06:34

華為云

2025-10-24 12:17:22

2024-01-03 13:37:00

模型數據
點贊
收藏

51CTO技術棧公眾號

亚洲性色视频| 国精品产品一区| 天天干天天做天天操| 一区在线不卡| 亚洲福利视频三区| 欧美一区二视频在线免费观看| 国产精品xxxxxx| 女主播福利一区| 日韩经典中文字幕| 中日韩av在线播放| av女在线播放| 国产精品天天看| 国产高清精品一区二区| 无码人妻av免费一区二区三区| 日本不卡电影| 亚洲激情视频网站| 欧美日韩一区二区三区69堂| missav|免费高清av在线看| 久久精品亚洲精品国产欧美kt∨| 亚洲综合社区网| 国产精品久久久久久人| 欧美日韩三级| 最近2019免费中文字幕视频三| 任你躁av一区二区三区| 日韩毛片在线| 亚洲国产毛片aaaaa无费看| 日本一区二区三区精品视频| 丰满人妻熟女aⅴ一区| 另类人妖一区二区av| 91国产高清在线| 岛国毛片在线观看| 成人一级毛片| 高清一区二区中文字幕| 一区二区三区国产豹纹内裤在线| 午夜视频久久久| 四虎在线视频| 日韩电影免费观看高清完整版在线观看| 伊人夜夜躁av伊人久久| 日韩福利影院| 可以在线观看的黄色| 99视频在线观看一区三区| 国产美女精彩久久| 熟女少妇内射日韩亚洲| jizz性欧美23| 日韩欧美不卡在线观看视频| 91福利免费观看| 久久夜夜久久| 欧美日韩一二区| 高清一区二区视频| 亚洲a∨精品一区二区三区导航| 日本精品不卡| 国产美女在线观看一区| 国产精品久久婷婷六月丁香| 免费黄色av片| 日韩有码一区二区三区| 清纯唯美亚洲激情| 懂色av蜜臀av粉嫩av分享吧最新章节| 午夜在线播放视频欧美| 日本欧美黄网站| 国产成人精品网| 老司机午夜精品视频在线观看| 欧美一级淫片videoshd| 国产精品男女视频| 男人的天堂成人在线| 国产97在线视频| 丰满熟女人妻一区二区三| 青青国产91久久久久久| 国产精品香蕉av| 91中文字幕在线视频| 国精产品一区一区三区mba视频| 成人久久一区二区| 性生活三级视频| 91香蕉视频mp4| 日韩精品欧美一区二区三区| 男人影院在线观看| 一区二区在线观看视频在线观看| 国产一区二区三区在线免费| 国产色播av在线| 精品久久久久久中文字幕| 青青青在线播放| 欧洲亚洲精品| 欧美成人乱码一区二区三区| 日本少妇色视频| 欧美日韩精品在线一区| 日韩视频免费在线| 精品无码久久久久久久久| 在线亚洲观看| 国产精品视频地址| 精品久久久久中文慕人妻| 99久久精品国产观看| 婷婷五月色综合| 久久久久黄久久免费漫画| 欧美午夜精品久久久久久人妖 | 精品国产户外野外| 日韩在线第三页| 精品国产乱码一区二区三区| 亚洲精品久久久久中文字幕欢迎你| 国产精品国产三级国产专业不 | 2019中文字幕在线电影免费| 国产成人精品影院| 久久99精品国产99久久| av中文字幕在线| 亚洲国产成人高清精品| 成人精品小视频| 美女久久精品| 亚洲天堂av在线免费观看| 特级片在线观看| 老司机亚洲精品| 99久久综合狠狠综合久久止 | caoporm超碰国产精品| 日本一区二区三区www| 日本天码aⅴ片在线电影网站| 欧美性极品xxxx娇小| 一级片免费在线观看视频| 亚洲综合福利| 欧美激情伊人电影| 91国偷自产中文字幕久久| 99re免费视频精品全部| 制服丝袜综合日韩欧美| 亚洲一区资源| 精品福利一区二区三区| 黄色a级片在线观看| 久久中文字幕一区二区三区| 成人av男人的天堂| caoporn97在线视频| 欧美视频在线一区| 97人妻精品一区二区三区免| 欧美区日韩区| 91香蕉电影院| 欧美激情黑人| 欧美日韩免费视频| 亚洲精品成a人在线观看| 久久久久久久久免费看无码 | 国产一区二区在线不卡| 国产日韩精品久久久| 97超碰青青草| 美国一区二区| 91国内免费在线视频| 正在播放木下凛凛xv99| 久久久久久久久99精品| 日韩精品一区二区三区久久| 久草在线综合| 久久青草福利网站| 天天色综合av| 天天色综合天天| 69xxx免费视频| 红桃视频国产一区| 国产精品免费看一区二区三区| 最新av在线播放| 欧美一级艳片视频免费观看| 波多野结衣不卡视频| 国产精品一区久久久久| 国产精品av免费观看| 欧美h版在线观看| 欧美黑人狂野猛交老妇| 韩国av免费在线观看| 亚洲成人激情综合网| 在线天堂www在线国语对白| 亚洲高清毛片| 久草精品电影| 欧洲亚洲两性| 色黄久久久久久| 国产视频手机在线| 亚洲一级二级在线| 极品粉嫩小仙女高潮喷水久久| 午夜在线播放视频欧美| 天天人人精品| 久久免费精品| 97久久精品人人澡人人爽缅北| 色呦呦视频在线| 在线视频亚洲一区| 亚洲熟女毛茸茸| 成人性生交大片免费看视频在线 | 欧美成人性网| 中文欧美在线视频| 国产欧美久久久| 亚洲成人综合网站| 妺妺窝人体色WWW精品| 毛片基地黄久久久久久天堂| 四虎4hu永久免费入口| 国产精品调教| 国产精品久久久久久久久久久新郎| 91精彩视频在线观看| 欧美一区二区视频在线观看| 国产精品白浆一区二小说| 91蝌蚪porny九色| 久久国产精品国产精品| 欧美午夜免费影院| 蜜桃视频在线观看91| 国产亚洲欧美日韩精品一区二区三区| 欧美激情精品久久久久久变态 | 久久精品亚洲乱码伦伦中文| www.久久久久久久久久久| 亚洲国产电影| 亚洲一区在线免费| 久久中文资源| 成人a免费视频| 日韩精品av| 久久中文久久字幕| 美丽的姑娘在线观看免费动漫| 欧美精品 国产精品| 欧美三级韩国三级日本三斤在线观看| 国产日产亚洲精品系列| 亚洲熟妇一区二区| 日韩福利视频导航| 欧美一级中文字幕| av中文一区| 欧美日韩久久不卡| 欧美乱做爰xxxⅹ久久久| 国产乱论精品| 国产va免费精品高清在线| h视频在线免费| 在线精品亚洲一区二区不卡| 综合五月激情网| 国产喷白浆一区二区三区| 亚洲v在线观看| 九一九一国产精品| 一女被多男玩喷潮视频| 亚洲欧美综合久久久| 奇米视频888战线精品播放| 视频欧美一区| 成人免费看吃奶视频网站| 亚洲欧洲美洲av| 久久久亚洲精选| 免费av毛片在线看| 日韩精品视频在线| 欧日韩在线视频| 欧美成人三级在线| 国产精品一区二区黑人巨大| 日本精品视频一区二区| 精品国产免费观看| 天天操天天干天天综合网| 极品颜值美女露脸啪啪| 亚洲日本va在线观看| 日韩一卡二卡在线观看| 国产欧美一区在线| 国产真实乱人偷精品人妻| 91美女视频网站| 人妻熟女aⅴ一区二区三区汇编| 成人丝袜18视频在线观看| 亚洲 自拍 另类 欧美 丝袜| 韩国三级中文字幕hd久久精品| 五月婷婷六月丁香激情| 免费精品视频在线| 日本在线一二三区| 久久99精品国产麻豆婷婷洗澡| 国模私拍视频一区| 日韩女优一区二区| 亚洲精品高清在线观看| 欧美成人aaa片一区国产精品| 亚洲乱码精品一二三四区日韩在线| 亚洲色图27p| 亚洲人成小说网站色在线| 丰满少妇被猛烈进入一区二区| 亚洲日本在线天堂| 国产女片a归国片aa| 亚洲午夜精品一区二区三区他趣| 久久老司机精品视频| 亚洲777理论| 日韩在线播放中文字幕| 欧美性色欧美a在线播放| 中文字幕人妻互换av久久| 欧美日韩久久一区| 国产三级三级在线观看| 欧美电影免费观看完整版| 人妻91麻豆一区二区三区| 亚洲精品乱码久久久久久金桔影视| 婷婷开心激情网| 亚洲欧洲自拍偷拍| 欧美三级理伦电影| 九九精品视频在线观看| 波多野结衣在线播放| 热门国产精品亚洲第一区在线| 欧美暴力调教| 亚洲自拍小视频| 日本午夜精品| 亚洲一区二区三区加勒比| 欧美va天堂| 无码精品a∨在线观看中文| 日韩成人午夜精品| 久久发布国产伦子伦精品| 99久久99久久综合| 特级西西人体高清大胆| 夜夜精品浪潮av一区二区三区| 你懂的国产在线| 欧美裸体一区二区三区| 全国男人的天堂网| 色偷偷av一区二区三区乱| 大香伊人中文字幕精品| 国产91精品一区二区麻豆网站| 欧美aⅴ在线观看| 精品一区二区三区香蕉蜜桃| a级片在线观看视频| 日本一区二区不卡视频| 国产在线综合网| 欧美在线免费视屏| 性生交大片免费看女人按摩| 国产一区二区激情| 国产网红在线观看| 国产日韩欧美在线播放| 日韩伦理一区二区三区| 浴室偷拍美女洗澡456在线| 免播放器亚洲| 第一页在线视频| 国产精品每日更新| 久久露脸国语精品国产91| 欧美丰满美乳xxx高潮www| 深夜福利在线看| 欧美超级免费视 在线| 韩国三级一区| 狠狠色综合欧美激情| 亚洲情侣在线| 天天干天天干天天干天天干天天干| 成人午夜私人影院| 婷婷久久综合网| 欧美三区在线观看| 欧美女优在线观看| 欧美精品久久久久a| 全球中文成人在线| 日本一区二区三区四区在线观看| 极品中文字幕一区| 国产人妻精品久久久久野外| 中文字幕欧美区| 中文在线第一页| 亚洲国产天堂久久综合网| 在线三级电影| 亚洲一区二区久久久久久久| 青青草成人影院| 91淫黄看大片| 国产亚洲欧美日韩日本| 国产专区第一页| 亚洲精品白浆高清久久久久久| ****av在线网毛片| 国产精品久久九九| 在线国产日韩| 亚洲av成人精品一区二区三区| 一区二区三区中文字幕| 免费观看日批视频| 日韩精品日韩在线观看| 国产精品电影| 国产伦精品一区二区三区免| 欧美精品一区二区三区久久久竹菊| 在线免费看v片| 亚洲黄色小视频| 亚洲毛片在线播放| 韩国精品美女www爽爽爽视频| 大香伊人久久精品一区二区| 青青青在线观看视频| 大陆成人av片| 欧美三级韩国三级日本三斤在线观看| 亚洲福利视频专区| 亚洲少妇视频| 日韩欧美99| 美女性感视频久久| 手机在线中文字幕| 日韩一级片在线播放| 日本h片在线观看| 国产一区二区不卡视频在线观看| 9色国产精品| 精品无码一区二区三区| 国产在线观看免费一区| 一本一道久久久a久久久精品91| 免费一区二区视频| 日韩福利小视频| 精品国产一区二区精华| 国产va在线视频| 日韩精品国内| 国产一区二区三区高清播放| 久久国产精品波多野结衣av| 亚洲高清不卡av| 青青热久免费精品视频在线18| 亚洲一卡二卡三卡| 成人网在线免费视频| 欧美人一级淫片a免费播放| www.99久久热国产日韩欧美.com| 欧美日韩黄网站| 美女av免费在线观看| 中文字幕乱码一区二区免费| 国产三级在线观看视频| 5566成人精品视频免费| 色琪琪久久se色| 折磨小男生性器羞耻的故事| 色综合天天综合网国产成人综合天| 精品在线免费观看视频| 亚洲国产精品美女| 日韩另类视频| 日韩一级片免费视频| 久久久国产综合精品女国产盗摄| 一本大道伊人av久久综合| 欧美黄色片视频| 国产伦精品一区二区三区千人斩 | 国产一级做a爱免费视频| 亚洲美女av在线播放| 国产精品国产三级在线观看| 自拍日韩亚洲一区在线| 国产精品入口麻豆九色| 粉嫩小泬无遮挡久久久久久| 国产精品久久久999| 在线欧美福利| 久久国产精品国语对白|