精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

谷歌:大模型不僅有涌現能力,訓練時間長了還有「領悟」能力

人工智能
模型在達到一定規模時會出現涌現現象,谷歌的研究表明,模型在訓練到一定時間后,會出現另一種現象,即「領悟」現象。

2021 年,研究人員在訓練一系列微型模型時取得了一個驚人的發現,即模型經過長時間的訓練后,會有一個變化,從開始只會「記憶訓練數據」,轉變為對沒見過的數據也表現出很強的泛化能力。

這種現象被稱為「領悟(grokking)」,如下圖所示,模型在長時間擬合訓練數據后,「領悟」現象會突然出現。

圖片圖片

既然微型模型有這種特性,那么更復雜一點的模型在經過更長時間的訓練后,是否也會突然出現「領悟」現象?最近大型語言模型(LLM)發展迅猛,它們看起來對世界有著豐富的理解力,很多人認為 LLM 只是在重復所記憶的訓練內容,這一說法正確性如何,我們該如何判斷 LLM 是輸出記憶內容,還是對輸入數據進行了很好的泛化?

為了更好的了解這一問題,本文來自谷歌的研究者撰寫了一篇博客,試圖弄清楚大模型突然出現「領悟」現象的真正原因。

圖片圖片

本文先從微型模型的訓練動態開始,他們設計了一個具有 24 個神經元的單層 MLP,訓練它們學會做模加法(modular addition)任務,我們只需知道這個任務的輸出是周期性的,其形式為 (a + b) mod n。

MLP 模型權重如下圖所示,研究發現模型的權重最初非常嘈雜,但隨著時間的增加,開始表現出周期性。

圖片圖片

如果將單個神經元的權重可視化,這種周期性變化更加明顯:

圖片圖片

別小看周期性,權重的周期性表明該模型正在學習某種數學結構,這也是模型從記憶數據轉變為具有泛化能力的關鍵。很多人對這一轉變感到迷惑,為什么模型會從記憶數據模式轉變為泛化數據模式。

用 01 序列進行實驗

為了判斷模型是在泛化還是記憶,該研究訓練模型預測 30 個 1 和 0 隨機序列的前三位數字中是否有奇數個 1。例如 000110010110001010111001001011 為 0,而 010110010110001010111001001011 為 1。這基本就是一個稍微棘手的 XOR 運算問題,帶有一些干擾噪聲。如果模型在泛化,那么應該只使用序列的前三位數字;而如果模型正在記憶訓練數據,那么它還會使用后續數字。

該研究使用的模型是一個單層 MLP,在 1200 個序列的固定批上進行訓練。起初,只有訓練準確率有所提高,即模型會記住訓練數據。與模運算一樣,測試準確率本質上是隨機的,隨著模型學會通用解決方案而急劇上升。

通過 01 序列問題這個簡單的示例,我們可以更容易地理解為什么會發生這種情況。原因就是模型在訓練期間會做兩件事:最小化損失 和權重衰減。在模型泛化之前,訓練損失實際上會略有增加,因為它交換了與輸出正確標簽相關的損失,以獲得較低的權重。

圖片圖片

測試損失的急劇下降使得模型看起來像是突然泛化,但如果查看模型在訓練過程中的權重,大多數模型都會在兩個解之間平滑地插值。當與后續分散注意力的數字相連的最后一個權重通過權重衰減被修剪時,快速泛化就會發生。

「領悟」現象是什么時候發生的?

值得注意的是,「領悟(grokking)」是一種偶然現象 —— 如果模型大小、權重衰減、數據大小和其他超參數不合適,「領悟」現象就會消失。如果權重衰減太少,模型就會對訓練數據過渡擬合。如果權重衰減過多,模型將無法學到任何東西。

下面,該研究使用不同的超參數針對 1 和 0 任務訓練了 1000 多個模型。訓練過程充滿噪音,因此針對每組超參數訓練了九個模型。表明只有兩類模型出現「領悟」現象,藍色和黃色。

圖片圖片

具有五個神經元的模塊化加法

模加法 a+b mod 67 是周期性的,如果總和超過 67,則答案會產生環繞現象,可以用一個圓來表示。為了簡化問題,該研究構建了一個嵌入矩陣,使用 cos? 和 sin? 將 a 和 b 放置在圓上,表示為如下形式。

圖片圖片

結果表明,模型僅用 5 個神經元就可以完美準確地找到解決方案:

圖片圖片

觀察經過訓練的參數,研究團隊發現所有神經元都收斂到大致相等的范數。如果直接繪制它們的 cos? 和 sin? 分量,它們基本上均勻分布在一個圓上。

接下來是圖片,它是從頭開始訓練的,沒有內置周期性,這個模型有很多不同的頻率。

圖片圖片

圖片圖片

該研究使用離散傅立葉變換 (DFT) 分離出頻率。就像在 1 和 0 任務中一樣,只有幾個權重起到關鍵作用:

圖片圖片

下圖表明,在不同的頻率,模型也能實現「領悟」:

圖片圖片

開放問題

現在,雖然我們對單層 MLP 解決模加法的機制及其在訓練過程中出現的原因有了扎實的了解,但在記憶和泛化方面仍有許多有趣的開放性問題。

哪種模型的約束效果更好呢?

從廣義上講,權重衰減的確可以引導各種模型避免記憶訓練數據。其他有助于避免過擬合的技術包括 dropout、縮小模型,甚至數值不穩定的優化算法。這些方法以復雜的非線性方式相互作用,因此很難先驗地預測哪種方法最終會誘導泛化。

此外,不同的超參數也會使改進不那么突然。

圖片圖片

為什么記憶比泛化更容易?

有一種理論認為:記憶訓練集的方法可能比泛化解法多得多。因此,從統計學上講,記憶應該更有可能首先發生,尤其是在沒有正則化或正則化很少的情況中。正則化技術(如權重衰減)會優先考慮某些解決方案,例如,優先考慮 「稀疏 」解決方案,而不是 「密集 」解決方案。

研究表明,泛化與結構良好的表征有關。然而,這不是必要條件;在求解模加法時,一些沒有對稱輸入的 MLP 變體學習到的 「循環 」表征較少。研究團隊還發現,結構良好的表征并不是泛化的充分條件。這個小模型(訓練時沒有權重衰減)開始泛化,然后轉為使用周期性嵌入的記憶。

在下圖中可以看到,如果沒有權重衰減,記憶模型可以學習更大的權重來減少損失。

圖片圖片

甚至可以找到模型開始泛化的超參數,然后切換到記憶,然后切換回泛化。

圖片圖片

較大的模型呢?

理解模加法的解決方案并非易事。我們有希望理解更大的模型嗎?在這條路上可能需要:

  • 訓練更簡單的模型,具有更多的歸納偏差和更少的運動部件。
  • 使用它們來解釋更大模型如何工作的費解部分。
  • 按需重復。

研究團隊相信,這可能是一種更好地有效理解大型模型的的方法,此外,隨著時間的推移,這種機制化的可解釋性方法可能有助于識別模式,從而使神經網絡所學算法的揭示變得容易甚至自動化。

更多詳細內容請閱讀原文。

原文鏈接:https://pair.withgoogle.com/explorables/grokking/

責任編輯:趙寧寧 來源: 機器之心
相關推薦

2023-05-22 09:19:19

2024-03-26 06:40:06

大語言模型人工智能AI

2023-08-14 08:15:44

谷歌模型

2025-04-02 01:25:00

2023-12-08 13:22:00

數據模型

2023-10-07 08:28:06

語言模型代碼技術

2023-05-04 12:32:28

模型研究

2025-04-08 00:40:00

谷歌合成數據大模型

2023-08-05 13:49:31

鴻蒙操作系統

2025-04-02 08:40:00

人工智能大模型AI

2024-02-18 13:43:57

文本轉語音模型人工智能

2023-04-27 13:46:08

語言模型ChatGPT人工智能

2023-09-05 14:43:15

2024-07-05 15:06:00

2011-12-06 08:44:01

程序員

2025-03-17 08:45:00

AI模型數據

2023-05-05 13:29:04

模型推理

2023-12-22 14:31:52

2023-04-24 18:22:09

數字化

2025-09-01 09:08:41

點贊
收藏

51CTO技術棧公眾號

精品久久久久久久久久久| 国产麻豆精品久久一二三| 日韩电影大片中文字幕| 99热自拍偷拍| √新版天堂资源在线资源| 国产一区二区在线看| 97av在线视频| 婷婷社区五月天| 久久99国产精品久久99大师| 色天使色偷偷av一区二区| 中文字幕中文字幕在线中心一区| 亚洲国产精品无码久久| 久热综合在线亚洲精品| 久久人体大胆视频| www.自拍偷拍| 日韩区欧美区| 欧美视频一区在线| 欧美又粗又长又爽做受| 18免费在线视频| 99精品欧美一区二区三区综合在线| 国产91热爆ts人妖在线| 久草福利资源在线观看| 欧美色图一区| 日韩禁在线播放| 国产精久久久久| 久草综合在线| 极品少妇xxxx偷拍精品少妇| 国产三级电影在线播放| 成人久久一区| 亚洲国产精品va在线| 日韩一区二区三区久久| 中日韩脚交footjobhd| 一区二区三区在线视频免费| 午夜欧美一区二区三区免费观看| 亚洲第一成人av| 久久国产精品99精品国产 | 国产视频精品久久| 国产91对白在线观看九色| 国产在线视频2019最新视频| 波多野结衣电车痴汉| 一本不卡影院| 国产+成+人+亚洲欧洲| www.av视频| 久久免费大视频| 一区三区二区视频| 久久精品视频18| 亚洲图区在线| 亚洲乱码av中文一区二区| 精品人妻伦一二三区久| 大奶在线精品| 亚洲第一av在线| 亚洲av无码一区东京热久久| 亚洲精品黑牛一区二区三区| 欧美一区二区精品久久911| 色戒在线免费观看| 九七电影院97理论片久久tvb| 欧美最新大片在线看| 天堂在线资源视频| av成人免费| 欧美日韩国产首页| www.夜夜爽| 成年永久一区二区三区免费视频| 欧美日韩亚洲高清一区二区| 亚洲第一中文av| 免费一级欧美在线观看视频| 欧美日韩国产综合一区二区| 国产永久免费网站| 欧美国产中文高清| 精品国产伦一区二区三区观看体验| 日本少妇一区二区三区| av在线亚洲色图| 日韩欧美在线综合网| 日本精品一二三| 青青草这里只有精品| 日韩av网址在线| 精品欧美一区二区久久久| 精品国产一区二区三区久久久蜜臀 | 91av国产在线| 中文字幕av影视| 国内不卡的二区三区中文字幕| 亚洲综合中文字幕在线观看| 欧美 日韩 国产 成人 在线 91 | 欧美精品 日韩| 日韩高清一二三区| 日韩美女精品| 日韩视频一区在线| 国产第100页| 视频在线观看一区二区三区| 成人综合网网址| 亚洲精品视频91| 久久免费视频色| 一区二区精品视频| 日本不卡影院| 欧美性猛交xxxx| 精品国产乱码久久久久久1区二区| 一区中文字幕| 国产一区二区三区四区福利| 欧美成人手机视频| 亚洲欧美日本国产专区一区| 国产欧美日韩丝袜精品一区| 国精品人妻无码一区二区三区喝尿| 久久婷婷综合激情| 国产免费xxx| 欧美男女交配| 精品奇米国产一区二区三区| 亚洲黄色小说视频| 日韩亚洲国产精品| 成人国产精品一区| 欧美日韩国产综合视频| 亚洲三级视频在线观看| 国产裸体舞一区二区三区| 精品一区二区三区四区五区| 亚洲欧美第一页| 久草视频免费在线播放| 理论电影国产精品| 免费h精品视频在线播放| 主播国产精品| 欧美欧美欧美欧美首页| 国产肥白大熟妇bbbb视频| 黄色成人在线网站| 成人黄色免费看| 国产高清视频免费最新在线| 性做久久久久久| 被黑人猛躁10次高潮视频| 精品一区二区三| 4p变态网欧美系列| 六月丁香综合网| 亚洲视频图片小说| 色噜噜狠狠一区二区| 蜜桃视频欧美| 热99精品只有里视频精品| www男人的天堂| 亚洲天堂成人网| 美女网站视频黄色| 欧美丝袜丝交足nylons172| 7777免费精品视频| 色婷婷av一区二区三| 亚洲精品老司机| 污污的网站免费| 精品产国自在拍| 欧洲美女7788成人免费视频| 五月天激情开心网| 婷婷六月综合网| 中文视频在线观看| 亚洲国内精品| 精品欧美日韩在线| 三妻四妾的电影电视剧在线观看| 亚洲成人亚洲激情| 五月婷婷激情网| 91麻豆精品在线观看| 香港三级韩国三级日本三级| 久久综合另类图片小说| 97国产在线视频| 视频二区在线| 色综合天天综合色综合av| 97人妻天天摸天天爽天天| 国产视频一区在线观看一区免费| 国产欧美一区二区在线播放| 女子免费在线观看视频www| 日韩午夜中文字幕| 久久久久亚洲AV| av在线不卡网| 哪个网站能看毛片| 第一社区sis001原创亚洲| 国产欧美精品一区二区三区-老狼 国产欧美精品一区二区三区介绍 国产欧美精品一区二区 | 男人的天堂影院| 午夜在线一区| 日韩欧美亚洲日产国产| 色成人综合网| 久久久久久12| 国产三区四区在线观看| 欧美日韩国产影片| 国产一级久久久| 91亚洲永久精品| 69久久久久久| 欧美伊人久久| 久久99精品久久久水蜜桃| 日日av拍夜夜添久久免费| 日韩中文字幕在线看| www.四虎在线观看| 欧美视频国产精品| 亚洲区一区二区三| 成人av高清在线| 91欧美视频在线| 国产在线成人| 视频一区二区综合| 91亚洲无吗| 国产精品久久久久99| 四虎影院观看视频在线观看| 日韩国产精品亚洲а∨天堂免| 中文字幕在线2019| 亚洲国产综合视频在线观看| 成人免费无遮挡无码黄漫视频| 日本不卡视频一二三区| 国产一二三区在线播放| 亚洲区小说区图片区qvod| 91久久精品国产| 亚洲精品一区| 欧美精品在线看| аⅴ资源新版在线天堂| 精品国产乱码久久久久久图片 | 欧美一区二区视频在线观看| 日韩xxxxxxxxx| 亚洲欧美日本韩国| 人人人妻人人澡人人爽欧美一区| 国产美女精品在线| 91av在线免费播放| 在线播放日韩| 日本xxxxx18| 精品国产aⅴ| 久久国产精品-国产精品| 豆花视频一区| 国产精品爽黄69| 超级碰碰久久| 国产69精品久久久| 国产不卡在线| 中文字幕少妇一区二区三区| 亚洲三区在线观看无套内射| 欧美一区二区免费视频| 在线免费观看视频网站| 欧美日韩国产在线播放| 欧美成人手机视频| 18欧美亚洲精品| 日本人亚洲人jjzzjjz| 97se亚洲国产综合自在线不卡| 伦伦影院午夜理论片| 乱一区二区av| 一区二区三区视频网| 六月天综合网| www一区二区www免费| 亚洲狠狠婷婷| 成人免费在线网| 国产精品分类| 波多野结衣 作品| 小处雏高清一区二区三区| 天天人人精品| 成人动漫免费在线观看| 日本一区免费看| 亚洲专区视频| 欧美日韩一区在线观看视频| 亚洲国产网址| 日本高清不卡一区二区三| 亚洲欧美校园春色| 欧美日韩无遮挡| 精品一区亚洲| 日韩一本精品| 日韩伦理视频| 中文网丁香综合网| 久久精品青草| 9191国产视频| 国模 一区 二区 三区| 妞干网视频在线观看| 亚洲天堂偷拍| 国产一区二区在线视频播放| 妖精视频成人观看www| 国产91美女视频| 三级久久三级久久久| 福利在线一区二区三区| 精品一区二区三区在线观看国产 | 老熟妇一区二区三区| 欧美综合亚洲图片综合区| 91久久精品无码一区二区| 69av一区二区三区| 成人久久久精品国产乱码一区二区 | 亚洲777理论| www.国产一区二区| 欧美伊人精品成人久久综合97| 亚洲天堂男人网| 日韩欧美一区在线| 天天干,天天操,天天射| 亚洲欧美一区二区激情| av在线免费一区| 欧美xxxx14xxxxx性爽| cao在线视频| 国产精品夫妻激情| 久久精品免视看国产成人| 好吊色欧美一区二区三区视频 | 91视频com| 手机av在线不卡| 亚洲图片一区二区| 最新在线中文字幕| 日韩免费高清av| 黄色视屏网站在线免费观看| 久久精品亚洲精品| av中文资源在线资源免费观看| 日本亚洲欧美成人| 麻豆精品国产| 美女被啪啪一区二区| 中文精品久久| 国产一区亚洲二区三区| 国产一区二区三区四区五区入口 | 亚洲综合色婷婷| 国产一卡二卡三卡| 精品乱码亚洲一区二区不卡| 国产粉嫩一区二区三区在线观看 | 日韩天堂在线| 成人免费在线一区二区三区| 国产不卡一区| 一二三在线视频| 日本不卡在线视频| 伊人网综合视频| 日韩美女视频一区| 婷婷激情五月综合| 精品国产乱码久久久久久夜甘婷婷| 成人动漫在线播放| 69精品小视频| 成人18夜夜网深夜福利网| 一区二区免费电影| 久久精品免费| 免费黄色三级网站| 亚洲视频一区二区免费在线观看| 无码视频在线观看| 亚洲精品一区二区三区蜜桃下载| 97在线观看免费观看高清| 欧美与黑人午夜性猛交久久久| 日韩三级av高清片| 亚洲成年人专区| 日本伊人精品一区二区三区观看方式| 精品无码人妻少妇久久久久久| 亚洲视频资源在线| 亚洲特级黄色片| 亚洲人成在线观| 午夜伦理福利在线| 国产一区二区免费在线观看| 亚洲老妇激情| 在线看免费毛片| 国产精品全国免费观看高清| 天天爽夜夜爽人人爽| 日韩精品一区二区视频| 黄色激情在线播放| 国产乱码精品一区二区三区中文| 欧美大片专区| 波多野结衣免费观看| 国产精品免费aⅴ片在线观看| 无码免费一区二区三区| 日韩精品极品视频免费观看| 成人黄色动漫| 国产一区自拍视频| 亚洲黄色天堂| 久久久久久久无码| 五月天婷婷综合| 天堂网在线中文| 性欧美长视频免费观看不卡| 精品视频自拍| ww国产内射精品后入国产| 99精品国产热久久91蜜凸| 黄色一级片免费看| 日韩精品视频三区| 日日av拍夜夜添久久免费| 视频一区视频二区视频三区视频四区国产| 久久久久久9| 国产精品视频在| 欧美一区二区三区四区视频| aa在线视频| 懂色av一区二区三区在线播放| 国产精品hd| 日本黄色片在线播放| 欧美小视频在线观看| 国产系列在线观看| 国产免费一区二区三区在线观看| 91一区二区| 香蕉视频免费网站| 欧美日韩另类在线| 国内在线精品| 成人在线国产精品| 黄色亚洲大片免费在线观看| 亚洲成人av免费在线观看| 在线精品视频一区二区三四 | 亚洲欧美在线aaa| 亚洲国产剧情在线观看| 欧美最顶级丰满的aⅴ艳星| 不卡在线一区| 免费黄视频在线观看| 黑人巨大精品欧美一区二区一视频 | 国产精品99久久久久久久女警| 国产一级在线视频| 亚洲色图17p| 国产精品久一| 北条麻妃在线视频观看| 中文字幕av资源一区| www日本高清| 日本sm极度另类视频| 久久久影院免费| 日批在线观看视频| 欧美三区在线观看| 免费污视频在线| 日韩欧美精品在线不卡| 懂色av一区二区三区免费观看| 日韩免费av网站| 美女黄色丝袜一区| 国产精品羞羞答答在线观看| www.成人黄色| 一本大道久久精品懂色aⅴ| 成人无遮挡免费网站视频在线观看| 好看的日韩精品视频在线| 精品午夜久久福利影院| 国产成人愉拍精品久久| 久久精品中文字幕电影| 色吊丝一区二区| 一区二区三区人妻|