精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制

發布于 2024-6-28 10:56
瀏覽
0收藏

本文作者李宏康,美國倫斯勒理工大學電氣、計算機與系統工程系在讀博士生,本科畢業于中國科學技術大學。研究方向包括深度學習理論,大語言模型理論,統計機器學習等等。目前已在 ICLR/ICML/Neurips 等 AI 頂會發表多篇論文。


上下文學習 (in-context learning, 簡寫為 ICL) 已經在很多 LLM 有關的應用中展現了強大的能力,但是對其理論的分析仍然比較有限。人們依然試圖理解為什么基于 Transformer 架構的 LLM 可以展現出 ICL 的能力。


近期,一個來自美國倫斯勒理工大學和 IBM 研究院的團隊從優化和泛化理論的角度分析了帶有非線性注意力模塊 (attention) 和多層感知機 (MLP) 的 Transformer 的 ICL 能力。他們特別從理論端證明了單層 Transformer 首先在 attention 層根據 query 選擇一些上下文示例,然后在 MLP 層根據標簽嵌入進行預測的 ICL 機制。該文章已收錄在 ICML 2024。


ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區


  • 論文題目:How Do Nonlinear Transformers Learn and Generalize in In-Context Learning?
  • 論文地址:https://arxiv.org/pdf/2402.15607


背景介紹


上下文學習 in context learning (ICL)


上下文學習 (ICL) 是一種新的學習范式,在大語言模型 (LLM) 中非常流行。它具體是指在測試查詢 (testing query)

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

前添加 N 個測試樣本 testing examples (上下文),即測試輸入

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

和測試輸出

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

的組合,從而構成一個 testing prompt:

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

,作為模型的輸入以引導模型作出正確的推斷。這種方式不同于經典的對預訓練模型進行微調的方式,它不需要改變模型的權重,從而更加的高效。


ICL 理論工作的進展


近期的很多理論工作都是基于 [1] 所提出的研究框架,即人們可以直接使用 prompt 的格式來對 Transformer 進行訓練 (這一步也可以理解為在模擬一種簡化的 LLM 預訓練模式),從而使得模型具有 ICL 能力。已有的理論工作聚焦于模型的表達能力 (expressive power) 的角度 [2]。他們發現,人們能夠找到一個有著 “完美” 的參數的 Transformer 可以通過前向運算執行 ICL,甚至隱含地執行梯度下降等經典機器學習算法。但是這些工作無法回答為什么 Transformer 可以被訓練成這樣 “完美” 的,具有 ICL 能力的參數。因此,還有一些工作試圖從 Transformer 的訓練或泛化的角度理解 ICL 機制 [3,4]。不過,受制于分析 Transformer 結構的復雜性,這些工作目前止步于研究線性回歸任務,而所考慮的模型通常會略去 Transformer 中的非線形部分。


本文從優化和泛化理論的角度分析了帶有非線性 attention 和 MLP 的 Transformer 的 ICL 能力和機制:


  • 基于一個簡化的分類模型,本文具體量化了數據的特征如何影響了一層單頭 Transformer 的域內 (in-domain) 和域外 (out-of-domain, OOD) 的 ICL 泛化能力。
  • 本文進一步闡釋了 ICL 是如何通過被訓練的 Transformer 來實現了。
  • 基于被訓練的 Transformer 的特點,本文還分析了在 ICL 推斷的時候使用基于幅值的模型剪枝 (magnitude-based pruning) 的可行性。


理論部分


問題描述


本文考慮一個二分類問題,即將

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

通過一個任務

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

映射到

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

。為了解決這樣的一個問題,本文構建了 prompt 來進行學習。這里的 prompt 被表示為:


ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區


訓練網絡為一個單層單頭 Transformer:


ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區


預訓練過程是求解一個對所有訓練任務的經驗風險最小化 (empirical risk minimization)。損失函數使用的是適合二分類問題的 Hinge loss,訓練算法是隨機梯度下降。


本文定義了兩種 ICL 泛化的情況。一個是 in-domain 的,即泛化的時候測試數據的分布和訓練數據一樣,注意這個情況里面測試任務不必和訓練任務一樣,即這里已經考慮了對未見任務 (unseen task) 的泛化。另一個是 out-of-domain 的,即測試、訓練數據分布不一樣。


本文還涉及了在 ICL 推斷的時候進行 magnitude-based pruning 的分析,這里的剪枝方式是指對于訓練得到的中的各個神經元,根據其幅值大小,進行從小到大的刪除。


對數據和任務的構建


這一部分請參考原文的 Section 3.2,這里只做一個概述。本文的理論分析是基于最近比較火熱的 feature learning 路線,即通常將數據假設為可分(通常是正交)的 pattern,從而推導出基于不同 pattern 的梯度變化。本文首先定義了一組 in-domain-relevant (IDR) pattern 用于決定 in-domain 任務的分類,和一組與任務無關的 in-domain-irrelevant (IDI) pattern,這些 pattern 之間互相正交。IDR pattern 有

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

個,IDI pattern 有

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

個。一個

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

被表示為一個 IDR pattern 和一個 IDI pattern 的和。一個 in-domain 任務就被定義為基于某兩個 IDR pattern 的分類問題。


類似地,本文通過定義 out-of-domain-relevant (ODR) pattern 和 out-of-domain-irrelevant (ODI) pattern,可以刻畫 OOD 泛化時候的數據和任務。


本文對 prompt 的表示可以用下圖的例子來闡述,其中

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

是 IDR pattern,

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

是 IDI pattern。這里在做的任務是基于 x 中的

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

做分類,如果是

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

那么其標簽為 + 1,對應于 +q,如果是

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

那么其標簽為 - 1,對應于 -q。α,α' 分別被定義為訓練和測試 prompt 中跟 query 的 IDR/ODR pattern 一樣的上下文示例。下圖中的例子里面,

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區


ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區


理論結果


首先,對于 in-domain 的情況,本文先給了一個 condition 3.2 來規定訓練任務需要滿足的條件,即訓練任務需要覆蓋所有的 IDR pattern 和標簽。然后 in-domain 的結果如下:


ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區


這里表明:1,訓練任務的數量只需要在全部任務中占比達到滿足 condition 3.2 的小比例,我們就可以對 unseen task 實現很好的泛化;2,跟當前任務相關的 IDR pattern 在 prompt 中的比例越高,就可以以更少的訓練數據,訓練迭代次數,以及更短的 training/testing prompt 實現理想的泛化。


接下來是 out-of-domain 泛化的結果。


ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區


這里說明,如果 ODR pattern 是 IDR pattern 的線性組合且系數和大于 1,那么此時 OOD ICL 泛化可以達到理想的效果。這個結果給出了在 ICL 的框架下,好的 OOD 泛化所需要的訓練和測試數據之間的內在聯系。該定理也通過 GPT-2 的實驗得到了驗證。如下圖所示,當 (12) 中的系數和

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

大于 1 的時候,OOD 分類可以達到理想的結果。與此同時,當

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

,即 prompt 中和分類任務相關的 ODR/IDR pattern 比例越高的時候,所需要的 context 長度越小。


ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區


然后,本文給出了帶有 magnitude-based pruning 的 ICL 泛化結果。


ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區


這個結果表明,首先,訓練得到的

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

中有一部分(常數比例)神經元的幅值很小,而剩下的相對比較大(公式 14)。當我們只枝剪小神經元的時候,對泛化結果基本沒有影響,而當枝剪比例增加到要剪大神經元的時候,泛化誤差會隨之顯著變大(公式 15,16)。以下實驗驗證了定理 3.7。下圖 A 中淺藍色的豎線表示訓練得到的

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

呈現出了公式 14 的結果。而對小神經元進行枝剪不會使泛化變差,這個結果符合理論。圖 B 反映出當 prompt 中和任務相關的上下文越多的時候,我們可以允許更大的枝剪比例以達到相同的泛化性能。


ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區


ICL 機制


通過對預訓練過程的刻畫,本文得到了單層單頭非線性 Transformer 做 ICL 的內在機制,這一部分在原文的 Section 4。該過程可以用下圖表示。


ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區


簡而言之,attention 層會選擇和 query 的 ODR/IDR pattern 一樣的上下文,賦予它們幾乎全部 attention 權重,然后 MLP 層會重點根據 attention 層輸出中的標簽嵌入來作出最后的分類。


總結


本文講解了在 ICL 當中,非線性 Transformer 的訓練機制,以及對于新任務和分布偏移數據的泛化能力。理論結果對于設計 prompt 選擇算法和 LLM 剪枝算法有一定實際意義。


本文轉自 機器之心 ,作者:機器之心


原文鏈接:??https://mp.weixin.qq.com/s/SJQiIp1W5kwWSVJaOXA9yA??

標簽
已于2024-6-28 10:57:20修改
收藏
回復
舉報
回復
相關推薦
欧美精品亚洲精品| 日本精品视频一区二区三区| 国产精品久久不能| 日本伦理一区二区三区| 国产欧美88| 亚洲国产精品麻豆| 欧美系列一区| 国产人妖一区二区| 亚洲久久一区| 中文字幕免费精品一区| 久久黄色一级视频| 在线高清av| 中文字幕中文字幕一区二区 | 国产又色又爽又高潮免费| 国产区一区二| 色综合天天综合在线视频| 亚洲一区二区三区涩| 亚洲毛片在线播放| 免费在线观看不卡| 午夜精品美女自拍福到在线| www中文在线| 久久国产精品免费精品3p| 精品视频资源站| 国自产拍偷拍精品啪啪一区二区| 免费黄色在线| 成人av资源站| 快灬快灬一下爽蜜桃在线观看| 日本中文字幕电影在线观看 | 国产精品国产三级国产aⅴ原创| 99三级在线| 日本妇乱大交xxxxx| 亚洲人人精品| 欧美成人精品一区| 在线小视频你懂的| 网曝91综合精品门事件在线| 欧美一级xxx| 91色国产在线| 免费v片在线观看| 亚洲精品午夜久久久| 欧美日韩精品一区| 欧美偷拍视频| 99国产精品久| 粉嫩av一区二区三区免费观看 | 日韩精品一区二区三区老鸭窝 | 国产乱码精品1区2区3区| 日本精品久久电影| 欧美不卡视频在线观看| 成人久久电影| 亚洲性线免费观看视频成熟| 日韩人妻无码一区二区三区| 欧美色资源站| 日韩国产激情在线| 久久人人爽人人爽人人片 | 日韩中文欧美在线| 91黄色8090| 日韩欧美三级在线观看| 在线看片成人| 高清欧美电影在线| 日本在线观看视频网站| 亚洲一级黄色| 午夜精品久久久久久久久久久久久| 久久亚洲成人av| 欧美午夜电影在线观看| 欧美黄色片视频| 劲爆欧美第一页| 激情久久中文字幕| 久久久久久一区二区三区| 国产无套粉嫩白浆内谢| 国产精品日韩| 国产91色在线|免| 国产精品免费无遮挡无码永久视频| 久久一区精品| 国产精品入口夜色视频大尺度| 人人草在线观看| 日韩av在线免费观看不卡| 国产成人一区二| 中文字幕人妻色偷偷久久| 经典三级在线一区| 99久久99久久| 桃花色综合影院| 国产色爱av资源综合区| 一区二区三区四区欧美| 污网站在线免费看| 欧美色道久久88综合亚洲精品| 黄色片久久久久| 日韩欧乱色一区二区三区在线| 日韩一区二区三区三四区视频在线观看 | 黄色大片在线播放| 亚洲国产综合在线| 成人免费无码av| 欧美亚洲二区| 亚洲第一黄色网| 91网站免费入口| 99久久亚洲精品蜜臀| 欧美精品www| 四虎影院在线免费播放| 国产一区二区电影| 免费h精品视频在线播放| av网站无病毒在线| 性做久久久久久| 日本熟妇人妻中出| 亚洲精品在线播放| 国产一区二区三区久久精品| 欧美做爰爽爽爽爽爽爽| 国产精品一页| 亚洲一区二区免费| 久久电影视频| 亚洲午夜激情网页| 狠狠躁狠狠躁视频专区| 99re6热只有精品免费观看| 国产午夜精品一区二区三区 | 一级精品视频在线观看宜春院| 国产精品秘入口18禁麻豆免会员| 五月天色综合| 亚洲欧洲在线观看| 妺妺窝人体色www婷婷| 日韩国产精品久久久久久亚洲| 97视频中文字幕| 福利在线视频导航| 欧美日韩性视频| 成人做爰69片免费| 国产精品国产一区| 国产精品激情av电影在线观看 | 波多野结衣亚洲一区| 亚洲精品一区二区三区樱花| 国产色播av在线| 欧美一区二区视频观看视频 | 欧美一区二区在线观看视频| 国产精品传媒在线| 国产av人人夜夜澡人人爽| 精品国产一区二区三区成人影院 | 久久久久久久久久久一区| 黄色网页在线播放| 欧美日韩在线一区二区| 日韩免费高清一区二区| 午夜性色一区二区三区免费视频| 国产精品综合网站| 番号在线播放| 色哟哟一区二区在线观看| 亚洲精品无码一区二区| 欧美三区不卡| 亚洲aaaaaa| 国产婷婷视频在线| 欧美日韩国产在线观看| 鲁丝一区二区三区| 久久久精品网| 品久久久久久久久久96高清| free性m.freesex欧美| 日韩欧美国产一区二区在线播放| 国产suv精品一区二区68| 老色鬼精品视频在线观看播放| 日韩一区免费观看| 你懂得影院夜精品a| 亚洲精品视频中文字幕| 日韩欧美一级视频| 99久久精品国产毛片| 国产黄色一级网站| 日韩有码中文字幕在线| 欧美一区二区色| 久蕉在线视频| 日本道精品一区二区三区| 国产一二三四五区| 免费久久精品视频| 一区二区不卡在线观看| 国产精品视频首页| 欧美激情18p| 欧美熟妇交换久久久久久分类| 亚洲国产aⅴ天堂久久| 午夜不卡久久精品无码免费| 国产情侣久久| 欧美极品视频一区二区三区| 国精产品一区一区三区四川| 日韩在线免费观看视频| 国产精品丝袜黑色高跟鞋| 一区二区视频免费在线观看| www.四虎精品| 羞羞答答国产精品www一本 | 国产精品观看| 精品在线观看一区二区| 日产精品一区| 免费91麻豆精品国产自产在线观看| 国产高潮流白浆喷水视频| 亚洲综合免费观看高清完整版在线| yy1111111| 日韩成人精品在线| 欧美中文字幕在线观看视频| 秋霞影视一区二区三区| 国产成人黄色av| 黄色在线视频网站| 亚洲成avwww人| 无码人妻aⅴ一区二区三区有奶水| 国产精品美女久久久久aⅴ国产馆| 亚洲一区二区图片| 欧美亚洲专区| 丰满女人性猛交| 久久精品国产亚洲5555| 国产精品美女av| 欧美xxxx少妇| 在线日韩中文字幕| 免费观看a视频| 欧美在线观看视频在线| 免费在线一级片| 欧美国产综合色视频| 无码人妻一区二区三区精品视频| 日韩有码一区二区三区| 欧美a级免费视频| 成人免费a**址| 91久久伊人青青碰碰婷婷| xx欧美xxx| 久久久亚洲国产| 免费在线午夜视频| 亚洲欧美另类中文字幕| а√中文在线资源库| 在线这里只有精品| 日本亚洲色大成网站www久久| 成人欧美一区二区三区黑人麻豆| 亚洲国产欧美视频| 国产成a人亚洲精| 中文字幕 日韩 欧美| 免费视频一区二区三区在线观看| 欧美在线观看黄| 手机亚洲手机国产手机日韩| 久久综合久久久| 91精品久久久久久综合五月天| 国产精品久久久久久久美男| 性孕妇free特大另类| 九九久久久久99精品| 日本高清中文字幕在线| 亚洲欧美日韩中文在线| 五月天福利视频| 日韩精品一区二区在线观看| 国产裸体永久免费无遮挡| 在线看国产一区| 中文字幕69页| 欧美日韩精品中文字幕| 精品无码人妻一区二区三| 亚洲视频 欧洲视频| 女同久久另类69精品国产| 欧美高清在线视频| 亚洲天堂视频一区| 91啪亚洲精品| 国产一级二级视频| thepron国产精品| 一本色道久久hezyo无码| 国产成人自拍网| 中文字幕一二三区| 国产精品夜夜嗨| 日韩不卡的av| 国产 欧美在线| 久草免费资源站| 国产1区2区3区精品美女| 日韩欧美中文在线视频| 国模一区二区三区白浆| 波多野结衣免费观看| 国产麻豆午夜三级精品| 久久艹这里只有精品| 国产精品一区三区| 日本wwwxx| av成人免费在线观看| 91视频啊啊啊| 久久久久久久久久久久久夜| 成人免费毛片糖心| 中文字幕不卡的av| 国产91在线播放九色| 亚洲欧美视频在线观看视频| 免费一级肉体全黄毛片| 亚洲午夜久久久久久久久久久 | 成人av影院在线| 欧美激情视频免费观看| 亚洲妇熟xxxx妇色黄| 欧美激情国产精品| 福利在线导航136| 国外成人在线视频| 亚洲性色av| 国产精品人成电影在线观看| 日本免费成人| 147欧美人体大胆444| 在线观看视频一区二区三区| 国产一区在线免费| 亚洲国产合集| 亚洲一区精品视频| 中国成人一区| 日韩精品一区二区三区久久| 免费看欧美女人艹b| 无套白嫩进入乌克兰美女| 99精品久久免费看蜜臀剧情介绍| 性欧美丰满熟妇xxxx性仙踪林| 国产精品久久久久久久久免费丝袜 | 欧美成人video| 麻豆导航在线观看| 久久精品久久久久| 国产欧洲在线| 成人a视频在线观看| 超碰97久久| 亚洲春色综合另类校园电影| 黄色在线成人| 男人舔女人下面高潮视频| 国产在线播放一区| 国产精品揄拍100视频| 亚洲啪啪综合av一区二区三区| 国产成人亚洲精品自产在线 | 51色欧美片视频在线观看| 亚洲伦理影院| 国产精品免费一区二区| 日韩成人精品一区二区| 成人午夜精品久久久久久久蜜臀| 日本视频中文字幕一区二区三区 | 久久这里只有精品6| 中文字幕五月天| 在线免费av一区| 姝姝窝人体www聚色窝| 精品国偷自产在线视频| 免费成人动漫| 精品在线一区| 欧美精品综合| 不卡的av中文字幕| 2024国产精品视频| 538任你躁在线精品视频网站| 色噜噜狠狠色综合欧洲selulu| 高清一区二区三区四区| 精品国产一区二区三区久久狼5月| 大菠萝精品导航| 91精品久久久久久久久| 精品久久综合| 日韩免费视频播放| 成人午夜在线免费| 国产97免费视频| 欧美日韩国产片| 国产69久久| 欧洲亚洲免费在线| 欧美丝袜足交| 人妻av中文系列| 成人动漫中文字幕| 久一区二区三区| 日韩小视频在线观看专区| 成人在线网址| 成人精品久久久| 国内精品久久久久久久影视简单 | 深夜av在线| 国产乱码精品一区二区三区日韩精品| 66视频精品| 日日干日日操日日射| 国产精品视频免费| 午夜视频网站在线观看| 亚洲图片欧美午夜| 456亚洲精品成人影院| 麻豆一区区三区四区产品精品蜜桃| 136国产福利精品导航网址| 男人添女人荫蒂国产| 亚洲综合激情网| 超碰在线观看av| 欧美国产日韩视频| 国产精品男女| 欧美一区二区三区爽大粗免费| 91香蕉视频在线| 亚洲黄色免费观看| 亚洲色图校园春色| 日本精品网站| 亚洲图片小说在线| 美女视频一区在线观看| 日本黄色免费片| 91麻豆精品国产| 欧美男男video| 精品国产乱码久久久久| 久久精品盗摄| 国产黄色大片免费看| 欧美美女bb生活片| 污污视频在线看| 精品一区国产| 日韩国产成人精品| 久久福利免费视频| 精品国产乱码久久| 性高爱久久久久久久久| 亚洲精品日韩在线观看| 国产精品77777| 好吊操这里只有精品| 亚洲一级一级97网| 成人51免费| 俄罗斯av网站| 国产精品乱码人人做人人爱| 国产深喉视频一区二区| 性视频1819p久久| 欧美色爱综合| 亚洲AV无码久久精品国产一区| 天天色综合成人网| 成人高清免费在线播放| 91久久精品一区二区别| 久久aⅴ乱码一区二区三区| 日本在线观看网址| 日韩精品综合一本久道在线视频| 韩国主播福利视频一区二区三区| 亚洲欧美日韩精品综合在线观看| 国产成人一区在线| 欧美超碰在线观看| 久久这里有精品视频| 日韩精品福利一区二区三区| 午夜精品中文字幕| 午夜精品久久久久久久99樱桃| 97超碰国产一区二区三区| 国产精品久久亚洲7777|