精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Transformer架構(gòu)的情境學(xué)習(xí)泛化能力

發(fā)布于 2025-3-24 00:32
瀏覽
0收藏

背景

大型語(yǔ)言模型(LLMs)如GPT-4和LLaMA-3憑借Transformer架構(gòu)的強(qiáng)大情境學(xué)習(xí)(In-Context Learning, ICL)能力,能夠從有限的示例中快速學(xué)習(xí)并適應(yīng)新任務(wù)。然而,ICL的泛化邊界和脆弱性一直缺乏系統(tǒng)性的理解,這限制了其在實(shí)際應(yīng)用中的潛力發(fā)揮。清華大學(xué)的研究團(tuán)隊(duì)通過定義一個(gè)以任務(wù)為中心的框架,從三個(gè)維度系統(tǒng)地研究了Transformer架構(gòu)在ICL下的泛化能力,并提出了優(yōu)化訓(xùn)練數(shù)據(jù)設(shè)計(jì)的重要指導(dǎo)原則。

研究框架:三維泛化能力分析

研究團(tuán)隊(duì)提出了一個(gè)任務(wù)中心框架,將ICL的泛化能力分為三個(gè)維度:

  1. 跨問題泛化(Inter-problem Generalization)模型能否將在一類問題上學(xué)到的知識(shí)遷移到全新的問題類型上。
  2. 問題內(nèi)泛化(Intra-problem Generalization)模型在接觸了問題類型的部分實(shí)例后,能否泛化到同類問題的其他實(shí)例。
  3. 任務(wù)內(nèi)泛化(Intra-task Generalization)模型在特定任務(wù)上學(xué)習(xí)后,能否在相似測(cè)試樣本上表現(xiàn)良好。

Transformer架構(gòu)的情境學(xué)習(xí)泛化能力-AI.x社區(qū)

這一框架使研究者能夠系統(tǒng)地評(píng)估Transformer模型在不同泛化場(chǎng)景下的表現(xiàn),從而揭示ICL能力的本質(zhì)和局限。

函數(shù)擬合實(shí)驗(yàn):泛化能力的基礎(chǔ)驗(yàn)證

研究首先通過函數(shù)擬合任務(wù)建立了一個(gè)可控的實(shí)驗(yàn)環(huán)境。研究者將基礎(chǔ)函數(shù)(如正弦、余弦函數(shù))定義為基本問題,將這些函數(shù)的組合(加法、乘法、復(fù)合)定義為復(fù)合問題,通過比較不同訓(xùn)練策略下模型的表現(xiàn)來評(píng)估其泛化能力。

實(shí)驗(yàn)設(shè)計(jì)

研究采用了兩種主要模型配置:

  • Baseline模型僅在基礎(chǔ)函數(shù)上訓(xùn)練
  • ComFuncLearner模型在基礎(chǔ)函數(shù)和部分組合函數(shù)上訓(xùn)練

通過比較這兩種模型在未見過的函數(shù)組合上的表現(xiàn),研究者能夠評(píng)估模型的跨問題和問題內(nèi)泛化能力。

關(guān)鍵發(fā)現(xiàn)

  1. 凸組合泛化:當(dāng)測(cè)試模型對(duì)基礎(chǔ)函數(shù)的凸組合進(jìn)行擬合時(shí),ComFuncLearner模型表現(xiàn)顯著優(yōu)于Baseline模型,即使ComFuncLearner只在訓(xùn)練中接觸過一種特定的凸組合。這表明Transformer模型具有強(qiáng)大的問題內(nèi)泛化能力。
  2. 乘積組合泛化:在函數(shù)乘積組合的測(cè)試中,隨著ComFuncLearner在訓(xùn)練中接觸的組合模式數(shù)量增加,其在未見過的乘積組合上的表現(xiàn)持續(xù)提升,進(jìn)一步證實(shí)了問題內(nèi)泛化能力的存在。
  3. 復(fù)合函數(shù)泛化:在更復(fù)雜的函數(shù)復(fù)合測(cè)試中,模型表現(xiàn)出類似的泛化模式,但由于復(fù)合操作的復(fù)雜性,泛化難度明顯增加。
  4. 預(yù)訓(xùn)練模型的影響:研究還發(fā)現(xiàn),即使是經(jīng)過大規(guī)模預(yù)訓(xùn)練的LLaMA-3模型,在沒有接觸過特定組合形式的情況下,也難以實(shí)現(xiàn)跨問題泛化,但在問題內(nèi)和任務(wù)內(nèi)泛化方面表現(xiàn)出色。

這些實(shí)驗(yàn)結(jié)果一致表明,Transformer模型在ICL范式下缺乏跨問題泛化能力,但具有出色的問題內(nèi)和任務(wù)內(nèi)泛化能力。

實(shí)際應(yīng)用場(chǎng)景驗(yàn)證

為了驗(yàn)證函數(shù)擬合實(shí)驗(yàn)的發(fā)現(xiàn)在實(shí)際應(yīng)用中的有效性,研究團(tuán)隊(duì)進(jìn)一步在工具調(diào)用和翻譯任務(wù)上進(jìn)行了實(shí)驗(yàn)。

工具調(diào)用實(shí)驗(yàn)

研究者將單API調(diào)用定義為基本問題,多API調(diào)用定義為復(fù)合問題,在LLaMA-2模型上進(jìn)行了實(shí)驗(yàn)。結(jié)果顯示:

  1. 在ComFuncLearner模型(訓(xùn)練包含多API調(diào)用示例)上應(yīng)用ICL,顯著提升了模型在多API任務(wù)上的表現(xiàn)。
  2. 有趣的是,ComFuncLearner模型在簡(jiǎn)單的單API任務(wù)上的表現(xiàn)也優(yōu)于Baseline模型,表明訓(xùn)練數(shù)據(jù)的多樣性不僅提升了復(fù)雜任務(wù)的表現(xiàn),還能提高簡(jiǎn)單任務(wù)的上限。

翻譯任務(wù)實(shí)驗(yàn)

研究者使用Qwen2-1.5B架構(gòu)的模型,在英語(yǔ)和德語(yǔ)翻譯任務(wù)上進(jìn)行了實(shí)驗(yàn),將單語(yǔ)言到單語(yǔ)言翻譯定義為基本問題,混合語(yǔ)言輸入的翻譯定義為復(fù)合問題。結(jié)果表明:

  1. 在復(fù)雜的混合語(yǔ)言輸入任務(wù)上,ComFuncLearner模型明顯優(yōu)于Baseline模型,且ICL帶來的提升更為顯著。
  2. 在簡(jiǎn)單的單語(yǔ)言翻譯任務(wù)上,針對(duì)特定任務(wù)微調(diào)的Baseline模型表現(xiàn)最佳,表明ICL的問題內(nèi)和跨問題泛化能力仍低于任務(wù)內(nèi)泛化能力。
  3. 當(dāng)將測(cè)試集分為簡(jiǎn)單和困難樣本時(shí),發(fā)現(xiàn)在復(fù)雜樣本上,ComFuncLearner模型通過ICL獲得的提升更為顯著,而Baseline模型的提升有限。

這些實(shí)際應(yīng)用實(shí)驗(yàn)進(jìn)一步證實(shí),當(dāng)模型在訓(xùn)練階段接觸更廣泛的問題類型時(shí),能顯著提高其通過ICL實(shí)現(xiàn)的泛化能力上限,尤其是在復(fù)雜任務(wù)上。

分布偏移下的泛化能力

研究還探討了當(dāng)ICL示例與測(cè)試樣本之間存在分布偏移時(shí),模型的泛化能力如何受影響。實(shí)驗(yàn)考察了三種關(guān)鍵場(chǎng)景:

  1. 標(biāo)簽噪聲:在ICL示例中引入標(biāo)簽噪聲,發(fā)現(xiàn)即使只有少量噪聲樣本(如39個(gè)示例中的10個(gè)),也會(huì)顯著影響模型的泛化能力。
  2. 輸入偏差:當(dāng)ICL示例包含測(cè)試范圍之外的輸入時(shí),模型在測(cè)試樣本上的表現(xiàn)顯著下降,即使這些額外樣本的輸出仍遵循真實(shí)函數(shù)。
  3. 輸入和輸出偏差:當(dāng)ICL示例同時(shí)包含范圍外的輸入和偏移的輸出時(shí),模型的泛化能力進(jìn)一步惡化。

這些發(fā)現(xiàn)表明,ICL對(duì)示例分布的偏移非常敏感,這在實(shí)際應(yīng)用中需要特別注意。

研究結(jié)論與指導(dǎo)原則

通過這一系列實(shí)驗(yàn),研究團(tuán)隊(duì)得出了幾個(gè)關(guān)鍵結(jié)論:

  1. Transformer模型在ICL中缺乏跨問題泛化能力,但在問題內(nèi)和任務(wù)內(nèi)泛化方面表現(xiàn)出色。
  2. 即使經(jīng)過大規(guī)模預(yù)訓(xùn)練的模型,如果沒有在微調(diào)階段接觸特定的問題組合形式,也難以通過ICL實(shí)現(xiàn)跨問題泛化。
  3. 在訓(xùn)練數(shù)據(jù)中包含更多樣化的任務(wù)類型,不僅能提高模型在未見任務(wù)上的ICL泛化能力,還能提升其在已知簡(jiǎn)單任務(wù)上的表現(xiàn)。
  4. 訓(xùn)練數(shù)據(jù)中任務(wù)多樣性的增加,能顯著放大ICL在復(fù)雜任務(wù)上帶來的改進(jìn)效果。

這些發(fā)現(xiàn)為大型語(yǔ)言模型的訓(xùn)練數(shù)據(jù)設(shè)計(jì)提供了重要指導(dǎo):應(yīng)當(dāng)最大化覆蓋任務(wù)的多樣性,并在可能的情況下結(jié)合不同任務(wù),而不是僅關(guān)注特定的目標(biāo)任務(wù)。這種策略不僅能提高模型的跨問題泛化能力,還能增強(qiáng)其在原本簡(jiǎn)單任務(wù)上的表現(xiàn)。

研究意義與未來方向

這項(xiàng)研究系統(tǒng)地揭示了Transformer架構(gòu)在ICL下的泛化邊界,為理解大型語(yǔ)言模型的能力與局限提供了重要見解。研究結(jié)果表明,雖然當(dāng)前模型在跨問題泛化方面存在局限,但通過優(yōu)化訓(xùn)練數(shù)據(jù)的多樣性,可以顯著提升其泛化能力。

未來研究可以進(jìn)一步探索:

  1. 如何設(shè)計(jì)更有效的訓(xùn)練數(shù)據(jù)組合,最大化模型的泛化能力
  2. 改進(jìn)模型架構(gòu),增強(qiáng)其跨問題泛化能力
  3. 開發(fā)更魯棒的ICL方法,減少對(duì)示例分布偏移的敏感性

這項(xiàng)研究不僅深化了我們對(duì)Transformer架構(gòu)和ICL機(jī)制的理解,也為大型語(yǔ)言模型的實(shí)際應(yīng)用提供了寶貴的指導(dǎo)原則,有助于釋放這些模型的全部潛力。

論文:???https://arxiv.org/abs/2503.15579???

代碼:????https://github.com/UbeCc/Generalization-of-Transformers???

 

本文轉(zhuǎn)載自??頓數(shù)AI??,作者:蔥蔥

收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
国产欧美一区二区三区精品观看| 粗大黑人巨茎大战欧美成人| 免费亚洲一区| 综合欧美国产视频二区| 肉色超薄丝袜脚交| 午夜激情在线播放| 国产精品电影一区二区三区| 国产精品久久久对白| 无码人妻久久一区二区三区 | 黄色小网站91| 日本欧美www| 欧美激情麻豆| 亚洲欧洲国产精品| 99精品视频免费版的特色功能| 麻豆视频在线观看免费网站黄| 中文字幕一区二区三区av| 国产综合av一区二区三区| 在线观看视频中文字幕| 亚洲福利精品| 久久综合色88| 2019男人天堂| 免费毛片在线不卡| 精品久久久久久久久久久久久久久 | 一本色道综合久久欧美日韩精品| www.久久久久爱免| 色婷婷av一区二区三区软件| 97视频在线免费| 黄色在线免费网站| 久久久久久免费毛片精品| 国产成人av一区二区三区| 伊人久久亚洲综合| 蘑菇福利视频一区播放| 久久人91精品久久久久久不卡| 呻吟揉丰满对白91乃国产区| 亚洲精品国产setv| 欧美精品一区二区高清在线观看 | 欧美美女被草| 欧美性精品220| 97视频久久久| 日本一本在线免费福利| 亚洲欧美日韩国产成人精品影院| 四虎永久国产精品| 国产小视频在线观看| 26uuu另类欧美亚洲曰本| 岛国视频一区| 午夜精品在线播放| 国产精品乡下勾搭老头1| 91亚洲精品久久久| 国产乱淫av片免费| 精品一区中文字幕| 国产日产久久高清欧美一区| 中文字幕免费播放| 免费观看30秒视频久久| 国产精品久久久久av免费| 无码人妻一区二区三区线| 久久深夜福利| 国产精品久久久久久久7电影| 中文字幕免费观看| 蜜臀91精品一区二区三区| 国产精品久久久久7777婷婷| 中文字幕丰满人伦在线| 蜜桃久久久久久| 国产精品一区二区三区成人| 91亚洲国产成人久久精品麻豆| 激情综合网天天干| 亚洲自拍偷拍区| 亚洲精品97久久中文字幕| 国产91对白在线观看九色| www.久久艹| 午夜18视频在线观看| 久久综合久久综合九色| 色综合影院在线观看| yes4444视频在线观看| 国产精品国产三级国产普通话蜜臀 | 超碰中文字幕在线观看| 亚洲精品视频一二三区| 亚洲国产精品999| 野外性满足hd| 99久久精品网| 欧美精品九九久久| 波多野结衣不卡| 国产在线不卡视频| 国产精品视频福利| 黄色av网站在线免费观看| 亚洲欧美影音先锋| 男的插女的下面视频| 日韩av首页| 欧美一级日韩不卡播放免费| 亚洲天堂美女视频| 成人女性视频| 欧美国产视频日韩| 免费一级a毛片| 国产一区二区三区免费| 久久av一区二区三区漫画| h视频在线观看免费| 亚洲一区二区在线免费看| 久久久久久久久久久久久久国产| 在线播放成人| 国产视频自拍一区| 天海翼在线视频| 国产情侣久久| 91网站免费观看| 欧美另类自拍| 午夜久久久久久久久| 亚洲 激情 在线| 久久综合社区| 久久亚洲精品成人| 国产精品免费精品一区| 国产精品一区二区黑丝| 日本一区二区久久精品| 美足av综合网| 欧美另类videos死尸| 一二三不卡视频| 午夜天堂精品久久久久| 国产美女久久久| 日本1级在线| 亚洲综合视频在线| 午夜免费一级片| 国产一区二区三区四区五区| 亚洲91精品在线观看| 精品国产999久久久免费| 欧美国产精品劲爆| 久久久久久香蕉| 精品网站aaa| 欧美大片网站在线观看| 亚洲天堂中文网| 国产亚洲一区字幕| 日本免费黄视频| 成人免费直播在线| 欧美国产亚洲精品久久久8v| 国产男男gay体育生白袜| 欧美国产精品劲爆| 热久久精品免费视频| 亚洲美女15p| 亚洲18私人小影院| 日本黄色不卡视频| 亚洲综合一区二区| jjzz黄色片| 欧美99久久| 亚洲一区二区三区久久| 免费av在线| 欧美精品久久一区二区三区| 日韩欧美在线视频播放| 日本vs亚洲vs韩国一区三区二区| 欧美在线播放一区二区| 亚洲精品88| 亚洲精品一区在线观看香蕉| 国产精品视频一区在线观看| 久久亚洲精品国产精品紫薇| 干日本少妇首页| 亚洲va久久| 日本电影亚洲天堂| 国外av在线| 在线观看亚洲a| 五月婷婷婷婷婷| 美女视频一区二区| 国产精品jizz在线观看老狼| 9999精品视频| 欧美夫妻性生活视频| 韩国中文字幕hd久久精品| 亚洲国产另类精品专区| 五十路六十路七十路熟婆| 日韩午夜高潮| 日韩久久久久久久久久久久久| 中文.日本.精品| 精品国产美女在线| 精品国精品国产自在久不卡| 亚洲狠狠爱一区二区三区| 在线精品一区二区三区| 爽好久久久欧美精品| 亚洲日本精品| 亚洲国产一区二区三区网站| 性欧美在线看片a免费观看| 黄色在线观看网| 欧美老女人第四色| 久久久久久久9999| 91免费视频大全| 国产视频手机在线播放| 在线精品小视频| 久久精品女人的天堂av| 日韩毛片在线| 久久91亚洲精品中文字幕奶水| 手机av在线免费观看| 91久久线看在观草草青青| 伊人在线视频观看| 91丨九色丨蝌蚪富婆spa| 亚洲视频在线观看一区二区三区| 中文字幕免费一区二区| 久久青青草原| 电影中文字幕一区二区| 91成人性视频| 免费日本一区二区三区视频| 亚洲精品在线观看视频| 中文字幕理论片| 亚洲成人一二三| 国产欧美小视频| 成年人网站91| 欧美美女一级片| 午夜亚洲性色视频| 青青视频免费在线观看| 国产99久久| 成人女人免费毛片| 精品久久福利| 2018日韩中文字幕| 成年视频在线观看| 在线成人免费网站| 五月婷婷久久久| 日韩一区二区免费在线观看| 国产黄色免费视频| 亚洲不卡在线观看| 一区二区视频免费看| 国产日韩精品一区二区三区在线| 人妻精油按摩bd高清中文字幕| 美女网站一区二区| 久久精品午夜福利| 宅男噜噜噜66一区二区| 久久免费一级片| 天天做天天爱天天综合网2021| 欧美激情国产日韩| 国产香蕉精品| 亚洲最大成人在线| 天堂综合在线播放| 国产精品久久视频| 国产精品一区二区av影院萌芽| 久久久亚洲影院| 91国内在线| 久久精品免费电影| 午夜在线视频播放| 夜夜躁日日躁狠狠久久88av| 青草久久伊人| 日韩国产一区三区| 日本美女一级视频| 欧美xxx久久| av免费观看在线| 91精品国产手机| 91一区二区视频| 欧美久久久一区| 中文字幕码精品视频网站| 欧美影院午夜播放| 精品乱码一区内射人妻无码 | 国产露脸国语对白在线| 欧美日韩亚洲综合在线 | 精品国产91乱码一区二区三区| www.爱爱.com| 日韩欧美国产精品| 亚洲国产一二三区| 欧美成人精品1314www| 性做久久久久久久| 欧美videossexotv100| 午夜久久久久久噜噜噜噜| 精品久久人人做人人爽| 日本高清视频网站| 日韩精品极品在线观看| 人人九九精品| 中文字幕日韩在线视频| 免费观看成人高潮| 欧美高清视频免费观看| 91破解版在线观看| 热门国产精品亚洲第一区在线| 国产精品专区免费| 国产精品久久91| 亚洲一区二区av| 不卡视频一区二区三区| 激情小说亚洲色图| 久久久久久久久久久久久久一区 | 一区二区三区四区在线观看视频| aaa在线观看| 久久综合国产精品台湾中文娱乐网| 成人日批视频| 亚州精品天堂中文字幕| 精品免费av在线| 91亚洲午夜在线| 岛国av一区| 日韩精品久久久毛片一区二区| 日韩欧美在线中字| 成人毛片100部免费看| 亚洲精品激情| 黄色永久免费网站| 国产福利91精品一区二区三区| 黄色免费看视频| 国产日韩欧美一区二区三区乱码| 天天操夜夜操av| 午夜久久久久久久久久一区二区| 中文区中文字幕免费看| 日韩女优毛片在线| 狠狠狠综合7777久夜色撩人| 久久久黄色av| 周于希免费高清在线观看| 国产中文日韩欧美| 牛牛影视一区二区三区免费看| 亚洲自拍偷拍二区| 国产精品日本| a级大片免费看| 欧美激情中文字幕| 国产在线拍揄自揄拍无码视频| 欧美一a一片一级一片| 风流少妇一区二区三区91| 中文国产成人精品| 大桥未久在线视频| 成人午夜在线视频一区| 亚洲最好看的视频| 大陆极品少妇内射aaaaaa| 日韩在线一区二区| 超碰caoprom| 亚洲麻豆国产自偷在线| 欧美brazzers| 亚洲第一色中文字幕| 黄色片网站在线| 国产精品wwwwww| 国内毛片久久| 50度灰在线观看| 久久国产免费看| 国产人妻大战黑人20p| 亚洲一卡二卡三卡四卡无卡久久| 国产原创中文av| 亚洲人成网在线播放| √最新版天堂资源网在线| 亚洲va久久久噜噜噜| 欧美激情偷拍自拍| 国产成人精品视频ⅴa片软件竹菊| 成人黄色av电影| 欧美成人免费观看视频| 在线电影一区二区三区| 阿v免费在线观看| 欧美在线视频a| 麻豆一区一区三区四区| 97干在线视频| 国产精品一区二区久激情瑜伽| 国产激情无码一区二区三区| 欧美日韩美女一区二区| 国产永久av在线| 国产成人a亚洲精品| 精品中文一区| 精品国产成人av在线免| 99re这里只有精品首页| 国产一级免费av| 精品剧情在线观看| av3级在线| 国产一区精品视频| 国产欧美丝祙| 醉酒壮男gay强迫野外xx| 色综合网站在线| 国产日本在线视频| 国产精品电影一区| 日韩精品dvd| 国产无遮挡猛进猛出免费软件| 国产精品久久久久影院老司| 中文字幕一区二区三区四区免费看| 一区二区三区四区在线观看视频| 成人午夜一级| 中文字幕欧美日韩一区二区| 国产一区二区三区在线观看精品| 国产探花在线视频| 日韩三级视频在线观看| 色婷婷av在线| 久久av一区二区三区漫画| 久久蜜桃精品| 欧美巨胸大乳hitomi| 欧美日韩电影在线| 五月天激情在线| 国产精品一区二区三区四区五区| 一本色道久久综合亚洲精品不| 久久人人爽人人爽人人片| 色噜噜狠狠色综合欧洲selulu| av播放在线观看| 亚洲free嫩bbb| 最新国产乱人伦偷精品免费网站| 超碰97人人干| 欧美色电影在线| 午夜羞羞小视频在线观看| 国产伦精品一区二区三区高清| 老司机一区二区三区| 少妇高潮一区二区三区喷水| 日韩一级黄色大片| 在线高清av| 手机福利在线视频| 成人精品电影在线观看| 成年人视频免费| 欧美成人免费全部观看天天性色| 久久久亚洲欧洲日产| 亚洲成人av免费看| 一区二区三区美女视频| 日韩电影网址| 成人亚洲综合色就1024| 亚洲黄色成人| 你懂得视频在线观看| 精品日产卡一卡二卡麻豆| 小黄鸭精品aⅴ导航网站入口| 丰满女人性猛交| 91美女在线观看| 国产又粗又猛又爽又黄视频| 91精品国产高清久久久久久| 日韩夫妻性生活xx| 少妇一级淫片免费放播放| 欧美性猛片xxxx免费看久爱| 超碰在线网站| 亚洲精品成人自拍| 不卡的av网站| 国产免费无遮挡| 国产成人在线播放|