精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

比知識蒸餾好用,田淵棟等提出連續概念混合,再度革新Transformer預訓練框架

人工智能 新聞
來自 Meta 等機構的研究者提出了一種新穎且高效的預訓練框架:連續概念混合(Continuous Concept Mixing, CoCoMix),其將離散的下一個 token 預測與連續概念相結合。

近年來,大型語言模型(LLMs)的進展徹底改變了自然語言處理領域,并因此成為各種現實應用中的核心技術,例如代碼助手、搜索引擎和個人 AI 助手。

這些突破的核心在于對「下一個 token 預測」的范式。

然而,自然語言 token 代表的意思通常是表層的(例如 the 或 a 這樣的功能性詞匯),需要模型進行大量訓練才能獲得高級推理和對概念的理解能力,同時也限制了它們處理長期任務(如規劃)的能力。

為了解決這一問題,最近的研究探索了超越 token 層面信號的方法。例如有研究表明稀疏自編碼器(Sparse Autoencoders, SAEs)能夠通過捕捉高級語義概念,有效地分離出大型語言模型(LLMs)中有意義的潛在特征。

本文,來自 Meta 等機構的研究者提出了一種新穎且高效的預訓練框架:連續概念混合(Continuous Concept Mixing, CoCoMix),其將離散的下一個 token 預測與連續概念相結合

CoCoMix 用來預測從預訓練的稀疏自編碼器中學習到的連續概念,并通過與 token 隱藏表示交錯的方式將其混合到模型的隱藏狀態中。

具體來說,本文使用經過預訓練的 SAE 提取語義概念,并根據歸因(attribution)分數選擇最具影響力的概念,這些分數量化了每個概念對模型輸出的影響。然后,模型通過交叉熵損失訓練,從其隱藏狀態中預測這些選定的概念。一旦預測出多個概念,就將它們壓縮為單個連續概念,并通過與 token 嵌入交錯的方式混合(或插入)到隱藏狀態中,從而直接貢獻于下一個 token 的預測。

本文通過在多個語言建模基準和不同規模的預訓練模型(從百萬級到十億級參數規模)上進行了評估,從而證明了 CoCoMix 的有效性。

結果表明,CoCoMix 采樣效率更高,優于標準的下一個 token 預測、知識蒸餾以及插入停頓 token。本文發現,在端到端的框架中結合概念學習和交錯技術對于性能提升至關重要。

CoCoMix 性能有多好?舉例來說,當將 CoCoMix 應用于一個 1.38B 規模的模型時,CoCoMix 在減少 21.5% 訓練 token 的情況下,實現了與下一個 token 預測相當的性能。

此外,CoCoMix 在弱監督到強監督的場景中表現出顯著改進,其中從小模型中提取的概念甚至可以用作監督更大模型訓練的標簽。

圖片

  • 論文標題:LLM Pretraining with Continuous Concepts
  • 論文地址:https://arxiv.org/pdf/2502.08524
  • 項目地址:https://github.com/facebookresearch/RAM/tree/main/projects/cocomix

此前,Meta 提出了大型概念模型(LCM),同樣也是通過概念而非 token 進行學習和推理,被許多聲音認為是大模型范式變革的新起點?,F在看來,CoCoMix 出現,讓 Meta 在創新算法逐步取代「連續預測下一個 token」這條道路上又邁出了重要的一步。

CoCoMix 介紹

CoCoMix 是一個使用連續概念擴展下一個 token 預測的框架。

其核心訓練流程包括:一個概念選擇框架(參見圖 1 左),以及兩個用于學習和利用連續概念的訓練步驟(step)(參見圖 1 右)。

  • 首先,本文使用歸因分數選擇重要概念,該分數衡量了每個概念對輸出的影響。
  • 然后,本文提出通過交叉熵損失從模型的隱藏狀態中預測選定的概念,使模型能夠隱式地學習哪些概念應被編碼為隱藏表示。
  • 最后,本文利用預測的概念創建一個連續概念,并將其交錯插入到隱藏狀態中,使模型能夠顯式地學習如何使用連續概念以及 token 隱藏狀態。直觀上,模型選擇性地學習哪些概念對下一個 token 預測有用,以及如何將這些概念與 token 表示混合。


圖片

實驗

實驗部分,研究者主要通過以下幾個問題對 CoCoMix 進行了實證評估: 

  • CoCoMix 能否提高 LLM 預訓練中下一個 token 預測的性能?(圖 2 和圖 3) 
  • 與其他知識提煉方法相比,CoCoMix 在弱到強監督設置中是否有所改進?(表 1 和圖 4) 
  • CoCoMix 是否引入了模型的可解釋性和可操縱性?(圖 5) 
  • CoCoMix 的每個建議組件對性能有何貢獻?(圖 6) 

首先是兩個核心結果:

  1. 在相對大規模的預訓練設置中與 NTP 的比較;
  2. 與 KD 基線的比較,尤其是在從小模型中提取的概念用于指導大模型的弱到強監督場景中。

大規模使用 CoCoMix 改進 NTP

如圖 3 所示,CoCoMix 在各種規模的模型上都能持續顯著提高下游任務的整體性能。結果還表明,較大的模型(如 386M 和 1.38B)可以從使用從較小的 124M 模型中提取的概念中獲益,顯示了有效的弱到強監督。

圖片

如圖 2 所示,在十億級規模的模型上,CoCoMix 與 NTP 相比持續提高了性能。例如,CoCoMix 的性能與 NTP 相近,但使用的 token 卻減少了 21.5%,顯示了很高的采樣效率。最后,值得注意的是,使用 CoCoMix 所獲得的性能增益隨著訓練步驟的增加而增加,顯示出很強的泛化性能。

圖片

與 KD 基線的比較

研究者還將 CoCoMix 與 KD 基線在多種情況下進行了比較,包括:

  1. 較強的教師模型教授較小的學生模型;
  2. 弱到強的監督,即較弱的教師教授較大的學生模型;
  3. 分布轉移,即學生在不同于教師預訓練分布的語料庫上接受訓練。

如表 1 所示,在這些模型配置中,CoCoMix 都比 KD 有所改進。特別是,CoCoMix 在從弱到強的監督設置中表現出了顯著的性能提升,例如在 386M 中平均復雜度提高了 2.8,而 KD 并沒有表現出很大的改進。這是因為較弱的教師可能會引入噪聲或次優知識,尤其是當學生的能力超過教師時。

圖片

在圖 4 中也可以觀察到這一趨勢,當學生的能力超過教師時(尤其是在分布轉移場景中),使用 KD 訓練的模型在訓練中途會落后于標準訓練。相比之下,CoCoMix 選擇性地利用了有用的概念,從而實現了持續的性能提升。

圖片

CoCoMix 的可解釋性和可操縱性

CoCoMix 的另一個核心優勢在于其可解釋性和模型操縱。具體來說,由于模型經過訓練后可以預測其隱藏狀態中的概念,因此研究者可以根據概念預測結果來分析其重點關注的概念。此外,通過放大預測概念 z_t 的大小,可以控制模型的輸出生成。

為了驗證可操縱性是否達到預期效果,研究者在預訓練模型的 SAE 潛在空間 c 中對同一概念的激活進行操縱,并確認輸出是否表現出相應的概念。這里使用的是用 CoCoMix 訓練的 386M 參數模型,其中預訓練模型為 GPT-2。

如圖 5 所示,當與「網站地址」相關的概念被放大時,兩個模型都開始生成實際的網站地址。這表明本文模型成功地學習了 GPT-2 對齊概念。

圖片

CoCoMix 有效性分析

隨后,研究者對 CoCoMix 進行了詳細分析,以驗證每個提出的組件的效果。角度如下:

  1. 歸因分數對選擇概念的有效性;
  2. 概念預測與直接隱藏狀態預測(即用連續損失預測隱藏狀態,而不是用 SAE 將隱藏狀態離散化)之間的比較;
  3. 壓縮權重的稀疏性;
  4. 通過分析概念預測和混合的貢獻進行成分分析;
  5. 通過比較將概念向量添加到原始隱藏狀態和混合(將概念向量與 token 隱藏表示交錯),對概念調節進行設計選擇;
  6. CoCoMix 與 Pause token(即添加可學習 token)之間的比較。

此處,研究者使用了 69M Transformer,并在 OpenWebText 數據集中的 20B token 上進行訓練。

更多研究細節,可參考原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-02-26 00:20:00

AI模型

2024-12-19 09:48:07

2025-10-08 10:19:29

2025-03-03 09:16:00

Meta模型預測

2024-03-08 12:35:41

模型數據

2023-06-12 09:57:22

AIChatGPT

2021-12-06 09:53:09

自然語言神經網絡人工智能

2024-12-12 09:00:00

2025-06-20 08:47:00

量子計算AI模型

2023-03-17 08:28:17

GPT-4AI

2022-11-02 14:02:02

強化學習訓練

2024-10-16 13:50:00

模型AI

2024-10-28 08:50:00

2025-03-25 09:12:00

LIMAI模型

2021-11-15 10:00:22

模型人工智能NLP

2020-09-22 09:54:19

谷歌Android開發者

2025-10-23 12:28:40

2023-12-07 06:51:18

AI模型

2024-02-27 11:46:40

2024-09-20 15:35:33

點贊
收藏

51CTO技術棧公眾號

欧美日韩理论片| 一区二区三区欧美在线| 欧美一级片免费在线观看| 国产精品入口久久| 91精品国产麻豆国产自产在线 | 在线中文字日产幕| 国产超碰精品| 亚洲亚洲人成综合网络| 日韩精品久久一区二区三区| 国产黄色片网站| 老**午夜毛片一区二区三区| 九九九热精品免费视频观看网站| 久久精品国产亚洲av麻豆| 91麻豆精品国产综合久久久 | av女名字大全列表| 六月婷婷色综合| 97色在线播放视频| 大地资源高清在线视频观看| 欧美电影完整版在线观看| 欧美日韩国产在线观看| 亚洲熟妇av日韩熟妇在线| 日本www在线观看视频| www..com久久爱| 亚洲一区二区三区视频播放| 中文字幕精品无| 午夜在线精品| 97av视频在线| 久久一级黄色片| 影音先锋日韩精品| 日韩午夜在线视频| 亚洲码无人客一区二区三区| 国产精品一区二区三区美女| 91精品国产一区二区人妖| 亚洲五月天综合| 欧美男男tv网站在线播放| 亚洲一区二区三区四区在线观看| 五月天色婷婷综合| 在线激情小视频| 久久色在线观看| 精品国产一区二区三区麻豆免费观看完整版 | 91久久夜色精品国产网站| 69视频免费在线观看| 激情五月***国产精品| 九九热这里只有精品免费看| 日韩精品一区二区亚洲av性色| 日韩欧美精品| 中文字幕久精品免费视频| 中日韩精品一区二区三区| 欧美人妖在线观看| 日韩精品中文字幕久久臀| 亚洲欧美日韩偷拍| 在线观看视频一区二区三区| 日韩视频免费直播| 黑人性生活视频| 日本精品在线播放| 日韩欧美国产系列| 99免费观看视频| 精品国内亚洲2022精品成人| 日韩av在线免费播放| 黄色国产在线观看| 一区二区三区韩国免费中文网站| 精品小视频在线| 国产男男chinese网站| 久久综合亚洲| 色婷婷综合成人av| 超碰手机在线观看| 亚洲美女色禁图| 2018国产精品视频| 91porny九色| 另类专区欧美蜜桃臀第一页| 亚洲www永久成人夜色| 亚洲成人一级片| 9i在线看片成人免费| 免费一区二区三区在在线视频| 精品av中文字幕在线毛片| 中文字幕不卡在线观看| 制服丝袜综合日韩欧美| 美女网站视频在线| 日韩欧美国产视频| 91看片破解版| 精品综合久久88少妇激情| 亚洲欧美精品一区二区| 2017亚洲天堂| 国语自产精品视频在线看8查询8| 国产91对白在线播放| 中文字幕一区二区三区波野结| 韩国欧美国产一区| 国产尤物99| 国产大片在线免费观看| av网站在线免费看推荐| 成人黄页毛片网站| 色综合久久av| 日本精品600av| 色8久久精品久久久久久蜜| 超碰人人草人人| 色爱av综合网| 久久久精品在线| 国产无遮挡呻吟娇喘视频| 精油按摩中文字幕久久| 黑人中文字幕一区二区三区| av播放在线| 午夜一区二区三区在线观看| 波多结衣在线观看| 盗摄牛牛av影视一区二区| 中文字幕一区电影| 西西44rtwww国产精品| 国产一区二区女| 欧美午夜欧美| 国产三线在线| 欧美一区二区三区婷婷月色| 久久久久久国产精品无码| 欧美日韩1080p| 国产精品视频xxx| 日色在线视频| 午夜精品福利一区二区蜜股av| 波多野结衣xxxx| 女人av一区| 97高清免费视频| 亚洲a视频在线观看| 18成人在线视频| 黄色免费观看视频网站| 日韩精品视频在线看| 在线不卡国产精品| 99久久久久久久久| www.日韩精品| 人体内射精一区二区三区| 国产成人视屏| 日韩一区二区精品视频| 91视频在线视频| 91麻豆福利精品推荐| 精品视频免费在线播放| 一区二区三区四区高清视频 | 亚洲女同志freevdieo| 亚洲精品在线网站| 欧美三级 欧美一级| 国产自产视频一区二区三区| 一区二区三区四区免费视频| 成人在线不卡| 日韩中文字幕不卡视频| 黄色av一区二区| 中文字幕欧美激情| 91制片厂毛片| 欧美高清在线| 亚洲aaa激情| 日韩少妇视频| 精品国产精品网麻豆系列| 久久精品人妻一区二区三区| 成人看片黄a免费看在线| 日本一级黄视频| 都市激情亚洲| 97在线视频免费观看| 日韩中文字幕综合| 午夜天堂影视香蕉久久| 麻豆国产精品一区| 久久蜜桃精品| 五月天亚洲综合小说网| 日韩美女在线| 欧美成人免费全部| 欧美一级淫片免费视频魅影视频| 国产精品字幕| 欧美成人a视频| 国产一级在线免费观看| 91丨九色丨蝌蚪富婆spa| 欧美日韩在线中文| 精品成av人一区二区三区| 国产精品欧美风情| 国产原创在线观看| 精品黑人一区二区三区久久| 99热在线观看免费精品| 久久综合色鬼综合色| 精品久久久久久中文字幕2017| 日韩一区二区在线| 91中文字幕一区| www.youjizz.com在线| 亚洲精品永久免费精品| 在线免费观看日韩视频| 一区二区在线免费观看| 精品黑人一区二区三区观看时间| 日韩在线播放一区二区| 国产在线拍揄自揄拍无码| 果冻天美麻豆一区二区国产| 日韩免费观看网站| av网站免费在线观看| 亚洲精品美女视频| 岳乳丰满一区二区三区| 亚洲一区二区av电影| 国产传媒国产传媒| 国产乱码精品一区二区三区忘忧草| 日本午夜激情视频| 成人在线电影在线观看视频| 91麻豆精品秘密入口| 性欧美freesex顶级少妇| 日韩视频在线观看免费| 亚洲av成人无码久久精品老人 | 亚洲免费电影在线| 中文字幕在线观看的网站| 久久精品99国产国产精| 欧美大片在线播放| 久久精品久久久| 久久精品日韩| 日韩在线亚洲| 国产精品久久久久久一区二区 | 国产精品高潮呻吟久久av无限| 在线中文免费视频| 在线观看国产成人av片| 香港一级纯黄大片| 91精品欧美一区二区三区综合在| 九九精品免费视频| 夜夜嗨av一区二区三区网页| 免费看91的网站| 97精品国产97久久久久久久久久久久 | 日韩亚洲欧美在线观看| 无码人妻丰满熟妇区bbbbxxxx| 亚洲一二三专区| 亚洲综合视频网站| 欧美激情一区不卡| 成人网站免费观看| 国产91精品一区二区麻豆亚洲| 污视频免费在线观看网站| 国产亚洲欧洲| 国产av国片精品| 欧美1级日本1级| 在线看无码的免费网站| 欧美精品系列| 欧美日韩免费观看一区| 欧美激情15p| 国产一区二区不卡视频| 视频一区日韩| 亚洲影影院av| 国产精品白丝久久av网站| 国产精品永久免费观看| 88xx成人网| 国产成人精品在线观看| www.成人爱| 欧美在线观看一区二区三区| av资源中文在线天堂| 欧美激情在线观看| 国产手机在线观看| 久久99热99| wwwwwxxxx日本| 麻豆国产精品777777在线| 99草草国产熟女视频在线| 久久久成人网| 日韩毛片在线免费看| 久久中文精品| 亚洲三级视频网站| 免费观看在线综合色| 日韩肉感妇bbwbbwbbw| 蜜芽一区二区三区| 免费av不卡在线| 极品少妇xxxx精品少妇偷拍| 久久久精品高清| 国产综合久久久久久鬼色 | 欧美一级做一级爱a做片性| 国产精品福利网站| 欧美日韩免费电影| 91麻豆国产精品| 伊人久久噜噜噜躁狠狠躁| 国产高清精品一区二区| 久久影院资源站| 欧美12av| 久久精品高清| 亚洲av首页在线| 在线成人h网| 免费在线观看的av网站| 日本亚洲天堂网| 国产美女视频免费看| 成人午夜精品一区二区三区| 少妇毛片一区二区三区| 国产欧美一区二区精品仙草咪| 99自拍偷拍视频| 亚洲一区二区三区美女| 啦啦啦免费高清视频在线观看| 欧洲亚洲国产日韩| 999av视频| 亚洲精品国精品久久99热| 久草在线青青草| 精品国产一区二区三区在线观看 | 99久久99久久| 亚洲深夜福利在线观看| 在线视频不卡一区二区三区| 欧美日本一区| 一本久道综合色婷婷五月| 精久久久久久久久久久| 性活交片大全免费看| 久久精品无码一区二区三区| 动漫性做爰视频| 欧美视频一区二区三区…| 亚洲天天综合网| 亚洲精品国产精品国产自| 午夜伦理在线| 97视频免费在线观看| 亚洲伊人精品酒店| 精品九九九九| 在线国产一区| 人妻无码视频一区二区三区| 国产精品69毛片高清亚洲| 国产色视频一区二区三区qq号| 亚洲欧美日韩一区二区| 伦av综合一区| 欧美成人国产一区二区| jzzjzzjzz亚洲成熟少妇| 欧美极品少妇与黑人| 粉嫩91精品久久久久久久99蜜桃| 国产精品区免费视频| 欧美第一精品| 国产精品人人妻人人爽人人牛| 成人午夜私人影院| 亚洲综合视频网站| 欧美午夜一区二区三区免费大片| 欧美一区二区三区激情| 精品国产一区二区三区久久| 欧美不卡高清一区二区三区| 国内精品二区| 国产精品av一区二区| 亚洲美女性囗交| 国产三级一区二区三区| 日韩精品一区二区在线播放| 这里是久久伊人| 日本成人网址| 国产精品美女久久| 韩日一区二区三区| 成人在线免费在线观看 | 久操视频免费看| 亚洲国产欧美在线| 国产欧美第一页| 日韩在线视频观看| 日本欧美日韩| 欧美另类一区| 国产日韩一区二区三区在线| 又色又爽又黄18网站| 一区二区三区四区在线播放| 国产精品无码天天爽视频| 最好看的2019年中文视频| 日韩不卡在线| 偷拍视频一区二区| 丝袜美腿一区二区三区| 男女黄床上色视频| 欧美日韩亚洲一区二| 亚洲欧洲综合在线| 日本精品一区二区三区在线| 偷拍自拍亚洲色图| 欧美爱爱视频免费看| 成人av网站在线观看| 日韩av一二三区| 日韩不卡在线观看| 欧美三级网站| 欧洲av一区| 毛片一区二区三区| 丝袜 亚洲 另类 欧美 重口| 日韩女优毛片在线| heyzo中文字幕在线| 久久av一区二区| 视频一区二区三区在线| 337人体粉嫩噜噜噜| 欧美日本韩国一区二区三区视频| 免费日本一区二区三区视频| 亚洲自拍欧美色图| www.天堂在线| 亚洲天堂男人天堂| 成人激情视屏| 成人手机在线播放| av欧美精品.com| 国产suv精品一区二区33| 最近2019免费中文字幕视频三 | 国产精品一区二区免费| 国产日韩综合| 国产精品久久久视频| 欧美一区二区在线看| av中文资源在线资源免费观看| 久久香蕉综合色| 美女网站色91| 欧美黄色免费看| 日韩精品视频免费| 欧美高清xxx| 亚洲国产精品无码观看久久| 久久久久久麻豆| 国产乱淫a∨片免费视频| 久久久久久国产| 久久成人高清| 国模大尺度视频| 色伊人久久综合中文字幕| 麻豆免费在线视频| 久久国产精品免费一区| 蜜臀久久99精品久久久久久9| 久久r这里只有精品| 亚洲欧美中文日韩v在线观看| 最新亚洲国产| 精品中文字幕av| 中文字幕综合网| 天堂91在线| 91久久国产综合久久蜜月精品| 久久婷婷丁香| 99视频只有精品| 亚洲少妇中文在线| jazzjazz国产精品麻豆| 日韩中文字幕a| 欧美性猛交xxxx富婆| 中国av在线播放| 日韩电影免费观看在|