精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

token危機解決?擴散模型數據潛力3倍于自回歸,重訓480次性能仍攀升

人工智能 新聞
擴散語言模型(DLMs)是超強的數據學習者。

token 危機終于要不存在了嗎?

近日,新加坡國立大學 AI 研究者 Jinjie Ni 及其團隊向著解決 token 危機邁出了關鍵一步。

在當前大語言模型(LLM)的持續發展中,面臨的挑戰之一是可用的高質量訓練文本數據(tokens)即將枯竭,并成為限制模型性能持續提升的關鍵瓶頸。另外,新增的高質量數據來源少,獲取成本高,去重后更加稀缺。因此,當模型規模繼續擴大,所需數據量按 Scaling Laws 成倍增加時,就出現了「優質 token 不夠訓練」的危機。

針對這一現象,該團隊從零開始預訓練了擴散語言模型(DLMs)與自回歸(AR)模型,其中規模最高至 80 億參數、4800 億 tokens、480 個 epoch。

研究有以下三項重要發現:

  • 在 token 數量受限的情況下,DLMs 優于 AR,并且具有超過 3 倍的數據潛力;
  • 一個僅用 10 億 tokens 訓練的 10 億參數 DLM,在 HellaSwag(常識推理基準) 上可達 56%,在 MMLU(綜合多任務語言理解基準) 上可達 33%,無任何技巧、無挑選數據;
  • 未出現性能飽和:重復訓練次數越多,提升越明顯。

此外,團隊還剖析了并行研究《Diffusion Beats Autoregressive in Data-Constrained Settings》中的嚴重方法論缺陷 —— 以共同提升開放評審的標準!

Jinjie Ni 在社媒 X 上詳細介紹了其團隊的研究結論、研究方法,接下來我們一一來看。

圖片

結論 1:擴散語言模型(DLMs)是超強的數據學習者。

如上所述,團隊從零開始預訓練了一系列 DLMs,規模最高達 80 億參數、4800 億 tokens。結果提供了有力證據:在普通網頁數據上進行重復訓練時,DLMs 在數據受限場景下無論模型規模如何,都優于自回歸(AR)模型,展現出顯著更高的潛力且未出現性能飽和。

總體而言,DLMs 的最終數據潛力比 AR 模型高出三倍以上。

圖片

結論 2:重復越多,收獲更多。

為了研究 DLM 訓練中 token 的全部潛力,團隊進行了額外實驗:將同一份 10 億 token 的數據集重復訓練 480 個 epoch,總訓練量達到 4800 億 tokens。結果顯示,模型在 HellaSwag 上取得約 56% 的準確率,在 MMLU 上取得約 33%,顯著優于 AR 的約 41% 和約 29%。

令人驚訝的是,即使在如此極端的重復條件下,性能依然未出現飽和,這表明 DLMs 能夠從固定的 10 億 token 語料中提取到遠超預期的有效信息。

圖片

「在驗證集上出現過擬合的模型,在下游任務上的表現卻持續提升。」為什么會這樣呢?

圖片

團隊可視化了多選評測中,真實答案與其他選項的平均負對數似然(NLL),以及它們之間的差值(△NLL)。即使在驗證集上出現「過擬合」后,真實答案與其他選項的 NLL 差距(△NLL)依然持續擴大,這表明盡管驗證損失在上升,模型的底層判別能力仍在不斷提升。這一現象在域內數據和域外數據的訓練中都同樣存在。

圖片

雖然 DLMs 對數據重復具有較強的魯棒性,但在訓練足夠長的 epoch 后,它們同樣會發生過擬合。更大的唯一數據量可以延緩過擬合的出現,而更大的模型規模則會加速過擬合的到來。

圖片

為什么 DLMs 是超強的數據學習者呢?原因有二。

其一,如下圖所示,網頁文本數據并非完全因果結構!雖然用非因果方向建模會導致更高的損失,但它仍然是可行的。這意味著僅用純因果方式來建模網頁數據是一種浪費!借助擴散目標和雙向注意力,DLMs 能夠對數據進行雙向建模,從網頁數據中提取到更多信息。

圖片

其二,DLMs 是「超密集模型」,它們在計算上的超高密度(每個任務需要更多的 FLOPs)直接轉化為更強的智能。

圖片

相比之下,AR 模型更優先考慮計算效率,而非數據潛力。它們的 Transformer 設計(包括教師強制和因果掩碼)最大化 GPU 的使用效率,但限制了建模能力。隨著計算成本下降,數據可得性反而成為關鍵瓶頸 —— 這正是團隊研究 DLMs 的動力所在。

擴散目標要求在有效訓練中,將預訓練數據集中的每個數據點在多個掩碼比例和組合下進行損壞,以便更精確估計期望值。這進一步解釋了為什么數據重復訓練能帶來如此顯著的收益。

圖片

巧合的是,一項同期研究「Diffusion Beats Autoregressive in Data-Constrained Settings」[1] 也探討了類似主題。然而,團隊在細致分析后,揭示了其中存在的若干方法論問題,可能導致結論存在偏差。

圖片

[1] 地址:https://arxiv.org/abs/2507.15857

在 [1] 的所有實驗中,研究者使用了損失函數 (1),但未做出明確的理論解釋。然而,這個損失函數與理論基礎更扎實、被廣泛采用的掩碼擴散語言建模損失 (2) 有顯著差異。從理論上可以證明損失函數 (1) 并不能忠實地表示模型似然,這可能會對其結論造成嚴重影響。

團隊還注意到,[1] 在最新的 arXiv v3 版本中對原始草稿進行了修改,增加了一個線性時間依賴的重新加權項。但仍假設其所有實驗均使用了公式 (1),因為論文中圖 4 (b) 的損失范圍與公式 (1) 的預期表現高度吻合。團隊期待 [1] 的代碼庫(在本文撰寫時仍為空倉庫)以及社區對相關實驗的復現。

圖片

問題來了:驗證集損失是比較 AR 和 DLM 的好指標嗎?簡短來說:當損失函數的形式本身有問題時,當然不是。它們并不代表相同的含義;即使損失函數形式正確,也依然不是好指標。

原因包括如下:

  • AR 測量的是精確的負似然,而 DLM 測量的是一個上界;
  • 更低的損失并不意味著更強的能力,這一點在上文的討論中已有體現。

此外,[1] 報告的 AR 基準測試結果距離最佳水平相差甚遠。換句話說,[1] 實際上是在拿一個尚未訓練到最佳狀態的 AR 檢查點,與一個最佳的擴散模型檢查點進行比較。這是不公平的。

圖片

此外,[1] 在比較 AR 與擴散模型的過擬合趨勢時,為 AR 使用了更大的模型規模和更少的唯一訓練 token 數量。這種設置并不公平,因為更大的模型在訓練數據多樣性不足的情況下,本身就更容易更早出現過擬合。

圖片

最后,[1] 中使用的 scaling law 公式假設驗證集損失不會下降,但這一假設在實際中并不成立,因為過擬合會導致驗證損失上升。這個有缺陷的假設會導致擬合效果不佳,并使基于其預測得出的任何結論產生偏差。

目前,團隊正在用一種瘋狂的設置訓練一個大模型,并在之后發布完整論文。

更多細節內容請參考博客和即將發布的論文。

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-08-14 09:10:00

2024-06-13 20:20:46

2025-07-10 14:54:13

AI模型圖像生成

2021-05-28 12:59:23

數據庫工具技術

2024-04-26 12:51:48

2023-05-24 07:47:23

ChatGPT參數模型

2023-05-26 07:47:41

ChatGPT模型AI

2025-03-25 12:44:24

2010-03-24 09:12:02

IE9性能測試

2025-05-27 15:28:11

模型訓練AI

2025-08-12 09:08:00

2019-12-18 16:17:56

自動駕駛數據人工智能

2025-05-30 15:54:16

模型AI生成

2023-09-04 10:05:01

GPT-4AI模型

2025-02-27 13:45:00

2025-08-04 08:23:00

2024-01-18 10:57:35

AIM模型NLP

2023-10-30 18:58:57

芯片

2024-11-12 13:10:49

2025-03-25 09:04:12

點贊
收藏

51CTO技術棧公眾號

亚洲av无码一区东京热久久| 日韩精品一区二区三区外面| 欧美精品入口蜜桃| 狠狠久久伊人| 色噜噜夜夜夜综合网| 自拍偷拍一区二区三区| 欧美 日韩 国产 成人 在线 91 | 老司机午夜精品99久久| 欧美成人免费一级人片100| 国产在线一区二区三区四区| www.国产一区二区| 亚洲精品成人| 日韩精品福利在线| 中文字幕精品一区二区三区在线| 538在线观看| 国产精品久久久久三级| 国产三区精品| 国产裸体永久免费无遮挡| 国产乱码精品一区二区亚洲| 欧美日韩国产综合一区二区| 男人插女人视频在线观看| 三级外国片在线观看视频| 成人av在线资源| 国产精品一区二区电影| 日韩欧美高清在线观看| 亚洲综合专区| 在线播放日韩欧美| chinese麻豆新拍video| 欧美激情三级| 欧美猛男超大videosgay| 久久成人免费观看| 后进极品白嫩翘臀在线视频| 日韩精品亚洲一区二区三区免费| 欧美激情在线观看视频| 国产一二三区精品| 成人在线免费小视频| 亚洲白拍色综合图区| 亚洲理论电影在线观看| 日本中文字幕伦在线观看| 91首页免费视频| 成人动漫视频在线观看免费| 一区二区三区免费高清视频| 日韩在线中文| 一区二区三区四区视频| 性欧美成人播放77777| 日韩在线伦理| 亚洲第一av色| 国产黄色激情视频| 自由的xxxx在线视频| 亚洲天堂福利av| 亚洲欧洲中文| av大片在线看| 国产精品嫩草影院com| 日韩免费电影一区二区| 国产玉足榨精视频在线观看| 久久久精品一品道一区| 欧美日韩精品免费看| 欧美特黄一级视频| 成人黄色一级视频| 国产一区二区高清不卡| 天天射天天色天天干| av影院午夜一区| 精品国产乱码久久久久软件 | 日本不卡一二区| 波多野结衣在线观看一区二区 | 欧美 日本 国产| 日韩高清电影免费| 国产午夜精品久久久| 中文字幕免费看| 久久不见久久见中文字幕免费 | 欧美图区在线视频| 中文字幕成人在线视频| 四虎视频在线精品免费网址| 91精品国产一区二区三区| ass极品水嫩小美女ass| 亚洲综合色婷婷在线观看| 亚洲大胆美女视频| 国产美女喷水视频| 日韩欧美一区二区三区在线视频 | 性欧美一区二区| 色乱码一区二区三区网站| 久久精品视频亚洲| 精品无码人妻一区二区三区| 亚洲欧美日本日韩| 国产九九精品视频| 亚洲黄色小说网| 久久综合色之久久综合| 一级做a爰片久久| 牛牛精品在线| 91黄色免费看| 国产精品熟女一区二区不卡| 青青草久久爱| 色偷偷av一区二区三区乱| 伊人久久久久久久久| 成人午夜亚洲| 精品久久久中文| 天天操天天爽天天射| 成年永久一区二区三区免费视频 | 国产91视频一区| 日韩激情电影| 91精品国产91热久久久做人人| 亚洲乱妇老熟女爽到高潮的片| 亚洲女娇小黑人粗硬| 中文字幕国产日韩| 9.1成人看片| 成人三级视频| 久久久久久久久久久人体| 亚洲 欧美 日韩 在线| 黑人精品欧美一区二区蜜桃| 激情视频一区二区| 菠萝菠萝蜜在线视频免费观看| 欧美色视频日本高清在线观看| 不卡的av中文字幕| 婷婷综合一区| 欧美老少配视频| 手机在线免费看片| 久久精品日韩欧美| 国产97人人超碰caoprom| 97人妻精品一区二区三区软件 | 亚洲综合色激情五月| 女人偷人在线视频| 亚洲综合久久久久| 欧美美女一级片| 要久久爱电视剧全集完整观看| 九九热视频这里只有精品| 国产主播第一页| 成人免费三级在线| 国产911在线观看| 91另类视频| 亚洲欧美日韩图片| 国产乡下妇女做爰| 国产精品88888| 亚洲美女网站18| 欧美大片1688| 亚洲欧美国产日韩天堂区| 久久久久成人片免费观看蜜芽| 美女久久久精品| 欧美日韩在线精品| 午夜激情在线播放| 亚洲精品成人久久久| 久久成人在线观看| 国产电影一区二区三区| 精品国产无码在线| 色婷婷成人网| 最近的2019中文字幕免费一页| 天堂网视频在线| 91麻豆免费看片| 高清欧美精品xxxxx| 中文字幕视频精品一区二区三区| 精品国产一区二区三区四区在线观看 | 欧美激情xxxx性bbbb| 国产高清在线观看视频| 综合久久给合久久狠狠狠97色| 91制片厂毛片| 久久精品99久久无色码中文字幕| 国产成人精品一区二区三区| 国产在线视频网址| 欧美性受xxxx| 乱老熟女一区二区三区| 久久99精品久久久久久国产越南 | 最新精品国产| 欧美精品久久久久久久| 午夜精品一区二区三| 樱花影视一区二区| 久久久久亚洲AV成人网人人小说| 亚洲黄色一区| 蜜桃久久精品乱码一区二区| 欧美专区福利免费| 中日韩美女免费视频网址在线观看| 青青国产在线视频| 中文字幕色av一区二区三区| 男人午夜视频在线观看| 欧美日韩一区自拍| 风间由美久久久| 夜鲁夜鲁夜鲁视频在线播放| 亚洲欧美在线免费观看| 伊人精品在线视频| 亚洲乱码国产乱码精品精的特点| 精品国产一二区| 一区二区三区四区五区精品视频| 免费在线观看一区二区| 欧美xxxx网站| 欧美情侣性视频| 青青草观看免费视频在线 | 国产三级按摩推拿按摩| 亚洲一区免费在线观看| www.久久国产| 蜜桃视频第一区免费观看| 97在线免费视频观看| 首页亚洲中字| 国产欧美一区二区三区四区| 中文在线字幕免费观看| 精品呦交小u女在线| 中文字幕久久网| 亚洲一区二区美女| 四虎永久免费在线观看| 国产在线一区二区综合免费视频| 国产白丝袜美女久久久久| 欧美精品乱码| 成人欧美一区二区三区视频xxx| 无遮挡在线观看| 久久精品精品电影网| 秋霞网一区二区| 欧美日韩在线播放| 日本a在线观看| 国产精品高潮呻吟| aaaa黄色片| 激情五月婷婷综合网| 欧美变态另类刺激| 亚洲色图网站| 日本欧美精品久久久| 97品白浆高清久久久久久| 国产精品美女在线观看| www.8ⅹ8ⅹ羞羞漫画在线看| 自拍偷拍亚洲一区| 天堂√在线中文官网在线| 亚洲综合免费观看高清完整版 | 国产精品成人一区二区艾草 | 国产日韩欧美麻豆| 深田咏美中文字幕| 国产精品白丝jk白祙喷水网站| 北条麻妃在线一区| 精品9999| 日韩a级黄色片| 久久国产精品亚洲人一区二区三区 | 亚洲最新中文字幕| 色窝窝无码一区二区三区| 欧美一区二区在线免费观看| 成人免费毛片视频| 色综合网站在线| 日本五十熟hd丰满| 伊人夜夜躁av伊人久久| 亚洲女人久久久| 国产欧美一区二区三区在线看蜜臀 | 一本久久a久久精品vr综合| 免费成人网www| 国产一区二区三区高清| 亚洲国产aⅴ精品一区二区| 91精品美女在线| 国产成人77亚洲精品www| 国内精品小视频| 亚洲电影天堂av| 欧美熟妇另类久久久久久不卡 | 日韩国产一区| 天天综合狠狠精品| 精品免费av| 欧洲精品一区色| 欧美人与牛zoz0性行为| 欧美人xxxxx| 自拍亚洲一区| 日韩av高清| 欧洲激情综合| 亚洲国产激情一区二区三区| 国产乱码精品一区二区亚洲 | 欧美一区二区视频| 精品亚洲男同gayvideo网站| 瑟瑟在线观看| 国产午夜精品视频免费不卡69堂| 九色视频在线观看免费播放| 亚洲人高潮女人毛茸茸| 国产黄在线看| 日韩在线视频国产| 黄色网页在线看| 亚洲丁香久久久| 四虎永久在线观看| 日韩精品免费电影| 免费a级毛片在线观看| 亚洲视频欧洲视频| 91大神在线网站| 久久精品91久久久久久再现| 18在线观看的| 午夜精品久久久久久久99热浪潮| 欲香欲色天天天综合和网| 欧洲亚洲免费在线| 久久久成人av毛片免费观看| 国产日本欧美在线观看| 日本一区影院| 精品欧美一区二区在线观看视频| 蜜桃一区二区三区| 天天爱天天做天天操| 国产尤物精品| av观看免费在线| 国内一区二区三区| koreanbj精品视频一区| 日本免费在线视频不卡一不卡二| 91国内在线播放| 成人av网址在线| 能直接看的av| 99久久国产综合精品女不卡| 久久精品无码一区| 亚洲日本丝袜连裤袜办公室| 国产午夜福利一区二区| 91国产成人在线| 国产色片在线观看| 日韩成人高清在线| 欧洲不卡av| 97视频免费在线看| 欧美国产视频| 精品国产一区二区三区四区精华| 第九色区aⅴ天堂久久香| 成人免费a级片| 久久只有精品| 69xxx免费视频| 国产精品私人影院| 丁香六月婷婷综合| 日韩欧美亚洲国产精品字幕久久久 | 绯色av蜜臀vs少妇| 国产欧美一区二区三区网站| 日韩黄色免费观看| 欧美亚洲愉拍一区二区| 日本成人动漫在线观看| www高清在线视频日韩欧美| 九色porny丨入口在线| 亚洲一区二区久久久久久久 | 亚洲永久一区二区三区在线| 亚洲精选一区| 波多野结衣中文字幕在线播放| 久久精品一级爱片| 日韩经典在线观看| 欧美一区二区日韩| caoporn国产精品免费视频| 91国产在线精品| 日本高清久久| 在线看视频不卡| 日本一不卡视频| 国产精品无码电影| 一区二区三区四区不卡在线| 中文字幕制服诱惑| 亚洲人a成www在线影院| 色是在线视频| 国产乱码一区| 欧美视频不卡| 91视频福利网| 亚洲欧美综合色| 在线观看不卡的av| 国产一区二区三区久久精品| 蜜桃av在线播放| 国内视频一区| 在线成人av| 国产一卡二卡三卡四卡| 夜夜精品浪潮av一区二区三区| 国产又粗又猛又爽又黄视频| 中文国产亚洲喷潮| 亚洲mmav| 日韩女优中文字幕| 日韩有码一区二区三区| 干b视频在线观看| 色久综合一二码| 国产资源在线播放| 国产成人一区二区三区电影| 国产毛片一区二区三区| 手机在线免费观看毛片| 亚洲国产精品av| 中文字幕视频免费观看| 中文综合在线观看| 91麻豆精品国产综合久久久| 国产高清精品软男同| 韩国欧美国产一区| 久久av高潮av无码av喷吹| 亚洲成人久久久久| 麻豆mv在线看| 欧美日本韩国一区二区三区| 日韩在线观看一区二区| 国产91在线播放九色| 91精品国产综合久久福利| 欧美人与动牲性行为| 国产一区二区三区免费不卡| 六月婷婷一区| 亚洲色图欧美色| 欧美一区二区福利视频| gratisvideos另类灌满| 欧美二区三区| 看片网站欧美日韩| 欧美黑人一级片| 亚洲精品一区二区三区不| 成人av集中营| 国产内射老熟女aaaa| 成人97人人超碰人人99| 国产字幕在线观看| 久久久精品免费| 精品精品精品| 精品久久久久久中文字幕2017| 一区在线观看视频| 天天射天天色天天干| 国产精品爽爽ⅴa在线观看| 欧美一区二区三区另类| 亚洲国产精品自拍视频| 欧亚一区二区三区| 天天操天天射天天| 国产精品69精品一区二区三区| 欧美高清视频在线观看mv| 久久久久亚洲av无码专区首jn| 福利一区福利二区微拍刺激| 午夜在线免费观看视频| 成人在线资源网址| 奇米一区二区三区| 国产在线观看免费av| 这里只有精品视频| 高清一区二区三区| 亚洲一级片免费|