精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

牛津劍橋「投毒」AI失敗9次登Nature封面,引爆學術圈激辯!AI訓AI能否打破崩潰魔咒?

人工智能 新聞
牛津劍橋的9次投毒導致模型崩潰的論文,已經遭到了諸多吐槽:這也能上Nature?學術圈則對此進行了進一步討論,大家的觀點殊途同歸:合成數據被很多人視為靈丹妙藥,但天下沒有免費的午餐。

AI時代,數據就是新的石油。全球人類數據逐漸枯竭的時代,合成數據是我們的未來嗎?

最近Nature封面一篇論文引起的風波,讓我們明白:重要的并不是「合成數據」,而是「正確使用合成數據」。

本周四,牛津、劍橋、帝國理工、多倫多大學等機構的一篇論文登上了Nature封面。

他們提出了AI的「近親繁殖」問題,即如果在訓練中不加區別地只用AI產生的內容,就會發生模型崩潰。

圖片

不過,讓人沒想到的是,論文一經刊出便引發了AI社區的大量討論。

圖片

圖片

一些人認為,問題的核心不在「合成數據」上,而是在「數據質量」上。

即使全部用的是人工數據,如果質量太差,那結果一樣也是「垃圾進垃圾出」。

圖片

圖片

甚至,有人覺得研究者故意采用了與實際操作不匹配的方法,實際上是在「嘩眾取寵」。

圖片

對此,馬毅教授表示,如今我們已經走進了缺少科學思想和方法的時代——

許多研究,不過都是重新發現一些科學常識。

圖片

如何避免模型崩潰?

那么問題來了,在使用AI合成數據時,如何才能避免發生模型崩潰呢?

混合數據才是未來

對于這篇Nature封面的文章,Scale AI的CEO Alexandr Wang深表贊同。

他表示,利用純合成數據來訓練模型,是不會帶來信息增益的。

通常,當評估指標因「自蒸餾」(self-distillation)而上升時,大概率是因為一些更隱蔽的權衡:

  • 合成數據可以在短期內提升評估結果,但之后你會為模型崩潰付出代價
  • 你在訓練或微調模型過程中積累了隱形的債務,而這些債務將很難償還

圖片

具體而言,在連續幾代的合成訓練中,錯誤主要來自三個方面:

  • 統計近似誤差(statistical approximation error)
  • 功能表達誤差(functional expressivity error)
  • 功能近似誤差(functional approximation error)

也就是,每次你用上一個模型生成的數據來訓練新模型時,都會丟失一些信息和精度,導致模型變得越來越空洞,最終無法正常工作。

圖片

雖然這些實驗是在小規模模型(100M參數)上進行的,但觀察到的基本效應也會隨著時間的推移在更大規模的模型上出現。

例如,今天的大多數模型無法生成像Slate Star Codex風格的博客文章,這也是由于模型崩潰的原因。隨著我們連續訓練模型,它們逐漸失去了在廣泛分布上進行預測的能力。

圖片

在Wang看來,混合數據(Hybrid Data)才是未來的發展方向,它能夠避免所有與模型崩潰相關的棘手問題。

也就是說,在合成數據的過程中,必須通過某種新的信息來源來生成:

(1)使用真實世界數據作為種子

(2)人類專家參與

(3)形式邏輯引擎

相比之下,那些不慎使用了無信息增益的合成數據來訓練模型的開發者,終將會發現他們的模型隨著時間的推移變得越來越奇怪和愚蠢。

強化學習is all you need

來自Meta、紐約大學和北京大學的研究人員,提出了一種通過人類或較弱模型的「排序-修剪反饋」方法,可以恢復甚至超越模型原來的性能。

對于這項研究,LeCun也進行了轉發,表示支持。

圖片

眾所周知,不管是對于人類還是機器來說,區分一個示例的好壞,要遠比從頭生成一個高質量的樣本容易得多。

基于此,作者提出了一種全新的方法——通過合成數據反饋來防止模型崩潰。

圖片

論文地址:https://arxiv.org/abs/2406.07515

為了研究這個問題,作者首先在理論環境中提供了分析結果。

在這里,作者提出了高維極限下的高斯混合模型和線性模型作為分類器,并讓一個驗證者(例如人類或oracle)來選擇或修剪生成的數據。

結果顯示,當合成數據點的數量趨于無限時,基于選定數據訓練的模型可以達到與原始數據訓練相媲美的最佳結果。

在合成數據上的模擬顯示,與使用原始標注相比,oracle監督始終能產生接近最佳的結果。

此外,由于通過人類監督來分辨高質量數據比直接人類標注更簡單且成本更低,這為人類參與監督的有效性提供了有力的證據。

圖片

一個具有線性生成器和線性剪枝器的高斯混合模型:其中的剪枝器通過選擇強化合成數據來提高性能

接下來,作者進行了兩個大規模的實驗:

1. 在算術任務(矩陣特征值預測)上訓練Transformer,并使用與真實值的距離來修剪大量合成數據

2. 使用大語言模型(Llama 2)和有限的合成數據進行新聞摘要

結果顯示,在這兩種情況下,僅依賴生成數據會導致性能下降,即使數據量增加,也會出現模型崩潰。

并且,僅根據困惑度從生成池中選擇最佳解決方案并不會提升性能,即模型本身缺乏基于困惑度選擇最佳預測的能力。

相反,在oracle監督下,可以獲得一個基于反饋增強的合成數據集,其性能隨著數據量的增加而超過了原始數據集。

圖片

通過人類和模型的強化,可以提升性能并防止模型崩潰;而在沒有強化的情況下則會出現性能下降

因此,在用合成數據訓練新模型時,不僅要關注生成器的質量,還需要一個高質量的驗證者來選擇數據。

一句話總結就是:reinforcement is all you need!

真實數據+合成數據

對于讀者們對于這篇Nature封面論文的吐槽,斯坦福大學的博士生Rylan Schaeffer表示理解。

他指出,模型崩潰通常出現在研究人員故意采用與實際操作不匹配的方法時。

數據積累可以崩潰,也可以不崩潰,這完全取決于具體的操作細節。

你們故意把它弄崩潰,它當然就會崩潰了。??

圖片

在這篇斯坦福、馬里蘭和MIT等機構合著的論文中,Schaeffer研究了積累數據對模型崩潰有何影響。

經過實驗后他們確認,用每一代的合成數據替換原始的真實數據,確實會導致模型崩潰。

但是,如果將連續幾代的合成數據與原始的真實數據一起積累,可以避免模型崩潰。

圖片

論文地址:https://arxiv.org/abs/2404.01413

在實踐中,后代LLM會隨著時間推移,在不斷增加的數據中進行訓練,比如Llama 1需要1.4萬億個token,Llama 2需要2萬億個token,Llama 3需要15萬億個token。

從某種意義上說,這種數據積累設定是極其悲觀的——

在這個假設的未來中,合成數據被不受控制地傾倒在互聯網上,用于訓練模型的下一次迭代。

圖片

如圖右側所示,積累數據可以避免模型崩潰

研究者使用了因果Transformer、擴散模型和自變分編碼器三種不同的實驗設置,分別在真實文本、分子構象和圖像數據集上進行了訓練。

他們發現,替換數據會導致所有模型和所有數據集的模型崩潰,而積累數據可以避免模型崩潰。

基于Tranformer的因果語言建模

首先,他們在文本數據上訓練了因果Transformer。

具體來說,就是在TinyS-tories上預訓練了單個epoch的9M參數GPT-2和 12M、42M和125M參數的Llama 2語言模型。

前者是一個470M token的,GPT-3.5/4生成的幼兒園閱讀水平的短篇故事數據集。

對于每次模型擬合迭代n≥2,研究者會從上一次迭代的語言型中采樣一個與TinvStories大小相同的新數據集,然后用新生成的數據集替換或連接以前的數據集。

在每次模型擬合迭代中,他們會來自上一次迭代的替換或串聯數據集來預訓練一個新的初始化模型。

圖片

結果顯示,對于所有架構、參數計數和采樣溫度,隨著模型擬合迭代次數的增加,替換數據會導致測試交叉熵的增加(圖2左)。

同時他們還發現,對于所有架構、參數計數和采樣溫度,隨著模型擬合迭代次數的增加,積累的數據會導致測試交叉熵等于或更低(圖2右)。

圖3是重復替換數據(頂部)和積累數據(底部)時各個模型擬合迭代的學習曲線。

結果顯示,數據積累避免了語言建模中的模型崩潰。

圖片

125M的Llama2和9M的GPT-2,在替換數據(R)時都表現出了質量下降,但在積累數據(A)時,卻保持了高質量的文本生成。

圖片

分子構象數據的擴散模型

接下來,他們在分子構象數據上訓練擴散模型序列。

具體來說,研究者在GEOMDrugs數據集上訓練了GeoDiff,這是一種用于分子構象生成的幾何擴散模型。

他們將GEOM-Drugs數據集的訓練部分下采樣到40,000個分子構象,將其用作初始訓練集,并為每個預測執行50個擴散步驟。

結果經過8次模型擬合迭代,研究者發現:替換數據時測試損失增加,這與我們的語言模型實驗相匹配,并且累積數據時測試損失保持相對恒定(圖4)。

圖片

與語言模型不同,他們發現,當替換數據時,在合成數據訓練的第一次模型擬合迭代中,性能會顯著惡化,并且在后續迭代中不會進一步大幅下降。

圖像數據的自變分編碼器

實驗最后,研究者在CelebA上訓練了自變分編碼器(VAE)序列,該數據集包含了20萬張人臉圖像,分為訓練集和測試集。

這種選擇,在具有許多樣本、彩色圖像和分辨率的現實數據集,和在累積數據上訓練模型多次迭代的計算可行性之間,達到了平衡。

結果他們發現,在每次迭代中替換數據再次表現出模型崩潰——

測試誤差會隨著每次額外的迭代而迅速上升,并且每次迭代產生的質量較低且生成的面孔多樣性較少,直到所有模型生成都代表單一模式。

圖片

相比之下,在每次迭代中,積累數據會顯著減緩模型崩潰——

隨著每次額外的迭代,測試誤差的增加速度顯著減慢。

雖然與圖6的中圖和右圖相比,世代的多樣性確實下降了,它仍然代表數據集中變化的主要軸,例如性別,但模型似乎不再沿著數據流形的更短軸生成其他細節,例如眼鏡和配件。

還有一個有趣的現象是,與語言建模不同,積累數據的測試誤差確實會隨著迭代次數的增加而增加(盡管比替換數據慢得多)。

為什么會存在這種差異?這個研究方向就留給未來了。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-07-25 13:56:49

2024-07-29 07:04:00

大模型AI訓AI人工智能

2024-07-25 12:35:33

2023-06-16 13:02:22

GPT-5GPT-4AI

2024-11-25 09:00:00

2025-04-25 10:57:39

2024-11-08 12:18:39

SynthID谷歌AI

2023-12-11 19:08:03

AI模型

2022-04-14 12:37:23

AI模型系統

2025-06-17 09:08:00

2018-06-05 11:27:12

2022-03-10 15:04:36

AI破解文字

2025-09-11 15:22:31

2023-08-22 14:07:14

AI機器

2023-06-05 09:48:19

谷歌模型

2025-05-06 00:35:33

2025-07-17 07:07:00

AI系統CISO安全

2021-12-02 15:57:46

AI 數據人工智能

2018-04-03 11:47:16

AI手機人工智能

2023-03-11 13:15:01

AI模型系統
點贊
收藏

51CTO技術棧公眾號

久久久久久综合网天天| 精品日韩欧美在线| 永久免费精品视频网站| 成人激情四射网| 国产精品毛片在线| 日韩性xxxx爱| av漫画在线观看| 色综合天天色| 亚洲猫色日本管| 91黄在线观看| www.亚洲激情| 亚洲国产三级| 大胆欧美人体视频| 免费污网站在线观看| 亚洲高清在线一区| 欧美三级资源在线| 日韩欧美国产免费| 在线观看av免费| 国产欧美日韩在线观看| 国产91免费视频| 在线观看毛片av| 国产一区二区三区久久久久久久久| 久久精品国产欧美亚洲人人爽| 日本黄色免费观看| 欧美1区2区3| 欧美老肥妇做.爰bbww| 国产精品亚洲a| av2020不卡| 亚洲综合网站在线观看| 中文字幕黄色大片| 成人不用播放器| 久久免费美女视频| 精品一区二区国产| 蜜桃av噜噜一区二区三区麻豆| 狠狠色丁香婷婷综合| 国产精品国产自产拍高清av水多| 少妇一级淫片免费放中国 | 国产大片aaa| 欧美激情亚洲| 久久成人精品电影| 精品国产大片大片大片| 成人综合久久| 一色桃子一区二区| 蜜乳av中文字幕| 国产乱码精品一区二区三区四区| 亚洲精品久久久久久下一站| 伊人久久一区二区三区| 4438全国亚洲精品观看视频| 日韩欧美国产不卡| 三上悠亚 电影| 精品一区二区三区中文字幕| 91精品在线观看入口| 涩涩网站在线看| 2019中文亚洲字幕| 欧美一卡二卡在线观看| 日本美女久久久| 视频精品一区| 精品久久久久久无| 亚洲第九十七页| 香蕉久久夜色精品国产使用方法| 亚洲精品自在久久| 熟女高潮一区二区三区| 大色综合视频网站在线播放| 日韩中文字幕在线| 丝袜 亚洲 另类 欧美 重口| 你懂的成人av| 97成人在线视频| 日韩欧美国产另类| 精品一二三四在线| 不卡视频一区| 午夜视频在线播放| 国产网站一区二区三区| 亚洲精品乱码视频| caopeng在线| 亚洲一区二区三区四区的| 亚洲国产精品无码av| 周于希免费高清在线观看| 欧美亚洲尤物久久| 国产裸体视频网站| 亚洲区小说区图片区qvod按摩| 亚洲图片欧洲图片av| 成人18视频免费69| 在线观看一区| 国产精品海角社区在线观看| www.97av| 久久精品一区二区三区四区| 在线播放 亚洲| 岛国在线视频网站| 欧美日韩午夜在线| 日本不卡视频一区| 日韩av在线播放网址| 久久精品亚洲热| 日产精品久久久| 久久成人免费网站| 久久国产精品久久精品国产| 四虎久久免费| 欧美日韩国产专区| 五月天视频在线观看| 理论片一区二区在线| 色先锋资源久久综合5566| 久久精品视频9| 理论片日本一区| 精品国产乱码久久久久软件| 求av网址在线观看| 欧美日韩中文在线观看| 午夜免费一级片| 精品一区二区三区在线| 高清在线视频日韩欧美| 91麻豆视频在线观看| 91麻豆国产自产在线观看| 中国人体摄影一区二区三区| 97成人资源| 亚洲成色777777在线观看影院| 国产精品无码无卡无需播放器| 亚洲精选在线| 97久久天天综合色天天综合色hd| 成人在线免费观看| 午夜精品123| 涩视频在线观看| 亚洲高清资源在线观看| 国产成人在线视频| 亚洲aⅴ在线观看| 一区二区三区.www| 免费黄频在线观看| 精品九九在线| 国产成人激情视频| 五月天婷婷在线观看| 亚洲综合在线免费观看| 成人在线短视频| 91精品国产麻豆国产在线观看 | av不卡一区| 欧美成人精品在线观看| 亚洲一卡二卡在线观看| 国产亚洲一区二区三区在线观看 | 亚洲精品国偷自产在线99热| 久艹视频在线观看| 国产寡妇亲子伦一区二区| 一区二区在线不卡| 日韩深夜福利网站| 视频在线观看一区二区| 又骚又黄的视频| 中文av一区二区| 亚洲免费看av| 成人久久综合| 成人黄色生活片| 国产欧美黑人| 精品三级在线观看| 日本在线免费观看| 9i在线看片成人免费| 久久久亚洲精品无码| 黄色成人美女网站| 欧美一二三视频| 蝌蚪视频在线播放| 欧美午夜精品一区二区蜜桃| av手机在线播放| 久久99精品国产麻豆婷婷| 一本—道久久a久久精品蜜桃| av在线精品| 欧美国产日韩一区二区| 人妻一区二区三区四区| 欧美日韩国产中文精品字幕自在自线| www.久久国产| 免费的成人av| 99久久久无码国产精品性色戒| 久久天堂久久| 97精品国产97久久久久久| 亚洲欧美色视频| 在线观看亚洲一区| 999精品在线视频| 国产成人免费在线视频| 日本在线xxx| 成人影院天天5g天天爽无毒影院| 91美女片黄在线观| 岛国av在线网站| 国产亚洲精品91在线| 99久久婷婷国产一区二区三区| 一区二区三区中文在线| 日本高清www| 久久精品国产久精国产| 亚洲色成人www永久在线观看| 伊人久久大香线蕉av不卡| 国产欧美日韩91| 国产高清在线a视频大全 | 欧美精品亚洲一区二区在线播放| 黄色一级免费视频| 国产色婷婷亚洲99精品小说| 中文字幕日韩久久| 亚洲专区一区二区三区| 亚洲午夜精品一区二区三区| 高清日韩中文字幕| 国产欧洲精品视频| 超碰97免费在线| 日韩中文视频免费在线观看| 少妇一级淫片免费看| 欧美羞羞免费网站| 日韩免费在线视频观看| 国产精品伦一区二区三级视频| 人妻换人妻a片爽麻豆| 日本怡春院一区二区| 天天做天天躁天天躁| 成人精品视频| 久久综合九色99| 1313精品午夜理伦电影| 成人a免费视频| 色老太综合网| 韩国三级日本三级少妇99| 麻豆传媒在线免费看| 亚洲欧美一区二区精品久久久| 国产男女无套免费网站| 欧美专区亚洲专区| 免费在线不卡视频| 亚洲综合免费观看高清完整版| 国产成人一区二区在线观看| 99精品视频中文字幕| 午夜诱惑痒痒网| 三级久久三级久久| 国产午夜福利在线播放| 午夜精品影院| 99re99热| 日韩一区二区在线免费| 欧美大香线蕉线伊人久久| 波多野结衣欧美| 999久久久| 久久九九精品视频| 成人免费xxxxx在线观看| av亚洲一区二区三区| 欧美在线视频网站| 咪咪网在线视频| 久久久久久久久久婷婷| 亚洲国产精品精华素| 久久夜色精品国产| 韩国av网站在线| 久久精品国产一区| 尤物在线视频| 日韩中文字幕亚洲| 色综合久久影院| 在线亚洲欧美视频| 99中文字幕一区| 日韩中文字幕国产| 欧美性猛交xxx乱大交3蜜桃| 色偷偷9999www| 免费高清在线观看| 久久精品一区中文字幕| 嫩草在线视频| 九九久久精品一区| 欧美人体视频xxxxx| 欧美疯狂xxxx大交乱88av| 欧美极品少妇videossex| 欧美精品videosex性欧美| 最新国产露脸在线观看| 欧美夫妻性生活xx| 超碰91在线观看| 日本韩国在线不卡| 成人黄色视屏网站| 成人有码在线视频| 91国内精品| 国内一区在线| 国产精品亚洲人成在99www| 神马影院午夜我不卡影院| 久久成人综合| 337p亚洲精品色噜噜狠狠p| 在线观看一区视频| 国产一级片黄色| 另类调教123区| 少妇极品熟妇人妻无码| 99免费精品在线观看| 免费一级做a爰片久久毛片潮| 欧美国产欧美亚州国产日韩mv天天看完整| 麻豆视频免费在线播放| 亚洲精品中文字幕乱码三区 | 在线观看国产一区二区| 97精品久久人人爽人人爽| 日韩精品一区二区在线观看| 色噜噜一区二区三区| 曰本色欧美视频在线| 91精品国产91久久久久久青草| 97福利一区二区| 91九色综合| 成人18视频| 国产成人精品999在线观看| 椎名由奈jux491在线播放 | 97在线视频免费| 精品欧美日韩精品| 3d蒂法精品啪啪一区二区免费| 人人精品视频| 亚洲一区二区三区加勒比| 亚洲三级视频| 中文字幕免费高清在线| av综合在线播放| 日本美女黄色一级片| 亚洲aⅴ怡春院| 影音先锋国产在线| 亚洲福利精品在线| 欧洲美女少妇精品| 人人做人人澡人人爽欧美| av一级久久| 色之综合天天综合色天天棕色| 国内在线观看一区二区三区| 天天操天天摸天天爽| 成人精品小蝌蚪| 777777国产7777777| 色综合天天综合网天天看片| www国产在线| 中文字幕av一区中文字幕天堂| 欧美1—12sexvideos| 成人www视频在线观看| 小嫩嫩12欧美| 男女视频网站在线观看| 国产综合色在线| 懂色av蜜桃av| 欧美性猛交xxxx乱大交极品| 亚洲精品网站在线| 久久精品国产视频| 久久麻豆视频| 日本不卡久久| 噜噜噜久久亚洲精品国产品小说| 久久av一区二区三| 亚洲男帅同性gay1069| 狠狠躁夜夜躁人人爽视频| 日韩电视剧在线观看免费网站| 亚洲无线看天堂av| 91免费国产视频| 成人在线免费视频观看| 999精品网站| 91美女在线观看| 99久久精品国产亚洲| 精品国产百合女同互慰| 污视频免费在线观看| 91精品视频免费| 亚洲最大av| 亚洲综合伊人久久| 亚洲日本在线天堂| 国产精品天天操| 精品国偷自产在线视频99| 精品久久久网| 欧美日韩电影一区二区| 国产日韩一区二区三区在线播放| 六十路息与子猛烈交尾| 精品成人国产在线观看男人呻吟| 午夜影院免费体验区| 97精品一区二区三区| 久久99偷拍| 国产精品后入内射日本在线观看| 91在线高清观看| 久久久久久久久久久影院| 亚洲欧美成人一区二区在线电影| 345成人影院| 茄子视频成人在线观看 | 无吗不卡中文字幕| 偷拍自拍在线| 日韩av123| 日韩免费视频| 天天操夜夜操很很操| 樱花草国产18久久久久| 丰满肥臀噗嗤啊x99av| 国模吧一区二区三区| 中国av一区| www.日本一区| 亚洲精品va在线观看| 色呦呦视频在线| 青草成人免费视频| 日韩av免费大片| 韩国一区二区三区四区| 午夜精品一区二区三区电影天堂 | 中文字幕一区二区三区日韩精品| 97超碰在线人人| 久久久噜噜噜久噜久久综合| 最新在线中文字幕| 久久国产精品影片| 欧美变态网站| 九九视频精品在线观看| 亚洲欧美激情一区二区| 天天操天天操天天| 国产成人免费av| 最新精品国产| 亚洲天堂资源在线| 欧美日韩电影一区| 超碰中文在线| 亚洲永久一区二区三区在线| 国产乱子伦视频一区二区三区| 欧美一级视频免费观看| 中文字幕在线精品| 丁香婷婷成人| 91n.com在线观看| 玉足女爽爽91| 黄色的视频在线免费观看| 91夜夜未满十八勿入爽爽影院 | 神宫寺奈绪一区二区三区| 国产成人精品综合久久久| 欧美日韩日本国产亚洲在线 | 天堂成人在线| 91精品久久久久久久久久另类| 在线成人av| 成人信息集中地| 亚洲国产黄色片| 日韩成人综合网| 免费高清在线观看免费| 亚洲视频免费看| 国产精品麻豆一区二区三区| 99精彩视频|