精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Nature封面:AI訓練AI,越訓越離譜

人工智能 新聞
訓練數據是用 GPT-4o 生成的?那質量不好說了。

我們知道,大模型面臨的三大挑戰是算法、算力和數據。前兩者靠優化升級,后者靠積累。隨著技術的不斷發展,高質量數據已經逐漸成為最大的瓶頸。

在很多新模型上,人們為了提升模型能力,都采用了使用 AI 生成數據來訓練的方式。人們普遍認為,使用合成數據可以顯著提升模型質量。

不過,最新的研究認為,使用 AI 生成的數據并不是什么好辦法,反而可能會讓模型陷入崩潰。

今天發表在學術頂刊《自然》雜志的封面研究認為,如果放任大模型用自動生成的數據訓練自己,AI 可能會自我退化,在短短幾代內將原始內容迭代成無法挽回的胡言亂語。

圖片

這篇由牛津大學等機構提交的研究,強調了由于自我訓練導致人工智能模型崩潰(Model Collapse)的風險,論證了原始數據源和仔細數據過濾的必要性。

圖片

論文鏈接:https://www.nature.com/articles/s41586-024-07566-y

哪種模型容易崩潰?

研究認為,當人工智能模型在生成的數據上進行過度訓練時,就會發生不可逆轉的模型崩潰。

「模型崩潰是指由于對合成數據進行不加區分的訓練而導致模型崩潰的現象」,牛津大學研究員、該論文的主要作者 Ilia Shumailov 表示。

根據論文所述,大型語言模型等生成式 AI 工具可能會忽略訓練數據集的某些部分,導致模型只對部分數據進行訓練。

眾所周知,大語言模型(LLM)需要巨量數據進行訓練,從而使自身獲得解釋其中信息并應用于各種用例的能力。LLM 通常是為了理解和生成文本而構建的,但研究小組發現,如果忽略它據稱正在閱讀并納入其知識庫的大量文本,可能會很快地使 LLM 淪為空殼。

「在模型崩潰的早期階段,模型首先會失去方差,在少數數據上的表現下降,在模型崩潰的后期階段,模型則會完全崩潰」,Shumailov 說道。因此,隨著模型繼續在模型本身生成的越來越不準確和相關的文本上進行訓練,這種遞歸循環會導致模型退化。

模型崩潰,到底是什么

在該論文中,作者發現的模型崩潰效應是一種退化過程,模型生成的數據會污染下一代模型的訓練集。模型接受受污染數據的訓練,會錯誤地感知現實,如下圖 (a) 所示。

圖片


模型崩潰可以分為早期和后期階段,早期模型會在少數數據上表現下降,后期模型會收斂到一種與原始分布幾乎沒有相似之處的分布,并且方差通常大大減少。

模型崩潰發生主要是因為下述三個特定誤差源在幾代模型中復合,并導致與原始模型出現較大偏差:

  • 統計近似誤差。這是由于樣本數量有限而產生的主要誤差,并且隨著樣本數量趨于無窮大而消失。發生這種情況是因為重采樣的每一步都可能丟失信息。

  • 函數表達誤差。這是第二種類型的誤差,是由于函數逼近器表達能力有限而產生的。特別是,神經網絡只是通用逼近器,無法完美地逼近任何分布。神經網絡可以在原始分布之外引入非零似然,或者在原始分布內引入零似然。函數表達誤差的一個簡單例子是,如果我們嘗試用單個高斯擬合兩個高斯的混合。即使我們有關于數據分布的完美信息(即無限數量的樣本),模型誤差也將是不可避免的。然而,在沒有其他兩種類型的誤差的情況下,這種情況只能發生在第一代模型。

  • 函數逼近誤差。這是次要類型的誤差,主要源于學習過程的局限性,例如隨機梯度下降的結構偏差。

上述每一項都可能導致模型崩潰變得更糟或更好。更高的逼近能力甚至可以是一把雙刃劍,更好的表達能力可以抵消統計噪聲,從而很好地逼近真實分布,但它同樣會加劇噪聲。這通常會產生級聯效應,其中個體的不準確性結合起來會導致整體誤差增加。

例如,過度擬合密度模型會導致模型錯誤推斷,將高密度區域分配給訓練集未覆蓋的低密度區域。

值得注意的是,還存在其他類型的誤差。例如,計算機在實踐中的精度有限。

語言模型中的模型崩潰

作者在文中還評估了模型崩潰對語言模型的影響。模型崩潰在各種機器學習模型中普遍存在。然而,與通常從零開始訓練的小模型(如 GMMs 和 VAEs)不同,LLM 需要巨大的成本從頭開始訓練,因此通常使用預訓練模型(如 BERT、RoBERTa 或 GPT-2)初始化,這些模型是在大型文本語料庫上訓練的。隨后,這些模型被微調以適應各種下游任務。

在這篇論文中,作者探討了當語言模型使用由其他模型生成的數據進行連續微調時會發生什么。本文中涉及的所有實驗可以在非微調設置下用更大的語言模型輕松復制。鑒于訓練一個中等規模的模型需要的算力也非常可觀,作者選擇不進行這樣的實驗,而是專注于更現實的概念驗證設置。

需要注意的是,本文描述的語言實驗即使在這種情況下也需要幾周時間才能完成。作者評估了訓練語言模型的最常見設置 —— 微調設置,其中每個訓練周期都從一個具有最新數據的預訓練模型開始。這里的數據來自另一個經過微調的預訓練模型。由于訓練被限制在生成與原始預訓練模型非常相似的模型,并且這些模型生成的數據點通常只會產生非常小的梯度,因此預期在微調后,模型只會發生適度的變化。作者使用 Meta 通過 Hugging Face 提供的 OPT-125m 因果語言模型進行了微調。

案例研究:教堂和長耳大野兔

研究人員在論文中提供了一個使用文本生成模型 OPT-125m 的示例(使用 wikitext2 數據集微調),該模型的性能與 ChatGPT 的 GPT-3 類似,但需要的算力較少。

研究人員將有關設計 14 世紀教堂塔樓的文本輸入到模型中。在第一代文本輸出中,該模型主要討論了在不同教皇統治下建造的建筑物。但到了第九代文本輸出,該模型主要討論了大量的黑尾、白尾、藍尾、紅尾和黃尾長耳大野兔。我們應該注意到的是,其中大多數并不是真正存在的長耳大野兔物種。

圖片

大模型輸出的內容:從教堂到 100 多種語言,再到野兔。

實驗結果表明,即使原數據一直保留,但模型崩潰的現象仍然會發生。隨著不斷迭代,模型開始忘記真實數據中的信息,并且生成的內容中包含越來越多重復的短語。

網絡充斥 AI 內容,「數據源」早已被污染

看到這里你可能會問了:那還不簡單,不使用合成數據訓練 AI 不就完事了?但實際上,現在能從互聯網上獲取的「數據」,里面已經不知道有多少是 AI 生成的了,而且我們經常無法把它們和正常內容區分開來。

互聯網上充斥著各種內容,這并不是新鮮事。正如研究人員在論文中指出的那樣,早在大規模語言模型(LLM)成為公眾熟知的話題之前,惡意網站就已經在制造內容,以欺騙搜索算法優先顯示他們的網站以獲取點擊量。隨著 OpenAI 的 GPT 系列大模型問世,生成式 AI 已經并將會極大地改變文本和圖像內容的生態。

AI 生成文本可比人類說廢話快得多,這引發了更大規模的擔憂。杜克大學專門研究隱私與安全的計算機科學家艾米麗 - 溫格 Emily Wenger 曾在文章中寫到相關內容:「盡管 AI 生成的互聯網對人類的影響還有待觀察,但 Shumailov 等人報告稱,在線上大量涌現的 AI 生成內容可能對這些模型本身造成毀滅性的影響。」

「模型崩潰帶來的問題之一是對生成式 AI 的公平性構成挑戰。崩潰的模型會忽略訓練數據中的一些不常見元素,從而無法反映世界的復雜性和細微差別,」Wenger 補充道,「這可能導致少數群體或觀點的代表性減少,甚至可能被抹去。」

大型科技公司正在采取一些措施,以減少普通網絡用戶看到的 AI 生成內容的數量。3 月份,谷歌宣布將調整其算法,把那些看起來是為搜索引擎而非人類搜索者設計的頁面的優先級進行降低。然而,這一聲明是在 404 Media 關于谷歌新聞推廣 AI 生成文章的報道之后發布的。

《自然》雜志封面的這項研究強調,訪問原始數據源并在遞歸訓練的模型中仔細過濾數據,有助于保持模型的準確性。

該研究還建議,創建大型語言模型(LLM)的 AI 社區可以協調合作,追蹤輸入到模型中的信息來源。「否則,隨著這種技術的廣泛應用,如果無法獲得在技術普及之前從互聯網上爬取的數據或大量人類生成的數據,訓練新的 LLM 版本可能會變得越來越困難」,研究團隊總結道。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-07-29 07:04:00

大模型AI訓AI人工智能

2025-05-08 06:00:00

AI幻覺AI人工智能

2021-08-16 15:47:02

AI決策人工智能

2023-08-31 07:16:32

人工智能AI算力

2021-08-16 20:45:52

AI人工智能

2024-07-25 13:56:49

2024-07-29 08:00:00

模型論文

2025-08-06 06:00:00

AI人工智能AI安全

2025-07-24 10:43:46

2025-11-04 08:43:00

2024-08-06 11:09:37

2021-09-29 15:36:43

人工智能算法AI

2021-09-18 09:52:07

AI 數據人工智能

2025-05-26 09:06:00

2025-09-01 08:46:00

AI數據職業

2025-07-01 08:37:13

2021-01-18 08:23:09

大數據AI人工智能

2018-05-05 08:54:24

2024-09-09 10:20:00

AI模型

2017-12-17 16:24:31

云計算AISaaS
點贊
收藏

51CTO技術棧公眾號

国产普通话bbwbbwbbw| 在线视频 日韩| 日本高清中文字幕在线| 精品一区二区三区视频| 久热精品视频在线观看| 免费黄视频在线观看| www.综合网.com| 91尤物视频在线观看| 日本欧美爱爱爱| 99久久精品久久亚洲精品| 99riav视频一区二区| 亚洲精品视频免费观看| 久久99精品久久久久久秒播放器| 国产精品尤物视频| 欧美成人69| 日韩精品视频在线| 亚洲娇小娇小娇小| mm视频在线视频| 91亚洲精品一区二区乱码| 日韩av快播网址| 欧美视频www| 欧美日韩播放| 日韩一区二区三区四区五区六区| 久久久久久久中文| 触手亚洲一区二区三区| 国产精品一区二区久久精品爱涩 | 欧美激情在线一区| 偷拍女澡堂一区二区三区| 国产精品久久久久久久久久久久久久久| 一区二区三区久久| 免费在线成人av电影| 国产伦精品一区二区三区四区| 亚洲国产第一| 日韩一区视频在线| 国产制服丝袜在线| 日本伊人久久| 欧美无砖专区一中文字| 久久视频这里有精品| 久cao在线| 久久久99精品免费观看不卡| 国产精品久久波多野结衣| 在线观看亚洲黄色| 一级成人国产| 欧美激情精品久久久久久蜜臀| 五月开心播播网| 成人直播在线观看| 91精品国产综合久久久久| 男人舔女人下面高潮视频| 国产精品剧情| 久久久午夜电影| 国严精品久久久久久亚洲影视| 99国产在线播放| 韩国av一区二区三区| 国产精品免费在线免费| 波多野结衣电影在线播放| 亚洲欧美日韩在线观看a三区| 欧美高清在线播放| 亚洲天堂网av在线| 91综合网人人| 在线日韩欧美视频| 国产又黄又粗视频| 国产伦一区二区三区| 亚洲男女性事视频| 天天插天天射天天干| 美腿丝袜亚洲图片| 亚洲国产第一页| 婷婷五月精品中文字幕| 操欧美女人视频| 亚洲成人久久电影| 北京富婆泄欲对白| 国产精品天天看天天狠| 亚洲高清av在线| 一起草在线视频| 88久久精品| 日韩精品一区二区在线| 日本精品一二三区| 牛牛影视一区二区三区免费看| 亚洲成年人在线播放| 你懂的在线观看网站| 老牛精品亚洲成av人片| 国产视频亚洲精品| 69精品无码成人久久久久久| 欧洲乱码伦视频免费| 自拍亚洲一区欧美另类| 成人涩涩小片视频日本| 激情综合在线| 欧洲成人在线观看| 中文字幕乱码无码人妻系列蜜桃| 极品少妇一区二区三区精品视频| 91欧美精品午夜性色福利在线| 国产情侣激情自拍| 成人小视频在线| 欧美日韩在线观看一区| 91在线网址| 亚洲视频在线一区二区| 综合视频免费看| 毛片在线网址| 色天天综合久久久久综合片| 午夜视频在线网站| 亚洲精品午夜| 日韩精品中文字幕有码专区| 一级特黄曰皮片视频| 国产精品久久久久久麻豆一区软件 | 欧美日韩看看2015永久免费| 中文精品99久久国产香蕉| 青娱乐国产在线| 亚洲麻豆一区| 国产精品偷伦免费视频观看的| 国产不卡精品视频| 91麻豆国产福利精品| 日韩视频在线观看国产| 50度灰在线| 色老头久久综合| aaaaaaaa毛片| 亚洲免费观看高清完整版在线观| 久久在精品线影院精品国产| 国产欧美一区二区三区在线看蜜臂| 毛片av一区二区三区| 国产麻豆日韩| 黄色动漫在线| 色就色 综合激情| 丰满少妇xbxb毛片日本| 国产精品二区不卡| 国内精品免费午夜毛片| 国产又黄又大又粗的视频| 97久久精品人人做人人爽50路| 好色先生视频污| 性欧美1819sex性高清| 亚洲黄色免费三级| 久久精品一区二区三区四区五区| 亚洲一区观看| 国产精品国产三级国产专区53 | 91麻豆精品视频| 亚洲巨乳在线观看| 国产直播在线| 欧美大片免费久久精品三p | 日韩久久综合| 91av在线看| 黄色小视频免费观看| 国产精品成人一区二区艾草 | 五月婷婷六月香| 国产欧美日本| 国产不卡一区二区在线观看| 免费在线观看av片| 欧洲在线/亚洲| 久久久久中文字幕亚洲精品| 亚洲成av人片一区二区密柚| 国产精品欧美日韩| 福利成人在线观看| 欧美色播在线播放| 黑丝av在线播放| 影音先锋日韩资源| 97超碰人人看人人| 国产人成网在线播放va免费| 5858s免费视频成人| 卡一卡二卡三在线观看| 天堂蜜桃91精品| 欧美另类高清视频在线| 欧美大片高清| 亚洲国产中文字幕在线观看| 久久久99精品| 粉嫩一区二区三区性色av| 亚洲一二三区在线| 国产精品4hu.www| 久久九九国产精品怡红院| 中文字幕+乱码+中文乱码91| 亚洲国产高清aⅴ视频| 中文字幕第80页| 妖精一区二区三区精品视频 | 免费超爽大片黄| youjizzjizz亚洲| 97久久精品视频| 无码h黄肉3d动漫在线观看| 欧美日韩国产一区在线| 香蕉网在线播放| 久久久国产精品一区二区中文| 欧美久久久久久久| 精品久久在线| 久久久av一区| 国产av无码专区亚洲av| 亚洲成人午夜电影| 一本色道综合久久欧美日韩精品 | 一道本在线视频| 亚洲欧美日韩人成在线播放| 韩国三级与黑人| 亚洲激情精品| 青娱乐国产91| 自拍偷拍亚洲图片| 久久999免费视频| 香蕉国产在线视频| 欧美日韩一区在线观看| 午夜国产福利视频| 国产精品1区2区| 国产69精品久久久久999小说| 蜜桃一区二区三区| 成人久久一区二区三区| 国产乱妇乱子在线播视频播放网站| 日韩高清免费在线| 欧美高清69hd| 亚洲综合色区另类av| 玖玖爱在线观看| 国模娜娜一区二区三区| 免费看一级大黄情大片| 日韩欧美视频在线播放| 国产精品一级久久久| 外国电影一区二区| 久久久久久网站| 午夜视频在线免费观看| 亚洲国产另类久久精品| 夜夜躁很很躁日日躁麻豆| 亚洲第一主播视频| 东京热无码av男人的天堂| 懂色一区二区三区免费观看 | 天堂√中文最新版在线| 精品激情国产视频| 在线观看xxx| 欧美xxxx在线观看| 国产伦子伦对白视频| 在线观看免费亚洲| 欧美男人亚洲天堂| 欧美日韩国产综合视频在线观看中文| 国产免费美女视频| 国产精品久久精品日日| 免费福利视频网站| 久久这里只有精品6| 性欧美丰满熟妇xxxx性久久久| 国产精品99久久久久久久女警 | 福利网址在线观看| 五月天中文字幕一区二区| 加勒比av在线播放| 亚洲九九爱视频| 亚洲天堂黄色片| 一色桃子久久精品亚洲| 超碰97av在线| 中文字幕成人av| 五月天精品在线| 国产欧美一区二区精品仙草咪| 少妇真人直播免费视频| 久久婷婷色综合| 精品人妻少妇嫩草av无码| 91免费版在线看| 91成年人网站| 国产婷婷色一区二区三区| 妺妺窝人体色WWW精品| 久久久精品国产99久久精品芒果| 我和岳m愉情xxxⅹ视频| 久久精品亚洲精品国产欧美 | 亚洲图片自拍偷拍| 久操视频免费在线观看| 亚洲国产精品久久久久婷婷884 | 国产精品三区在线观看| 亚洲女人的天堂| 免费一级片视频| 精品久久久一区二区| 6080午夜伦理| 欧美日韩小视频| 99热这里只有精品9| 日韩欧美第一区| 亚洲 精品 综合 精品 自拍| 亚洲视频日韩精品| 色网站免费在线观看| 米奇精品一区二区三区在线观看| 在线观看午夜av| 久久久免费av| 桃子视频成人app| 91亚洲国产成人精品性色| 成人黄色av网址| 欧美精品七区| 亚洲91久久| 男人用嘴添女人下身免费视频| 麻豆成人精品| 五月天六月丁香| av电影在线观看一区| 国产一区二区三区四区五区六区 | 日韩精品一区二区免费| 中国女人久久久| 亚洲欧美自偷自拍另类| 国产精品99久久久久久似苏梦涵| 疯狂揉花蒂控制高潮h| 欧美国产一区在线| 中文字幕第28页| 欧美综合一区二区| 二区三区在线视频| 国产午夜精品全部视频在线播放| www久久日com| 日韩免费观看网站| 欧美.com| 日韩.欧美.亚洲| 黄色av一区| jizz欧美性11| 99久久夜色精品国产网站| 亚洲色图27p| 精品久久久久久久久久| 国产精选久久久| 亚洲嫩模很污视频| 中文字幕中文字幕在线十八区 | 中文字幕一区二区三区视频| 日本一区二区免费在线观看| 欧美日韩国产a| 外国精品视频在线观看| 视频一区视频二区国产精品 | a天堂中文在线88| 久久久久久久久国产| 欧美网站免费| 欧美午夜精品理论片a级大开眼界| 在线电影一区二区| 亚洲综合日韩欧美| 久久亚洲一级片| 日本熟妇毛耸耸xxxxxx| 日韩一二三区不卡| 日本在线观看视频| 国产成人鲁鲁免费视频a| 亚洲综合网站| 国产树林野战在线播放| 蜜臀av一级做a爰片久久| 亚欧洲乱码视频| 午夜精品aaa| 亚洲第一色网站| 久久精品国产视频| 久久精品资源| 日本亚洲自拍| 亚洲综合丁香| a视频免费观看| 调教+趴+乳夹+国产+精品| 国产91麻豆视频| 欧美高清视频一区二区| 视频一区国产| 免费cad大片在线观看| 国产最新精品免费| 国产精品免费在线视频| 欧美日韩1234| 在线观看美女网站大全免费| 国产精品久久久久77777| 神马电影久久| 久久国产色av免费观看| 国产片一区二区| 丁香社区五月天| 亚洲男人天堂久| 欧美色网一区| 水蜜桃亚洲精品| 免费一级片91| 国产视频不卡在线| 欧美日韩国产首页| 免费黄色网页在线观看| 成人妇女免费播放久久久| 国产精品精品国产一区二区| 日韩精品aaa| 一区二区三区四区在线免费观看 | 欧美性受黑人性爽| 国产乱码字幕精品高清av | 色呦呦网站一区| fc2在线中文字幕| 91免费在线视频| 亚洲天堂偷拍| 男生裸体视频网站| 色诱亚洲精品久久久久久| 高清毛片在线看| 成人免费观看a| 狠狠综合久久| 国产三级国产精品| 欧美曰成人黄网| 精品黄色免费中文电影在线播放| 亚洲最大的成人网| 亚洲人妖在线| av网站免费在线看| 欧美久久一二三四区| 羞羞视频在线观看免费| 国产一区免费在线| 久久久亚洲人| 天天天天天天天天操| 欧美成人官网二区| 91久久国产综合久久91猫猫| 亚洲精品中字| 国产91精品在线观看| 手机在线看片1024| 日韩视频永久免费观看| 国内精品偷拍| www欧美激情| 亚洲一二三四在线观看| 国产在线一二三区| 91免费国产视频| 国产精品久久777777毛茸茸| 中文字幕第二区| 亚洲精品一区二区三区精华液| 成人自拍av| 污污污污污污www网站免费| 久久久久国产精品免费免费搜索| 国产喷水福利在线视频| 奇门遁甲1982国语版免费观看高清| 国产精品久久久久久影院8一贰佰| 欧美激情 亚洲| 欧美另类z0zxhd电影| 理论不卡电影大全神| 一区二区三区电影| 2020国产精品自拍| 亚洲a视频在线| 国产日韩欧美视频| 国产一区二区三区的电影 | 视频一区二区三区不卡| 久久国产精品免费一区|