精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

人類創造的數據太貴了!開發者悄悄使用AI合成數據訓練模型

人工智能 新聞
人類數據快耗盡了,怎么訓練更高級的AI?很多公司,已經在悄悄使用AI合成的數據來訓練AI模型了。

現在,開發者都在悄悄使用AI生成的數據來訓練AI模型。

原因就是——人類創造的數據,實在是太貴了!

在以往,大多數AI模型都是靠人類的數據訓練的,但現在,越來越多的公司(包括OpenAI、微軟,以及Cohere這樣的初創公司)都開始使用這種AI生成的「合成數據」,或者在努力搞清如何使用AI生成的數據了。

雖然,這會讓整個AI生態系統變成一種自己吃自己的「貪吃蛇」,但是,人類自己創造的數據,實在是負擔不起了??!

互聯網上的人類數據快耗盡了

除了價格,另外還有一個原因,就是規模問題。

現在,互聯網上很多可用的人類數據都被薅干凈了,可是如果要構建更強大的模型,就需要更多數據。

去年11月,ChatGPT的推出引爆了大模型之戰,谷歌、微軟、Meta、Anthropic等大科技公司輪番下場,三不五時就更新一波新產品。

而像ChatGPT和Bard這樣的聊天機器人背后的LLM,主要就是通過抓取互聯網數據來訓練的,包括所有數字化書籍、新聞文章、博客、搜索查詢、Twitter和Reddit帖子、YouTube視頻、Flickr圖像等等。

但現在,生成式AI變得越來越復雜,即使是很多財力雄厚的大公司,也耗盡了易于訪問的高質量數據,來訓練AI模型。

與此同時,因為訓練AI所消耗的個人數據數量龐大,來源廣泛,他們也在不斷承受著全世界各地的監管機構、藝術家和媒體的抨擊。

大家早就在悄悄用了

開發者紛紛表示,來自網絡的通用數據,已經不足以推動人工智能模型的性能。

Cohere首席執行官Aiden Gomez在接受《金融時報》采訪時表示,如果能從網上獲取需要的所有數據,就太完美了。

然而可惜的是,互聯網上的信息如此嘈雜、混亂,以至于它們并不能代表開發者真正想要的數據。

圖片

其實,Cohere早就在悄悄用合成數據訓練LLM了,雖然這個消息還未被廣而告之。

而OpenAI之類的公司,也在做此打算。

在五月份于倫敦舉行的一次活動中,OpenAI CEO Sam Altman被問及是否擔心對ChatGPT隱私侵犯風險的監管調查。

Altman對此不以為意,云淡風輕地表示,很快所有的數據都會變成合成數據,他對此非常有信心。

合成數據潛力巨大

合成數據,似乎前途大好。

而微軟已經發表了一項研究,來論證合成數據如何加強基本的LLM。

論文地址:https://arxiv.org/pdf/2306.11644.pdf

如今,像GPT-4這類最前沿的模型,在寫作和編碼等領域的表現已經在接近人類,還能通過美國律詩考試等基準測試。

為了顯著提高性能,讓它們能夠應對科學、醫學或商業方面的挑戰,就需要使用獨特而復雜的數據集來訓練AI模型。

這些數據集要么需要由科學家、醫生、作家、演員或工程師等專家創建,要么需要作為專有數據,從制藥、銀行和零售商等大公司獲得。

然而,人類創造的數據集,價格太昂貴了。

如果使用合成數據,成本就會大大降低。

公司可以用AI模型來生成與醫療保健、金融欺詐等領域相關的文本、代碼或更復雜的信息,然后用這些合成數據來訓練高級LLM,讓它們性能更強。

Gomez透露,Cohere及其幾個競爭對手早就在使用合成數據,然后由人類進行微調和調整了?,F在很多地方都在大量采用合成數據了,盡管這個消息還沒有大量公開。

Gomez解釋道,比如為了訓練一個高等數學模型,Cohere就會讓兩個AI模型對話,一個充當導師,一個充當學生。

它倆會談論三角學,所有對話都是合成的、靠模型想象出來的。

然后人類會檢查這個對話,如果模型說錯了,人類就去糾正。

微軟最近的兩項研究表明,合成數據可以用來訓練比OpenAI的GPT-4或Google的PaLM-2這類先進模型更小、更簡單的模型。

一篇論文描述了由GPT-4生成的短篇小說的合成數據集,它只包含了四歲孩子能理解的單詞。

論文地址:https://arxiv.org/pdf/2305.07759.pdf

這個數據集被稱為TinyStories,它被用來訓練一個簡單的LLM,它會講出流利和語法正確的故事。

另一篇論文表明,人工智能可以以教科書和練習的形式進行合成Python代碼的訓練,這些代碼在編碼任務上表現得很好。

Scale AI和Gretel.ai等初創企業也如雨后春筍般涌現,它們提供的,就是合成數據即服務。

Gretel由來自NSA和CIA的前美國分析師成立,與谷歌、匯豐銀行、Riot Games和Illumina等公司合作,用合成數據訓練更好的AI模型。

根據Gretel CEO Ali Golshan的說法,合成數據關鍵就在于,它保留了數據集中的所有個人隱私,同時仍然保持了統計上的完整性。

并且,精心制作的合成數據還可以消除現有數據中的偏見和不平衡。

「對沖基金可以查看黑天鵝事件,還能創建一百種變體,看看我們的模型是否會失敗?!?/span>

對于銀行來說,欺詐通常占總數據的不到100%,而Gretel的軟件可以生成「數千個關于欺詐的邊緣案例場景,并用于訓練AI模型。

AI貪吃蛇,可行嗎?

當然,用AI「自產自銷」的貪吃蛇式數據,也存在著巨大的問題。

就算是在人類數據上訓練出來的AI,都會出現重大的事實性錯誤,更何況AI自己生成數據呢。

批評者指出,并非所有合成數據都會經過精心策劃,以反映或改進現實世界的數據。

隨著AI生成的文本和圖像開始充斥互聯網,人工智能公司很可能最終會使用由自己模型的原始版本產生的原始數據——這種現象被稱為「狗糧」。

斯坦福大學和萊斯大學的科學家發現,將人工智能生成的內容提供給人工智能模型,似乎會導致它們的輸出質量下降。

論文地址:https://arxiv.org/abs/2307.01850

這種類似貪吃蛇的自我消費,會打破模型的數字大腦。

萊斯大學和斯坦福團隊發現,將AI生成的內容喂給模型,只會導致性能下降。研究人員對此給出一種解釋,叫做「模型自噬障礙」(MAD)。

研究發現在使用AI數據,經過第5次迭代訓練后,模型就會患上MAD。

在合成數據上訓練AI模型會逐漸放大偽影

換句話說,如果不能給模型提供「新鮮的數據」,即由人類標注的數據,其輸出質量將會受到嚴重影響。

而牛津大學和劍橋大學的研究者也發表了論文,發出警告說,在自己的原始輸出上訓練人工智能模型,其中可能包含虛假或捏造,會隨著時間的推移,這些數據或許會破壞模型,導致「不可逆轉的缺陷」。

論文地址:https://arxiv.org/pdf/2305.17493v2.pdf

AI,你趕快學會自學吧

Golshan同意,如果用糟糕的合成數據進行訓練模型,可能會阻礙它們的進步。

「隨著互聯網上充斥著越來越多AI生成的內容,確實會導致模型退化,因為它們在產生反芻的知識,沒有產生任何新的見解?!?/span>

盡管存在這些風險,但Cohere的Gomez等AI研究人員仍然表示,合成數據有望加速通往超級智能AI系統的道路。

CEO Gomez這樣說道:你真正需要的,就是能夠自學的AI模型——自己提出問題,自己發現真理,自己創造知識,這就是人類的夢想。

網友展開激烈辯論

對此,多位網友發表了高見。

合成數據有以下好處—— 

?? 合成數據可以潛在地解決使用真實世界數據會產生的隱私問題。 

?? 針對特定需求創建的合成數據,可能具有更高的質量,從而產生更準確的AI模型。 

?? 訓練高級AI模型對數據的需求正在飆升。合成數據幾乎能無限供應,大大減少了數據赤字。

但是,AI訓練AI背后的目的至關重要: 

??如果我們的目標是創建幫助人類的人工智能模型,那么對人類生成的數據進行訓練可能更合適。這確保了人工智能的反應和行為與我們自己的反應和行為更加一致,并且與我們相關。 

??如果我們的目標是創建超級智能AI,那么合成數據可能是關鍵,它讓模型能夠從超出人類理解能力的模型中學習。 

??我們已經看到很多例子,人工智能從合成數據中自我學習導致結果質量下降。所以,現在的答案在于真實世界的合成數據和用于訓練的專家數據的平衡組合。可解釋性AI是解釋如何確定模型結果的絕對關鍵。

我的立場和其他人不同:我不認為在未來應該讓LLM生成數據并讓其他模型從中學習,我認為,必須在私有領域數據上進行進一步的模型訓練和調整,使公司能夠利用其敏感但獨特的數據,作為業務的核心差異化因素。 

正確的方法是,具有隱私保證的合成數據。

正如我們所說,「訓練模型是為了了解疾病,而不是了解患者」——這就是合成數據的承諾,我們是將自己的見解轉移到模型中,而無需分享我們的個人詳細信息。

1. 有些領域需要好的數據,而不是完美的數據,在這些地方合成數據將產生最大的影響。

2. 與此相關的是,質量將基于平均水平的范圍,而不是極端情況下的杰出結果。 

3. 如果技術人員設計的計算機制造數據被用于訓練AI,就會加劇系統中的偏見——其中大多數是認知偏見——即使只是無意中, 因此,與其考慮有風險的工作類別,更好的方法可能是考慮哪些工作是體面的、必要的,但它只需要達到一定的閾值標準,而不是100%。 

最后一點,很多人在討論人工智能與工業革命的相似之處。在股市場上,被動投資基金和ETF的興起也有很多相似之處,即現在大多數交易都是基于算法,而不是實際的人為干預完成的。

但這樣的系統本質上往往是被動的,并且很容易被操縱。

責任編輯:張燕妮 來源: 新智元
相關推薦

2022-06-13 11:18:08

合成數據AIML

2023-02-23 07:46:48

學習模型數據倉庫

2021-03-23 23:17:18

AI人工智能

2024-04-18 08:38:15

LLM數據訓練模型

2025-06-27 07:10:00

合成數據AI人工智能

2023-08-13 14:48:14

OpenAIAI模型

2023-02-22 09:37:14

AI模型

2025-06-04 09:15:16

2022-08-11 08:00:00

機器學習合成數據深度學習

2025-01-23 09:15:00

數據技術模型

2025-06-04 03:00:00

人工智能AI智能訓練

2024-07-08 10:51:16

2024-09-24 07:31:52

2024-07-05 11:34:07

2025-10-16 05:00:00

2017-04-01 18:00:08

開發者數據庫

2019-05-08 10:16:03

谷歌Android開發者

2024-01-23 18:53:04

PostgreSQL關系數據庫

2024-01-16 14:23:32

大數據人工智能AI

2019-08-16 10:55:37

開發者技能AI
點贊
收藏

51CTO技術棧公眾號

a级片在线免费观看| 99久久国产免费| 日韩理论电影大全| 欧美主播一区二区三区| 特级毛片在线免费观看| 日本免费不卡视频| 久久久久久久欧美精品| 久久九九亚洲综合| a视频免费观看| 成人1区2区| 午夜成人免费视频| 性欧美精品一区二区三区在线播放 | 99视频在线免费| 伊人影院蕉久影院在线播放| 97aⅴ精品视频一二三区| 国产精品亚洲欧美导航| 精品无码人妻一区二区三| 国产欧美亚洲精品a| 欧美一区二区三区在线看 | 美腿丝袜亚洲三区| 97视频在线观看视频免费视频 | 亚洲国产免费看| 视频直播国产精品| 不卡一区二区在线观看| 欧美专区视频| 欧美日韩国产首页| 欧美牲交a欧美牲交aⅴ免费真 | 亚洲最大天堂网| 欧美日韩在线观看首页| 亚洲免费观看高清完整版在线观看熊 | 农村妇女精品一二区| 91精选在线| 中文字幕一区在线| 日韩欧美一区二区在线观看 | 中日韩av在线| 亚洲影视在线| 久久久噜噜噜久久| 欧美国产在线看| 日韩情爱电影在线观看| 亚洲日本欧美中文幕| 亚洲天堂资源在线| 中文字幕一区二区三区中文字幕| 欧美日韩国产一二三| 成人一级片网站| 蜜桃视频动漫在线播放| 亚洲成人av一区二区| 九一免费在线观看| 国产原创精品视频| 亚洲天堂2014| 青春草在线视频免费观看| 国产人成在线视频| 久久久久久毛片| 麻豆av一区| 婷婷婷国产在线视频| 99精品国产一区二区三区不卡| 亚洲a级在线观看| 国产精品嫩草影院桃色| 国产一区二区免费看| 亚洲一区二区少妇| 精品国产无码一区二区三区| 国内精品视频666| 91久久国产精品| 国产精品久久久久久久一区二区| 韩国女主播成人在线| 91色琪琪电影亚洲精品久久| 一区二区三区精| 国产一区啦啦啦在线观看| 91麻豆国产精品| 精品人妻一区二区三区麻豆91 | 国产另类自拍| 天堂v视频永久在线播放| 久久久久久久一区| 亚洲国产另类久久久精品极度| 中文日本在线观看| 国产精品护士白丝一区av| 一区二区三区四区五区视频| 国产激情在线视频| 亚洲国产精品自拍| 日韩免费毛片视频| 另类中文字幕国产精品| 欧美日韩视频专区在线播放| 五月婷婷六月丁香激情| 国产亚洲高清一区| 亚洲国内精品在线| 丰满少妇一区二区三区| 欧美系列电影免费观看| 久久综合免费视频| 欧美三级一区二区三区| 蜜臀久久99精品久久久久久9| 91在线色戒在线| 人妻少妇精品无码专区| 欧美激情综合网| 小泽玛利亚av在线| 蜜桃视频www网站在线观看| 欧美这里有精品| 妖精视频在线观看| 国产成人短视频在线观看| 久久国产天堂福利天堂| 日韩中文字幕在线观看视频| 另类小说欧美激情| 国产精品中出一区二区三区| 福利在线午夜| 亚洲国产日韩在线一区模特| 成年人在线观看视频免费| 欧美黄视频在线观看| 日韩激情在线视频| 午夜国产福利一区二区| 国产日韩视频| 91久久久久久久| 国产在线免费观看| 亚洲国产精品尤物yw在线观看| 日本三级黄色网址| 日韩精品欧美大片| 久久的精品视频| 亚洲天堂视频在线播放| 成人免费av资源| 国产精品av免费| 亚洲第一二三四区| 亚洲福利影片在线| 国产日韩欧美在线观看视频| 国产精品人人爽人人做我的可爱| 91中文字幕在线观看| 黄上黄在线观看| 精品欧美一区二区三区| 红桃视频一区二区三区免费| 精品日本12videosex| 97精品伊人久久久大香线蕉 | 干日本少妇视频| 欧美成人精品三级网站| 日韩av网站电影| 国产在线拍揄自揄拍| 国产自产v一区二区三区c| 日韩aⅴ视频一区二区三区| 国产夫妻在线| 亚洲国产美女精品久久久久∴| 精品欧美一区二区久久久久| 精品制服美女丁香| 四虎永久国产精品| 91精品xxx在线观看| 日韩黄在线观看| 日本一二三区不卡| 成人免费看的视频| 18禁网站免费无遮挡无码中文| 欧美经典影片视频网站| 久久精品99无色码中文字幕| 夜夜爽8888| 国产精品国产成人国产三级 | 国产成人精品综合在线观看| 中文字幕av导航| 高清一区二区三区av| 日韩在线中文字| 一级特黄录像免费看| 国产精品嫩草久久久久| 免费看涩涩视频| 97偷自拍亚洲综合二区| 国产日韩中文字幕| а√天堂8资源在线官网| 欧美一区二区日韩一区二区| 国内偷拍精品视频| 床上的激情91.| 免费毛片网站在线观看| 思热99re视热频这里只精品| 66m—66摸成人免费视频| 天堂а在线中文在线无限看推荐| 色悠久久久久综合欧美99| 国产视频三区四区| 精品亚洲国内自在自线福利| 亚洲一区 在线播放| gogo人体一区| 97在线视频国产| 九色国产在线观看| 欧美疯狂做受xxxx富婆| 国产97免费视频| 97精品视频在线观看自产线路二| 国产最新免费视频| 日韩av在线中文字幕| 91日本在线视频| 免费在线小视频| 国产亚洲成精品久久| 91在线观看喷潮| 亚洲国产一区视频| 中文幕无线码中文字蜜桃| 蜜臀av一级做a爰片久久| 日本特级黄色大片| 加勒比中文字幕精品| 国产精品久久久久久久久借妻| 麻豆av在线导航| 337p日本欧洲亚洲大胆色噜噜| 老熟妇仑乱一区二区av| 亚洲同性同志一二三专区| 久久久久成人精品无码中文字幕| 视频一区二区欧美| 亚洲av综合色区| 国产成人精品999在线观看| 91色在线观看| 国产超碰精品| 欧美黄色成人网| av中文字幕在线| 亚洲成人久久久| 一本色道久久综合熟妇| 亚洲高清视频在线| 亚洲伦理一区二区三区| 91小视频在线观看| 国产裸体视频网站| 视频在线在亚洲| 精品无码国模私拍视频| 91成人超碰| 日本中文不卡| 天堂一区二区三区四区| 99国产超薄丝袜足j在线观看| 亚洲一区二区三区四区| 久久久久久久电影一区| 麻豆传媒在线免费| 这里精品视频免费| 欧美视频综合| 亚洲精品av在线播放| 精品国产av鲁一鲁一区| 欧美色老头old∨ideo| 青青青国产在线| 亚洲国产一区二区a毛片| 亚洲视频重口味| 欧美国产日本视频| 中文字幕在线观看的网站| 国产成人精品午夜视频免费| 九九九九九国产| 人人超碰91尤物精品国产| 国产中文字幕在线免费观看| 国产一区激情| 欧美一级爱爱视频| 久久久9色精品国产一区二区三区| 热舞福利精品大尺度视频| 欧美日韩导航| 精品九九九九| 欧美激情影院| 国产精品美女久久久久av福利| 精品一区二区三区四区五区| 成人在线精品视频| 日韩第二十一页| 国产精品一区二区久久精品| 日韩欧美精品电影| 日韩美女免费视频| 香蕉视频亚洲一级| 国产大片精品免费永久看nba| 丝袜美腿一区| 国产精品久久999| 99久久久国产精品免费调教网站| 国产成+人+综合+亚洲欧美丁香花| www.com.cn成人| 日本精品一区二区三区在线播放视频| 中文在线免费视频| 日韩美女视频免费在线观看| 亚洲精品一级二级| 国产精品久久国产精品99gif| 69堂精品视频在线播放| 国产精品视频yy9099| 欧美网站免费| 91情侣偷在线精品国产| 日韩精品一区二区三区中文 | 污视频网站在线播放| 亚洲成人国产精品| 性感美女福利视频| 亚洲深夜福利网站| 思思99re6国产在线播放| 久久久久www| 欧美xxxx做受欧美88bbw| 国内精品久久久久久中文字幕| 免费成人在线电影| 国产精品美女午夜av| 婷婷激情成人| 国产高清一区视频| 亚洲宅男一区| 久久久国产精华液999999| 伊人蜜桃色噜噜激情综合| 日韩少妇内射免费播放18禁裸乳| 丝袜a∨在线一区二区三区不卡| 天堂av在线网站| 国产成人午夜高潮毛片| 蜜桃传媒一区二区亚洲av | 亚洲成人精品电影在线观看| 91精品福利| 一二三四视频社区在线| 日本成人在线一区| 99国产精品免费视频| 337p粉嫩大胆色噜噜噜噜亚洲| jizzjizz日本少妇| 亚洲已满18点击进入久久| 区一区二在线观看| 欧美一区二区三区小说| 无码国产伦一区二区三区视频 | 狠狠色2019综合网| 一区二区视频观看| 中文字幕一区二区三区不卡| 国产特黄大片aaaa毛片| 欧美群妇大交群的观看方式| 日韩一级片免费| 久久精彩免费视频| 激情开心成人网| 国产综合第一页| 偷拍欧美精品| 亚洲人成无码www久久久| 国产精品一区二区黑丝| 日本少妇xxxxx| 亚洲国产欧美一区二区三区丁香婷 | 欧美日韩国产免费观看 | 亚洲福利影视| 欧美视频小说| 亚洲激情另类| 91香蕉国产线在线观看| 亚洲国产岛国毛片在线| 91看片在线播放| 日韩美女在线视频| 1769在线观看| 欧洲精品久久久| 国产精品午夜av| 法国空姐在线观看免费| 三级影片在线观看欧美日韩一区二区| 激情综合激情五月| 亚洲人123区| 97超碰人人模人人人爽人人爱| 国产午夜精品理论片a级探花| 在线看一级片| 成人在线国产精品| 99久久九九| 一区二区三区入口| 国产午夜亚洲精品午夜鲁丝片| 亚欧洲精品在线视频| 欧美成人乱码一区二区三区| 麻豆传媒视频在线| 成人福利免费观看| 成人3d精品动漫精品一二三| av动漫免费看| 久久久久久久精| 久久国产黄色片| 国产视频精品免费播放| www成人免费观看| 国产欧美一区二区三区另类精品| 女生裸体视频一区二区三区| 肉色超薄丝袜脚交| 亚洲欧美日韩国产手机在线| 97人妻精品一区二区三区动漫| 深夜福利国产精品| 成人全视频在线观看在线播放高清 | 欧美中文字幕在线观看| 欧美调教在线| heyzo国产| 久久久青草青青国产亚洲免观| 秋霞精品一区二区三区| 亚洲一级黄色av| 久久免费影院| 色99中文字幕| 麻豆精品在线观看| 中国一级片在线观看| 欧美丰满少妇xxxxx高潮对白| 国产区在线观看| 99国产超薄肉色丝袜交足的后果| 激情欧美日韩一区| 少妇大叫太粗太大爽一区二区| 岛国av一区二区三区| 国产中文在线视频| 国产欧美日韩亚洲精品| 欧美一区在线看| 国产二级一片内射视频播放 | 国产真实乱子伦| 国产精品天干天干在观线| 91久久国语露脸精品国产高跟| 欧美xxxx做受欧美.88| 成人资源在线播放| 91视频最新入口| 国产精品久久久久一区| 精品久久无码中文字幕| 亚州国产精品久久久| 经典一区二区| 黄色片免费网址| 欧美性xxxxx极品| 香蕉视频在线免费看| www.久久爱.cn| 久久久水蜜桃av免费网站| 精品无码一区二区三区蜜臀| 精品免费日韩av| 超碰这里只有精品| 久久亚洲国产成人精品无码区| 久久久久久毛片| 亚洲va天堂va欧美ⅴa在线| 青草成人免费视频| 亚洲国产日韩欧美在线| 日韩av一二区| 在线播放91灌醉迷j高跟美女| 91www在线| 亚洲三区在线观看| 91亚洲精品久久久蜜桃网站 | 亚洲第一网站男人都懂| 素人啪啪色综合| 欧美男女爱爱视频| 国产精品久久久久久久裸模| 日韩一级免费毛片| 成人羞羞国产免费| 日日夜夜免费精品视频| 久久精品国产亚洲av高清色欲| 国产亚洲在线播放| 久久成人福利|