精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型“自學”后能力反下降,Llama/Mistral都沒逃過

人工智能 新聞
人工智能的未來令人期待,但同時也需要以更加審慎和全面的視角來看待其發展。只有這樣,才能真正實現AI的潛力,創造出既智能又可靠的系統,為人類社會帶來真正的價值。

AI經過多輪“自我提升”,能力不增反降?

上海交通大學GAIR團隊最新研究表明,在常識理解、數學推理和代碼生成等復雜任務中,AI經過多輪“自我提升”后,可能會出現一種稱為“自我提升逆轉”(self-improvement reversal)的現象。

LLaMA-2-7B、Mistral-7B、LLaMA-8B都沒逃過。

圖片

這就像一個學生刷題刷到”走火入魔”——雖然考試成績提高了,但實際解決問題的能力反而可能下降!

更值得警惕的是,這種訓練還可能導致AI的回答變得千篇一律,失去了原有的創造力和適應新情況的能力。好比一個學生只會應付考試,遇到真實世界的問題就束手無策。

要知道,OpenAI最近被曝光的項目“草莓”,據說還在使用post-training階段的自我提升來提升模型復雜推理能力……

目前該研究《Progress or Regress?Self-Improvement Reversal in Post-training》已獲得了 ICML 2024 (AI for Math Workshop) 的Honorable Mention Award。

刷分更高但是能力下降

具體說來,該工作將”迭代后訓練”(Iterative post-training)分成三個主要步驟:

  • 答案采樣:讓AI回答一系列問題,每個問題回答多次。
  • 訓練集構建:從AI的回答中挑選出好的答案。
  • 模型后訓練:用這些好答案來”教”AI,讓它學會更好的回答方式。

研究人員嘗試了不同的”教學”方法:

  • 迭代SFT:直接告訴AI哪些答案是對的。
  • 迭代DPO:讓AI學會比較不同答案的好壞。
  • 迭代SFT-DPO:將上面兩種方法結合起來。

他們還研究了影響AI學習效果的幾個關鍵因素(如圖1所示):

  • 訓練次數:一般來說,多訓練幾次,AI的表現會更好。但訓練4-5次后,進步就不明顯了。
  • AI的基礎能力:有趣的是,最聰明的AI并不一定學得最快,但最后表現通常最好。
  • 問題類型:有些類型的問題(如常識問答和簡單數學)AI學得比較快,而復雜的數學問題和編程任務就比較困難。
  • 訓練方法:不同的問題可能需要不同的訓練方法。研究者發現,如果AI一開始就表現不錯,用DPO或SFT-DPO方法效果更好。

圖片

圖1:三種迭代后訓練范式在多個任務求解上的Pass@1性能(從常識知識、數學推理、代碼生成方向選擇了四個聚焦復雜問題求解能力的數據集:CSQA,GSM8k,MATH,MBPP以及三種不同的基座模型LLaMA-2-7B,Mistral-7B,LLaMA-8B。所有實驗的迭代次數$$$$設置為5。評估時使用貪婪解碼,并且選擇Pass@1作為性能評價指標。)

起初,結果看起來很令人興奮。AI在測試中的分數確實提高了!但研究團隊深入觀察后,發現了一些“出人意料”的現象:

1、能力幻覺

研究者發現,AI并沒有真正學會解決更難的問題。相反,它只是變得更擅長在已知的答案中挑選正確的那個。他們用”正確答案覆蓋率”這個指標來衡量這一現象。結果顯示,即使是未經過多輪訓練的AI,只要給它足夠多的嘗試機會,也能在那些看似”學會”的問題上得到正確答案。這就像一個學生通過背答案提高了考試分數,但實際解決問題的能力并沒有提升。

2、多樣性喪失

隨著訓練次數增加,AI的回答變得越來越“千篇一律”。研究者從三個方面測量了這種變化:

  • 語法多樣性:使用”Distinct N-gram”指標。
  • 語義多樣性:使用句子嵌入的余弦相似度。
  • 邏輯多樣性:在數學問題中計算不同方程的數量。結果顯示,無論哪種訓練方法,AI的回答都變得越來越相似,失去了原有的創意和多樣性。

3、泛化能力下降

研究者還測試了AI面對全新類型問題時的表現。他們先讓AI在一個簡單的數學問題集(GSM8K)上訓練,然后用一個更難的數學問題集(MATH)來測試它。結果發現,經過多輪”自學”的AI在面對這些新問題時,表現反而更差。而且,AI在簡單問題和困難問題上的表現差距越來越大,這說明它可能只是在”死記硬背”,而不是真正理解和學習。

毫無疑問,post-training階段的”自我提升“仍然是一個充滿潛力的研究方向,”讓AI自我提升”也是一個很酷的想法。但GAIR團隊的發現表明,AI的進化之路可能比想象中更加復雜和充滿挑戰。在追求AI性能提升的同時,也需要更全面地考慮:

  • AI真正的問題解決能力是否提升了?
  • AI是否保持了創造力和多樣性?
  • AI能否靈活應對新的、未知的情況?

人工智能的未來令人期待,但同時也需要以更加審慎和全面的視角來看待其發展。只有這樣,才能真正實現AI的潛力,創造出既智能又可靠的系統,為人類社會帶來真正的價值。

實驗室介紹:

生成式人工智能研究實驗室(GAIR,主頁:https://plms.ai/)由上海交通大學劉鵬飛副教授2023年4月回國創建,是國內首個聚焦于生成式人工智能的高校研究組。匯聚了來自于CMU、復旦、交大(ACM班、IEEE試點班等)等頂尖高校的年輕本碩博人才。實驗室專注于三大核心領域:大模型基礎研究、對齊系統和社會影響,致力于培養頂尖人工智能人才(具有原創、批判精神等)、開發尖端的生成式人工智能技術,賦能人類解決復雜問題,提升人類生活質量。

論文地址:https://arxiv.org/pdf/2407.05013

項目主頁:https://gair-nlp.github.io/self-improvement-reversal/

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-03-04 00:00:00

GemmaAI模型

2024-01-29 06:40:00

AI模型

2025-07-01 07:24:56

2024-07-19 12:48:29

2025-06-30 04:30:00

2023-12-30 13:31:30

模型數據信息

2023-08-21 10:36:23

2023-06-08 11:45:50

模型語言

2024-06-13 16:50:24

2024-02-27 13:38:16

微軟OpenAI模型

2025-04-02 01:25:00

2024-02-19 13:45:14

OpenAIGPT-2模型

2024-10-23 09:30:00

2023-10-07 08:28:06

語言模型代碼技術

2025-03-10 18:50:57

2024-04-19 14:52:13

MetaGPT-4模型

2023-12-17 11:39:38

微軟模型

2025-01-20 07:58:51

2023-04-10 16:15:16

模型開源

2025-04-02 08:40:00

人工智能大模型AI
點贊
收藏

51CTO技術棧公眾號

西西人体一区二区| 天堂久久av| 日韩一区在线播放| 99久久99久久精品国产片| 国产成人精品亚洲男人的天堂| 亚洲福利天堂| 日韩视频一区二区| 亚洲乱码中文字幕久久孕妇黑人| 一区二区三区视频在线观看视频| 国产白丝精品91爽爽久久| 欧洲美女7788成人免费视频| 朝桐光av在线| 精品国产美女| 精品99999| 在线能看的av网站| 乡村艳史在线观看| 亚洲一区二区视频在线观看| 亚洲国产精品一区在线观看不卡 | 视频三区二区一区| 精品区在线观看| 蜜臀91精品一区二区三区| 久久久久久av| 精品人妻伦九区久久aaa片| 国内成人精品| 亚洲精品网址在线观看| 少妇愉情理伦片bd| 国产精品无码久久久久| 欧美视频裸体精品| 精品无码一区二区三区爱欲| 国产激情小视频在线| 国产午夜精品一区二区三区嫩草| 国产精品日韩高清| 国产a级免费视频| 久久er99精品| 国产精品视频资源| 国产精品99精品| 影视一区二区| 最近2019中文字幕一页二页 | 欧美77777| 国产黑丝在线一区二区三区| 91久久久在线| 一级特黄aaaaaa大片| 视频精品一区二区| 日本一区二区在线免费播放| 国产成人无码精品亚洲| 在线欧美福利| 久久琪琪电影院| 国产一级大片在线观看| 欧美日韩精品| 欧美激情按摩在线| 免费在线视频观看| 午夜亚洲福利| 久久久久日韩精品久久久男男| 麻豆精品国产免费| 无码一区二区三区视频| 久久精品影视伊人网| av黄色免费在线观看| 欧美3p在线观看| 久久视频在线看| 久久久久亚洲av无码专区体验| 综合日韩在线| 久久免费国产视频| 欧美日韩综合在线观看| 国产午夜精品一区二区三区欧美| 欧美亚洲国产成人精品| 国产精品一区二区三区四| 久久久久久亚洲精品杨幂换脸| 国产91精品最新在线播放| 日韩综合在线观看| 美女视频黄 久久| 亚洲v日韩v综合v精品v| xxxx18国产| 99re8在线精品视频免费播放| 欧美不卡三区| 淫片在线观看| 亚洲国产精品影院| 久久久久久久久久福利| 亚洲人成777| 欧美精品一区二区三区四区| 成人精品在线观看视频| 久久国产成人午夜av影院宅| 美日韩精品免费观看视频| 国产无遮无挡120秒| 美女网站久久| 91久久爱成人| 美州a亚洲一视本频v色道| 国产精品国产三级国产aⅴ原创| 97超碰人人爱| xxx欧美xxx| 欧美一级爆毛片| 少妇毛片一区二区三区| 国产精品久久久久久久免费观看| 欧美激情免费看| 成人黄色三级视频| 国产91精品免费| 日韩电影在线播放| 在线观看免费视频你懂的| 欧美午夜影院在线视频| 手机在线视频一区| 色婷婷av一区二区三区丝袜美腿| 色噜噜狠狠狠综合曰曰曰| 日本五十熟hd丰满| 免费观看成人鲁鲁鲁鲁鲁视频| 99视频在线免费观看| 粉嫩av在线播放| 亚洲国产视频网站| 国产九九在线观看| 群体交乱之放荡娇妻一区二区| 日韩视频一区在线| 四虎成人在线观看| 国产jizzjizz一区二区| 亚洲一卡二卡三卡| 原纱央莉成人av片| 精品粉嫩超白一线天av| 天天操夜夜操av| 蜜桃传媒视频麻豆第一区免费观看| 夜夜狠狠擅视频| av一区二区三区黑人| 亚洲一卡二卡| 欧美理论影院| 亚洲第一在线视频| 免费看一级大片| 日韩和欧美一区二区三区| 国外成人免费视频| 亚洲无线看天堂av| 777亚洲妇女| 大胸美女被爆操| 久久人人超碰| 欧美黑人xxxxx| 精品丝袜在线| 亚洲二区中文字幕| 精品无码m3u8在线观看| 国产成人精品亚洲777人妖| 在线视频不卡国产| 国产亚洲精品精品国产亚洲综合| 亚洲视频欧美视频| 黑人一级大毛片| 高清成人在线观看| 欧美黄色免费网址| 国产精品一区二区三区av| 中文字幕视频一区二区在线有码| 久久国产黄色片| 2020国产成人综合网| www黄色日本| 老汉色老汉首页av亚洲| 国自在线精品视频| 人妻夜夜爽天天爽| 亚洲福中文字幕伊人影院| 国产又黄又嫩又滑又白| 欧美成人中文| 国产99午夜精品一区二区三区| 手机av在线播放| 日韩欧美色电影| 久久网一区二区| www.av亚洲| 超碰网在线观看| 国产一区日韩| 国产精品午夜视频| 国产黄a三级三级三级av在线看 | 有坂深雪av一区二区精品| 小早川怜子一区二区三区| 你懂的视频一区二区| 成人区精品一区二区| 8x8ⅹ拨牐拨牐拨牐在线观看| 日韩av影视综合网| 日韩一级在线视频| 国产精品久久久久久亚洲伦| 在线a免费观看| 亚洲无线视频| 蜜桃欧美视频| 中韩乱幕日产无线码一区| 久久激情视频免费观看| www.xxx国产| 黄网站色欧美视频| 中文字幕在线观看免费高清| 久久电影网电视剧免费观看| 91看片淫黄大片91| 日韩三区视频| 国产热re99久久6国产精品| 在线网址91| 亚洲毛片在线观看| 一起草av在线| 亚洲成人自拍一区| 夜夜春很很躁夜夜躁| 国产精品一区在线观看你懂的| 福利视频一区二区三区四区| 国产亚洲一区二区三区不卡| 91麻豆桃色免费看| 日本在线影院| 菠萝蜜影院一区二区免费| 免费观看成年人视频| 欧美三级视频在线播放| 久久久91视频| 国产欧美一区二区在线| 亚洲美女精品视频| 日韩av在线播放中文字幕| 麻豆一区二区三区在线观看| 亚洲婷婷伊人| www.久久爱.cn| 99re久久| 欧美一级大片视频| 香蕉久久aⅴ一区二区三区| 亚洲视频自拍偷拍| www三级免费| 欧美精选一区二区| 久久久久久不卡| 亚洲国产日日夜夜| www.com.av| 久久久久久久久久久久久久久99 | 国产精品福利影院| 大地资源二中文在线影视观看| 国产在线精品一区二区| 欧美日韩亚洲一二三| 黄色av成人| 最新视频 - x88av| 青草国产精品| 日产精品一线二线三线芒果| 狠狠一区二区三区| 亚洲在线视频观看| 国产亚洲人成a在线v网站| 欧美亚洲在线视频| 极品美鲍一区| 久久久久国产一区二区三区| 午夜伦理在线视频| 久久夜精品香蕉| 五月香视频在线观看| 亚洲最大中文字幕| 欧美一区二区少妇| 亚洲精品美女在线| 日韩性xxxx| 亚洲精品456在线播放狼人| www.亚洲黄色| 日韩视频免费观看高清完整版 | 欧美gay囗交囗交| 国产91对白在线播放| av成人福利| 久久久久久亚洲精品中文字幕| 91精品久久久| 欧美成人免费在线视频| 91精品国产综合久久福利 | 卡通动漫亚洲综合| 1000部国产精品成人观看| 呻吟揉丰满对白91乃国产区| 亚洲国产精品t66y| 怡红院一区二区三区| 久久久99免费| 公肉吊粗大爽色翁浪妇视频| 欧美激情一区二区三区全黄 | 三级视频在线| 亚洲毛片一区二区| 国产高清免费av在线| 这里只有精品视频在线| 东热在线免费视频| 深夜福利亚洲导航| 老司机午夜在线| 久久99亚洲热视| 超级碰碰不卡在线视频| 久久露脸国产精品| 中文字幕在线直播| 国产精品美腿一区在线看| 草民电影神马电影一区二区| 国产情人节一区| 视频二区欧美毛片免费观看| 国产精品三区四区| 日韩大片在线免费观看| 日韩精品久久久| 国产精品福利在线观看播放| 天天做天天躁天天躁| 国产精品毛片一区二区三区| 那种视频在线观看| 久久99国产精品麻豆| 欧美一区二区三区影院| 95精品视频在线| 亚洲综合欧美综合| 亚洲免费电影在线| 国产精品xxxx喷水欧美| 欧美亚洲日本国产| 亚洲国产欧美另类| 日韩理论片久久| 日本不卡不卡| 久久免费观看视频| 电影亚洲一区| 成人9ⅰ免费影视网站| 亚洲警察之高压线| av动漫免费观看| 一区二区三区成人精品| 亚欧美在线观看| 成人黄色av网站在线| 欧美激情亚洲色图| 亚洲高清在线精品| 中文字幕第一页在线播放| 精品国产乱码久久久久久老虎| 久久经典视频| 欧美第一页在线| 成人精品国产亚洲| 国产一区自拍视频| 午夜欧美在线| 国产二级片在线观看| 极品销魂美女一区二区三区| 水蜜桃av无码| 亚洲色图欧美偷拍| 欧美特黄aaaaaa| 日韩精品一区二区三区在线| 二人午夜免费观看在线视频| 午夜免费日韩视频| 国产美女精品视频免费播放软件| 日韩av大全| 日韩一级大片| 亚洲成人激情小说| 国产精品国产自产拍高清av| 精品国产午夜福利| 亚洲精品在线观| 1区2区在线观看| 国产欧美精品在线播放| 欧美综合精品| 日韩a级在线观看| 国产精品羞羞答答xxdd| 成人午夜免费影院| 日本韩国欧美三级| 亚洲av成人精品一区二区三区在线播放| 久久深夜福利免费观看| 91国内外精品自在线播放| 久久久国产精品一区二区三区| 欧美精品激情| 亚洲av毛片在线观看| 国产精品网站导航| 日本久久综合网| 亚洲伦理中文字幕| av日韩电影| 久久久国产精品一区二区三区| 在线欧美日韩| 95视频在线观看| 亚洲高清中文字幕| 人妻一区二区三区| 久久免费国产视频| 国产精品任我爽爆在线播放| wwwwww欧美| 国产91在线|亚洲| 精品视频久久久久| 精品电影一区二区| 日本性爱视频在线观看| 国产69精品久久久久9999apgf| 欧美日韩伊人| 又色又爽又黄18网站| 亚洲自拍偷拍图区| 狠狠人妻久久久久久综合麻豆 | 中文字幕av一区二区三区佐山爱| 久久综合九色欧美狠狠| 国产农村妇女精品一区二区| 黄色a一级视频| 色域天天综合网| 成人午夜电影在线观看| 国产精品一区专区欧美日韩| 99久久99热这里只有精品| 91pony九色| 一级日本不卡的影视| 人人妻人人澡人人爽精品日本| 97久久精品国产| 国内精品久久久久久久久电影网 | 国产精品日韩精品在线播放| 狠狠噜天天噜日日噜| 成人黄色国产精品网站大全在线免费观看| xxxxxx国产| 亚洲欧美日韩天堂一区二区| 99riav视频一区二区| 黄色污污在线观看| 成人短视频下载| 日韩欧美在线观看免费| 久久精品国产91精品亚洲| jizz国产精品| 国产亚洲综合视频| 国产精品久久毛片| 国产夫绿帽单男3p精品视频| 97成人超碰免| 色综合咪咪久久网| 成人做爰www看视频软件| 一本高清dvd不卡在线观看| 青青青青在线| 国产一区二区中文字幕免费看| 日韩中文字幕一区二区三区| 欧美爱爱免费视频| 日韩av中文字幕在线| 日韩有码欧美| 精品国产一二三四区| 日本一区二区三区国色天香| 亚洲av无码国产综合专区| 日本精品久久久久久久| 综合久久精品| 先锋影音av在线| 亚洲成人黄色网| 欧美爱爱视频| 欧美 丝袜 自拍 制服 另类| 国产精品久久久久久久久快鸭 | 日韩免费毛片视频| 亚洲人精品午夜| 国产剧情在线观看| 国产精品久久精品国产| 麻豆精品国产传媒mv男同| 亚洲精品视频在线观看免费视频| 最近的2019中文字幕免费一页 |