精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

RL微調(diào),關鍵在前10%獎勵!基于評分準則,Scale AI等提出新方法

人工智能 新聞
大模型強化學習總是「用力過猛」?Scale AI聯(lián)合UCLA、芝加哥大學的研究團隊提出了一種基于評分準則(rubric)的獎勵建模新方法,從理論和實驗兩個維度證明:要想讓大模型對齊效果好,關鍵在于準確區(qū)分「優(yōu)秀」和「卓越」的回答。這項研究不僅揭示了獎勵過度優(yōu)化的根源,還提供了實用的解決方案。

讓大模型按照人類意圖行事,一直是AI領域的核心挑戰(zhàn)。目前主流的強化學習微調(diào)(RFT)方法雖然有效,但存在一個致命弱點:獎勵過度優(yōu)化(reward over-optimization)。

獎勵過度優(yōu)化是大模型對齊的「阿喀琉斯之踵」。

簡單來說,就是模型學會了「鉆空子」——它們不是真正變得更好,而是學會了如何在獎勵模型上刷高分,實際輸出質(zhì)量反而下降。這就像考試時學生死記硬背標準答案來應付老師,而不是真正理解知識。

Scale AI的最新研究直擊這一痛點,從理論層面揭示了問題的根源,并提出了創(chuàng)新的解決方案。

論文鏈接:https://arxiv.org/abs/2509.21500 

代碼開源:https://github.com/Jun-Kai-Zhang/rubrics

數(shù)據(jù)開源:https://huggingface.co/datasets/JunkaiZ/Rubrics

理論突破

高分區(qū)才是關鍵戰(zhàn)場

來自Scale AI、UCLA和芝加哥大學的研究團隊,首次從理論上給出了明確答案:

獎勵過度優(yōu)化的根源,在于獎勵模型在高分區(qū)的不準確性。

  • 高獎勵區(qū)域的準確性決定一切:當代理獎勵在高分區(qū)域出現(xiàn)偏差時,模型性能會隨著訓練進程急劇崩潰;而低分區(qū)域的誤差影響微乎其微。
  • 只需要準確識別Top 2響應:即使只能正確排序前10%的優(yōu)質(zhì)回答,模型性能就能接近最優(yōu),效果幾乎與完美獎勵模型相當。

這意味著:我們不需要在所有回復上都準確,只需要準確區(qū)分「優(yōu)秀」和「卓越」!

方法創(chuàng)新

用評分準則捕捉「卓越」

理論清晰了,但新問題來了:如何獲得高質(zhì)量樣本來訓練獎勵模型?這里存在一個悖論:

從基礎模型采樣?太低效了——高分樣本本來就稀少。

用更強模型生成?又會引入分布偏移——獎勵模型可能學到的是表面特征而非真實能力。

研究團隊提出了基于評分準則(rubric)的解決方案。評分準則是一組衡量回答好壞的明確準則,每個準則都有相應權重。比如對于醫(yī)療診斷問題,可能包括:

高權重準則:「正確識別疾病」「標明緊急程度」

低權重準則:「提及治療方案」

Rubric的核心優(yōu)勢在于:

  • 將評分分解為多個可驗證的具體標準
  • 每個標準都是二元判斷(滿足/不滿足)
  • 最終得分是滿足標準的加權平均

更重要的是,Rubric天然具有分布不變性——它關注的是回復本身的質(zhì)量特征,而非生成來源。

兩大原則:如何構建有效的Rubric

為了讓Rubric真正捕捉高分區(qū)的差異,研究團隊提出兩大關鍵原則:

  • 原則1:區(qū)分「優(yōu)秀」與「卓越」。通過對比兩個都很好的回答,識別它們的細微差異,將這些差異編碼為新的評分準則。
  • 原則2:在多樣化的優(yōu)質(zhì)回答中尋找差異。擴大候選池,從16個頂尖模型中采樣,確保覆蓋不同的優(yōu)秀回答模式。

實驗驗證

全面碾壓基線方法

研究在通用和醫(yī)療兩個領域進行了大規(guī)模實驗:

性能提升明顯

  • 使用優(yōu)質(zhì)樣本改進的評分準則,勝率從31.3%提升至39.7%
  • 醫(yī)療領域的HealthBench得分從0.3004提升至0.3513

有效緩解獎勵過度優(yōu)化

  • 初始評分準則訓練的模型在60步后性能急劇下降
  • 改進后的評分準則將崩潰點推遲到160步,延長了近3倍

高獎勵區(qū)域準確率大幅提升

評分準則改進后,在高獎勵區(qū)域的準確率提升顯著,而低獎勵區(qū)域的準確率基本不變,完美驗證了理論預測。

質(zhì)的飛躍:優(yōu)秀樣本帶來更深層的改進

研究團隊還分析了不同質(zhì)量樣本帶來的Rubric改進類型:

優(yōu)秀樣本驅(qū)動的改進

  • 添加懲罰項,避免明顯錯誤
  • 放寬過于嚴格的標準
  • 糾正錯誤或?qū)R預期標準

卓越樣本驅(qū)動的改進

  • 將復雜標準分解為子標準
  • 增強驗證和證據(jù)標準
  • 明確范圍、邊界和約束
  • 納入風險分析和安全約束

以醫(yī)療案例為例:

初始Rubric只要求「提到正確診斷」和「說明緊急性」——兩個優(yōu)秀回復都滿足。

精煉后的Rubric新增標準:「明確指出需要緊急影像學檢查(如增強CT或MRI/MRV)來確認診斷」,成功區(qū)分出了更好的那個。

這就是質(zhì)的飛躍:從表面判斷到深層驗證標準。

產(chǎn)業(yè)意義與展望

這項研究為大模型對齊提供了全新視角:

  1. 理論指導實踐:明確了獎勵建模的優(yōu)化方向——聚焦高獎勵區(qū)域
  2. 方法可操作性強:基于評分準則的方法易于實施和解釋
  3. 領域適應性好:在醫(yī)療等專業(yè)領域表現(xiàn)尤其出色

當然,研究也指出了當前的局限:

  • 簡單的加權平均可能不是最優(yōu)的分數(shù)聚合方式

對于大模型從業(yè)者來說,這項工作提供了一個清晰的方向:

不要試圖在所有地方都完美,專注于準確區(qū)分頂尖回復,這才是對齊的關鍵。

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-02-25 10:04:10

2023-12-27 18:12:50

2024-08-30 12:58:43

AI多模態(tài)技術

2025-02-21 09:35:00

3DAI生成

2022-12-08 13:00:10

AI性別偏見

2025-06-30 09:08:00

2022-07-25 15:34:01

量化仿真數(shù)據(jù)誤差內(nèi)存占用

2022-12-12 11:31:39

數(shù)據(jù)學習

2024-12-30 07:11:00

大型視覺語言模型VLMs人工智能

2024-10-23 19:47:54

2025-04-10 09:38:37

2025-09-22 10:44:20

2023-11-23 15:05:02

玻璃歸檔存儲微軟

2015-07-20 11:49:56

Wi-Fi

2021-11-26 18:37:39

技術人工智能計算機

2024-07-25 12:33:45

2021-09-27 10:12:42

欺騙防御rMTD網(wǎng)絡攻擊

2024-09-29 10:40:00

數(shù)據(jù)模型

2010-09-30 14:05:27

JavascriptIE6

2019-12-30 09:41:59

機器學習人工智能計算機
點贊
收藏

51CTO技術棧公眾號

91麻豆精品国产综合久久久久久| 久久综合给合久久狠狠狠97色69| 九九热最新视频//这里只有精品| 性生交大片免费看l| 成人观看网址| 国产视频在线观看一区二区三区| 亚洲一区免费网站| 免费在线不卡视频| 91精品高清| 亚洲乱码国产乱码精品精| 加勒比av中文字幕| 电影一区二区三区| 亚洲精品日日夜夜| 少妇精品久久久久久久久久| 亚洲成人中文字幕在线| 肉丝袜脚交视频一区二区| 色综合久久久888| 无码人妻aⅴ一区二区三区69岛| 欧美激情三级| 欧美丝袜丝交足nylons图片| 阿v天堂2018| 国产最新在线| 欧美国产精品久久| 国产伦精品一区二区三区照片 | 欧美日韩免费一区二区三区视频 | 日韩激情一区二区| 97av在线影院| 九九九免费视频| 91精品推荐| 在线亚洲午夜片av大片| 三级黄色片网站| 成人看片黄a免费看视频| 777午夜精品免费视频| 欧美日韩在线免费播放| 国产精品迅雷| 欧美日韩精品国产| 欧美精品久久久久久久久久久| 成人片在线看| 国产精品久久久久婷婷二区次| 欧美日韩在线观看一区| 午夜福利视频一区二区| 成人午夜激情片| 91入口在线观看| 国产男女裸体做爰爽爽| 另类人妖一区二区av| 国产精品久久久久久av下载红粉| 亚洲 欧美 中文字幕| 美女视频一区免费观看| 日韩av免费一区| 在线免费观看国产精品| 天堂av在线一区| 国产精品jizz在线观看麻豆| 婷婷激情五月综合| 久久国产日韩| 国产精品美女午夜av| 在线免费一级片| 国内久久婷婷综合| 69堂成人精品视频免费| 午夜精品久久久久久久99老熟妇| 国产成人av电影在线观看| 国产精品日韩一区二区| 黄色av一区二区三区| av一区二区三区在线| 久久精品中文字幕一区二区三区| 五月天婷婷在线播放| 久久免费美女视频| 亚洲国产成人不卡| 黄色av电影在线观看| 亚洲自拍另类综合| 久久久久久久久久网| 日韩伦理福利| 欧美日韩精品一区二区在线播放 | 久久午夜国产精品| 日韩精品无码一区二区三区| 女女色综合影院| 一区二区三区在线观看网站| av在线播放亚洲| av一区在线播放| 4438x成人网最大色成网站| 在线成人免费av| 亚洲第一二三区| 中文字幕精品www乱入免费视频| 欧美日韩色视频| 伊人蜜桃色噜噜激情综合| 日韩免费在线免费观看| 96日本xxxxxⅹxxx17| 成人免费看黄yyy456| 青青草国产精品| 影音先锋中文在线视频| 欧美日韩激情小视频| 五月天中文字幕在线| xxxx日韩| 精品国产网站地址| 日本少妇在线观看| 蜜臀av性久久久久蜜臀aⅴ流畅| eeuss一区二区三区| 国产在线视频福利| 亚洲香肠在线观看| 小明看看成人免费视频| 神马午夜久久| 九九久久久久99精品| 精品国产乱子伦| 国产成人精品免费| 神马影院我不卡午夜| 黄色成人在线网| 精品视频资源站| 欧美xxxxx精品| 一区二区日韩欧美| 国产精品免费久久久久影院| 天堂在线观看视频| 亚洲美女在线一区| 亚洲成色www.777999| 开心激情综合| 欧美猛交免费看| 亚洲天堂手机版| 久久女同性恋中文字幕| av网站大全免费| 亚洲网站免费| 一本色道久久88综合亚洲精品ⅰ | 欧美亚洲愉拍一区二区| 亚洲视频在线播放免费| 欧美成人中文| 91亚洲va在线va天堂va国| 久草在线网址| 一本大道综合伊人精品热热| 欧美xxxxx精品| 欧美96在线丨欧| 国产欧美在线看| 成全电影播放在线观看国语| 欧美性xxxx极品高清hd直播| 国产一级二级视频| 亚洲视频中文| 69174成人网| 91精品国产91久久久久久青草| 欧美精品丝袜中出| 小嫩苞一区二区三区| 老司机免费视频一区二区三区| 三区精品视频| 电影网一区二区| 国产亚洲精品久久久久动| 欧美一区二区三区网站| 久久久久综合网| 日本成人黄色网| 国产一区二区三区站长工具| 日本三级久久久| 成年人视频在线看| 欧美日韩一区中文字幕| 成人在线手机视频| 久久电影网电视剧免费观看| 久久久国产精华液999999| 涩涩涩久久久成人精品| 久久亚洲精品一区二区| 精品人妻无码一区二区色欲产成人| 亚洲人成网站在线| 国产乱淫av麻豆国产免费| 精品成人一区| 免费一区二区三区在在线视频| 成人动漫一区| 国产亚洲精品成人av久久ww| 欧美另类高清videos的特点| 国产精品成人免费精品自在线观看| 依人在线免费视频| 你懂的国产精品| 精品久久久三级| 欧美大胆成人| 日韩在线不卡视频| 999久久久久久| 亚洲一级二级在线| 在线免费看黄视频| 麻豆高清免费国产一区| 大陆极品少妇内射aaaaaa| 国产在线播放精品| 国产精品久久久av久久久| 黄av在线免费观看| 亚洲国产精品久久| 亚洲午夜无码久久久久| 亚洲人吸女人奶水| 一区二区视频观看| 蜜桃视频免费观看一区| 日韩a级黄色片| 久草在线成人| 亚洲综合中文字幕68页| 日韩欧美精品一区二区三区| 丝袜情趣国产精品| 色偷偷在线观看| 欧美三电影在线| 久久综合加勒比| 国产日韩欧美精品在线| 在线免费黄色小视频| 校园激情久久| 特级西西444| 教室别恋欧美无删减版| 97久草视频| 91p九色成人| 91精品国产高清| 免费黄网站在线播放| 日韩成人在线观看| 国产理论片在线观看| 激情懂色av一区av二区av| 亚洲国产123| 久久久久久久久久久电影| 日本中文字幕有码| 免费一级片91| 国产午夜福利视频在线观看| 午夜久久美女| 一区二区三区四区欧美| 日韩系列在线| 91手机在线视频| 国产精品天堂蜜av在线播放| 欧美大片在线影院| 毛片在线不卡| 一区二区在线免费视频| 日本午夜在线视频| 精品国产乱码久久久久久老虎 | 日韩免费小视频| 高清一区二区三区日本久| 在线免费黄色| 国产性色av一区二区| 神马午夜一区二区| 精品捆绑美女sm三区| 国产三级午夜理伦三级| 欧洲激情一区二区| 亚洲天堂男人av| 精品国产乱码久久久久久虫虫漫画| 欧美成人黄色网| 亚洲日本一区二区三区| youjizz亚洲女人| 久久久久99精品国产片| av直播在线观看| 91在线视频观看| 日本不卡视频一区| 国产v日产∨综合v精品视频| 国产91在线免费观看| 国产一区二区三区综合| 欧美成年人视频在线观看| 美女一区二区久久| 午夜精品中文字幕| 久久国产乱子精品免费女| 精品久久久久久久无码| 日韩av一区二区三区四区| 黄色一级二级三级| 日韩精品每日更新| 欧美一级黄色影院| 日韩激情视频在线观看| 天天干在线影院| 蜜桃av噜噜一区二区三区小说| 国产野外作爱视频播放| 奇米精品一区二区三区四区| 日韩av片网站| 久久99精品久久只有精品| www.成人黄色| 国产精品18久久久久| 一个人看的视频www| 国产一区二区福利| 国产精品一级无码| av亚洲精华国产精华精| 亚洲专区区免费| 国产欧美日韩卡一| 91香蕉视频网| 亚洲免费视频中文字幕| 国产一级片免费| 天天免费综合色| 久久久蜜桃一区二区| 欧美区在线观看| 亚洲精品国产suv一区| 亚洲精品一区中文字幕乱码| 草碰在线视频| 欧美精品制服第一页| 9999热视频在线观看| 日韩av成人在线| 二区三区精品| 在线精品国精品国产尤物884a| 欧美日韩一区二区电影| 欧美做爰啪啪xxxⅹ性| 一区二区三区欧美亚洲| 国产精彩视频在线观看| 日韩欧美精品中文字幕| 中文字幕日本人妻久久久免费| 欧美丰满少妇xxxbbb| 天堂中文资源在线观看| 亚洲一级免费视频| 色yeye免费人成网站在线观看| 97在线视频一区| 久久不卡日韩美女| 国产精品区一区二区三在线播放| 精品在线观看入口| 色乱码一区二区三区熟女| 亚洲激情在线| 艹b视频在线观看| 成人妖精视频yjsp地址| 免费福利视频网站| 亚洲一区二区三区不卡国产欧美| 欧美成人精品网站| 欧美精品一区在线观看| 9191在线观看| 欧美一区二三区| 视频精品国内| 亚洲7777| 国产日产高清欧美一区二区三区| 拔插拔插华人永久免费| 91农村精品一区二区在线| 中文字幕在线观看成人| 欧美性猛交xxxxxxxx| 人人妻人人玩人人澡人人爽| 日韩网站在线观看| 成人免费看视频网站| 99re6热在线精品视频播放速度| 精品黄色一级片| 成人午夜免费在线| 国产一区二区精品久久| 免费人成又黄又爽又色| 亚洲第一搞黄网站| 国产精品无码天天爽视频| 亚洲韩国青草视频| 秋霞成人影院| 国产精品久久久久久久9999| 欧美一区二区三区久久| 国产91沈先生在线播放| 另类成人小视频在线| 国产精品久久久久无码av色戒| 亚洲在线观看免费| av观看在线免费| 日韩一区二区福利| 九色成人搞黄网站| 日本精品一区二区| 久久视频一区| 法国伦理少妇愉情| 午夜电影一区二区三区| 国模人体一区二区| 欧美激情欧美激情在线五月| 国产精一区二区| 欧美h视频在线观看| 看片的网站亚洲| 亚洲一级片在线播放| 在线观看视频欧美| 国产毛片在线看| 国产精品久久久999| 欧美亚洲高清| 国产精品区在线| 亚洲国产激情av| 中文字幕一区二区人妻痴汉电车| 亚洲欧美综合另类中字| 香蕉视频亚洲一级| 日韩av高清在线播放| 日日夜夜精品免费视频| 亚洲欧美va天堂人熟伦 | 色偷偷偷综合中文字幕;dd| 欧美日韩亚洲国产| 亚洲欧美日本国产有色| 毛片基地黄久久久久久天堂| 无码黑人精品一区二区| 欧美一区二区黄色| 欧美性video| 精品无人乱码一区二区三区的优势 | 久久中文字幕国产| 久久久久九九精品影院| 91大学生片黄在线观看| 成人在线视频一区二区| 国产又黄又粗又爽| 国产亚洲欧美日韩美女| 国产成人a视频高清在线观看| 一区二区三区四区久久| 国产精品99久久久久久久女警| 久久免费公开视频| 亚洲黄色在线看| 日韩网站中文字幕| 三上悠亚免费在线观看| 成人久久18免费网站麻豆| 中文字幕免费在线观看视频| 伊人久久精品视频| 国产精品成人3p一区二区三区 | avtt天堂在线| 精品欧美一区二区久久| 欧美18—19sex性hd| 亚洲午夜在线观看| 顶级嫩模精品视频在线看| 五月天激情四射| 久久综合电影一区| 女同另类激情重口| 中文字幕久久av| 调教+趴+乳夹+国产+精品| 亚乱亚乱亚洲乱妇| 国产一区二区免费电影| 久久国产精品第一页| 国产91av视频| 最新的欧美黄色| 欧美三级电影在线| 亚洲综合20p| 色呦呦国产精品| 欧美理论片在线播放| 日产中文字幕在线精品一区| 国产黑丝在线一区二区三区| 日韩三级一区二区| 欧美激情精品久久久久久蜜臀| 国产传媒欧美日韩成人精品大片| 午夜影院免费版| 欧美性xxxxxxxx| 色网在线免费观看| 久久久99精品视频| 国产精品久久久久aaaa|