精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

最新RLHF拯救語言模型「胡說八道」!微調效果比ChatGPT更好,兩名華人共同一作

人工智能 新聞
華盛頓大學和艾倫人工智能研究院的研究人員提出了一種新的RLHF框架——FINE-GRAINED RLHF(細粒度的人類反饋強化學習)。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

RLHF(基于人類反饋的強化學習)的一大缺點,終于被解決了!

沒錯,雖然RLHF是大語言模型“核心技巧”之一,然而這種方法也存在一個問題——

它只會判斷生成文本的整體效果,不會仔細判斷細節是否存在事實性錯誤、信息不完整和相關度等問題。

換而言之,傳統的RLHF只會對大語言模型的整個輸出進行打分,而不會揪出細節上的毛病。

為此,華盛頓大學和艾倫人工智能研究院的研究人員提出了一種新的RLHF框架——FINE-GRAINED RLHF(細粒度的人類反饋強化學習)。

圖片

這個RLHF框架包含多種不同類型的“打分器”(reward model),通過對語言模型輸出的每句話進行評估,從而提升生成文本的質量。

不僅如此,對這些“打分器”的權重進行調配,還能更靈活地控制語言模型輸出效果。

事實證明,這種RLHF方法能很好地降低語言模型生成內容的錯誤率、毒性,并提升它回答問題的全面性和解析能力。

所以,這個RLHF方法究竟長啥樣?

對傳統RLHF進行兩大改進

這個名叫FINE-GRAINED RLHF的框架,核心目的就是細化傳統RLHF的評估方法。

具體來說,在語言模型輸出結果后,它要能標識出具體哪些句子是錯誤的、哪些部分是不相關的,從而更精細地指導模型學習,讓模型更好地理解任務要求、生成高質量輸出。

為此,它主要做了兩大改進:

圖片

一方面,對要評估的文本進行拆解

如果說之前的RLHF評估語言模型,就像老師給學生的高考作文整體打分,那么FINE-GRAINED RLHF,就像是先把學生的作文拆成一句句話,再給每句話進行打分。

另一方面,訓練三個“打分器”,分別用來評估事實準確性、相關性和信息完整性:

  • 相關性、重復性和連貫性:給每一句話中的短句子(sub-sentences)進行打分。如果一句話里面的各個句子不相關、重復或不連貫就扣分,否則加分。
  • 錯誤或無法驗證的事實:給每一句話(sentences)進行打分。如果一句話中存在任何事實錯誤,就扣分;否則加分。
  • 信息完整性:檢查回答是否完整,涵蓋與問題相關的參考段落中的所有信息,對整個輸出進行評分。

為了檢驗模型的效果,研究人員用兩大任務,對這種新RLHF和傳統RLHF方法進行了評估。

兩大任務效果均有提升

任務一:生成文本毒性評估

為了研究這種新框架的效果,研究人員先進行了去毒任務的實驗。

實驗使用了Perspective API來測量毒性,它可以返回一個介于0(無毒)和1(有毒)之間的毒性值。

圖片

上圖展示了兩種不同的打分機制,其中(a)是傳統的RLHF打分機制,也就是對模型所生成的內容打一個“總分”。

而(b)則是新的RLHF評估方法,將輸出的內容進行拆解,分成了兩個句子,對兩個句子分別打分。

針對模型生成的這兩句話:

I am such an idiot.She is so smart!
(我真是個白癡。她真聰明!)

顯然前半句話是造成生成內容有毒的關鍵。

傳統(a)的方法,并沒有指出這一點;而(b)的方法可以很好地指出問題所在。
對兩種方法進行比較:

圖片

可以看到,在上面所有方法中,基于FINE-GRAINED RLHF框架,在多樣性(Diversity,大語言模型創造豐富度)水平和其它方法相近的情況下,仍能保持生成內容的毒性最低。

圖片

與此同時,根據上圖的困惑度曲線,FINE-GRAINED RLHF的毒性下降速度更快,同時保持較低水平的困惑度(Perplexity,越低表示模型對給定序列的預測越準確)。這表明基于FINE-GRAINED RLHF框架學習比傳統的RLHF更高效。

關于這一點,其中一個解釋是:

新的RLHF方法能夠確定有毒內容的位置,這與傳統RLHF方法用的整體打分相比,提供的訓練目標更明確。

綜上,可以看到FINE-GRAINED RLHF在去毒任務中表現更為良好。

任務二:長篇問答

緊接著,研究人員還對FINE-GRAINED RLHF進行了長篇問答任務的實驗。

他們收集了一個包含人類偏好和細粒度反饋的長問答數據集——QA-Feedback,基于ASQA(一個專注于回答模糊事實性問題的數據集)制作。

然后,對不同的微調方法(SFT監督微調、Preference RLHF)進行了評估:

圖片

△人工評估的不相關性錯誤(左圖)和事實性錯誤(右圖)

與其它方法相比,FINE-GRAINED RLHF生成的內容在事實上更正確,包含更完整的信息。

相比當前表現較好的微調方法,如SFT和Preference RLHF,FINE-GRAINED RLHF生成的無關、重復和不連貫錯誤也要更少。

圖片

△信息完整度評估,“win”表示FINE-GRAINED RLHF獲勝,即在信息完整性方面表現更好;而“lose”表示FINE-GRAINED RLHF失敗,即在信息完整性方面表現較差。

上面給出的是人工評估的結果,而在測試集上也有自動的評分。

在QA-FEEDBACK測試集上,評分結果與人工評估類似,四個系統在Rouge分數上都顯示FINE-GRAINED RLHF效果更好:

圖片

△在QA-FEEDBACK測試集上的自動評估結果

更靈活地定制RLHF

此外,研究人員還發現,由于FINE-GRAINED RLHF中使用了多個“打分器”,調整它們的權重,就可能更為靈活地定制語言模型的行為。

例如,將更多的權重添加到評估信息完整性的“打分器”中,可能會使生成的信息完整性更好。

圖片

△不同獎勵模型權重配置下FINE-GRAINED RLHF的測試集自動評估結果。

如上表所示,研究人員探索了FINE-GRAINED RLHF定制化語言模型行為的能力。

他們探索了三種“打分器”權重配置,并根據語言模型的平均文本生成長度,將它們分別命名為“short”、“medium”、“long”。

圖片

“short”生成了相關性更高的內容,但是事實性和完整性方面較差。與之相反,“long”提供了最準確和完整的生成內容。這反映出語言模型引用了大量的文本段落內容。而“medium”配置平衡了三種打分方法,并具有最高的得分。

不過,三個“打分器”之間還存在著競爭關系。

“相關性打分器”(the rel. reward model)偏向于生成短而簡潔的回答,而”信息完整性打分器”(the comp. reward model)更偏向于生成更長、更豐富的回答。

因此,在訓練過程中,這兩個“打分器”會相互競爭,并最終達到一個平衡。

與此同時,“事實性打分器”(the fact. reward model)則會不斷提高回答的正確性。

不過,移除任何一個“打分器”都會降低模型性能。

最后,研究人員還將他們的模型與ChatGPT的回答進行了比較。

ChatGPT在測試集上的RougeLSum得分為40.92,遠低于本文使用FINE-GRAINED RLHF所訓練的模型。

簡單來說,ChatGPT生成的回答通常非常簡潔且事實準確,但是缺乏澄清模糊問題所需的補充信息。

作者介紹

兩位論文共同一作均是來自于華盛頓大學(University of Washington)自然語言處理研究小組的博士生。

Zeqiu Wu,本科就讀于伊利諾伊大學電子與計算機工程系,并且取得了該校的碩士學位。

她的研究主要專注于信息檢索型對話系統和通用交互系統。

曾在谷歌研究院的實習,擔任學生研究員。

胡雨石(Yushi Hu),于2021年從芝加哥大學獲得數學、計算機科學和經濟學的學士學位。目前師從Mari Ostendorf教授和Noah A. Smith教授。

他的主要興趣領域是多模態學習和基于人類反饋的強化學習(RLHF)。

此前,他還曾與美國阿貢國家實驗室的Saidur Bakaul博士和清華大學的寧傳剛教授合作過。

論文地址:https://finegrainedrlhf.github.io/

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-09-10 15:27:12

AI模型訓練

2023-04-11 14:32:25

騰訊面試Chunk

2023-06-30 13:01:26

2024-04-15 12:50:00

大型語言模型ReFT

2009-06-29 13:28:18

PHP小組PHP技巧網站加速

2023-05-05 10:28:47

2025-09-23 09:44:02

2023-04-02 18:00:56

2024-09-29 13:40:00

2023-11-18 09:30:42

模型AI

2023-09-18 11:25:00

2025-07-11 08:27:29

2025-02-13 11:02:12

2023-10-26 23:55:46

數據模型

2025-08-25 00:02:00

人工智能AI語言模型

2024-07-09 12:54:57

2024-03-20 00:00:00

大語言模型人工智能AI

2023-04-28 15:24:06

模型研究

2023-11-16 15:58:00

訓練數據

2012-11-08 10:27:54

AMD離職高管
點贊
收藏

51CTO技術棧公眾號

国产精品www.| 国产精品亚洲一区二区在线观看| 99国产精品99久久久久久| 亚洲成人黄色影院| 国产精品手机在线| 欧美brazzers| 亚洲精品成人无限看| 日韩精品极品在线观看| 在线观看国产福利| 国产免费拔擦拔擦8x高清在线人 | 久久精品国产露脸对白| 91丝袜在线| 日韩美女啊v在线免费观看| 国产区欧美区日韩区| 中文字幕日韩三级| 日韩午夜电影| 久久精品福利视频| 日本xxx在线播放| 久久99成人| 欧美中文字幕一区二区三区亚洲| 蜜臀精品一区二区| 1pondo在线播放免费| 国产成人免费高清| 国产噜噜噜噜久久久久久久久| 国产真实乱偷精品视频| 外国成人激情视频| 国产一区二区三区视频免费| 香蕉视频污视频| 97久久中文字幕| 欧美探花视频资源| 欧美日韩在线一| 国产福利在线免费观看| 亚洲欧洲日韩一区二区三区| 日韩wuma| 美国一级片在线免费观看视频| 丁香六月久久综合狠狠色| 成人午夜在线观看| www.4hu95.com四虎| 精品午夜电影| 精品国产精品一区二区夜夜嗨| 欧美成人乱码一二三四区免费| 久久精品女人天堂av免费观看| 亚洲va韩国va欧美va精品| 午夜探花在线观看| 日本三级在线视频| 日本一区二区高清| 日韩高清av| 黄网在线观看| 国产欧美一区二区精品性色| 欧美高清视频一区| 你懂的在线观看视频网站| 91在线porny国产在线看| 国产91aaa| 丁香六月色婷婷| 丁香婷婷综合激情五月色| 91九色极品视频| 精品人妻无码一区二区| 国产成人精品亚洲日本在线桃色| 98国产高清一区| www日本视频| 成人午夜电影久久影院| 国产精品一区二区你懂得| 好男人在线视频www| 成人高清av在线| 久久精品国产第一区二区三区最新章节 | 久久综合之合合综合久久| 国产精品久久久一区麻豆最新章节| 日本在线免费观看一区| 日本成人网址| 亚洲精品日韩综合观看成人91| 色撸撸在线观看| 主播国产精品| 精品国产福利视频| 国产男女激情视频| 日韩成人精品一区二区三区| 91精品国产欧美一区二区18 | www.激情成人| 欧美成熟毛茸茸复古| 成a人v在线播放| 亚洲天堂成人在线观看| 久久久久久久9| 人人草在线视频| 欧美最新大片在线看| 久久6免费视频| 好吊妞国产欧美日韩免费观看网站| 日韩精品视频在线观看网址| 日韩av片在线| 黄色av一区| 国产91精品在线播放| 亚洲一区二区三区网站| 粉嫩aⅴ一区二区三区四区五区| 久久亚洲国产精品日日av夜夜| 成人亚洲综合天堂| 一区二区在线观看不卡| 四虎永久在线精品无码视频| 日日夜夜亚洲精品| 亚洲国产成人av在线| 中文字幕第24页| 国产精品videosex极品| 国产精品96久久久久久又黄又硬| 99精品免费观看| 久久久影院官网| 免费看污污视频| 丝袜美腿一区| 精品成人一区二区| 天堂а√在线中文在线鲁大师| 伊人久久亚洲美女图片| 成人av在线网址| 欧洲亚洲精品视频| 亚洲影院在线观看| 亚洲精品视频导航| 色婷婷综合久久久久久| 精品中文字幕在线观看| 一级片在线免费播放| 成人短视频下载| 在线观看欧美激情| 日本成人三级电影| 欧美精品一区二区在线播放| 网站永久看片免费| 久久精品中文| 国内不卡一区二区三区| 色呦呦在线视频| 欧美日韩电影一区| 亚洲天堂久久新| 亚洲视频一二| 亚洲wwwav| 欧美猛烈性xbxbxbxb| 91久久线看在观草草青青| 日本一区二区在线免费观看| 中文字幕日韩欧美精品高清在线| 国产热re99久久6国产精品| 久久经典视频| 欧美性猛交xxxx免费看漫画| 日本五十肥熟交尾| 亚洲午夜久久久久久尤物 | 要久久电视剧全集免费| 97视频国产在线| 亚洲AV无码一区二区三区性 | 成人h版在线观看| 国产成人亚洲综合无码| 精品视频91| 久久中文字幕一区| 国产男男gay网站| 综合久久久久久久| 亚洲制服中文字幕| 亚洲高清影视| av噜噜色噜噜久久| 青春草免费在线视频| 日韩一区二区三区免费看| 99久久99久久精品国产| 国精产品一区一区三区mba视频| 亚洲一区不卡在线| 免费视频观看成人| 精品国产一区二区三区久久久 | 精品日韩一区二区三区| 久久午夜无码鲁丝片| 亚洲天堂男人| 日韩欧美午夜| 日韩一区在线视频| 国产精品嫩草影院精东| 国产精品高潮呻吟| 亚洲一二三不卡| 欧美精选在线| 精品国产日本| 亚洲成人短视频| 中文字幕在线日韩| 99久久精品日本一区二区免费| 亚洲毛片av在线| 性猛交╳xxx乱大交| 一本久久知道综合久久| 茄子视频成人在线观看| 日本成人一区二区| 欧美人在线视频| 97国产一区二区精品久久呦| 好吊色在线视频| 国产精品乱码人人做人人爱| 色男人天堂av| 日韩五码在线| 亚洲精品成人久久久998| 日韩一区二区三区在线看| 7m第一福利500精品视频| 国产视频三级在线观看播放| 欧美人妖巨大在线| 久久精品性爱视频| 国产嫩草影院久久久久| 亚洲av无码久久精品色欲| 中文国产一区| 影音先锋欧美资源| 你懂的在线观看一区二区| 中文字幕日韩欧美在线| 精品人妻一区二区三区四区不卡| 图片区小说区区亚洲影院| www久久久久久久| 国产iv一区二区三区| 可以免费观看av毛片| 这里只有精品在线| 欧美精品一区二区三区在线看午夜| 国产精品久久久久久吹潮| 九九热最新视频//这里只有精品| 久热av在线| 日韩一区二区麻豆国产| 国产又大又黄又粗| 亚洲精品欧美综合四区| japanese在线观看| 日韩精品一二三四| 欧洲精品在线播放| 婷婷久久国产对白刺激五月99| 国产精品免费看一区二区三区| 麻豆精品蜜桃| 91地址最新发布| h视频在线免费观看| 亚洲欧美激情精品一区二区| 亚洲精品911| 91精品久久久久久蜜臀| 欧美性猛交xxxx乱大交hd| 亚洲第一综合色| 一区二区国产精品精华液| 久久久久88色偷偷免费| 国产69视频在线观看| 九色|91porny| 男操女免费网站| 久久av最新网址| 亚洲理论电影在线观看| 围产精品久久久久久久| 欧美污视频久久久| 日韩三级毛片| 国产九色精品| 日韩在线成人| 亚洲一区二区中文| 亚洲欧洲日韩精品在线| 国产精品免费在线免费| 性欧美超级视频| 日韩av电影中文字幕| 欧美伦理91| 97超级碰碰人国产在线观看| 欧美人体视频xxxxx| 九九久久久久久久久激情| a级影片在线| 日韩中文字幕第一页| 日p在线观看| 精品国产欧美一区二区三区成人| 91se在线| 精品国产一区二区三区久久久狼| www.国产精品.com| 中文字幕无线精品亚洲乱码一区| 国产毛片av在线| 国产亚洲精品美女久久久| 国产在线黄色| 中文国产亚洲喷潮| 麻豆影院在线观看| 久久久精品999| 超碰在线免费播放| 欧美老肥婆性猛交视频| 美足av综合网| 97在线视频免费| 韩日成人影院| 国产97免费视| 粉嫩av一区二区三区四区五区| 国产伊人精品在线| 9.1麻豆精品| 97se视频在线观看| silk一区二区三区精品视频 | 欧美华人在线视频| 伦理av在线| 欧美一级片在线播放| 我爱我色成人网| 国产日韩精品一区二区| 日本在线视频一区二区三区| 国产有色视频色综合| 国产日产精品一区二区三区四区的观看方式 | 成人免费一区二区三区在线观看| 日本在线一级片| 亚洲成a人片综合在线| 欧美精品一二三四区| 欧美系列在线观看| 国产草草影院ccyycom| 欧美精品一区二区三区很污很色的| 日产精品久久久久久久性色| 中文字幕亚洲国产| 性欧美videoshd高清| 51色欧美片视频在线观看| 国产亚洲欧美日韩精品一区二区三区 | 邪恶网站在线观看| 国内久久婷婷综合| 国产真实乱人偷精品| 国产人成亚洲第一网站在线播放 | 欧美视频中文字幕在线| 久久精品国产免费观看| 91国内在线| 欧美亚洲激情在线| 国产高清精品二区| 精品在线视频一区二区| 99久久综合狠狠综合久久aⅴ| 国产原创popny丨九色| 久草精品在线观看| v8888av| 亚洲天堂成人网| 五月婷婷激情视频| 欧美一级理论性理论a| 国产精品一区在线看| 欧美黄色成人网| 福利一区视频| 精品欧美国产| 自拍偷拍欧美| 欧美一级裸体视频| 成人手机电影网| 久草福利资源在线| 狠狠综合久久av一区二区小说| 国产丝袜视频在线观看| 在线精品91av| 在线看片福利| 成人黄色片视频网站| 欧美丰满日韩| 天堂在线资源视频| wwwwxxxxx欧美| 日韩av免费网址| 日韩欧美第一区| 黄色片网站在线观看| 国产成人精品综合久久久| 亚洲精品18p| 亚洲男人的天堂在线aⅴ视频| 国产日产精品一区二区三区| 欧美大片顶级少妇| 日本高清中文字幕在线| 日韩免费观看av| 日韩精品免费一区二区夜夜嗨 | 美女网站色91| 中文字幕一区二区人妻在线不卡| 亚洲一级二级三级在线免费观看| 91国内精品久久久| 在线激情影院一区| 欧洲精品一区二区三区| 欧美国产二区| 国产一区二区三区久久| 精品影片一区二区入口| 亚洲一区二区欧美| 国产成人av免费看| 久久精品小视频| 国产精品亚洲欧美日韩一区在线| 亚洲高清资源综合久久精品| 日本伊人色综合网| 日韩精品无码一区二区三区久久久| 欧美日韩国产一区中文午夜| 黄片毛片在线看| 性欧美办公室18xxxxhd| 国产精品网址| 日日橹狠狠爱欧美超碰| 99久久免费视频.com| 久久久久久久久久久久久av| 日韩国产一区三区| 视频二区不卡| 亚洲乱码国产乱码精品天美传媒| 麻豆91在线观看| 日韩一级片大全| 日韩精品一区二区三区在线播放| 国产盗摄一区二区| 久久精品日产第一区二区三区乱码 | 国产男女无遮挡猛进猛出| 一区二区三区四区视频精品免费 | 日韩在线 中文字幕| 伊人一区二区三区久久精品| 激情亚洲小说| 久久天天东北熟女毛茸茸| 高清日韩电视剧大全免费| 亚洲视频免费播放| 亚洲片在线观看| 四虎影视成人精品国库在线观看 | 久热精品视频| 奇米网一区二区| 日韩精品中文字幕在线不卡尤物 | 国产一区二区在线免费| 欧美激情综合| 久久国产精品无码一级毛片| 在线免费不卡电影| 污片在线免费观看| 久久99国产精品99久久| 美女视频黄 久久| 久草福利资源在线观看| 亚洲精品自拍偷拍| 亚洲一区av| 成人一对一视频| 国产精品久久福利| 免费国产精品视频| 亚洲欧美国产一区二区三区| 成人国产激情| 男人的天堂avav| 国产无人区一区二区三区| 不卡av中文字幕| 国产成人综合久久| 91精品91| 国产真实乱人偷精品人妻| 日韩欧美一级特黄在线播放| av有声小说一区二区三区| 黄网站色视频免费观看| 国产亚洲欧美日韩日本| 性网爆门事件集合av| 国产精品av在线播放| 国产精品xvideos88| 四季av中文字幕| 亚洲精品国产品国语在线|