精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

優于人類參考摘要,OpenAI用人類反饋提升了摘要生成質量

新聞 人工智能
近日,來自 OpenAI 的研究者利用人類反饋優化了文本摘要生成模型,該模型生成的摘要質量顯著提升,并且可以遷移至 CNN/DM 的文章生成新聞摘要。

  隨著語言模型越來越強大,用于特定任務的數據和度量標準越來越成為訓練和評估的瓶頸。例如,摘要模型通常被訓練用來預測人類參考摘要,并使用 ROUGE 進行評估,但是這些度量指標都沒有觸及真正的關注點——摘要質量。

近日,OpenAI 的一項研究表明,人們可以通過訓練模型來優化人類偏好,進而顯著提升摘要質量。具體而言,研究者收集了一個人類摘要比較的大型、高質量數據集,訓練了一種模型來預測人類偏好的摘要,并使用該模型作為獎勵函數通過強化學習來微調摘要策略。

優于人類參考摘要,OpenAI用人類反饋提升了摘要生成質量

論文鏈接:https://arxiv.org/pdf/2009.01325.pdf

項目地址:https://github.com/openai/summarize-from-feedback

研究者將該方法應用于 Reddit 帖子的摘要生成,結果顯示該研究的模型顯著優于人類參考摘要,以及僅通過監督學習進行微調的更大規模的模型。

研究中的模型還可以遷移至 CNN/DM 新聞文章,在不進行任何特定新聞微調的情況下生成幾乎和人類參考摘要一樣好的結果。

最后,研究者進行了擴展分析,以理解人類反饋數據集和微調模型。該研究確保獎勵模型能夠泛化到新數據集上,并且優化獎勵模型的結果要比根據人類要求優化的 ROUGE 更佳。

該研究的主要貢獻有:

研究表明,在英文摘要生成上,基于人類反饋的訓練顯著優于強大的基準訓練;

人類反饋模型相較于監督模型能夠更好地泛化到新的領域;

對其策略和獎勵模型進行了擴展實驗分析。

接下來詳細解讀 OpenAI 采用的研究方法以及相應的實驗細節和結果。

方法與實驗細節

高階方法

研究者采用的方法適用于批處理設置。從一個初始策略開始,該策略通過對所需數據集(以 Reddit TL;DR 摘要數據集為示例)的監督學習進行微調。整個過程(如下圖 2 所示)由可以迭代重復的三個步驟組成:

基于現有策略中收集樣本,并將比較結果發送給人類;

從人類比較中學習獎勵模型;

針對獎勵模型優化策略。

優于人類參考摘要,OpenAI用人類反饋提升了摘要生成質量

人類反饋、獎勵模型訓練和策略訓練整體流程圖。

數據集和任務

研究者使用 TL;DR 摘要數據集,它包含來自 reddit.com 上涉及各種主題(subreddit)約 300 萬個帖子,以及原始發帖人(TL; DR)撰寫的帖子摘要。

此外,研究者還對該數據集進行了過濾(請參閱附錄 A)以確保數據集質量,包括使用一般人群可以理解的 subreddit 白名單。

研究者將 ground-truth 任務定義為生成一個模型,其中該模型生成長度少于 48 個 token 且盡可能好的摘要。此外,判斷摘要質量的標準是:摘要如何忠實地將原文傳達給一個只能閱讀摘要而不閱讀文章的讀者

收集人類反饋

先前根據人類反饋對語言模型進行微調的研究表明[66]:我們希望自身模型學習的質量與人類標簽者實際評估的質量之間存在不匹配。這導致了模型生成摘要在標簽者看來質量是好的,但在研究人員看來,質量卻很低。

與 [66] 相比,研究者實現了兩個改進來提高人類數據質量。首先,完全過渡到離線設置,在這里交替發送大量的比較數據給人工標簽者,然后根據累積收集的數據重新訓練模型;其次,與標簽者保持親密關系:給他們詳細的指導,在共享的聊天室中回答他們的問題,并定期對他們的表現提供反饋。

模型

研究者使用的所有模型都是 GPT-3 風格的 Transformer 解碼器,并對具有 13 億(1.3B)和 67 億(6.7B)參數的模型進行人類反饋實驗。與 [12,44] 類似,研究者從預訓練模型開始,以自動回歸預測大型文本語料庫中的下一個 token。

接著,通過監督學習對這些模型進行微調,根據過濾后的 TL; DR 數據集預測摘要(詳細信息參見附錄 B)。使用這些監督模型對初始摘要進行抽樣,以收集比較結果,初始化策略和獎勵模型,并作為評估基準。

最后,為了訓練獎勵模型,研究者從一個監督基準開始,然后添加一個隨機初始化線性頭(linear head)輸出一個標量值。

研究者想要利用訓練得到的獎勵模型,來訓練一個能夠生成基于人類判斷的高質量輸出的策略。

實驗

根據人類反饋生成 Reddit 帖子的摘要

與規模更大的監督策略相比,基于人工反饋訓練的策略更可取。在 TL;DR 數據集上評估人工反饋策略的主要結果如下圖 1 所示:

優于人類參考摘要,OpenAI用人類反饋提升了摘要生成質量

研究者衡量策略質量采用的指標是該數據集中由該策略生成的人們偏好的參考摘要所占的百分比。從圖中可以看到,基于人工反饋訓練的策略顯著優于監督基準策略,并且 1.3B 的人工反饋模型也顯著優于其 10 倍規模的監督模型(兩者相對于參考摘要的原始偏好得分為 61% vs 43%)。

控制摘要長度

在判斷摘要質量時,摘要長度是一個混淆因子(confounding factor)。摘要的目標長度是摘要生成任務的隱式部分,并且根據簡潔性與涵蓋性之間的預期權衡來判斷生成長摘要還是短摘要。

該研究中的模型學會了生成更長的摘要,因此長度在質量改進中起到了很大的作用。

策略如何在基準上實現提升?

為了更好地了解該模型生成摘要與參考摘要和監督基準摘要三者之間的質量比較,研究者進行了一項補充分析,其中人類標簽員使用 7-point 李克特量表(Likert scale)從四個指標(整體表現、涵蓋性、連貫性和準確性)對摘要質量進行了評估。評估結果如下圖 3 所示,表明從所有指標,特別是涵蓋性來看,人類反饋模型優于監督基準模型。

優于人類參考摘要,OpenAI用人類反饋提升了摘要生成質量

具備生成新聞文章摘要的遷移性

如下圖 4 所示,人類反饋模型還可以在沒有任何進一步訓練的情況下,生成優秀的 CNN/DM 新聞文章摘要。

具體來講,人類反饋模型在 TL;DR 數據集上顯著優于通過監督學習訓練的模型,以及僅在預訓練語料庫上訓練的模型。盡管生成的摘要更短,6.7B 人類反饋模型的效果幾乎相當于在 CNN/DM 參考摘要上進行微調的 6.7B 模型。

優于人類參考摘要,OpenAI用人類反饋提升了摘要生成質量

理解獎勵模型

優化獎勵模型

根據該研究的獎勵模型進行優化應該使該研究的策略和人的偏好保持一致。但是獎勵模型并不能完美地代表標簽偏好。雖然該研究希望獎勵模型能夠泛化到訓練期間不可見的摘要,但尚不清楚在獎勵模型開始進行無用的評估之前,獎勵模型能夠優化多少。

為了回答這個問題,研究者創建了一系列針對獎勵模型的早期版本進行優化的策略,這些策略都具有不同程度的優化強度,并要求標簽者對將其樣本與參考摘要進行比較。

優于人類參考摘要,OpenAI用人類反饋提升了摘要生成質量

獎勵模型如何隨著模型和數據量的增加進行擴展?

研究者進行了控制變量實驗以確定數據量和模型大小如何影響獎勵模型的性能。研究者訓練了 7 個獎勵模型,從 160M 到 13B 參數,從 8k 到 64k 的人類比較數據。

該研究發現,訓練數據量增加一倍會導致獎勵模型驗證集準確率增加大約 1.1%,而模型大小增加一倍則會導致增加大約 1.8%。具體如下圖 6 所示:

優于人類參考摘要,OpenAI用人類反饋提升了摘要生成質量

獎勵模型學到了什么?

研究者在幾個驗證集中評估了該獎勵模型,在下表 17 中給出了完整結果:

優于人類參考摘要,OpenAI用人類反饋提升了摘要生成質量

研究者發現該獎勵模型泛化到評估 CNN/DM 摘要,具體如下表 18 所示:

優于人類參考摘要,OpenAI用人類反饋提升了摘要生成質量

分析用于摘要的自動度量指標

研究者研究了各種自動度量指標如何很好地預測人類的偏好,并將其與 RM 進行比較。具體來講,研究者在基線監督模型下檢查了 ROUGE、摘要長度、從帖子中復制的數量以及對數概率。

如下圖 7 所示,使用簡單的優化方案優化 ROGUE 并不能持續提高質量,與針對獎勵模型的優化相比,針對 ROGUE 的優化不僅可以更快達到峰值,而且質量比率也大大降低。

優于人類參考摘要,OpenAI用人類反饋提升了摘要生成質量

 

責任編輯:張燕妮 來源: 機器之心Pro
相關推薦

2020-06-15 10:42:42

谷歌Android開發者

2023-02-27 14:55:54

技術研究

2023-05-25 09:00:00

人工智能ChatGPTOpenAI

2024-11-14 09:59:23

2023-09-20 15:21:48

2024-12-05 10:57:24

2024-04-10 08:40:18

2023-08-22 13:21:07

AI算法

2023-01-01 13:42:11

AI學項目預測

2020-08-26 13:18:19

AI 數據人工智能

2009-11-19 15:44:22

Oracle Chec

2022-07-04 23:29:56

人工智能語言模型數據

2012-11-20 10:29:26

數據中心供電微軟

2025-03-17 13:51:06

2025-01-06 10:23:00

AI模型訓練

2025-03-21 08:13:29

2025-05-14 10:09:12

2024-04-07 08:50:00

谷歌框架

2023-07-28 08:13:30

2017-10-17 14:35:50

谷歌
點贊
收藏

51CTO技術棧公眾號

一区在线观看免费| 鲁大师成人一区二区三区| 9191成人精品久久| 肉大捧一出免费观看网站在线播放| 朝桐光av在线一区二区三区| 亚洲欧美清纯在线制服| 色偷偷偷亚洲综合网另类| 少妇高潮一69aⅹ| 欧美大片免费| 亚洲在线视频免费观看| 日本一区视频在线| 亚洲精品成人电影| 日韩精品视频网站| 久久久久久高潮国产精品视| 1024手机在线观看你懂的| 91成人午夜| 欧美日韩在线播放| www黄色日本| 操你啦视频在线| 久久久久久久久岛国免费| 91超碰在线电影| 亚洲图片视频小说| 国产欧美综合一区二区三区| 久久艳片www.17c.com| 女~淫辱の触手3d动漫| 亚洲啊v在线免费视频| 欧美日韩一区二区在线观看| 国产精品一区二区免费在线观看| 成人福利片网站| 欧美国产一区二区在线观看| 精品视频一区二区三区四区| 精品国产无码AV| 精品亚洲免费视频| 国产精品黄色av| 午夜毛片在线观看| 欧美女人交a| 欧美成人h版在线观看| 在线观看亚洲大片短视频| 亚洲区小说区图片区qvod| 精品国产网站在线观看| 欧美日韩理论片| 欧美高清xxx| 欧美在线短视频| 18岁视频在线观看| 伊人久久在线| 色哟哟在线观看一区二区三区| 免费观看美女裸体网站| 少女频道在线观看高清 | av网站在线免费看推荐| 国产精品你懂的在线欣赏| 日本视频一区在线观看| 久草在线网址| 国产丝袜在线精品| 日韩高清专区| 一本一道波多野毛片中文在线| 国产三级精品在线| 色姑娘综合av| 免费黄色在线| 亚洲一区二区在线视频| 日本人妻伦在线中文字幕| 日本性爱视频在线观看| 一区二区三区日韩欧美| 日韩黄色片在线| 国产白丝在线观看| 精品久久久久久久久久| 久久精品国产精品亚洲色婷婷| 无码小电影在线观看网站免费| 欧美性少妇18aaaa视频| 国产v亚洲v天堂无码久久久| 欧美日韩视频免费看| 欧美精品乱码久久久久久| 日韩va在线观看| 国产一区 二区| 亚洲成av人乱码色午夜| 国产精品无码午夜福利| 日韩精品免费一区二区三区| 久久手机精品视频| 久久久之久亚州精品露出| 国内精品视频在线| 国产亚洲精品女人久久久久久| 在线电影一区| 国产aⅴ夜夜欢一区二区三区| 中文字幕人成人乱码亚洲电影| 久久精品久久综合| av资源站久久亚洲| 欧美女v视频| 综合久久综合久久| 国产freexxxx性播放麻豆| 成人私拍视频| 欧美一级精品在线| 免费在线观看成年人视频| 日韩精品二区| 78色国产精品| 国产精品自偷自拍| 97久久精品人人爽人人爽蜜臀| 亚洲成人av动漫| 福利成人导航| 欧美精品久久久久久久多人混战| 精品国产aⅴ一区二区三区东京热| 欧美日韩直播| 欧美成人黑人xx视频免费观看| 亚洲天堂一区在线| 国产一区二区免费看| 你懂的视频在线一区二区| 黄色免费在线观看| 一本大道久久a久久精品综合| 久久久久久国产精品日本| 在线观看欧美理论a影院| 精品中文字幕乱| 中文字幕久久熟女蜜桃| av成人免费在线观看| 宅男噜噜99国产精品观看免费| 久草在线中文最新视频| 欧美一区二区三区四区高清| 老熟妇一区二区| 一本久道久久久| 亚洲aa中文字幕| caoporn国产精品免费视频| 午夜精品久久久久久| 日韩av加勒比| 日韩免费av| 国产成人一区二区三区小说| 日韩在线视频第一页| 亚洲视频香蕉人妖| 天天干天天玩天天操| 免费成人结看片| 午夜精品理论片| 国内老熟妇对白xxxxhd| 成人欧美一区二区三区1314| 热久久精品免费视频| 日韩影视高清在线观看| 欧美精品久久一区二区| av中文字幕观看| 中文字幕综合网| 中文字幕资源在线观看| 日韩大片在线| 国产色综合天天综合网| 高清中文字幕一区二区三区| 色综合一区二区| 亚洲最大成人网站| 国产精品亚洲欧美| 久久久久高清| 中文字幕不卡三区视频| 国产视频亚洲视频| √资源天堂中文在线| 91麻豆国产香蕉久久精品| 亚洲 自拍 另类小说综合图区| 国产一区丝袜| 91精品国产高清自在线看超| 亚洲欧洲精品视频| 欧美性生活大片免费观看网址| 免费看污片网站| 日日摸夜夜添夜夜添精品视频 | 清纯唯美亚洲综合一区| 国产精品伦子伦免费视频| 国产毛片在线| 欧美三级乱人伦电影| 日本成人免费在线观看| 麻豆精品视频在线观看免费| 中文字幕在线亚洲精品| 精品国产亚洲一区二区三区大结局| 久久成人精品电影| 男人天堂手机在线观看| 精品久久久久久久久中文字幕 | 18视频在线观看娇喘| gay欧美网站| 亚洲日本aⅴ片在线观看香蕉| 一二三区免费视频| 国产欧美一区二区三区沐欲| 亚欧激情乱码久久久久久久久| 久久精品亚洲人成影院 | 国内精品偷拍| 欧美综合一区第一页| 韩日在线视频| 欧美精品视频www在线观看| 欧美精品一级片| 91蝌蚪porny九色| 在线免费av播放| 欧美日韩亚洲一区三区| 你懂的视频在线一区二区| 国产成人免费精品| 欧美激情视频免费观看| 欧美777四色影视在线| 6080国产精品一区二区| www.天天色| 欧美国产日韩亚洲一区| 欧美体内she精高潮| 在线综合亚洲| 自拍亚洲欧美老师丝袜| 欧美中文一区| 成人黄色午夜影院| 黄视频网站在线观看| 一区二区在线视频| 亚洲国产日韩在线观看| 日本韩国一区二区三区| 美女的奶胸大爽爽大片| www亚洲一区| 日本少妇xxx| 久久综合九色综合欧美狠狠| 欧洲精品视频在线| 九九综合久久| 国产日韩亚洲精品| 欧美激情不卡| 欧美性受xxxx白人性爽| 国产一二区在线| 亚洲欧洲日产国码av系列天堂| 99热精品在线播放| 欧洲av在线精品| 亚洲 欧美 视频| 亚洲日穴在线视频| 亚洲 小说 欧美 激情 另类| 国产91精品免费| 999这里有精品| 久久亚洲风情| 日本一道本久久| 国产精品mm| 99精品视频网站| 欧美日韩国产传媒| 韩国成人动漫在线观看| 精品国产不卡一区二区| 国产精品稀缺呦系列在线 | 国产精品久久久久久久久久久不卡| 国产探花视频在线观看| 久久久国产精品亚洲一区| 国产精品一二三区视频| 亚洲精品国产精品国自产观看浪潮 | 久久高清精品| 日本一区二区三不卡| 欧美精品中文| 精品一区二区日本| 国产+成+人+亚洲欧洲在线 | 五月天亚洲色图| 国产精品久久久久久免费观看| 国产一区二区av在线| 成人午夜黄色影院| 国产95亚洲| 91中文在线观看| 96视频在线观看欧美| 国产欧美一区二区三区在线看| 欧美成人精品三级网站| 国产成人精品优优av| 范冰冰一级做a爰片久久毛片| 91国语精品自产拍在线观看性色| 超碰97免费在线| 久久久亚洲成人| av电影在线免费| 91国内精品久久| 水蜜桃在线视频| 奇米影视亚洲狠狠色| 欧美香蕉视频| 国产精品丝袜高跟| 日本免费成人| 亚洲www视频| 国产精品乱战久久久| 精品国产乱码一区二区三区四区| 日本国产精品| 日韩理论片在线观看| 日本一本不卡| 黄色一级视频播放| 狠狠综合久久av一区二区老牛| 2018日日夜夜| 久久亚洲风情| 亚洲制服在线观看| 成人免费黄色在线| 在线免费观看日韩av| 亚洲国产精品二十页| 老熟妇高潮一区二区三区| 一区二区成人在线视频| 国产成人在线观看网站| 在线观看免费视频综合| 99产精品成人啪免费网站| 精品成a人在线观看| 天堂网www中文在线| 亚洲午夜精品久久久久久性色 | 亚洲日本丝袜连裤袜办公室| 亚洲国产成人精品综合99| 五月天视频一区| 国产乡下妇女三片| 欧美一区二视频| 天天操天天干天天爽| 在线播放日韩精品| 亚洲综合伊人久久大杳蕉| 1769国产精品| 粉嫩av国产一区二区三区| 国产欧美日韩综合一区在线观看| 国产一区二区三区四区二区| 色乱码一区二区三区熟女 | 美女网站免费观看视频| 国产精品影视天天线| 成人影视免费观看| 日韩美女久久久| 成人免费区一区二区三区| 欧美日韩精品一区二区三区| 刘亦菲毛片一区二区三区| 国产一区二区三区在线观看视频 | 羞羞答答国产精品www一本 | 97久久人人超碰| 朝桐光av在线| 欧美曰成人黄网| 四虎在线视频免费观看| 久久精品国产99国产精品澳门| av影院在线| 2022国产精品| 精品免费视频| 国产午夜福利100集发布| 久久99精品国产| 亚洲理论片在线观看| 亚洲国产人成综合网站| 97超碰国产在线| 国产午夜精品一区理论片飘花| a天堂资源在线| 91麻豆蜜桃| 亚洲国产一成人久久精品| 免费激情视频在线观看| 99久久精品情趣| 免费一级a毛片夜夜看| 欧美日韩视频一区二区| 日韩大胆人体| 国内伊人久久久久久网站视频 | 欧美美乳视频网站在线观看| 欧美日韩综合| 香蕉网在线视频| 成人欧美一区二区三区| 国产精品高清无码| 亚洲另类xxxx| 免费v片在线观看| 国产精品10p综合二区| 一区二区电影| а 天堂 在线| 亚洲欧美另类小说| 一级特黄色大片| 日韩中文字幕免费看| 精品123区| 水蜜桃亚洲精品| 天堂蜜桃一区二区三区| 五月婷婷综合在线观看| 岛国av一区二区三区| 三级小视频在线观看| 午夜精品久久久久久久99热| 国产主播性色av福利精品一区| 久久99中文字幕| 不卡av电影在线播放| www.国产成人| 精品一区精品二区| 免费h视频在线观看| 欧美不卡三区| 日韩精品视频网站| 久久久久99精品成人| 欧美日韩国产不卡| 精品孕妇一区二区三区| 91精品网站| 亚洲第一精品影视| 色天使在线视频| 91久久精品网| 日本高清视频在线观看| 91色琪琪电影亚洲精品久久| 亚洲欧美综合| 欧美无人区码suv| 日本精品一区二区三区高清| 日韩黄色影院| av成人午夜| 美女国产一区| 操她视频在线观看| 日韩午夜三级在线| 精品极品在线| 亚洲黄色一区二区三区| 国产中文字幕精品| 国产一级片免费| 亚洲天堂av女优| 国产精品一级在线观看| 男女私大尺度视频| 国产丝袜美腿一区二区三区| 国产精品无码天天爽视频| 久久久久久久久久久国产| 亚洲人成亚洲精品| www.成年人| 天天免费综合色| 欧美一级二级三级区| 91久久爱成人| 日韩av一区二区三区| tube国产麻豆| 日韩精品高清在线观看| 成人全视频免费观看在线看| 国产青草视频在线观看| 久久综合狠狠综合久久激情| 91在线你懂的| 欧美在线不卡区| 91精品国产麻豆国产在线观看| 国产亚洲色婷婷久久99精品91| 欧美私模裸体表演在线观看| 污视频网站免费在线观看| 日本电影一区二区三区| 国产成人一区在线| 日韩黄色片网站| 久久久久久久成人| 日韩在线精品| 97伦伦午夜电影理伦片| 欧美成人aa大片| 成人免费黄色| 中国丰满人妻videoshd|