精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-4批評GPT-4實現「自我提升」!OpenAI前超級對齊團隊又一力作被公開

人工智能 新聞
今天,OpenAI悄悄在博客上發布了一篇新論文——CriticGPT,而這也是前任超級對齊團隊的「遺作」之一。CriticGPT同樣基于GPT-4訓練,但目的卻是用來指正GPT-4的輸出錯誤,實現「自我批評」。

OpenAI最近的拖延癥狀逐漸嚴重,不僅GPT-5遙遙無期,前幾天還宣布GPG-4o的語音功能將推遲一個月發布。

或許是為了緩解廣大網友的熱切期待,OpenAI在今天放出了新模型CriticGPT,相當于GPT-4的「拐杖」。

圖片

我們訓練了一個模型CriticGPT,來捕獲GPT-4生成代碼中的錯誤。我們開始將此類模型集成到RLHF對齊管道中,以幫助人類監督AI執行困難的任務。

值得注意的是,CriticGPT依舊是用GPT-4模型訓練的,但被用于給GPT-4生成的代碼「捉蟲」,這似乎有點「自我閉環」的意思?

推特網友迅速質疑,「我用石頭摧毀石頭」,矛盾得有點好笑。

圖片

但也有人從另一個角度發現了華點:這難道就是模型自我提升的開始?

圖片

官方發布的推文和博客中還沒有提及CriticGPT何時會集成到ChatGPT中,但技術文章已經發布,而且又是一篇離職人員的遺留作品——由超級對齊的scalable oversight團隊共同完成,作者署名包含Jan Leike。

圖片

論文地址:https://cdn.openai.com/llm-critics-help-catch-llm-bugs-paper.pdf

那就來仔細看看,讓GPT-4「自我提升」的結果究竟如何?

GPT-4自己批自己

RLHF全稱為Reinforcement Learning from Human Feedback,是包括ChatGPT在內的很多LLM常用的對齊方法。人類AI訓練師們會收集模型對同一個問題的不同響應并進行評分,以此改進模型。

隨著ChatGPT的響應變得更加準確,它犯的錯誤也會更微妙、讓人類訓練師更難察覺,因而降低了RLHF的有效性。

事實上,這也是RLHF的根本限制,隨著模型逐漸進化到比任何提供反饋的專家都更有知識,基于人類的評價來調整模型就會越來越困難。

因此,OpenAI的「可擴展監督」團隊想到了跳出RLHF的框架,干脆訓練模型為ChatGPT撰寫評論,糾正輸出結果中不準確的地方。

圖片

這種方法似乎取代了RLHF,但好像又沒取代——因為訓練CriticGPT的過程,仍然采用了RLHF。

核心思想非常簡潔:CriticGPT依舊是自回歸模型。標注者先向ChatGPT的響應輸出中人為注入一些微妙的錯誤,CriticGPT針對這些有錯誤的答案生成批評意見,之后再由人類訓練師為批評意見進行打分排名。

圖片

CriticGPT訓練流程

RLHF的訓練過程與ChatGPT類似,具體如下:

  1. 為數據集中每個問題和答案采樣CriticGPT生成的批評意見
  2. 人類評估者對其各個屬性及總體質量進行評分
  3. 訓練獎勵模型用于預測人類對模型輸出的整體質量排名
  4. 使用PPO優化獎勵模型
  5. 應用一種創新的推理時采樣策略:強制采樣束搜索(FSBS)

大部分的訓練數據都來自人類篡改GPT答案的這個過程,但也包含少部分未經修飾的原始答案。

為什么一定要人為向ChatGPT的響應輸出中注入bug?不能直接篩選出有bug的答案嗎?

論文中提出,使用原始、未經修飾的答案會存在如下幾個問題:

  • 許多答案不會包含嚴重問題,進而降低了數據對于改進批評意見的價值
  • 如果無法控制錯誤類型,CriticGPT會輸出自由形式且模糊不清的批評意見,難以驗證其正確性
  • 人類也很難發現CriticGPT遺漏的重要問題
  • 偏好率可能受到許多風格因素的影響,并會高估模型性能

需要注意的是,人類已經檢測到有bug的模型輸出,本身就說明它們更容易被人發現!

篡改方法最重要的優點是制造出了高質量、難以發現的錯誤,而且平均而言更嚴重。知道了哪里有預先插入的bug,人類訓練師也更容易區分出那些不夠全面、遺漏bug的批評。

團隊有意地保證了這些人為篡改的復雜和微妙。他們訓練了一個二元判別器預測代碼是否被篡改,發現較小的模型并沒有較好的分辨能力(圖13),以此驗證了篡改代碼的質量。

圖片

人類評估CriticGPT的批評意見時,從以下幾個維度給出評分和排名:

  • 是否全面 ,即沒有遺漏任何明顯或嚴重的問題
  • 是否捕獲到了之前插入的特定bug,即CBI(critique-bug inclusion)
  • 有沒有出現幻覺或者挑剔現象,指出了不存在的問題
  • 對整體有用性的主觀評級,包含上述內容并考慮風格和整體的實用性

在訓練CriticGPT的過程中,除了RLHF方法,團隊將獎勵模型與搜索結合,提出了一種名為強制采樣束搜索的方法(Forced Sampling Beam Seach,FSBS)。

一般來說,模型產生的批評意見更長時,也更容易出現幻覺。這有點類似于「準確率」和「召回率」之間的權衡。

FSBS能夠激勵CriticGPT在產生更長、更全面的批評時,減少「無中生有」或者「雞蛋里挑骨頭」的發生率。

之后進行的消融實驗也證明了FSBS方法的有效性(圖12)。

圖片

當然,OpenAI還是忘不了他們最喜歡的Scaling Law。他們用RLHF訓練并評估了一系列模型,來描述模型規模對bug檢測效果的影響(圖5)。

直觀來看,要達到CriticGPT(只進行了RL)的同等水平,在沒有額外數據或修改pipeline的情況下,需要將ChatGPT的預訓練計算量擴大30×。

圖片

評估結果

首先,團隊把人類和CriticGPT撰寫的批評意見混雜在一起,再交給人類進行評估。

標注者們會更喜歡自己同行們的產出嗎?并沒有。

ChatGPT和CriticGPT都超過了人類表現(圖1b),而且63%的情況下,CriticGPT撰寫的批評意見比人類的更受青睞(圖1a)。

要知道,研究團隊招來寫批評意見的不是編程門外漢,而是有平均5年Python研發經驗的技術人員。他們在每個例子上大約會花費50分鐘,并能執行代碼或查找參考手冊,結果也只能發現25%左右的人為注入的bug。

圖片

論文認為,這些評估者在沒有LLM幫助下撰寫的批評意見相對較短,而且可能缺乏所需的領域知識(比如特定的Python庫),并且有些篡改行為確實難以發現,這三個原因導致了人類和模型之間如此明顯的差異。

從圖6中可以看到,CriticGPT的檢測錯誤能力比較全面,對于人為篡改的錯誤以及原始輸出中就存在的錯誤,都達到了最高的全面性百分比。

更令人驚訝的是,ChatGPT在這兩個方面的表現也都超過人類獨立撰寫的批評意見。人類評估者要借助CriticGPT,才能與ChatGPT水平相當。

圖片

但是下面的圖7又開啟了一輪反轉。團隊發現,雖然人類容易遺漏錯誤,但人類也最不容易產生幻覺或者「雞蛋里挑骨頭」的問題。

在產生幻覺這方面,ChatGPT的表現最不如人意,CriticGPT稍有提升。

圖片

考慮到批評意見的全面性與減少幻覺之間的權衡,作者提出了團隊中「人機合作」模式的好處。如圖8所示,人類+CriticGPT的團隊表現能夠超越模型或人類分別單獨工作時的Pareto邊界。

圖片總結

可擴展監督(scalabel oversight)的終極目標是幫助人類評估模型,來訓練出更好、更安全的策略。

從長期來看,我們應該找到一種泛化性更強的批評模型訓練方法,適用于沒有groung truth和獎勵函數的長形式、開放式任務。

在現實場景中,模型輸出的錯誤可能分布在答案的很多部分。CriticGPT的工作重點是指出一處的重要錯誤,但未來依舊需要探索,如何識別出分散在答案中各處的錯誤。

CriticGPT依舊存在幻覺問題,且幫助有限。如果編碼任務或者原模型的輸出過于復雜,即使是有模型協助的專家也可能無法做出很好的評估。

但這篇文章的方法為今后的RLHF訓練帶來了一種新鮮思路:將RLHF應用到GPT-4中,訓練出CriticGPT這樣的模型,可以合成出更多的高質量RLHF數據。

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-06-19 08:19:50

2025-04-16 09:35:03

2023-12-16 09:45:56

論文GPT-4AI

2025-05-30 07:40:56

2023-04-04 11:20:40

GPT-4OpenAI

2023-07-07 09:32:57

GPT-4OpenAI

2024-05-21 12:23:17

2023-12-09 13:24:40

OpenAIChatGPT人工智能

2023-04-09 16:17:05

ChatGPT人工智能

2023-12-15 12:52:17

AI模型

2023-08-06 08:06:30

OpenAIChatGPTGPT-4

2023-03-16 17:28:59

技術AI

2024-04-25 16:56:14

GPT-4大模型人工智能

2024-06-07 16:40:53

2023-12-17 22:04:04

微軟GPT-4

2023-03-16 19:17:57

2023-03-28 13:01:20

GPT-4開發OpenAI

2023-05-03 20:53:48

2023-08-15 10:33:06

微軟必應人工智能

2023-03-16 08:13:56

人工智能?OpenAI
點贊
收藏

51CTO技術棧公眾號

中文字幕资源网| 800av在线播放| av在线下载| 国产成人午夜电影网| 亚洲3p在线观看| 综合 欧美 亚洲日本| 在线综合色站| 欧美性videosxxxxx| 成人国产在线看| 国产小视频福利在线| 欧美国产精品| 国产精品全国免费观看高清| 成人看片人aa| 国产大片aaa| 日韩精品免费一区二区三区| 亚洲精品一区二区精华| wwwwwxxxx日本| 美女的胸无遮挡在线观看| 国产精品久久久一区麻豆最新章节| 99久久精品免费看国产一区二区三区 | 欧美日韩美女| 亚洲综合免费观看高清完整版 | 超碰caoprom| 在线视频成人| 欧美色涩在线第一页| 97国产在线播放| 青春草免费在线视频| 国产精品第五页| 欧美午夜免费| 婷婷五月综合激情| 国产河南妇女毛片精品久久久| 国产精品久久电影观看| www.国产高清| 在线免费观看欧美| 欧美国产日韩一区二区三区| 国产精品综合激情| 欧洲美女日日| 亚洲日韩中文字幕在线播放| 99精品一区二区三区无码吞精| 韩国三级大全久久网站| 欧美日韩视频第一区| 国产免费999| 欧美日韩视频免费观看| 欧美午夜女人视频在线| 女人喷潮完整视频| 高清毛片在线观看| 欧美日韩国产在线看| 日本a视频在线观看| 91亚洲精品乱码久久久久久蜜桃 | 国产精品久久久久久久久久尿 | 欧美日韩国产成人在线91| 亚洲欧美综合图区| www.日本高清| 粉嫩久久久久久久极品| 日韩一区二区不卡| 韩国三级丰满少妇高潮| 亚洲精品69| 亚洲成人综合在线| 欧美一级视频免费看| 精精国产xxxx视频在线中文版 | 在线观看国产精品一区| 亚洲影院天堂中文av色| 亚洲免费av网址| 国产熟女高潮一区二区三区| 日韩极品在线| 亚洲色无码播放| 调教驯服丰满美艳麻麻在线视频| 精品国产精品| 色久欧美在线视频观看| 日韩一区二区三区四区视频| 亚洲成人三区| 久久久久久久久亚洲| 丰满少妇乱子伦精品看片| 校园激情久久| 国产精品亚洲自拍| 国产精品探花视频| 国产精品一级黄| 国产在线精品日韩| 成人在线免费视频| 亚洲欧美另类久久久精品| 国产一级大片免费看| 激情黄产视频在线免费观看| 欧美视频一区二区三区| 欧美性猛交xxxx乱大交91| 亚洲视频精选| 亚洲天堂开心观看| 久久噜噜色综合一区二区| 成人久久综合| 欧美肥臀大乳一区二区免费视频| 日韩欧美不卡视频| 老司机午夜精品视频| 国产欧美va欧美va香蕉在线| 国产黄色片免费| www久久精品| 正在播放一区二区三区| av资源网在线播放| 欧美日本不卡视频| 波多野结衣一二三区| 成人国产精品一级毛片视频| 久久久久久成人| 黄色一区二区视频| av电影在线观看完整版一区二区| 日韩中文一区| 国产777精品精品热热热一区二区| 日本高清不卡在线观看| gogo亚洲国模私拍人体| 超碰成人久久| 97视频在线免费观看| 国产精品一区二区人人爽| 91视频xxxx| 9191国产视频| 欧美日韩国产网站| 亚洲激情自拍图| 国产精品国产精品88| 久久美女性网| 久久99精品久久久久久秒播放器| 麻豆视频在线| 在线视频国内自拍亚洲视频| 影音先锋资源av| 日韩精品免费| 国产精品99导航| 色哟哟在线观看| 一区二区高清免费观看影视大全 | 国产福利91精品一区二区三区| 日韩欧美一区二区在线观看| 国产精品—色呦呦| 日韩免费福利电影在线观看| 国产成人免费在线观看视频| 久久精选视频| 精品国产一区二区三区久久久久久| 成人在线免费看片| 欧美日韩久久久| 99在线视频免费| 久热精品在线| 欧美激情第六页| 中文av在线全新| 亚洲成人免费网站| 国产午夜小视频| 成人深夜视频在线观看| 中文字幕日韩一区二区三区| 成人国产综合| 中文字幕在线国产精品| 精品国产青草久久久久96| 国产亚洲综合av| 国产免费视频传媒| 成人黄色av| 国产欧美va欧美va香蕉在线| 日本中文字幕视频在线| 欧美日韩国产a| 欧美爱爱免费视频| 国产精品亚洲人在线观看| 国产盗摄视频在线观看| 色噜噜成人av在线| 久久在线视频在线| 91麻豆国产语对白在线观看| 日韩一级片免费在线观看| 亚洲综合在线第一页| 国产精品嫩草69影院| 国产综合婷婷| 国产精品我不卡| 99riav视频在线观看| 亚洲护士老师的毛茸茸最新章节| 日本三级午夜理伦三级三| 99精品偷自拍| 国产情侣av自拍| 久久香蕉国产| 亚洲综合最新在线| 波多一区二区| 亚洲免费精彩视频| 一级日韩一级欧美| 亚洲黄网站在线观看| 亚洲自拍偷拍精品| 久久亚洲一区| 一区二区三区四区欧美| 亚洲码欧美码一区二区三区| 欧美亚洲午夜视频在线观看| 国产一二在线观看| 欧美一区二区免费视频| 国产精品suv一区二区三区| 久久久99久久| 成人在线短视频| aa级大片欧美三级| 亚洲高清在线观看一区| 精品国产亚洲一区二区三区| 午夜精品一区二区三区在线视频 | 久久精品成人欧美大片| 亚洲精品国产片| 色乱码一区二区三区88| 紧身裙女教师波多野结衣| av一区二区久久| 奇米影音第四色| 亚洲国产日韩欧美一区二区三区| 日本精品国语自产拍在线观看| 99er精品视频| 日本精品va在线观看| 久操视频在线观看| 日韩黄色在线免费观看| 国产精品怡红院| 色综合色综合色综合色综合色综合 | 日韩中文字幕在线一区| 国产成+人+综合+亚洲欧洲| av在线播放观看| 亚洲午夜久久久影院| 国产小视频一区| 在线播放欧美女士性生活| 成人毛片18女人毛片| 综合色天天鬼久久鬼色| 真实乱视频国产免费观看| 丁香网亚洲国际| 日韩在线不卡一区| 久久蜜桃精品| www.99热这里只有精品| 欧美另类女人| 一区二区三区偷拍| 视频国产一区| 精品一卡二卡三卡四卡日本乱码| 国产精品久久久久久久久久久久久久久 | 亚洲女同性videos| 亚洲精品国产suv一区| 91 com成人网| 在线亚洲欧美日韩| 欧洲亚洲精品在线| 黄色一级片免费在线观看| 亚洲一区二区视频在线观看| 日本一级特级毛片视频| 日本一区二区三级电影在线观看 | 国产精品久久久久久一区二区| 国内在线视频| 久久久久久久91| 中中文字幕av在线| 久久中文字幕国产| 麻豆传媒在线免费看| 中文字幕自拍vr一区二区三区| 久久精品a一级国产免视看成人 | 午夜免费福利在线观看| 亚洲天堂男人天堂| 黄色在线播放| 尤物精品国产第一福利三区| 风间由美一区| 国产一区二区激情| 国产精品久久一区二区三区不卡| 精品伊人久久97| 欧美日韩伦理片| 亚洲欧美中文日韩在线v日本| 婷婷亚洲一区二区三区| 日韩成人小视频| 色网站在线免费观看| 亚洲欧美日韩第一区| 青青草免费观看免费视频在线| 日韩av在线免费播放| 视频一区二区在线播放| 亚洲少妇激情视频| 大乳在线免费观看| 在线日韩精品视频| 蜜桃视频网站在线观看| 久久亚洲精品一区| 亚洲91av| 98精品国产自产在线观看| 在线天堂资源| 国产成人一区三区| 日韩电影免费观看高清完整版在线观看 | 九九热在线视频播放| 欧美午夜无遮挡| 中文字幕有码无码人妻av蜜桃| 欧美区视频在线观看| 精品人妻av一区二区三区| 亚洲二区在线播放视频| 天天干天天干天天干| 国产亚洲免费的视频看| 黄色精品免费看| 欧美激情一区二区三区在线视频观看 | 手机在线一区二区三区| 欧洲精品视频在线| 999亚洲国产精| 男人搞女人网站| 国产麻豆成人传媒免费观看| 天天躁日日躁狠狠躁免费麻豆| 国产亚洲精品aa午夜观看| 人人干在线观看| 性久久久久久久久| 一区二区三区麻豆| 日韩欧美精品在线视频| 天堂网www中文在线| 色偷偷88888欧美精品久久久| 欧洲中文在线| 国产精品91免费在线| 日韩精品一区二区三区中文在线| 久久66热这里只有精品| 亚洲xxx拳头交| 91视频 -- 69xx| 精品中文字幕一区二区| 成人免费无码大片a毛片| 国产精品理论片在线观看| 91精品国产高潮对白| 欧美三级欧美一级| 免费看日韩av| 久久夜色撩人精品| 高清不卡亚洲| 成人av蜜桃| 色琪琪久久se色| 青青草国产精品视频| 激情综合五月婷婷| 亚洲第一成人网站| 亚洲国产综合在线| 国产精品自拍电影| 在线观看久久久久久| 成人观看网址| 97人人香蕉| 久久一区91| 免费在线激情视频| 成人午夜免费视频| 午夜爽爽爽男女免费观看| 欧美综合在线视频| 亚洲三级中文字幕| 欧美日本啪啪无遮挡网站| 精品美女一区| 日本不卡一区二区三区视频| 亚洲欧洲综合| 九色91porny| 18成人在线视频| 99re热视频| 亚洲人成在线观看| 无码小电影在线观看网站免费| 99视频国产精品免费观看| 小处雏高清一区二区三区| 天天干天天干天天干天天干天天干| 91在线播放网址| 国产精品第72页| 精品日韩一区二区三区| 成人影院在线看| 91精品视频在线| 国产精品97| 最新免费av网址| 国产精品麻豆视频| 中文字幕久久熟女蜜桃| 在线看欧美日韩| 国产成人77亚洲精品www| 亚洲精品tv久久久久久久久| 视频一区二区不卡| 熟女少妇内射日韩亚洲| 欧洲精品一区二区| bbbbbbbbbbb在线视频| 国产精品久久久久久久久免费看 | bt欧美亚洲午夜电影天堂| 国产午夜福利一区二区| 精品国产电影一区二区| www.51av欧美视频| 久久久久久九九| 视频一区在线播放| 久久精品色妇熟妇丰满人妻| 日韩av有码| 成人羞羞国产免费网站| 久久久亚洲欧洲日产国码αv| www.国产毛片| 综合国产在线观看| 亚洲色图综合| 成人免费看片'免费看| 成人国产免费视频| 亚洲国产精品无码久久久| 中文字幕欧美日韩精品| 婷婷久久免费视频| youjizz.com在线观看| 91蝌蚪porny| 夜夜躁狠狠躁日日躁av| 久久天天躁狠狠躁老女人| a级日韩大片| 欧美黄色一级片视频| 日韩美女久久久| 天天操天天舔天天干| 国产成人精品亚洲精品| 成人91在线| 国产精品二区视频| 色综合色综合色综合色综合色综合 | 国产91露脸合集magnet| 日韩精品1区2区| 中文字幕亚洲无线码在线一区| 久久av偷拍| 日韩在线视频在线观看| 国产精品久久久久久久久免费桃花 | 久久久久久免费观看| 亚洲精品美女久久久久| 精品176极品一区| 久久99中文字幕| 欧美国产精品中文字幕| 午夜免费福利视频| 日韩美女福利视频| 自拍偷拍欧美| 91网站免费视频| 欧美一级精品大片| 欧美电影网址| 国产高清不卡无码视频| 久久久久久一二三区| www.久久综合| 国产精品96久久久久久| 狠狠综合久久| 亚洲欧美综合7777色婷婷| 亚洲成人久久一区| 国产欧美日韩电影| 亚洲欧美另类动漫| 精品国产成人在线|