精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OpenAI突發新模型:用GPT改進GPT訓練,左腳踩右腳登天,RLHF突破人類能力上限

人工智能 新聞
CriticGPT,用于給代碼挑Bug時能找到75%以上,而相比之下人類只能找到不到25%。

OpenAI突然發布新模型!基于GPT-4訓練,可以幫助下一代GPT訓練

CriticGPT,用于給代碼挑Bug時能找到75%以上,而相比之下人類只能找到不到25%。

它還可以給Bug寫“銳評”,在60%的情況下人類訓練師更喜歡有CriticGPT幫助下的批評。

圖片

有網友開玩笑說,“只會批評的GPT,這不是我前妻么”。

圖片

但這項研究最重要之處在于,CriticGPT挑錯能力可以泛化到代碼之外。

比如在RLHF訓練中給AI的輸出挑錯,而且已經進入OpenAI內部訓練流程

圖片

更好的RLHF就能訓練出更強的模型,更強的模型又能通過更好地挑錯來增強RLHF訓練……

論文結論中赫然寫道:在真實世界數據中挑錯誤上,AI還可以繼續進步,人類智能已經到頭了。

圖片

左腳踩右腳上天,難道真的被這幫人給搞出來了?

圖片

這是一篇來自被解散的超級對齊團隊的“遺作”,由前負責人Jan Leike帶隊。

而Leike本人已經跳槽去了隔壁Anthropic,繼續做這類研究。

圖片

基于GPT-4,改進GPT-4

OpenAI官網文章變相承認了,GPT-4之后這么久沒有大的改進,還真的遇到一些瓶頸:

隨著AI能力變強,它犯的錯也不那么顯眼了,人類訓練師都難以發現不準確之處。

人類給不出反饋,那RLHF“人類反饋強化學習”就無從談起了。

圖片

CriticGPT正是為了應對這一挑戰而生。

CriticGPT基于GPT-4,也接受了RLHF訓練出,但特別之處在于訓練數據中包含大量的錯誤輸入。

具體來說,分為三步:

  1. 讓人類標注員在ChatGPT生成的代碼里故意植入一些微妙的bug。
  2. 標注員扮演代碼審查員的角色,寫下他們對這些bug的評論。
  3. 用這些數據來訓練CriticGPT,讓它學會如何發現和指出代碼中的問題。

圖片

在具體訓練過程中,他們還玩了點花樣。

比如不斷讓標注員驗證自己插入的bug是否足夠隱蔽,能夠騙過當前版本的CriticGPT。這樣一來,CriticGPT就被迫不斷進化,學會發現越來越隱蔽的問題。

思路有點像GAN的左右互搏,只不過生成器這個位置是人類來充當的……

最后,OpenAI還使用了一種“強制采樣束搜索”(FSBS)的技術,允許CriticGPT在生成評論時既能保持全面,又能減少”幻覺”和“雞蛋里挑骨頭”現象。

具體來說,FSBS會強制模型生成多個不同的評論片段,用獎勵模型對這些片段進行評分,最后根據評分和一個長度修正因子來選擇最佳的評論組合。

通過調整長度修正因子,可以在評論的全面性和準確性之間找到最佳平衡點,既不會錯過重要問題,又不會過度挑剔。

圖片

等一下,推理時搜索,這不正是和傳聞中的Q*一個思路,這次居然寫到了論文里。

可能是看外部團隊(如顏水成)按這一思路的研究已經夠多了,就不再藏著掖著了。

圖片

說回到CriticGPT,取得了哪些結果呢?

  • 在發現人為插入的bug方面,人類審核員平均只能找到25%,而CriticGPT的成功率高達75%以上
  • 在評估自然出現的Bug時,有63%的情況下人類更傾向于選擇CriticGPT的評論而非人類評論
  • CriticGPT的評論被認為比ChatGPT的更全面,更少出現”幻覺”和無關緊要的挑剔
  • 在評估非代碼任務時,成功識別出數百個在ChatGPT訓練數據中被人類認為是”完美”的錯誤。

不過CriticGPT也不是十全十美,它也會有”幻覺”問題,指出一些實際上不存在的問題。

目前,人類和CriticGPT組隊工作效果最好:既能發現大部分問題,又能避免AI的”幻覺”。

圖片

RLHF上限不再是人類

對于CriticGPT,負責這項研究的Jan Leike也補充了他自己的一些看法。

圖片

RLHF是創造出ChatGPT的核心技術之一,但隱患在于人類能力就是RLHF的天花板。

當需要AI去解決人類無能為力的任務時,人類給不出相應反饋,AI也就無法改進了。

CriticGPT的成功,意味著超級對齊團隊設想中的可擴展監督,也就是用弱模型監督訓練更強的模型,終于有希望了。

圖片

不過他也透露,目前CriticGPT并沒有幫助人類顯著提高艱難任務上的準確性,但是框架有了只要有更好的預訓練模型就能不斷改進。

圖片

為什么先從代碼任務開始入手呢?

一方面,代碼任務有現實意義,做出來的模型可以直接用上。

另一方面,代碼可以清晰明確的評估,比開放式對話更客觀,更容易評估CriticGPT發現的問題是否真實和重要。

結果CriticGPT在代碼上訓練,卻不僅能挑代碼Bug,還給1/4的ChatGPT生產數據挑出了問題。

圖片

最后,由于原OpenAI超級對齊團隊已經解散,已經跳槽的Jan Leike插入了一條Anthropic招聘廣告:

想做后續研究的請去隔壁。

也是讓人不得不感嘆硅谷是真的沒有競業協議。

圖片

One More Thing

同日,谷歌發布了開源大模型Gemma 2,OpenAI趕緊甩出一條消息來狙擊,這都第幾次了。

圖片

對于甩出來的不是Sora公測或者GPT-4o完整語音、視頻模式,也有很多人不滿。

有網友提了個更好的主意:

做個ReleaseGPT,專門用來發布承諾好的更新吧。

圖片

不過這次OpenAI久違的放出了論文,也還算有一些誠意。

論文地址:https://cdn.openai.com/llm-critics-help-catch-llm-bugs-paper.pdf

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-07-19 09:26:12

2023-06-08 07:58:29

2024-12-20 11:41:52

2025-06-26 15:16:42

AI獎勵模型GPT-4.1

2023-12-18 07:15:37

2023-12-16 09:45:56

論文GPT-4AI

2021-03-23 15:21:00

人工智能機器學習技術

2024-01-11 07:28:42

2025-08-07 14:05:40

OpenAI大模型開源

2024-05-14 11:29:15

2023-08-02 00:19:46

2025-08-19 08:40:00

AI技術模型

2024-08-28 13:00:42

2023-04-09 16:17:05

ChatGPT人工智能

2023-06-01 12:46:46

GPT-4數學OpenAI

2025-06-11 08:54:52

2024-03-08 12:35:27

AI模型

2022-05-05 09:00:00

AI模型數據

2025-09-08 15:13:52

AI模型訓練

2023-04-27 08:15:09

點贊
收藏

51CTO技術棧公眾號

久久综合色综合| 91精品国产高清91久久久久久 | 暴力调教一区二区三区| 欧美怡红院视频一区二区三区| 日本一级免费视频| 日韩一区网站| 欧美在线播放高清精品| 青青草综合视频| 理论视频在线| 国产传媒日韩欧美成人| 日韩av手机在线看| 久久久久久久中文字幕| 日本一二区不卡| 亚洲激情第一页| 欧美一级免费在线| 国产情侣一区二区三区| 精品国产91久久久久久老师| 400部精品国偷自产在线观看| 日韩电影网址| 粉嫩在线一区二区三区视频| 国产日韩精品综合网站| 国产综合精品视频| 亚洲狠狠婷婷| 欧美久久精品一级黑人c片 | 一区2区3区在线看| 亚洲欧洲久久| 黄色视屏网站在线免费观看| 岛国av在线一区| 91人成网站www| 中文字幕在线观看免费| 香蕉久久国产| 欧美中在线观看| xxxx 国产| 欧美精选一区| 欧美成在线视频| 亚洲欧美精品aaaaaa片| 欧美亚洲高清| 亚洲欧美制服另类日韩| 日本护士做爰视频| av在线亚洲色图| 欧美变态tickling挠脚心| 国产亚洲视频一区| 婷婷精品久久久久久久久久不卡| 日本道色综合久久| 日本999视频| 亚洲第一会所| 欧美三日本三级三级在线播放| 免费无码国产v片在线观看| 多野结衣av一区| 欧美日韩国产专区| 男人和女人啪啪网站| 欧美a级在线观看| 狠狠爱在线视频一区| 玩弄中年熟妇正在播放| 成人在线黄色电影| 黑人巨大精品欧美一区免费视频 | 日韩一区二区三区高清| 六十路在线观看| 欧美国产激情一区二区三区蜜月| 日韩电影免费观看高清完整| 国产永久免费高清在线观看 | 亚洲国产成人一区| 在线免费看黄色片| 思热99re视热频这里只精品| 日韩精品免费在线视频观看| 97伦伦午夜电影理伦片| 日韩欧美国产精品综合嫩v| xvideos成人免费中文版| 日日噜噜夜夜狠狠久久波多野| 影音先锋日韩在线| 欧美激情一区二区三级高清视频| 日本熟妇毛茸茸丰满| 性欧美xxxx大乳国产app| 国产成人精品视频在线观看| 亚洲天堂狠狠干| 国产v日产∨综合v精品视频| 久久99导航| av在线之家电影网站| 亚洲免费av高清| 九九爱精品视频| 欧美与亚洲与日本直播| 欧美一区二区视频观看视频| 亚洲香蕉中文网| 国内成人精品| 久久成人av网站| 国产专区第一页| 精品一区二区三区久久| 国产尤物99| 成a人片在线观看www视频| 亚洲免费观看高清| 欧美三级午夜理伦三级| 国产精品1区| 亚洲精品一区中文字幕乱码| 久久久久久久久久97| 夜夜嗨一区二区| 国产精品麻豆va在线播放| 国产黄色片网站| 国产亚洲欧美日韩在线一区| 青草全福视在线| 三级中文字幕在线观看| 91精品国产综合久久久久久漫画 | 国产精品天天av精麻传媒| 蜜桃精品一区二区三区| 亚洲全黄一级网站| 久久机热这里只有精品| 青青草国产精品97视觉盛宴| 国产伦精品一区二区三区在线| 最新国产在线观看| 都市激情亚洲色图| 久久久久国产免费| 日韩成人三级| 欧美最顶级丰满的aⅴ艳星| 国产三级第一页| 国产女主播视频一区二区| 国产一线二线三线女| 欧美性aaa| 国产午夜精品一区理论片飘花| 九九热视频精品| 久久99国产精品久久99| 日韩在线第一区| 色多多在线观看| 精品国产免费人成电影在线观看四季| 刘亦菲国产毛片bd| 久久久久在线| 久久偷窥视频| 成人一级福利| 亚洲精品国产精品乱码不99按摩| 欧美国产日韩综合| 国产一区二区女| 在线观看免费91| 成人在线观看免费播放| 亚洲欧美国产一本综合首页| 日韩欧美不卡视频| 成人av免费在线观看| 白白操在线视频| 精品一区二区三区亚洲| 日韩亚洲一区二区| 97国产成人无码精品久久久| 国产精品入口麻豆原神| 波多野结衣天堂| 精品日韩一区| 国产精品1区2区在线观看| 韩国免费在线视频| 日本道在线观看一区二区| 亚洲人成人无码网www国产 | 国产精品久久久久久av福利| 你懂的好爽在线观看| 欧美性猛交xxxx久久久| 草草影院第一页| 丝袜美腿亚洲色图| 日韩一区二区三区资源| 日本另类视频| 日韩有码在线电影| 国产毛片久久久久| 亚洲妇熟xx妇色黄| 男女黄床上色视频| 琪琪一区二区三区| 亚洲精品一区二区三区av| 色综合一区二区日本韩国亚洲| 日韩视频免费在线| 午夜久久久久久噜噜噜噜| 亚洲大片精品永久免费| 国产精品探花一区二区在线观看| 国产精品色网| 亚洲图片欧洲图片日韩av| 国产不卡精品| 97免费在线视频| 国产资源在线播放| 在线电影一区二区三区| 久久久久久久福利| 91一区二区三区在线观看| 成人免费视频久久| 亚洲精品久久久| 国产在线欧美日韩| 欧美日韩国产网站| 久久成年人视频| 欧美捆绑视频| 777午夜精品视频在线播放| 久久久久成人片免费观看蜜芽| 26uuu亚洲综合色| 少妇网站在线观看| 在线观看日韩av电影| 久久天天狠狠| 国语精品视频| 青青青国产精品一区二区| 91视频在线观看| 精品国产免费一区二区三区四区| 国产主播第一页| 一区二区不卡在线播放 | 国产精品亚洲一区二区三区| а√中文在线8| 亚洲欧美激情精品一区二区| 国产精品久久久久久69| 欧美日韩另类在线| 天天操夜夜操av| www成人在线观看| 亚洲高清av一区二区三区| 国产日韩欧美一区| 麻豆映画在线观看| jizzjizz欧美69巨大| 成人免费视频网| 欧美黑人一区| 久久免费视频网站| 欧美videos极品另类| 日韩精品免费综合视频在线播放| 99在线观看精品视频| 色噜噜狠狠色综合欧洲selulu| 妺妺窝人体色www婷婷| 欧美国产成人在线| 中国毛片在线观看| 丰满岳乱妇一区二区三区| 久久黄色片网站| 美女黄网久久| www国产精品内射老熟女| 中文字幕av亚洲精品一部二部| 亚洲高清视频一区二区| 伊甸园亚洲一区| 国产欧美综合精品一区二区| 国产精品视频首页| 国产在线精品播放| 国产成人精品一区二区三区在线 | 成人51免费| 国产欧美精品一区二区三区-老狼 国产欧美精品一区二区三区介绍 国产欧美精品一区二区 | 香蕉成人久久| 北条麻妃在线视频观看| 国产精品99一区二区| 日本xxx免费| 婷婷综合在线| 超碰在线免费观看97| 精品国产a一区二区三区v免费| 久久精品国产精品国产精品污 | 成人午夜免费电影| 日本少妇一区二区三区| 久久av中文字幕片| 奇米视频7777| 精品一区二区三区久久久| 日本三级黄色网址| 麻豆精品国产传媒mv男同| 午夜国产一区二区三区| 日本亚洲欧美天堂免费| 亚洲视频在线a| 日韩专区欧美专区| 91香蕉视频导航| 蜜臀av性久久久久蜜臀aⅴ流畅| 免费观看精品视频| 久久午夜激情| 手机在线看福利| 免费成人在线影院| 性欧美在线视频| 国产精品一区一区| 日本少妇xxxx| 91在线一区二区三区| 精品无码人妻一区| 日本一区二区综合亚洲| 国产一区第一页| 亚洲免费伊人电影| 国产精品第56页| 欧美视频专区一二在线观看| 中文字幕在线看人| 欧美日韩日日夜夜| 国产丝袜视频在线观看| 精品国产髙清在线看国产毛片| 亚洲美女性生活| 日韩精品久久久久久福利| 国产三级视频在线| 久久精品成人欧美大片古装| 亚洲91av| 国产69久久精品成人看| 99久久精品一区二区成人| 亚洲aaaaaa| 天堂网av成人| 亚洲看片网站| 激情综合自拍| 国产高清视频网站| 国产精品99久久久久久宅男| 亚洲天堂美女视频| 国产精品毛片a∨一区二区三区| 欧美黑吊大战白妞| 色综合久久66| 国产成人精品一区二区无码呦| 亚洲国产精品久久久久秋霞不卡| 国产51人人成人人人人爽色哟哟 | 成人美女大片| 国产一区红桃视频| 狼人天天伊人久久| 中文字幕久久综合| 国产日本精品| 中文字幕在线视频一区二区| 99久久久久久99| 欧美xxxooo| 精品国产福利在线| 国产区精品在线| 亚洲欧美中文日韩在线v日本| 成人片在线看| 国产不卡视频在线| 北条麻妃一区二区三区在线| 亚洲不卡1区| 亚洲精品社区| 午夜免费福利在线| 99热在这里有精品免费| 午夜爽爽爽男女免费观看| 色88888久久久久久影院按摩| 午夜精品一二三区| xxxx性欧美| 成人激情视屏| 麻豆精品传媒视频| 亚洲视频一区| 亚洲欧美一区二区三区不卡| 久久精品视频一区二区三区| 亚洲国产精一区二区三区性色| 欧美年轻男男videosbes| 欧美孕妇性xxxⅹ精品hd| 欧美高跟鞋交xxxxhd| 国产精品诱惑| 日本在线免费观看一区| 99精品99| 97中文字幕在线观看| 亚洲人精品午夜| 在线观看亚洲一区二区| 亚洲无线码在线一区观看| rebdb初裸写真在线观看| 亚洲影院高清在线| 羞羞答答成人影院www| 成人性生交免费看| 国产精品女人毛片| 青青国产在线视频| 亚洲欧美制服另类日韩| 免费日韩电影| 日本一区免费| 视频一区中文字幕国产| www.17c.com喷水少妇| 香港成人在线视频| 欧美一级特黄aaaaaa大片在线观看| 久久成年人免费电影| 久久精品免视看国产成人| 成人短视频在线看| 精品一区二区三区免费毛片爱| 99热在线观看精品| 欧美日韩国产另类不卡| 婷婷免费在线视频| 国产欧美欧洲在线观看| 精品国产乱码久久久久久蜜坠欲下| 激情婷婷综合网| 国产性天天综合网| 亚洲网站免费观看| 久久国产精品久久久| 视频成人永久免费视频| 国产精品无码电影在线观看| 国产成人精品三级| 日本三级欧美三级| 亚洲精品国精品久久99热| 欧美粗大gay| 丝袜足脚交91精品| 久久国产精品99久久人人澡| 日本中文字幕免费在线观看| 精品久久久久久久久久久院品网| 国产一线二线在线观看 | 色屁屁草草影院ccyycom| 97欧美精品一区二区三区| 天天躁日日躁成人字幕aⅴ| 国产淫片av片久久久久久| 欧美激情在线一区二区| 91国产精品一区| 欧美激情免费观看| 亚洲黄页网站| 亚洲色图 在线视频| 亚洲人吸女人奶水| 天堂成人在线视频| 国产精品第8页| 91精品国偷自产在线电影| 精品久久久久久无码人妻| 一本大道久久a久久精品综合| 91精品专区| 成人免费视频网站入口| 亚洲欧洲综合| 日本美女xxx| 日韩精品在线一区二区| 久久爱91午夜羞羞| 中国黄色录像片| 91麻豆国产福利在线观看| 一区二区三区亚洲视频| 久久久久亚洲精品| 郴州新闻综合频道在线直播| 4438x全国最大成人| 色综合久久综合网欧美综合网| 秋霞成人影院| 精品国产一区二区三区麻豆免费观看完整版 | 蜜桃av噜噜一区二区三区麻豆| 欧美在线一区二区三区四| 国产精品成人a在线观看| 自拍偷拍亚洲在线| 蜜桃av中文字幕| 国产日韩精品在线| 国产一区91| xxxx日本少妇| 亚洲视频axxx| 极品束缚调教一区二区网站| 亚洲欧美国产日韩综合| 狠狠躁夜夜躁人人爽天天天天97| 超碰在线最新|