精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-2能監督GPT-4,Ilya帶頭OpenAI超級對齊首篇論文來了:AI對齊AI取得實證結果

人工智能 新聞
人類無法監督超級人工智能,但人工智能可以。在近日的一次訪談中,OpenAI 首席科學家 Ilya Sutskever 大膽預言,如果模型能夠很好地預測下一個詞,那么意味著它能夠理解導致這個詞產生的深刻現實。

過去一年,以「預測下一個 Token」為本質的大模型已經橫掃人類世界的多項任務,展現了人工智能的巨大潛力。

在近日的一次訪談中,OpenAI 首席科學家 Ilya Sutskever 大膽預言,如果模型能夠很好地預測下一個詞,那么意味著它能夠理解導致這個詞產生的深刻現實。這意味著,如果 AI 按照現有路徑發展下去,也許在不久的將來,一個超越人類的人工智能系統就會誕生。

但更加令人擔心的是,「超級人工智能」可能會帶來一些意想不到的負面后果。這也是「對齊」的意義。

此前的對齊方法依賴于人類的監督,如在 ChatGPT 訓練中起到關鍵作用的人類反饋的強化學習(RLHF)。但未來的人工智能系統或許能夠做出極其復雜和富有創造性的行為,使人類難以對其進行可靠的監督。例如,超人類模型可能會編寫出數百萬行新奇的、具有潛在危險的計算機代碼,即使是人類專家也很難理解這些代碼。

一旦人工智能的水平超過人類,我們又該如何監督比自己聰明得多的人工智能系統?人類文明最終會被顛覆甚至摧毀嗎?

即使是 Hinton 這樣的學界巨佬,對這個問題同樣持悲觀態度 —— 他表示自己「從沒見過更高智能水平的東西被遠遠更低智能水平的東西控制的案例」。

剛剛,OpenAI「超級對齊」團隊發布了成立以來的首篇論文,聲稱開辟了對超人類模型進行實證對齊的新研究方向。

論文鏈接:https://cdn.openai.com/papers/weak-to-strong-generalization.pdf

OpenAI「超級對齊」團隊成立于今年 7 月,目標是在四年內解決超智能 AI 的對齊問題,即搞清楚如何構建一種值得信任的人類水平的研究器,然后將其用于解決對齊問題。據說這個團隊投入了公司 20% 的算力。

在這篇論文中,OpenAI 對「人類監督超級人工智能」這個問題做了一個簡單的類比:讓小模型監督大模型。

研究表明,15 億參數的 GPT-2 模型可以被用來激發 GPT-4 的大部分能力,使其達到接近 GPT-3.5 級別的性能,甚至可以正確地泛化到小模型失敗的難題上。

OpenAI 將這種現象稱為「弱到強泛化」(Weak-to-strong generalization),這表明強大的模型具備如何執行任務的隱含知識,并且即使在給出粗制濫造的指令時也可以在其自身中找到這些知識。

圖片

但研究同時指出,用弱監督訓練的強模型和用真實標簽訓練的強模型之間仍然存在很大的差距。這表明在沒有額外工作的情況下,諸如基于人類反饋的強化學習(RLHF)之類的技術可能無法很好地擴展到超人類模型。對于 ChatGPT 獎勵建模任務來說,性能差距尤其大。

幾種簡單的方法可以顯著提高弱到強的泛化能力,比如使用中間模型大小進行引導監督,在微調時添加輔助置信度損失以鼓勵模型即使在與弱標簽相矛盾時也能保持自信,或者通過額外的無監督預訓練改進表征學習。

為了鼓勵其他研究人員解決此類問題,OpenAI 今天還宣布將提供 1000 萬美元的資助,用于各種比對方法的研究。

以下是論文細節。

研究方法

本文主要通過人類反饋 (RLHF) 的強化學習來指導或對齊模型,他們是這樣做的:強化評估人員評價高的行為,懲罰評估人員評價低的行為。假如說人類評估者能夠準確判斷模型行為是好是壞,這種做法非常有效,并且這種方式還是訓練如 ChatGPT 等大語言模型的核心部分。

然而問題來了,超級模型可能做出人類無法完全理解的復雜行為和創造性行為。例如,一個超級助手模型生成的代碼達到一百萬行,那么人類將無法為關鍵對齊相關任務提供可靠的監督,包括代碼是否遵循用戶的意圖,助手模型是否如實地回答有關代碼的問題,代碼執行是否安全或危險,等等。

因此,如果我們在人類的監督下微調超級模型,我們無法確定這個模型將如何泛化到那些人類自己也難以可靠監督的復雜行為。換句話說,這意味著即使在人類的指導下,這些超級模型在處理一些復雜或未知情況時的表現仍然是不確定的。

這就為對齊超級模型帶來了挑戰:不那么聰明的監督者怎么能控制比他們聰明得多的模型呢?盡管這個問題很重要,但目前很難進行實證研究。

一般來講,超級對齊的一個核心挑戰是人類需要監督比自己更聰明地模型。這是一個弱 - 強(weak-to-strong)的學習問題:一個弱監督者如何監督一個比它聰明得多的模型?為了解決這個問題,本文提出了一個簡單的類比,用弱模型作為監督者來代替較弱的人類監督者。

一般來講,傳統的機器學習側重于這種設置,即人類監督的模型比人類弱。但對于最終的超級對齊問題,人類監督的模型比他們聰明。因而本文研究了一個類似的問題:使用弱模型來監督強模型。

他們是這樣實現的,對于一個給定的任務:

  1. 構建弱監督者。本文通過在真值標簽上微調較小的預訓練模型來構造弱監督者,他們把弱監督者的表現稱為弱表現,并通過弱模型的預測來生成弱標簽。
  2. 通過弱監督訓練強學生模型。本文使用生成的弱標簽微調強模型,并將該模型稱為強學生模型,將其產生的性能稱為從弱到強的性能。
  3. 訓練一個以真值標簽為上限的強模型。為了比較,本文使用真值標簽對強模型進行了微調。將此模型的最終性能稱為強大的上限性能。

通常,弱到強的表現將介于弱表現和強上限表現(strong ceiling)之間。本文將 PGR(performance gap recovered)定義為上述三種性能(弱、弱到強和強上限)的函數,如下圖所示。

圖片

如果實現完美的弱到強泛化,則 PGR 為 1。如果弱到強模型的表現并不比弱監督者更好,則 PGR 為 0。

實驗結果

在 NLP 任務、國際象棋和獎勵建模任務中,本文評估了強學生模型的表現,結果如下。總的來說,在所有的設置中,本文觀察到從弱到強的泛化:強學生模型始終勝過他們的弱監督者。

圖片

本文發現可以使用簡單的方法來大大提高弱到強的泛化,如圖 4 所示。

圖片

圖 5 表明,對于較小的強學生來說,雖然它的表現比 naive 基線稍差,但提高泛化能力還是很明顯的。

圖片

圖 7 (a) 顯示了 ChatGPT RM 任務訓練過程中的真值測試準確度曲線,圖 7 (b) 和 (c) 比較了最佳和最終真值測試的準確度。

圖片

圖 9a 考慮了 7 個有代表性的 NLP 任務,并比較了微調、零樣本提示和 5-shot 提示;對于零樣本和 5-shot 基線,本文使用表 2 中總結的特定于任務的提示。

圖片

了解更多內容,請參考原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-12-16 09:45:56

論文GPT-4AI

2024-06-28 13:40:03

2023-08-11 13:41:42

2023-06-19 08:19:50

2023-08-17 08:00:00

2023-05-10 17:33:56

2023-08-15 15:03:00

AI工具

2023-03-16 19:17:57

2023-03-28 08:23:38

2024-06-07 16:40:53

2023-05-10 14:54:23

AI

2023-08-02 10:45:43

2024-06-07 18:14:53

2023-03-17 22:10:53

ChatGPTOpenAIGPT-4

2025-04-16 09:35:03

2023-07-07 09:32:57

GPT-4OpenAI

2022-04-20 10:47:46

AIGPT-4

2023-11-02 12:10:00

AI訓練

2023-03-31 15:11:26

OpenAIAI

2024-05-15 09:28:01

點贊
收藏

51CTO技術棧公眾號

亚洲成年人在线播放| 中文字幕在线不卡视频| 久久久久亚洲精品成人网小说| 亚洲黄色av片| 久久av色综合| 久久婷婷成人综合色| 国产精品日韩精品| 国产精品久久久久久久精| 懂色av一区二区| 色综合色狠狠天天综合色| 亚洲免费不卡| 四虎永久在线观看| 久久成人综合网| 亚洲91精品在线| 三级黄色片在线观看| 都市激情久久| 欧美军同video69gay| 欧美日韩亚洲一| 看黄网站在线| 久久美女高清视频| av一本久道久久波多野结衣| 波多野结衣影片| 欧美视频导航| www.亚洲一区| 精品无码国产污污污免费网站 | 日韩在线观看| 亚洲精品久久久久久久久久久久 | 男女猛烈激情xx00免费视频| 日本高清视频在线观看| 91免费国产在线| 97碰碰视频| 91久久久久久久久久久久| 国产亚洲午夜| 91国内精品久久| 国产盗摄x88av| 国产精品传媒精东影业在线| 亚洲天堂免费在线| 国产成人无码一区二区在线观看| 日韩中文字幕无砖| 6080午夜不卡| 九九热精品在线播放| 成人欧美magnet| 欧美日韩国产丝袜美女| www.avtt| 美女精品导航| 一个色在线综合| 欧美xxxx吸乳| 色呦呦视频在线观看| 自拍av一区二区三区| 在线国产精品网| 午夜老司机在线观看| 欧美国产丝袜视频| 性刺激综合网| 色网站免费在线观看| 国产精品你懂的在线| 亚洲精品中文字幕乱码三区不卡| 国产视频第一区| 久久精品一区二区三区不卡牛牛 | 久久久久无码精品| 久久久久九九精品影院| 91精品国产91久久综合桃花| 日韩 国产 一区| 日韩一二三区| 精品奇米国产一区二区三区| zjzjzjzjzj亚洲女人| 成人h动漫免费观看网站| 精品88久久久久88久久久| 日本美女视频网站| 久久综合五月婷婷| 日韩av在线网页| 国产精品扒开腿做爽爽| 国产一区毛片| 久久久久www| 久草视频在线免费看| 亚洲免费成人| 国产精彩精品视频| 国产影视一区二区| 成人午夜私人影院| 狠狠色狠狠色综合人人| 国产特黄在线| 亚洲黄色免费网站| a在线视频观看| 91国内外精品自在线播放| 日韩色视频在线观看| 国产精品无码电影| 不卡一区2区| 欧美xxxx做受欧美.88| 日本网站免费观看| 人人超碰91尤物精品国产| 91亚洲va在线va天堂va国| 天天爱天天干天天操| 国产欧美一区二区精品久导航| 国产精品jizz在线观看老狼| 丰乳肥臀在线| 欧洲另类一二三四区| 免费国偷自产拍精品视频| 偷窥自拍亚洲色图精选| 色午夜这里只有精品| 久久久夜色精品| 三级在线观看一区二区| 99精品欧美一区二区三区| 激情小视频在线| 一区二区在线观看不卡| 激情婷婷综合网| www.爱久久| 精品国产一区二区三区久久狼5月 精品国产一区二区三区久久久狼 精品国产一区二区三区久久久 | 欧美综合天天夜夜久久| 搡的我好爽在线观看免费视频| 亚洲欧洲av| 欧美日韩aaaa| 在线观看色网站| 91视频免费观看| 国产女主播av| 欧美亚洲人成在线| 日韩毛片中文字幕| 久久久久久免费观看| 欧美aaa在线| 久久久久久久久久久久久久久久av | 色8久久久久| 亚洲欧洲在线免费| 日韩黄色精品视频| 国产精品中文有码| 午夜老司机精品| 这里有精品可以观看| 精品国产乱码久久久久久免费 | 国产精品亚洲视频在线观看| 天天干天天爱天天操| 亚洲免费观看高清完整版在线| 任你操这里只有精品| 久久影院资源站| 久久99久久99精品中文字幕| 国产精品探花视频| 日本一区二区三区四区在线视频| 国产黄色一级网站| 欧美高清视频看片在线观看| 欧美成aaa人片在线观看蜜臀| 91精品国产乱码久久久久| 国产日韩欧美在线一区| 成人观看免费完整观看| 精品中国亚洲| 高清视频欧美一级| 懂色av一区二区三区四区| 亚洲天堂精品视频| 在线视频观看一区二区| 图片区亚洲欧美小说区| 91久久中文字幕| 国产一区久久精品| 51精品国自产在线| 中文字幕电影av| 国产一级精品在线| 国产成人免费高清视频| 欧美日韩黄网站| 久操成人在线视频| 亚洲精品字幕在线观看| 亚洲一级电影视频| 久久福利小视频| 国产精品亚洲综合久久| 美女主播视频一区| 成人看片网页| 精品激情国产视频| 99热这里只有精品99| 一区二区三区四区激情| 日本三级日本三级日本三级极| 激情综合激情| 麻豆亚洲一区| av一区在线播放| 久久资源免费视频| 亚洲AV午夜精品| 精品福利樱桃av导航| 人人妻人人藻人人爽欧美一区| 日韩电影在线一区二区| a级黄色片网站| a看欧美黄色女同性恋| 91极品视频在线| 黄色软件在线| 日韩亚洲欧美成人一区| 国产超碰人人爽人人做人人爱| 久久免费的精品国产v∧| 九九热在线免费| 午夜精品久久99蜜桃的功能介绍| 国产精品二区在线观看| 黑人巨大精品| 麻豆国产va免费精品高清在线| 日本成人动漫在线观看| 欧美影院一区二区三区| 日韩成人毛片视频| 91玉足脚交白嫩脚丫在线播放| 天天爽夜夜爽一区二区三区| 欧美成人日本| 日韩欧美一区二区视频在线播放 | 99色在线观看| 一本色道久久88亚洲综合88| 国产福利视频导航| 色国产综合视频| 欧美黄色一区二区三区| 久久色在线视频| 免费不卡av网站| 老鸭窝亚洲一区二区三区| 在线观看欧美亚洲| 蜜桃一区二区三区| 亚洲永久免费观看| 日韩欧美一区二区三区免费观看| 欧美成人亚洲成人| 国产精品一区二区婷婷| 精品久久久久香蕉网| 中文字幕激情视频| 五月婷婷久久丁香| 中文字幕电影av| 国产欧美日韩另类视频免费观看| 亚洲一区二区三区四区av| 精品亚洲aⅴ乱码一区二区三区| 日本丰满少妇xxxx| 欧美在线亚洲综合一区| 丝袜足脚交91精品| 亚洲涩涩av| 国产麻豆一区二区三区在线观看| 色婷婷成人网| 国产精品第100页| 蜜桃视频m3u8在线观看| 欧美激情亚洲精品| www.欧美日本韩国| 上原亚衣av一区二区三区| 日韩porn| 亚洲精品久久7777777| 蜜桃av噜噜一区二区三区麻豆| 欧美美女激情18p| 99精品人妻国产毛片| 亚洲国产成人av| 久久久久人妻一区精品色欧美| 国产精品国产三级国产| 日韩中文字幕有码| 26uuu国产在线精品一区二区| 中文字幕乱码一区| 国产成人av一区二区| 三级性生活视频| 久久国内精品自在自线400部| 污污视频网站免费观看| 鲁大师影院一区二区三区| 国产午夜福利在线播放| 亚洲国产裸拍裸体视频在线观看乱了中文 | 亚洲电影激情视频网站| 青青青在线视频| 亚洲免费av高清| 午夜69成人做爰视频| 亚洲精品视频在线| 九九热精品免费视频| 欧美在线视频精品| 欧美日韩在线三级| 国产精品一区二区三区在线免费观看 | 深夜福利一区二区三区| 3d动漫精品啪啪一区二区三区免费| 日韩亚洲国产免费| 亚洲精品日韩激情在线电影| 9999精品免费视频| αv一区二区三区| 好吊妞视频这里有精品 | 性xxxxbbbb| 亚洲精品视频中文字幕| 国产三级在线| 日韩午夜在线视频| av片哪里在线观看| 97热精品视频官网| 另类图片综合电影| 国产精品日韩专区| 精品国产伦一区二区三区观看说明 | 欧美黑人国产人伦爽爽爽| av资源一区| 日本午夜精品理论片a级appf发布| 亚洲人成午夜免电影费观看| 国产精品久久久91| 日韩精品一区二区三区中文| 国产女主播一区二区三区| 丝袜美腿一区二区三区动态图| 欧美久久久久久一卡四| 欧美xxxxx视频| 99久久久精品视频| 日韩精品乱码av一区二区| 日韩有码免费视频| 国产一区二区精品在线观看| 亚洲欧洲国产视频| xnxx国产精品| 三级黄色在线观看| 午夜精品福利久久久| 波多野结衣激情视频| 欧美一级日韩免费不卡| 亚洲av成人无码网天堂| 日韩中文字幕免费看| 国产白浆在线免费观看| 国产精品久久久久久久久久免费 | 国产福利一区在线观看| 国产在线观看无码免费视频| 国产精品不卡一区二区三区| 精品小视频在线观看| 91久久精品网| 黄色av中文字幕| 国产一区二区三区在线视频| 欧美伦理免费在线| 国产精品一二三在线| jizz性欧美2| 国产91av视频在线观看| 中文亚洲欧美| 波多野结衣中文字幕在线播放| 国产亚洲欧洲一区高清在线观看| 欧美极品aaaaabbbbb| 欧美亚洲国产一区二区三区 | 91动漫在线看| 久久99精品国产.久久久久久| 亚洲av无码一区二区三区观看| 亚洲乱码一区二区三区在线观看| 一级片在线观看免费| 精品国产一区二区三区不卡| 91涩漫在线观看| 国产成人精品在线视频| 成人线上播放| 青青视频免费在线观看| 久久激情综合网| 99久久99久久精品免费| 黑人狂躁日本妞一区二区三区 | 亚洲欧美在线人成swag| 日本高清不卡一区二区三| 影音先锋中文字幕一区二区| 久久久久久综合网| 欧美国产欧美综合| 综合网在线观看| 亚洲精品久久久久中文字幕欢迎你 | 久久久九九九九| 日韩精品手机在线| 精品美女在线播放| 国模私拍视频在线播放| 亚洲一区二区三区成人在线视频精品 | 国产ts人妖一区二区| 永久免费未视频| 欧美放荡的少妇| 欧美另类极品| 国产日韩精品电影| 欧美1级片网站| 亚洲一级免费观看| 中文字幕第一区综合| 黄色网址中文字幕| 亚洲一区二区精品| 精品三区视频| 一卡二卡3卡四卡高清精品视频| 日本伊人色综合网| 黄色av免费播放| 欧美午夜精品久久久久久超碰 | 欧亚精品中文字幕| 色综合www| 欧美激情国产精品日韩| 久久免费精品国产久精品久久久久| 国产精品一区无码| 国产亚洲欧美aaaa| 久久青草免费| 少妇高潮大叫好爽喷水| 国产黑丝在线一区二区三区| 久久精品第一页| www视频在线免费观看| 91国产在线播放| 日韩视频在线一区二区三区 | 韩国三级hd两男一女| 天天av天天翘天天综合网色鬼国产| 亚洲欧美日本在线观看| 日韩美女免费线视频| 日韩一区电影| 男插女视频网站| 亚洲h在线观看| 久久这里精品| 成人免费淫片视频软件| 亚洲私拍自拍| 日韩一级av毛片| 91麻豆精品国产91久久久资源速度 | 亚洲婷婷影院| 国产又大又黄又粗又爽| 亚洲色图视频网| 亚洲国产成人一区二区| 国产91对白在线播放| 91嫩草亚洲精品| 野战少妇38p| 在线亚洲一区观看| 国产乱色在线观看| 久久99国产精品| 久久精品99国产精品日本| 国产一级特黄a高潮片| 亚洲欧美三级在线| 国产精品亚洲欧美一级在线| 三上悠亚久久精品| 国产精品久99| 污污的视频网站在线观看| 国产精品免费网站| 在线看片一区| 九九热久久免费视频| 亚洲成人精品av| 久久精品xxxxx| 97超碰青青草| 一区二区三区在线视频观看| 欧美女优在线| 国产高清自拍99| 久久爱www久久做| 国产区一区二区三| 欧美大秀在线观看| 日韩理论电影院|