精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Karpathy觀點惹爭議:RLHF不是真正的強化學習,谷歌、Meta下場反對

人工智能 新聞
RLHF 與 RL 到底能不能歸屬為一類,看來大家還是有不一樣的看法。

AI 大牛 Karpathy 又來科普人工智能概念了。

昨日,他發推表示,「基于人類反饋的強化學習(RLHF)只是勉強算得上是強化學習(RL)。」

Karpathy 的全文解釋如下:

RLHF 是訓練大語言模型(LLM)的第三個(也是最后一個)主要階段,前兩個階段分別是預訓練和監督微調(SFT)。我認為 RLHF 只是勉強算得上 RL,它沒有得到廣泛的認可。RL 很強大,但 RLHF 卻不然。

讓我們看看 AlphaGo 的例子,它是使用真正的 RL 訓練的。計算機玩圍棋(Go)游戲,并在實現獎勵函數最大化的回合(贏得比賽)中訓練,最終超越了最厲害的人類棋手。AlphaGo 沒有使用 RLHF 進行訓練,如果它用了,效果就不會那么好。

用 RLHF 訓練 AlphaGo 會是什么樣子呢?首先,你要給人類標注員兩個圍棋棋盤的狀態,然后問他們更喜歡哪一種:

圖片

然后你會收集到 10 萬個類似的比較,并訓練一個「獎勵模型」(RM)神經網絡來模擬人類對棋盤狀態的氛圍檢查(vibe check)。你要訓練它同意人類判斷的平均水平。一旦我們有了獎勵模型氛圍檢查,你就可以針對此運行 RL,學習如何下出帶來良好氛圍的棋步。顯然,這不會在圍棋中產生任何太有趣的結果。

這主要有以下兩個根本的、獨立的原因:

1) 氛圍可能會產生誤導,這不是實際獎勵(贏得比賽)。這是一個糟糕的智能體目標。更糟糕的是,2) 你會發現你的 RL 優化偏離了軌道,因為它很快發現棋盤狀態與獎勵模型相反。請記住,獎勵模型是一個龐大的神經網絡,使用數十億參數來模擬氛圍。有些棋盤狀態超出了自身訓練數據的分布范圍,實際上并不是良好狀態,但卻從獎勵模型中獲得了非常高的獎勵。

出于同樣的原因,我有時感到驚訝的一點是 RLHF 工作竟然適用于 LLM。我們為 LLM 訓練的獎勵模型只是以完全相同的方式進行氛圍檢查,它會對人類評分者在統計學上看起來喜歡的助手響應給出高分。這不是正確解決問題的實際目標,而是人類認為好的智能體目標。

其次,你甚至無法長時間地運行 RLHF,因為你的模型很快學會以游戲獎勵模型的方式來做出響應。這些預測看起來真的非常奇怪,你會看到你的 LLM 助手開始對很多 prompt 做出無意義的響應,比如「The the the the the the」。這在你看來是荒謬的,但隨后你查看獎勵模型氛圍檢查,卻發現出于某種原因,獎勵模型會認為這些看起來很棒。

你的 LLM 發現了一個對抗性示例,它超出了獎勵模型訓練數據的范圍,處于未定義的范圍。你可以通過反復講這些特定示例添加到訓練集來緩解這一情況,但下次仍會找到其他對抗性示例。你甚至無法運行 RLHF 進行很多優化步驟。你執行了幾百或幾千步之后必須調用它,因為你的優化將開始與獎勵模型博弈。這并不是 AlphaGo 那樣的 RL。

不過,RLHF 是構建 LLM 助手的一個非常有用的步驟。我認為這有幾個微妙的原因,其中我最喜歡的一點是通過 RLHF,LLM 助手會從生成器 - 判別器的 gap 中受益。也就是說,對于很多問題類型,人類標注員從幾個候選答案中選出最佳答案要比從頭寫出理想答案容易得多。一個很好的例子是像「生成一首回形針詩」這樣的 prompt。一個普通的人類標注員很難從頭寫出一首好詩來作為監督微調示例,但可以在給定幾個候選答案(詩)的情況下選出一首較好的。因此 RLHF 是一種從人類監督的「容易度」差距中獲益的方式。

還有一些其他原因,比如 RLHF 有助于緩解幻覺。如果獎勵模型是一個足夠強大的模型,能夠在訓練期間發現 LLM 編造的東西,則可以學會用低獎勵來懲罰這種行為,教會模型在不確定時避免冒險獲取事實性知識。但令人滿意的幻覺緩解和處理是另外的事情,這里不做延伸。總之,RLHF 確實有用,但它不是 RL。

到目前為止,還沒有一個針對 LLM 的生產級 RL 在開放域得到令人信服的實現和大規模展示。直觀地說,這是因為在開放式問題解決任務中獲得實際獎勵(即贏得比賽)非常困難。在圍棋這類封閉、類博弈的環境中,一切都很有趣。其中動態受到限制,獎勵函數評估成本很低,不可能進行博弈。

但是,你如何為總結一篇文章提供客觀的獎勵?或者回答關于某個 pip 安裝的模棱兩可的問題?或者講個笑話?或者將一些 Java 代碼重寫為 Python?實現這些在原則上并非不可能, 但也非易事,需要一些創造性思維。無論誰能令人信服地解決這個問題,都將能夠運行真正的 RL,使得 AlphaGo 在圍棋中擊敗了人類。有了 RL,LLM 在解決開放域問題中才有可能真正擊敗人類。

Karpathy 的觀點得到一些人的附議,并指出 RLHF 與 RL 的更多差異。比如 RLHF 沒有進行適當的搜索,主要學習利用預訓練軌跡的子集。相比之下,在進行適當的 RL 時,離散動作分布通常會通過在損失函數中添加熵項來增噪。Kaypathy 認為,原則上你可以輕松地為 RLHF 目標添加熵獎勵,這在 RL 中也經常這樣做。但實際上似乎并不多見。

圖片

谷歌研究科學家 Kevin Patrick Murphy 也完全同意 Karpathy 的觀點。他認為 RLHF 更像是一個具有字符串值操作的上下文「強盜」,其中 prompt 是上下文,所以不能稱為完整的 RL。此外將日常任務的獎勵形式化是困難的部分(他認為或許可以叫做對齊)。

圖片

圖源:https://x.com/sirbayes/status/1821421936045597022

不過,另一位谷歌高級研究科學家 Natasha Jaques 認為 Karpathy 的觀點是錯誤的。她認為智能體在與人互動時,給出人類喜歡的答案才是真正的目標。

超出分布范圍并不是 RLHF 獨有的問題。如果僅僅因為人類反饋比運行無限的圍棋模擬更受限,并不意味著這不是一個不值得解決的問題,只會讓它成為一個更具挑戰性的問題。她希望這成為一個更有影響力的問題,畢竟在 LLM 中減少偏見比在圍棋中擊敗人類更有意義。使用貶義的話術,比如 Karpathy 說獎勵模型是一種氛圍檢查,這是愚蠢的。你可以用同樣的論點來反對價值估計。

她覺得 Karpathy 的觀點只會阻止人們從事 RLHF 工作,而它是目前唯一可行的減輕 LLM 偏見和幻覺可能造成嚴重傷害的方法。

圖片

圖源:https://x.com/natashajaques/status/1821631137590259979

Meta 研究者 Pierluca D'Oro 不同意 Karpathy 的主要觀點,但同意「RLHF is just barely RL」這一標題。他認為通常用于微調 LLM 的 RLHF 幾乎不能算是 RL。

主要觀點如下:在強化學習中,追求一個「完美的獎勵」概念是不現實的,因為大多數復雜任務中,除了目標的重要性,執行方式同樣重要。盡管在圍棋等明確規則的任務中,RL 表現出色。但在涉及復雜行為時,傳統 RL 的獎勵機制可能無法滿足需求。他主張研究如何在不完美的獎勵模型下提高 RL 的性能,并強調了反饋循環、魯棒 RL 機制以及人機協作的重要性。 

圖片

圖源:https://x.com/proceduralia/status/1821560990091128943

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-08-09 12:46:04

2023-05-25 09:00:00

人工智能ChatGPTOpenAI

2023-02-27 09:24:05

模型技術

2025-04-18 10:01:41

2018-08-29 08:13:22

Google 學習框架技術

2013-03-07 10:26:21

編程程序員編程觀點

2025-10-14 08:59:00

2025-10-20 01:00:00

強化學習AI人工智能

2025-08-29 17:09:30

KarpathyAGILLM

2020-12-17 19:43:36

編程代碼程序員

2025-05-28 02:25:00

2025-10-10 09:02:16

2009-04-03 08:26:54

華為末位淘汰制裁員

2020-08-10 06:36:21

強化學習代碼深度學習

2023-03-09 08:00:00

強化學習機器學習圍棋

2021-10-11 09:51:38

谷歌人工智能強化學習

2025-06-23 09:07:00

2024-11-18 13:30:00

2025-08-29 09:01:40

AI模型訓練

2020-11-12 19:31:41

強化學習人工智能機器學習
點贊
收藏

51CTO技術棧公眾號

免费日韩电影在线观看| 久久99热这里只有精品国产| 啊啊啊国产视频| 黄色网址免费在线观看| 成人aaaa免费全部观看| 国产精品高清免费在线观看| 国产日韩欧美在线观看视频| 米奇精品关键词| 精品视频一区二区不卡| 国产一二三区在线播放| 国产福利小视频在线观看| 精品一区二区免费| 18性欧美xxxⅹ性满足| 黑人操日本美女| 日韩系列在线| 日韩一区二区在线免费观看| 日本毛片在线免费观看| av网站免费在线观看| 26uuu色噜噜精品一区| 91色视频在线导航| 午夜精品久久久久久久蜜桃| 欧美特黄a级高清免费大片a级| 亚洲欧美国产高清va在线播| 人妻体体内射精一区二区| 日韩精品免费观看视频| 欧美日韩国产精品一区二区不卡中文| 久久免费视频2| 国产天堂素人系列在线视频| 豆国产96在线|亚洲| 成人精品网站在线观看| 正在播放木下凛凛xv99| 亚洲精品女人| 欧美日本黄视频| 亚洲第九十七页| 这里视频有精品| 欧美精品丝袜久久久中文字幕| 久久久久狠狠高潮亚洲精品| 丁香花高清在线观看完整版| 1024成人网色www| 亚洲国产欧美日韩| 国产午夜在线视频| 久久久久国产免费免费| 久久综合给合久久狠狠色| 免费a视频在线观看| 国产黄色91视频| 亚洲xxxxx电影| 国产精品国产三级国产普通话对白| 久久婷婷一区| 国产成人综合精品在线| 日韩不卡在线播放| 男人的天堂成人在线| 97精品一区二区三区| 久草中文在线视频| 欧美精品综合| 久久久久国产一区二区三区| 久久久久香蕉视频| 激情视频一区| 91超碰caoporn97人人| 中文字幕在线字幕中文| 国产精品尤物| 日韩av不卡电影| 国产字幕在线观看| 免费观看成人av| 91免费精品国偷自产在线| 国产精品一区二区av白丝下载| 韩国v欧美v亚洲v日本v| 97神马电影| 天天操天天干天天插| 91性感美女视频| 欧美日韩另类丝袜其他| a√在线中文网新版址在线| 日本一区二区免费在线 | 亚洲 中文字幕 日韩 无码| 久久sese| 在线观看91精品国产麻豆| www.污污视频| 成人性生交大片免费看96| 日韩毛片中文字幕| 欧美日韩国产黄色| 女主播福利一区| 97精品免费视频| 最新国产中文字幕| 国产成人精品一区二区三区四区 | 色婷婷激情一区二区三区| 中文字幕第80页| 国产一区二区| 日韩成人在线电影网| 日韩不卡av在线| 中文av一区| 欧美伊久线香蕉线新在线| 中文字幕观看视频| 国产成a人亚洲| 日本高清一区| 欧美另类tv| 一本色道综合亚洲| 亚洲区 欧美区| 国产一区二区在线| 欧美日韩国产91| 一二三区免费视频| 国产成人在线免费观看| 欧美一区二区高清在线观看| 18av在线播放| 欧美视频你懂的| 精品国产乱码久久久久夜深人妻| 国产最新精品| 91国产高清在线| 国产精品毛片一区视频播| 91欧美一区二区| 女女百合国产免费网站| 91亚洲视频| 亚洲国产一区自拍| 欧美做爰啪啪xxxⅹ性| 视频一区视频二区中文字幕| 成人av免费在线看| 日本精品在线| 欧美中文字幕一区二区三区亚洲| 88av在线播放| 欧美一区激情| 国产主播欧美精品| 成年人在线免费观看| 亚洲不卡在线观看| 久久av一区二区三| 亚洲成人精选| 国产欧美va欧美va香蕉在线| 极品白浆推特女神在线观看| 欧美日韩国产综合视频在线观看中文 | 国产又粗又猛又爽又黄的视频四季| 亚洲激情社区| 国产精品久久久久久久天堂第1集| 欧美成人视屏| 欧美日韩亚洲综合一区二区三区| 国产黄色网址在线观看| 99精品国产在热久久婷婷| 99热国产免费| 日本一本在线免费福利| 欧美一区二区三区喷汁尤物| 日韩一区二区三区四区视频| 秋霞午夜鲁丝一区二区老狼| 区一区二区三区中文字幕| 色网在线免费观看| 精品视频久久久久久| www.av麻豆| 99精品国产热久久91蜜凸| 日本欧美视频在线观看| 99亚洲乱人伦aⅴ精品| 欧美俄罗斯性视频| 丰满大乳国产精品| 亚洲成人动漫av| 日本一卡二卡在线| 国产亚洲一区在线| 九九九久久久| 波多视频一区| 中国日韩欧美久久久久久久久| 成人毛片一区二区三区| 国产网站一区二区三区| 日本美女高潮视频| 日韩精品2区| 成人av在线天堂| 黄网页免费在线观看| 日韩网站在线看片你懂的| 免费在线一级片| www.在线欧美| 国产xxxxx视频| 欧美三级情趣内衣| 成人h视频在线观看播放| 免费看a在线观看| 日韩欧美成人一区二区| 日韩精品视频免费播放| 91麻豆国产香蕉久久精品| 99热这里只有精品在线播放| 永久91嫩草亚洲精品人人| 国产91aaa| 欧美激情护士| 在线电影av不卡网址| 国产情侣自拍小视频| 精品动漫一区二区| 精品人妻中文无码av在线| 精品一区二区三区久久久| 91成人综合网| 久操精品在线| 91精品国产综合久久久久久丝袜| 老牛影视精品| 久久精品这里热有精品| 色婷婷在线视频| 欧美特级限制片免费在线观看| 杨钰莹一级淫片aaaaaa播放| 99久久综合狠狠综合久久| 亚洲国产高清av| 亚洲国产午夜| 亚洲一区三区| 欧美男人操女人视频| 国产美女主播一区| av在线播放资源| 久久精品一区中文字幕| 香蕉视频网站在线| 欧美一级国产精品| 97人妻一区二区精品视频| 亚洲午夜激情网站| 久久久久亚洲AV成人无在| 不卡av在线网| 日韩a一级欧美一级| 快she精品国产999| 久久99中文字幕| 午夜av一区| 日本成人看片网址| 豆花视频一区二区| 91午夜在线播放| 久久xxx视频| 国产91ⅴ在线精品免费观看| aa在线视频| 在线观看日韩欧美| 日韩欧美在线番号| 亚洲第一页在线| 亚洲国产精品成人久久蜜臀| 欧美日韩一级片在线观看| 啦啦啦免费高清视频在线观看| 亚洲免费伊人电影| 亚洲欧美综合7777色婷婷| 久久先锋影音av鲁色资源网| 伊人久久一区二区三区| 国产激情偷乱视频一区二区三区| wwwwwxxxx日本| 日本不卡一区二区三区 | 亚洲精品中文字幕| 91国内在线视频| xxxx在线视频| 欧美极品第一页| jizz性欧美| 久久久国产精彩视频美女艺术照福利| 国产三级在线看| 亚洲欧美精品伊人久久| 亚洲人午夜射精精品日韩| 亚洲第一色在线| 韩国中文字幕hd久久精品| 日韩三级.com| 亚洲AV无码一区二区三区性| 欧美一区二区在线观看| 国产露脸无套对白在线播放| 欧美日韩另类一区| 亚洲影视一区二区| 欧美日韩一区二区欧美激情| 一区二区日韩视频| 欧美精品乱人伦久久久久久| 这里只有精品9| 欧美巨大另类极品videosbest | 看电视剧不卡顿的网站| 欧美成年人视频在线观看| 美国一区二区三区在线播放| jizz18女人| 精品写真视频在线观看| 992kp免费看片| 粉嫩一区二区三区在线看 | 国产日产欧美精品一区二区三区| 在线观看福利片| 国产日韩精品视频一区| 激情高潮到大叫狂喷水| 亚洲激情六月丁香| 久久精品欧美一区二区| 婷婷久久综合九色综合绿巨人| www.国产色| 欧美视频精品在线观看| 国产永久免费视频| 日韩欧美电影一区| 午夜成人免费影院| 中文字幕精品www乱入免费视频| 色大18成网站www在线观看| 欧美精品在线免费| 老牛影视精品| 国产欧美精品日韩| silk一区二区三区精品视频| 久久av免费一区| 欧美国产一级| 欧美成人官网二区| 国产精品免费电影| 奇米777四色影视在线看| 亚洲一级理论片| 久热av在线| 日日夜夜精品| 久久精品国产一区二区三区免费看 | 日韩av懂色| 欧洲av在线精品| 亚州欧美一区三区三区在线| 极品束缚调教一区二区网站| 日本高清不卡三区| 女同性一区二区三区人了人一| 波多野结衣之无限发射| 日产欧产美韩系列久久99| 日本美女久久久| 久久亚洲一级片| 国产男女猛烈无遮挡在线喷水| 亚洲成年人网站在线观看| 免费又黄又爽又猛大片午夜| 欧美一区二区黄| 青青操视频在线| 久久国产天堂福利天堂| 亚洲风情在线资源| 亚洲自拍偷拍第一页| 国产99久久| 中国丰满熟妇xxxx性| 青青草一区二区三区| 久久精品无码专区| 国产精品久久久久久久久久久免费看| 伊人国产在线观看| 4438x亚洲最大成人网| 欧美日韩免费做爰大片| 欧美第一页在线| 伊人久久大香| 日韩精品久久久| 欧美日韩三级电影在线| 视色视频在线观看| 91丝袜呻吟高潮美腿白嫩在线观看| 亚洲av无码一区二区三区在线| 色八戒一区二区三区| 蜜桃视频久久一区免费观看入口| 日韩中文字幕第一页| 成人开心激情| 久久国产精品久久| 亚洲网站在线| 日本黄色www| 中文字幕视频一区二区三区久| 特级毛片www| 亚洲精品成人久久| 男人添女人下部高潮视频在线观看| 国产一区二区香蕉| 日韩国产一区| 久久99爱视频| 欧美激情在线看| 亚洲无码精品一区二区三区| 亚洲精品美女网站| 日本不卡1234视频| 国产精品一区二区在线观看| 中文精品电影| 无码人妻丰满熟妇区毛片蜜桃精品| 国产精品高潮呻吟久久| 国产偷人爽久久久久久老妇app| 亚洲免费视频网站| 国产伦精品一区二区三区视频金莲| 国产精品亚洲不卡a| 在线播放亚洲| 美女扒开腿免费视频| 亚洲国产一区二区三区| 性生交生活影碟片| 欧美黄色片免费观看| av成人男女| 成人黄色av片| www激情久久| 无码人妻一区二区三区免费| 亚洲欧洲第一视频| 欧美三区四区| 亚洲欧洲国产日韩精品| 六月丁香综合在线视频| 欧美h片在线观看| 日韩一区二区三区精品视频 | 神马日本精品| 六月激情综合网| 国产性做久久久久久| 在线免费观看日韩视频| 精品国产一区久久久| 欧美激情精品| 国产黄页在线观看| 久久综合狠狠综合| 一卡二卡在线视频| 欧美巨大黑人极品精男| 久久99国产精品久久99大师| 成年人视频网站免费观看| 国产日产欧美一区二区三区| 国产又黄又粗又硬| 欧美寡妇偷汉性猛交| 一本久久青青| 在线一区二区不卡| 亚洲va天堂va国产va久| 免费一级在线观看播放网址| 国产欧美日韩免费| 激情视频一区| 久久久久亚洲av无码a片| 3d动漫精品啪啪1区2区免费| 日本在线视频www鲁啊鲁| 久久久久久久久久久一区| 美女视频免费一区| 在线看成人av| 最近2019中文字幕第三页视频| 日韩在线成人| 久久国产色av免费观看| 《视频一区视频二区| 五月天激情婷婷| 成人黄色av播放免费| 亚洲每日在线| 搜索黄色一级片| 日韩成人免费视频| 欧美国产亚洲精品| mm1313亚洲国产精品无码试看| 亚洲狠狠丁香婷婷综合久久久| 亚洲色大成网站www| 91久久国产精品91久久性色| 亚洲美女色禁图| 在线看的片片片免费| 亚洲美女视频网站| 无人区乱码一区二区三区| 美女黄色片视频| 天天影视网天天综合色在线播放|