精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

十行代碼媲美RLHF,用社交游戲數據訓練社會對齊模型

人工智能 新聞
人類大腦中真的存在一個打分模型負責價值判斷嗎?

讓語言模型的行為符合人類社會價值觀是當前語言模型開發的重要環節。相應的訓練也被稱為價值對齊 (value alignment)。

當前主流的方案是 ChatGPT 所采用的 RLHF (Reinforcenment Learning from Human Feedback),也就是在人類反饋上進行強化學習。這一方案首先先訓練一個 reward model (價值模型)作為人類判斷的代理。代理模型在強化學習階段為生成式語言模型的提供獎勵作為監督信號。

這一方法存在如下痛點:

1.代理模型產生的獎勵很容易被破除或者篡改。

2. 在訓練過程中,代理模型需要和生成式模型進行不斷交互,而這一過程可能非常耗時且效率不高。為了保證高質量的監督信號,代理模型不應小于生成式模型,這也就意味著在強化學習優化過程中,至少有兩個比較大的模型需要交替進行推理(判斷得到的獎勵)和參數更新(生成式模型參數優化)。這樣的設定在大規模分布式訓練中可能會非常不便。

3. 價值模型本身并無和人類思考模型上明顯的對應。我們腦海中并沒有一個單獨的打分模型,而且實際上長期維護一個固定的打分標準也非常困難。相反,我們的成長過程中價值判斷的形成大部分來自每天的社交 —— 通過對相似場景的不同社交反饋的分析,我們逐漸意識到什么是會被鼓勵的,什么是不允許的。這些通過大量 “社交 — 反饋 — 改進” 而逐漸積累的經驗和共識成為了人類社會共同的價值判斷。

最近一項來自達特茅斯,斯坦福,谷歌 DeepMind 等機構的研究表明,利用社交游戲構造的高質量數據配合簡單高效的對齊算法,也許才是實現 alignment 的關鍵所在。

圖片

  • 文章地址:https://arxiv.org/pdf/2305.16960.pdf
  • 代碼地址:https://github.com/agi-templar/Stable-Alignment
  • 模型下載(包含基座,SFT,和對齊模型):https://huggingface.co/agi-css

作者提出一種在多智能體游戲數據上訓練的對齊方法。基本思想可以理解為將訓練階段的獎勵模型和生成式模型的在線交互,轉移到游戲中大量自主智能體之間的離線交互之中(高采樣率,提前預演博弈)。游戲環境的運行獨立于訓練,并且可以大量并行。監督信號從取決于代理獎勵模型的性能變成取決于大量自主智能體的集體智慧。

圖片

為此作者設計了一個虛擬社會模型,稱之為沙盒 Sandbox。沙盒是一個格點構成的世界,每一個格點是一個 social agent (社交體)。社交體具有記憶系統,用于存儲每一次交互的問題,回答,反饋等各種信息。在社交體每一次對于問題做出回答時,都要先從記憶系統中檢索并返回和問題最相關的 N 條歷史問答,作為這一次回復的上下文參考。通過這一設計,社交體能在多輪互動中的立場不斷更新,且更新的立場能和過去保持一定延續性。初始化階段每一個社交體都有不同的預設立場。

圖片

將游戲數據轉化為 alignment 數據

在實驗中作者使用 10x10 的格點沙盒(一共 100 個社交體)進行社會仿真,且制定了一個社會規則(即所謂 Sandbox Rule):所有社交體必須通過使自己對于問題的回答更加 socially aligned (社交對齊)來給其它社交體留下好的印象。此外沙盒還部署了沒有記憶的觀察者,在每一次社交前后,給社交體的答復做出打分。打分基于 alignment 和 engagement 兩個維度。

圖片

使用不同模型在沙盒中的模擬人類社會

作者利用沙盒 Sandbox 測試了不同大小,以及不同訓練階段的語言模型。整體而言,經過 alignment 訓練的模型 (即所謂 “對齊后的模型”),比如 davinci-003, GPT-4,和 ChatGPT,能在更少的交互輪次中就能生成符合社會規范的回復。換句話說,alignment 訓練的意義就在于讓模型在 “開箱即用” 的場景下更加安全,而不需要特別的多輪對話引導。而未經 alignment 訓練的模型,不僅需要更多的交互次數使回復達到 alignment 和 engagement 的整體最優,而且這種整體最優的上限顯著低于對齊后的模型。

圖片

作者同時提出一種簡便易行的對齊算法,稱為 Stable Alignment (穩定對齊),用于從沙盒的歷史數據中學習 alignment。穩定對齊算法在每一個 mini-batch (小批次)中進行打分調制的對比學習 —— 回復的得分越低,對比學習的邊界值就會被設定的越大 —— 換句話說,穩定對齊通過不斷采樣小批次數據,鼓勵模型生成更接近高分回復,更不接近低分回復。穩定對齊最終會收斂于 SFT 損失。作者還對穩定對齊和 SFT,RLHF 的差異進行了討論。

圖片

作者特別強調來自沙盒 Sandbox 的游戲的數據,由于機制的設定,大量包含通過修訂 (revision)而成為符合社會價值觀的數據。作者通過消融實驗證明這種大量自帶漸進式 (step-by-step)改進的數據是穩定訓練的關鍵。

圖片

圖片

作者還和當前主流對齊算法性能和訓練穩定性進行了性能上的比較,證明穩定對齊不僅比 reward modeling 更穩定,而且在通用性能和 alignment 性能上都足以媲美 RLHF (由于 ChatGPT 使用未公開的模型,數據和算法,因此僅作為參考)。

實例生成結果:

圖片

更多細節請參考論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2011-04-29 14:08:19

手機社交游戲游戲開發

2010-09-16 09:21:45

OpenFeintAndroid

2012-03-05 20:14:00

移動

2022-03-14 09:57:30

Python代碼

2023-12-06 18:09:01

2020-11-08 14:44:37

VSCode代碼編碼

2010-09-01 08:32:40

2013-04-27 16:14:33

Corona

2012-03-12 21:49:33

移動

2022-07-07 15:50:19

Python開發功能

2013-11-11 13:55:56

移動社交游戲微信游戲

2012-02-01 15:09:00

社交游戲休閑游戲用戶維續

2013-03-26 10:27:32

社交游戲公司云存儲

2013-10-15 17:40:52

手游騰訊游戲

2011-07-22 09:31:11

Google+Facebook谷歌

2022-01-25 12:51:58

Python代碼證件照

2022-03-23 15:32:38

Python開發代碼

2013-01-28 09:27:56

移動社交Line移動游戲

2012-06-18 09:24:48

2016-03-29 10:08:07

點贊
收藏

51CTO技術棧公眾號

韩国中文字幕av| 国产美女娇喘av呻吟久久| 26uuu亚洲综合色| 亚洲图片欧美午夜| 99一区二区三区| 国产精品www爽爽爽| 国产九色在线| 成人台湾亚洲精品一区二区| 欧美激情综合网| 97精品国产91久久久久久| 亚洲无在线观看| 91九色在线porn| 狂野欧美一区| 亚洲另类图片色| 狠狠干 狠狠操| 成人久久久精品国产乱码一区二区 | 久久一二三国产| 欧美国产日韩中文字幕在线| 怡红院亚洲色图| av影片在线看| av一区二区三区| 78m国产成人精品视频| 日韩Av无码精品| 久久一卡二卡| 国产成人av影院| 久久99视频免费| 久久发布国产伦子伦精品| 麻豆传媒在线完整视频| 久久99精品久久久久久国产越南| 中文字幕无线精品亚洲乱码一区 | 9191精品国产综合久久久久久| 欧美亚洲免费高清在线观看 | 精品9999| 日韩成人在线视频观看| 黑人糟蹋人妻hd中文字幕| 你懂的在线免费观看| 亚洲尤物在线| 亚洲女人天堂视频| 亚洲午夜久久久久久久久| 亚洲a成人v| 一区二区三区精品视频| 国产传媒一区二区三区| 成人午夜视频精品一区| 婷婷成人在线| 欧美日韩视频在线一区二区| 中文字幕日韩一区二区三区不卡| 一级黄色免费片| 欧美日韩亚洲三区| 日韩久久免费电影| 乌克兰美女av| 牛牛电影国产一区二区| 中文字幕永久在线不卡| 成人av影视在线| 国产免费av观看| 一本久道久久久| 国产性色av一区二区| 丰满大乳奶做爰ⅹxx视频| 99久久综合国产精品二区| 亚洲乱码国产乱码精品精98午夜| 97久草视频| 五月天婷婷激情| 久久国产精品成人免费观看的软件| 欧美日韩一级大片网址| 成年人在线观看视频免费| 久久久成人av毛片免费观看| 一区二区三区在线看| 欧美大香线蕉线伊人久久| 91成品人影院| 狠狠色2019综合网| 欧美一级bbbbb性bbbb喷潮片| 日韩欧美视频免费观看| 乱亲女h秽乱长久久久| 欧美日韩亚洲综合在线| 一区二区三区四区毛片| 高清在线一区二区| 色综合久久久久| 亚洲一区尤物| 天堂网www中文在线| 精品亚洲国内自在自线福利| 亚洲xxxxx| 五月激情丁香网| 日韩视频久久| 国产成人在线播放| 国产精品自拍视频一区| 五月天综合网站| 一区二区福利视频| xxxx黄色片| 一区二区三区四区高清视频| 一本到不卡免费一区二区| 国产自偷自偷免费一区| 国产直播在线| 亚洲综合区在线| 青青在线视频观看| 亚洲伊人伊成久久人综合网| 在线免费观看视频一区| 黄色动漫网站入口| a天堂资源在线| 一区二区成人在线| 欧美亚洲精品一区二区| 国产精品蜜臀| 亚洲综合在线五月| 99热成人精品热久久66| gogo大尺度成人免费视频| 亚洲国产精久久久久久久| 无码人妻少妇色欲av一区二区| 欧美久久精品| 亚洲精品国产电影| 中文字幕永久免费| 亚洲精品aⅴ| 亚洲欧美激情一区| 九九精品在线观看视频| 欧美午夜a级限制福利片| 欧美又大又粗又长| a在线观看视频| 欧美aⅴ一区二区三区视频| 国产成人avxxxxx在线看| 国产人妖一区二区三区| 久久精品亚洲国产奇米99| 欧洲亚洲一区二区| 国产黄在线观看免费观看不卡| 亚洲欧美激情在线| 不卡av免费在线| 欧美大奶一区二区| 欧美激情精品久久久久| 亚洲天堂自拍偷拍| 国内精品国产成人| 欧美日韩在线一区二区三区| 国产精品69xx| 欧美大胆一级视频| 李丽珍裸体午夜理伦片| 日本亚洲不卡| 欧美成人午夜激情在线| 精品无码人妻一区二区三区| 亚洲高清久久| 成人日韩在线电影| 风流老熟女一区二区三区| 国产精品美日韩| 91传媒免费视频| 999福利在线视频| 欧美一个色资源| 波多野结衣有码| 欧美女激情福利| 91九色视频导航| 后进极品白嫩翘臀在线视频| 中文字幕亚洲电影| av中文字幕av| 原纱央莉成人av片| 欧美视频一区二区三区四区| 亚洲丝袜在线观看| 99久久亚洲精品蜜臀| 国产精品视频xxxx| 国产高清免费在线观看| 亚洲视频精选在线| 337p粉嫩大胆噜噜噜鲁| 久久97精品| 欧美亚州一区二区三区| 色av男人的天堂免费在线| 国产精品久久综合| 久久久久久久久久久久91| jvid福利在线一区二区| 欧美大片第1页| 精品人妻一区二区三区换脸明星| 91老师片黄在线观看| 黄色动漫网站入口| 精品国产乱码| 亚洲日本韩国一区| 国产一区二区0| 色婷婷亚洲综合| 99久久人妻无码中文字幕系列| 亚洲精选国产| 国产日韩欧美一二三区| 成人福利小视频| 一区二区三区色| 中文字幕在线视频播放| 亚洲综合精品四区| 三区精品视频观看| 国产美女情趣调教h一区二区| 精品国产一区二区三区久久影院| 超薄肉色丝袜一二三| 琪琪一区二区三区| 久久综合一区二区三区| 美女福利一区二区| 久久精品亚洲热| 五月天婷婷激情| 国产精品久久久久久久久久免费看 | 91免费看网站| 成入视频在线观看| 一区二区三区在线播放欧美| av中文在线观看| 狠狠躁18三区二区一区| 中文字幕55页| 日本不卡高清| 日本伊人精品一区二区三区介绍 | 四虎4545www精品视频| www.日韩av.com| 人人妻人人爽人人澡人人精品| 成人av综合一区| 欧美视频在线第一页| 欧美aaaaaaaa牛牛影院| 国产伊人精品在线| 99re6在线精品视频免费播放| 亚洲午夜精品视频| 亚洲第一页综合| 亚洲三级小视频| 亚洲国产综合视频| 经典三级在线一区| 成人观看免费完整观看| 欧美fxxxxxx另类| 亚洲free嫩bbb| 自由日本语热亚洲人| 不卡伊人av在线播放| 国产又大又黑又粗| 亚洲欧洲日韩一区二区三区| 在线黄色免费网站| 精品一区二区三区免费| av观看免费在线| 欧美激情精品久久久六区热门| 日韩欧美亚洲在线| 久久日本片精品aaaaa国产| 色婷婷久久av| 国产精品视频a| 日本二三区不卡| 粉嫩aⅴ一区二区三区四区 | 国产成人一区二区三区影院在线 | 亚洲第一中文字幕| 一级黄在线观看| 色8久久精品久久久久久蜜| 久久久久久久福利| 亚洲欧美另类小说| 成年人视频软件| 国产婷婷色一区二区三区四区| 国产精品999视频| 亚洲人体av| 成人在线看片| 国产精品免费精品自在线观看| 国产成人鲁鲁免费视频a| 9999精品成人免费毛片在线看| 欧美精品制服第一页| 国产在线69| 精品粉嫩超白一线天av| 97人妻精品一区二区三区动漫| 在线亚洲欧美专区二区| 黄色在线视频网址| 国产精品家庭影院| 国产毛片久久久久久久| 久久国产麻豆精品| 国产内射老熟女aaaa| 欧美黄色录像片| 国产精品手机视频| 日本综合视频| 国产成人精品视频在线观看| 在线观看特色大片免费视频| 日韩中文在线观看| 中文字幕在线播放| 日韩亚洲一区二区| 黄色视屏免费在线观看| 久久午夜a级毛片| 在线观看中文| 亚洲欧美在线一区二区| 国产精品国产一区二区三区四区| 欧美日韩专区在线| 一区二区三区日| 制服丝袜亚洲色图| 精品久久久无码中文字幕| 日韩午夜中文字幕| 人妻丰满熟妇av无码区hd| 欧美综合在线视频| 中文字幕 国产| 午夜电影一区二区三区| 欧美成人另类视频| 国产精品久久久一区麻豆最新章节| 99热这里只有精品4| 91麻豆高清视频| 熟女少妇一区二区三区| 国产福利91精品| 校园春色 亚洲色图| 久久99精品久久久久久动态图| 亚洲av毛片在线观看| 成人免费视频播放| 一本之道在线视频| 不卡的av电影在线观看| 一级黄色性视频| 99久久国产综合精品女不卡| 999热精品视频| 老色鬼精品视频在线观看播放| 亚洲第一天堂久久| 成人免费观看男女羞羞视频| 久久久久久九九九九九| 中文字幕亚洲在| 日韩 欧美 精品| 欧美在线观看禁18| 亚洲AV无码国产精品午夜字幕 | 午夜国产精品视频免费体验区| 亚洲熟妇国产熟妇肥婆| 日韩高清一级片| 中文字幕乱码人妻综合二区三区 | 99久久久久久久久久| 亚洲欧洲日韩av| 久久国产视频播放| 亚洲福利视频三区| 国产一二三四在线| 在线一区二区三区四区五区| 国产激情久久久久久熟女老人av| 精品小视频在线| 成人在线免费看片| 久久国产精彩视频| 亚洲最大网站| 国产伦精品一区二区三区高清版| 久久激情电影| 日韩精品―中文字幕| 韩国三级电影一区二区| 亚洲国产日韩一区无码精品久久久| 91亚洲国产成人精品一区二三| 岛国片在线免费观看| 精品久久久久久久久久国产| 日韩免费不卡视频| 欧美久久免费观看| 中文字幕日本视频| 亚洲国产精品久久久久| 国产日产一区二区三区| 国产精品久久91| 日韩美女在线| 日本高清不卡一区二区三| 亚洲第一区色| 亚洲高清av一区二区三区| 中文字幕欧美激情一区| 三级av在线免费观看| 亚洲男人的天堂一区二区| 人人妻人人爽人人澡人人精品 | 欧美日精品一区视频| 免费一级毛片在线观看| 97在线视频免费观看| 97久久亚洲| www.欧美黄色| 国产精品久久久久久模特| 欧美两根一起进3p做受视频| 西西裸体人体做爰大胆久久久| 极品人妻一区二区| 亚洲欧美日韩国产综合| 国产精品特级毛片一区二区三区| 一区二区三区亚洲| 成人黄色毛片| 神马影院一区二区三区| 日韩av不卡一区二区| 日本二区在线观看| 欧美探花视频资源| 在线观看免费黄视频| 国产一区欧美二区三区| 亚洲精品a级片| 久色视频在线播放| 不卡的av在线播放| wwwxxx亚洲| 亚洲精品视频在线播放| sis001欧美| 视频在线精品一区| 麻豆精品视频在线| 三级在线观看免费大全| 欧美一区二区三区日韩| 青青久在线视频免费观看| 欧美整片在线观看| 视频一区在线| 日韩久久不卡| 蜜臀精品久久久久久蜜臀| 国产三级aaa| 日韩一区二区三区在线| 俺来俺也去www色在线观看| 国产精选在线观看91| 国产精品亚洲综合久久| 法国空姐电影在线观看| 欧美日韩一级片在线观看| 国产精品剧情| 国产色综合一区二区三区| 久久日文中文字幕乱码| 久久久精品高清| 久久久久久久电影| 久久国产香蕉视频| 久青草国产97香蕉在线视频| 成人av资源网址| 男人操女人逼免费视频| 亚洲国产精品ⅴa在线观看| 国产日韩精品suv| 国模极品一区二区三区| 免费观看亚洲天堂| 亚洲一区二区三区精品动漫| 国产一区美女在线| 在线观看中文字幕视频| 视频在线一区二区| 9l亚洲国产成人精品一区二三| 久久久噜噜噜www成人网| 国产精品久久久久毛片软件| 欧美 日韩 人妻 高清 中文| 国产精品国产三级国产aⅴ9色| 99久久这里只有精品| 中文字幕第3页| 欧美精品在线一区二区| 日韩av影片| 精品一卡二卡三卡四卡日本乱码 | 亚洲欧洲精品一区二区精品久久久 | 精品一区二区三区视频在线观看 | 麻豆蜜桃91|