精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

無需訓練實現價值觀實時動態對齊:上交開源價值觀對齊方法OPO,閉源與開源大模型均適用

人工智能 新聞
上海交通大學生成式人工智能實驗室 GAIR 迅速采取行動,推出了一種全新的價值對齊方法:OPO (On-the-fly Preference Optimization,實時偏好優化)。

隨著人工智能技術的發展,以 GPT-4 為代表的大語言模型依靠其強大的能力正在對社會產生深遠的影響。與此同時,大模型本身的安全性問題也變得尤為重要。如何確保大語言模型可以和人類的價值、真實的意圖相一致,防止模型被濫用、輸出有害的信息,這是大模型安全治理的核心問題。之前的大多數對齊方法需要收集新數據重新訓練模型,然而對訓練數據質量要求高以及優化模型參數耗時耗力是對齊中的痛點。除此之外,待對齊的價值觀可能是動態變化的,這進一步給大模型價值觀對齊帶來了挑戰。

有鑒于此,上海交通大學生成式人工智能實驗室 GAIR 迅速采取行動,推出了一種全新的價值對齊方法:OPO (On-the-fly Preference Optimization,實時偏好優化)。OPO 無需訓練即可實現實時動態對齊,而且因其即插即用的特性,適用于所有的開源與閉源大模型。研究者透過 OPO 實現了大模型對于法律與道德標準的對齊,展示了 OPO 的動態性以及優越性。

相比于之前工作中的對齊方法(i.e., SFT、PPO 和 DPO),OPO 方法有如下優勢:

  • 無需訓練即可實現價值觀對齊;
  • 舍棄獎勵模型,并對任意大模型均適用,包括開源與閉源大模型;
  • 容易更新待對齊的價值觀。考慮到價值觀可能會隨著時間發生變化(比如法律),OPO 能方便快捷地通過替換相應的準則完成價值觀的更新,而其他對齊方法則需要收集數據重新訓練模型。

圖片

表 1:OPO 與 SFT、PPO、DPO 等對齊方法的對比。

目前,該項目開源了大量資源,包括:

  • OPO 代碼(使用方法和測試流程也已經在 GitHub 上給出);
  • 5 種類型的測試數據集,包括人出的法考題目、《道德與法治》考試題目(只保留了道德相關的題目)和從 NormBank 數據的測試集中隨機采樣的題目,以及利用大模型自動生成的法律題目和職業道德題目;
  • 2 大類價值觀準則,分別是法律準則和道德準則。法律準則包括截止到 2023 年 7 月中國現行有效的所有法律法規(約 95 萬條)。道德準則:①從中學的《道德與法治》教材里收集的基礎道德準則;②從網上收集多家不同公司 / 行業的職業道德準則;③從 NormBank 訓練集數據中隨機抽取得到的社會道德規則;
  • 用于自動生成測試數據的 prompt 以及評估生成的測試數據質量的 prompt;
  • 用 OpenAI embedding 模型提取的法律和道德準則文本對應的向量。

圖片


  • 論文:Align on the Fly: Adapting Chatbot Behavior to Established Norms
  • 論文地址:https://arxiv.org/abs/2312.15907
  • 項目地址:https://gair-nlp.github.io/OPO/
  • 代碼地址:https://github.com/GAIR-NLP/OPO

方法

OPO 框架包含 3 部分,準則構建模塊、對齊模塊和評估模塊。

圖片

圖 1:OPO 框架。

準則構建模塊:

收集原始的準則文檔,清洗文本數據,統一準則的格式,分別得到一個法律準則語料庫和道德準則語料庫。具體而言,對于法律準則,研究者從國家法律法規數據庫中收集憲法、行政法規、地方性法規等法律法規,從國家規章庫中收集部門規章與地方政府規章。這 2 個數據庫涵蓋了中國現行有效的所有法律。對于道德準則,研究者從中學的《道德與法治》教材里收集剔除法治內容后的文本作為基礎道德準則,從網上收集了 57 家不同公司 / 行業的職業道德準則。除了收集顯式的道德準則外,研究者也嘗試從人標注好的道德數據里提取道德準則。從 NormBank 的訓練集里隨機選了 1000 條數據,每一條數據均是一個結構化的社會道德場景,之后研究者利用 ChatGPT 從每條數據里提取一條社會道德準則。

圖片

表 2:收集的道德準則與法律準則的分析。

圖片

表 3:收集的法律準則、基礎道德準則、職業道德準則和社會道德準則的示例。

對齊模塊:

對齊模塊基于檢索增強生成(RAG),旨在通過提供相應的準則,引導大模型在遵守準則的前提下更好地回答用戶的問題。研究者利用 OpenAI 的 text-embedding-ada-002 embedding 模型將每條準則都表征為稠密向量并存儲在一個向量庫里。給定一個提問,首先也將問詢轉換為一個稠密向量,然后利用 Faiss 作為檢索器在向量庫里檢索和問詢最相關的 k 條準則,接下來,大模型會通過設計的 prompt 利用檢索回來的準則作為行為規范回答問詢。

圖片

圖 2:利用檢索信息回答問詢的 prompt。

評估模塊:

評估模塊是一個通用可擴展的問題自動生成工具,能夠輕松擴展評測范圍、擴大評測數據數量,還能緩解測試數據泄露的問題。大模型在預訓練和有監督微調階段通常會涉及大量的非公開文本,之前的一些研究表明這可能會造成測試數據泄露的問題,進而影響大模型性能對比的公平性。此外,研究者觀察到人出的法考題目只涵蓋一小部分法律,很多法律尤其是地方性法律沒有被覆蓋到,而對于這部分法律又很難收集到相應的測試題目。并且,職業道德作為道德的一個重要組成部分,目前沒有對應的測試基準。為了解決上述問題,研究者提出了一個評估模塊,該模塊利用 GPT-4 自動生成帶有答案的單項選擇題。評估模塊共包含 3 步:

1. 自動出題:收集人出的單項選擇題并從中隨機抽取一道題作為 seed quesiton,同時從收集的準則庫里隨機選擇準則,要求 GPT-4 參考 seed quesiton 并依據準則和出題要求生成一道合理的包含題目、備選項、選項分析和答案的單項選擇題;

2. 自動檢測題目質量:將第一步的準則和生成的題目輸入到 GPT-4,對單項選擇題的 4 個部分(題目、備選項、選項分析和答案)依次核驗,篩掉任意一部分不符合要求的題目;

3. 人工檢測題目質量:研究者發現利用 GPT-4 并不能去掉所有質量差的自動生成的題目。為了確保評估的可靠性,研究者邀請了 3 個人類標注者,對第二步保留的題目作進一步的篩選。如果 2 個及以上的標注者都認為某道題不合理,則去掉這道題。

實驗和結果

為了驗證 OPO 的有效性,研究者構建了三個由人類標注的測試基準,以及兩個由模型自動生成的測試基準。這些基準涵蓋了法律和道德兩大類別,包括中文和英文基準。測試基準中的每一條數據均為單項選擇題。

圖片

表4:測試基準的分析。

在 H-Law 和 A-Law 測試基準上,OPO 能顯著提高大多數模型的準確率。尤其值得一提的是,OPO 能在 A-Law 測試基準上為許多大型模型帶來 10 個百分點的準確率提升。例如,經過 OPO 優化后,GPT-4 的準確度從 84.83% 提升至 94.65%。此外,國產大模型 Qwen-Chat-14B 和 XuanYuan-70B 在應用 OPO 后的表現不僅與 GPT-4 不相上下,而且略微優勝。

圖片

表5:各個大模型在 H-Law 與 A-Law 上的原始準確率(Base)、應用 OPO 后的準確率(OPO)、將生成題目用到的準則替換 OPO 中檢索得到的準則后的準確率(Oracle)。圖片 表示 OPO 相比 Base 的絕對提升,而 圖片 表示 Oracle 相比 Base 的絕對提升。

在 H-Basic-Morality、H-Social-Morality 和 A-Professional-Morality 等 3 個道德測試基準上,能觀察到類似的現象。OPO 能提升所有模型在 A-Professional-Morality 上的表現,提升大部分模型在 H-Basic-Morality 和 H-Social-Morality 上的分數。

圖片

表6:各個大模型在 H-Basic-Morality、H-Social-Morality 和 A-Professional-Morality 上的原始準確率(Base)、應用 OPO 后的準確率(OPO)、將生成選擇題用到的準則替換 OPO 中檢索得到的準則后的準確率(Oracle)。圖片 表示 OPO 相比 Base 的絕對提升,而 圖片 表示 Oracle 相比 Base 的絕對提升。

同時,研究者還探索了不同檢索長度對 OPO 方法的影響。檢索回來的文本長度最大值分別設置成 200、500、1000、1500、2000,發現大部分模型在不同的測試基準上均具有相似的趨勢:隨著檢索長度的增加,模型的性能先上升后下降。可能得原因是,較短的文本提供了有益信息,而更長的檢索內容引入了噪聲。

圖片

圖 3:在 H-law 基準上,改變檢索長度對 OPO 效果的影響。

圖片

圖 4:在 A-law 基準上,改變檢索長度對 OPO 效果的影響。

圖片

圖 5:在 H-Basic-Morality 基準上,改變檢索長度對 OPO 效果的影響。

圖片

圖 6:在 H-Social-Morality 基準上,改變檢索長度對 OPO 效果的影響。

圖片

圖 7:在 A-Professional-morality 基準上,改變檢索長度對 OPO 效果的影響。

總結

總結來說,GAIR 研究組提出了一個無需訓練實現價值觀實時動態對齊的方法 OPO,能夠作用于開源模型與閉源模型。同時,為了緩解測試數據泄露的問題并擴大測試數據的數量與覆蓋范圍,研究者介紹了一個可擴展的評估模塊用于根據準則自動生成測試問題。實驗證明 OPO 能夠顯著提升不同大模型在 5 個測試基準上的性能。此外,也公開了收集的所有法律準則與道德準則,以及 5 個測試基準中所使用的所有數據。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2021-03-30 10:41:48

比特幣加密貨幣貨幣

2024-12-19 17:52:27

2020-07-24 09:39:40

大數據信息價值觀技術

2021-09-08 14:38:34

開放式社會規范環境

2011-06-19 09:15:25

搜索引擎

2021-08-30 11:30:47

互聯網數據技術

2012-11-20 16:53:43

白永祥

2009-02-04 18:07:04

服務器虛擬化戴爾

2023-06-14 15:20:37

模型訓練

2015-06-01 15:00:22

程序員

2023-01-13 15:37:27

團隊軟件開發集成

2023-10-16 12:32:00

OpenAI價值觀AGI

2018-07-06 10:47:26

數據

2015-05-27 13:35:34

程序員無價之寶

2023-07-14 14:14:07

模型開源

2019-06-20 09:38:04

谷歌Android開發者

2015-12-02 18:20:36

華為

2019-05-17 10:08:55

大數據IT人工智能

2016-09-24 23:21:57

2023-10-16 13:36:36

點贊
收藏

51CTO技術棧公眾號

国产高清一区在线观看| 亚洲精品综合精品自拍| 视频一区视频二区国产精品| 亚洲美女搞黄| www.美色吧.com| 欧美日韩欧美| 秋霞影院一区二区| 日韩欧美精品在线观看| 91免费国产网站| 少妇人妻好深好紧精品无码| av不卡高清| 国产精品综合久久| xxx一区二区| 黄色免费网址大全| 天天色棕合合合合合合合| 99精品网站| 91国偷自产一区二区开放时间 | 久久综合亚洲精品| 免费观看成人毛片| 高潮按摩久久久久久av免费| 成人免费在线视频观看| 国产精品av免费在线观看| 亚洲啪av永久无码精品放毛片 | 中文字幕亚洲乱码熟女1区2区| 99国产精品免费网站| 亚洲摸摸操操av| 成人免费直播live| 亚洲天堂黄色片| 亚洲国产天堂| 亚洲啪啪综合av一区二区三区| 国产日本欧美在线观看| 91香蕉视频污在线观看| 亚洲精品毛片| 国产精品卡一卡二卡三| 成人xvideos免费视频| av大片在线免费观看| 亚洲桃色综合影院| 91国产丝袜在线播放| 国产美女在线一区| 日本中文字幕电影在线观看| 性娇小13――14欧美| 亚洲色图色老头| 日本免费色视频| 在线观看午夜av| 成人av在线网站| 日韩免费在线观看视频| 午夜激情福利电影| 成人在线一区| 日韩一区二区电影在线| 九九爱精品视频| 日本在线视频中文有码| 91女人视频在线观看| 日韩av免费在线观看| 精品91久久久| 日韩电影二区| 精品国产人成亚洲区| 久久久久久久久久久免费视频| 成人免费视频| 国产不卡高清在线观看视频| 日本中文字幕久久看| 日本中文字幕第一页| 久久人人97超碰国产公开结果| www.xxxx欧美| 国产麻豆视频在线观看| 日本一区福利在线| 欧美一区二区三区在线看| 5月婷婷6月丁香| 韩国av网站在线| 91麻豆精品视频| 日本公妇乱淫免费视频一区三区| 又污又黄的网站| 激情欧美日韩| 在线电影av不卡网址| 国产精九九网站漫画| 北条麻妃一区二区三区在线观看| 亚洲福利视频在线| 日韩av片专区| 久久国产精品美女| 欧美主播一区二区三区美女| 妺妺窝人体色777777| 国产拍在线视频| 亚洲精品中文字幕在线观看| 欧美这里只有精品| 精品国产丝袜高跟鞋| 亚洲精品日韩一| 欧美在线观看黄| 天堂网在线最新版www中文网| 日韩久久一区二区| 欧美性视频在线播放| 国产乱理伦片a级在线观看| 亚洲国产精品激情在线观看| 国产综合动作在线观看| 午夜精品久久久久久久91蜜桃| 青青国产91久久久久久| 91亚洲va在线va天堂va国| 日本黄色不卡视频| 福利视频网站一区二区三区| 美国av一区二区三区| 刘亦菲久久免费一区二区| 韩国av一区二区三区在线观看| 国产精欧美一区二区三区| 一级特黄录像免费看| 可以免费看不卡的av网站| 成人精品视频在线| 国产91免费看| 亚洲欧洲日产国码二区| 国产综合av在线| 91视频成人| 亚洲片国产一区一级在线观看| 97成人资源站| 免费在线看一区| 国产精品免费久久久久影院| 国产真人无遮挡作爱免费视频| 亚洲欧美卡通另类91av| 成人羞羞国产免费| 欧美精品久久久久久久久久丰满| 97久久超碰国产精品| 久久艹中文字幕| 你懂的视频在线| 一区二区三区四区亚洲| 999一区二区三区| 国产精品.xx视频.xxtv| 欧美日韩第一区日日骚| 国产又粗又长又爽又黄的视频| 免费一区二区三区在线视频| 国产亚洲欧洲高清一区| 国产黄色录像视频| 亚洲国产精品综合久久久| 久久综合色影院| 欧美成人一区二区三区高清| 影音先锋亚洲精品| 91亚洲精品久久久久久久久久久久| 日韩三级电影网| 亚洲大片免费看| 国产免费黄色av| 日本精品另类| 欧美一区二区三区成人| 久久午夜精品视频| 日本视频一区二区三区| 欧美另类高清视频在线| 9191在线| 亚洲午夜久久久久久久久电影院| 无码人妻丰满熟妇区96| 97一区二区国产好的精华液| 超在线视频97| aaa一区二区三区| 91在线观看免费视频| 国产午夜精品视频一区二区三区| 国产不卡精品| 亚洲韩国青草视频| 国产精品成人无码免费| 久久综合九色综合欧美狠狠| 欧美二区三区在线| 免费亚洲电影| 91精品国产综合久久香蕉麻豆| 中文字幕在线永久| 亚洲高清在线| 精品乱色一区二区中文字幕| 色大18成网站www在线观看| 亚洲一区二区偷拍精品| 免费观看一区二区三区| 精品一区av| 国内精品在线一区| 97精品人妻一区二区三区香蕉| 国产农村妇女精品| 女人帮男人橹视频播放| 美女视频一区| 精品夜色国产国偷在线| 美女视频黄免费| 青草av.久久免费一区| 亚洲欧美精品| 国产区一区二| 久久免费视频在线| 欧美伦理影视网| 欧美日韩免费观看一区二区三区 | 69影院欧美专区视频| 91tv国产成人福利| 一区二区三区色| 手机在线成人av| 日本视频一区二区三区| 亚洲精品国产suv一区88| 亚洲欧美校园春色| 国产日韩在线观看av| 免费av不卡在线观看| 欧美日本国产视频| 久久久久亚洲av成人片| 日本麻豆一区二区三区视频| 97超碰人人爱| 婷婷激情成人| 国模精品系列视频| 91女主播在线观看| 日韩欧美国产高清| 你懂得在线观看| 成人福利视频在线| 久久久精品麻豆| 黄色精品网站| 国产精品xxxx| 美女精品导航| 国产午夜精品美女视频明星a级| 国产女无套免费视频| 中文一区二区在线观看 | 99热这里都是精品| 97av中文字幕| 麻豆国产一区二区三区四区| 91po在线观看91精品国产性色| a视频网址在线观看| 精品福利二区三区| 国产又粗又长视频| 亚洲国产精品成人综合 | 伊人网站在线观看| 国产亚洲午夜高清国产拍精品| 乱妇乱女熟妇熟女网站| 夜间精品视频| 97人人模人人爽人人少妇| a天堂中文在线官网在线| 9191国产精品| www毛片com| 亚洲国产成人va在线观看天堂| 日本美女xxx| 波多野结衣在线一区| 欧美性受xxxx黒人xyx性爽| 日韩激情在线观看| 一区二区欧美日韩| 国产区一区二| 国产精品爽黄69天堂a| 免费av在线| 亚洲色图美腿丝袜| 日本高清中文字幕二区在线| 精品国产在天天线2019| 国产高清视频免费| 欧美巨大另类极品videosbest| 久久精品黄色片| 国产精品久久久久9999吃药| 亚洲免费在线播放视频| 老司机精品久久| 欧美 日韩 国产一区| 日韩午夜精品| 日韩成人av电影在线| 久久精品国产福利| 国产999精品久久久| 亚洲国产欧美日本视频| 91成人福利在线| 国产精品vvv| 91国自产精品中文字幕亚洲| 久草在线视频网站| 久久久综合免费视频| 超黄网站在线观看| 中文在线不卡视频| www.四虎在线观看| 91精品国产高清一区二区三区 | 最新国产精品久久| 一区二区三区在线免费看| 97超级碰在线看视频免费在线看 | 91久久久久久久久久久| 亚洲国产天堂| 97netav| 91久久精品无嫩草影院| 丁香婷婷久久久综合精品国产| 一区二区三区亚洲变态调教大结局| 3d蒂法精品啪啪一区二区免费| 精品国产麻豆| 国产伦一区二区三区色一情| 亚洲欧美在线成人| 欧美激情videos| av片在线看| www国产精品com| av黄在线观看| 亚洲97在线观看| 一二三四区在线观看| 欧美肥臀大乳一区二区免费视频| 黑人精品视频| 欧美综合在线观看| 成人在线高清免费| 欧美整片在线观看| 成人在线高清| 亚洲最大成人网色| 国产亚洲欧美日韩精品一区二区三区 | 中文字幕一区二区三区中文字幕| 国产日韩欧美一区二区三区四区 | 中文精品一区二区三区| 欧美日韩三级电影在线| 日韩尤物视频| 欧美激情视频一区二区三区免费| 性欧美大战久久久久久久免费观看| 成人av影音| 欧美在线3区| 在线成人超碰| 日本精品一区在线观看| 久久99国产精品免费| 第四色婷婷基地| 久久久噜噜噜| 日韩av黄色网址| 麻豆精品久久久| 一区二区成人网| 久色成人在线| 又黄又爽又色的视频| 国产在线视频不卡二| 欧美成年人视频在线观看| 国产.欧美.日韩| www.av天天| 欧美激情中文字幕| 欧美日韩免费做爰视频| 91久久精品一区二区二区| 精品国产va久久久久久久| 亚洲天堂男人天堂| a级片在线免费| 国产一区二区在线播放| 日本欧美韩国国产| 久久久天堂国产精品| 日韩电影在线观看电影| 国模无码视频一区| 最新日韩在线视频| 区一区二在线观看| 精品国产一区a| 久草资源在线| 国产精品男人的天堂| 米奇精品关键词| 精品久久久久久综合日本| 在线中文字幕第一区| 99草草国产熟女视频在线| 日韩高清欧美激情| 精品人妻二区中文字幕| 中文字幕亚洲区| 天天爱天天做天天爽| 亚洲精品电影网站| 丝袜国产在线| 亚洲va电影大全| 久久久久久久久国产一区| 中文字幕在线导航| 久久久久久久久久看片| 蜜桃av免费在线观看| 亚洲人成电影网站色mp4| 最近中文字幕在线视频| 欧美一区二区性放荡片| 91伦理视频在线观看| 国产精品女主播视频| 国产一区二区三区91| 中文字幕中文字幕99| 日本va欧美va精品| 久久午夜福利电影| 一本色道a无线码一区v| 国产老女人乱淫免费| 亚洲开心激情网| 97成人资源| 96精品久久久久中文字幕| 国产大片一区| 天堂av8在线| 亚洲欧美激情一区二区| 国产精品久久久久久久免费| 久久精品国产久精国产思思| 狠狠操一区二区三区| 国产女人水真多18毛片18精品| 精品999日本| 国产成人精品无码片区在线| 欧美日韩性生活视频| 国产精品视频久久久久久| 自拍亚洲一区欧美另类| 9999在线精品视频| 国产一级不卡视频| 91在线观看视频| 波多野结衣小视频| 久久精品国产精品亚洲| 日韩一区二区三区在线看| 日韩在线观看电影完整版高清免费| 日韩不卡一区二区三区| 99热99这里只有精品| 欧美一区二区人人喊爽| 丝袜在线视频| 久久久久久久有限公司| 日日夜夜精品免费视频| 午夜爽爽爽男女免费观看| 精品国产伦一区二区三区观看体验| 日本在线啊啊| 高清国产在线一区| 在线亚洲自拍| 国产传媒视频在线| 日韩美女在线视频| 久久青青视频| 中文字幕一区二区三区四区五区六区 | a级影片在线观看| 精品国产日本| 日本va欧美va瓶| 久久免费视频精品| 亚洲天堂av网| 久久影院一区二区三区| 九色在线视频观看| 中文字幕在线免费不卡| 成人毛片在线免费观看| 国产精品福利网| 免费一区二区三区视频导航| 色欲色香天天天综合网www| 久久蜜桃一区二区| 69成人免费视频| 久久精品成人动漫| 三级精品视频| 5月婷婷6月丁香| 亚洲欧洲精品天堂一级| 天天摸天天碰天天爽天天弄| 成人免费在线视频网址| 乱码第一页成人|