精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

模型偏好只與大小有關(guān)?上交大全面解析人類與32種大模型偏好的定量組分

人工智能 新聞
上海交通大學(xué)生成式人工智能實(shí)驗(yàn)室(GAIR)發(fā)布了一項(xiàng)新研究成果,對人類用戶與多達(dá) 32 種流行的大語言模型所展現(xiàn)出的偏好進(jìn)行了系統(tǒng)性的全面解析,以了解不同來源的偏好數(shù)據(jù)是如何由各種預(yù)定義屬性(如無害,幽默,承認(rèn)局限性等)定量組成的。

在目前的模型訓(xùn)練范式中,偏好數(shù)據(jù)的的獲取與使用已經(jīng)成為了不可或缺的一環(huán)。在訓(xùn)練中,偏好數(shù)據(jù)通常被用作對齊(alignment)時的訓(xùn)練優(yōu)化目標(biāo),如基于人類或 AI 反饋的強(qiáng)化學(xué)習(xí)(RLHF/RLAIF)或者直接偏好優(yōu)化(DPO),而在模型評估中,由于任務(wù)的復(fù)雜性且通常沒有標(biāo)準(zhǔn)答案,則通常直接以人類標(biāo)注者或高性能大模型(LLM-as-a-Judge)的偏好標(biāo)注作為評判標(biāo)準(zhǔn)。

盡管上述對偏好數(shù)據(jù)的應(yīng)用已經(jīng)取得了廣泛的成效,但對偏好本身則缺乏充足的研究,這很大程度上阻礙了對更可信 AI 系統(tǒng)的構(gòu)建。為此,上海交通大學(xué)生成式人工智能實(shí)驗(yàn)室(GAIR)發(fā)布了一項(xiàng)新研究成果,對人類用戶與多達(dá) 32 種流行的大語言模型所展現(xiàn)出的偏好進(jìn)行了系統(tǒng)性的全面解析,以了解不同來源的偏好數(shù)據(jù)是如何由各種預(yù)定義屬性(如無害,幽默,承認(rèn)局限性等)定量組成的。

進(jìn)行的分析有如下特點(diǎn):

  • 注重真實(shí)應(yīng)用:研究中采用的數(shù)據(jù)均來源于真實(shí)的用戶 - 模型對話,更能反映實(shí)際應(yīng)用中的偏好。
  • 分場景建模:對屬于不同場景下的數(shù)據(jù)(如日常交流,創(chuàng)意寫作)獨(dú)立進(jìn)行建模分析,避免了不同場景之間的互相影響,結(jié)論更清晰可靠。
  • 統(tǒng)一框架:采用了一個統(tǒng)一的框架解析人類與大模型的偏好,并且具有良好的可擴(kuò)展性。

該研究發(fā)現(xiàn):

  • 人類用戶對模型回復(fù)中錯誤之處的敏感度較低,對承認(rèn)自身局限導(dǎo)致拒絕回答的情況有明顯的厭惡,且偏好那些支持他們主觀立場的回復(fù)。而像 GPT-4-Turbo 這樣的高級大模型則更偏好于那些沒有錯誤,表達(dá)清晰且安全無害的回復(fù)。
  • 尺寸接近的大模型會展現(xiàn)出相似的偏好,而大模型對齊微調(diào)前后幾乎不會改變其偏好組成,僅僅會改變其表達(dá)偏好的強(qiáng)度。
  • 基于偏好的評估可以被有意地操縱。鼓勵待測模型以評估者喜歡的屬性進(jìn)行回復(fù)可以提高得分,而注入最不受歡迎的屬性則會降低得分。

圖 1:人類,GPT-4-Turbo 與 LLaMA-2-70B-Chat 在 “日常交流” 場景下的偏好解析結(jié)果,數(shù)值越大代表越偏好該屬性,而小于 50 則表示對該屬性的厭惡。

本項(xiàng)目已經(jīng)開源了豐富的內(nèi)容與資源:

  • 可交互式演示:包含了所有分析的可視化及更多論文中未詳盡展示的細(xì)致結(jié)果,同時也支持上傳新的模型偏好以進(jìn)行定量分析。
  • 數(shù)據(jù)集:包含了本研究中所收集的用戶 - 模型成對對話數(shù)據(jù),包括來自真實(shí)用戶以及多達(dá) 32 個大模型的偏好標(biāo)簽,以及針對所定義屬性的詳細(xì)標(biāo)注。
  • 代碼:提供了收集數(shù)據(jù)所采用的自動標(biāo)注框架及其使用說明,此外也包括了用于可視化分析結(jié)果的代碼。

  • 論文:https://arxiv.org/abs/2402.11296
  • 演示:https://huggingface.co/spaces/GAIR/Preference-Dissection-Visualization
  • 代碼:https://github.com/GAIR-NLP/Preference-Dissection
  • 數(shù)據(jù)集:https://huggingface.co/datasets/GAIR/preference-dissection
方法介紹

該研究收集了來自 ChatbotArena Conversations 數(shù)據(jù)集中大量來自真實(shí)應(yīng)用中的成對用戶 - 模型對話數(shù)據(jù)。每個樣本點(diǎn)由一個用戶問詢與兩個不同的模型回復(fù)組成。研究者們首先收集了人類用戶與不同大模型在這些樣本上的偏好標(biāo)簽,其中人類用戶的標(biāo)簽已經(jīng)包含在所選用的原始數(shù)據(jù)集內(nèi),而 32 個選用的開源或閉源的大模型的標(biāo)簽則由研究者額外進(jìn)行推理與收集。

該研究首先構(gòu)建了一套基于 GPT-4-Turbo 的自動標(biāo)注框架,為所有的模型回復(fù)標(biāo)注了它們在預(yù)先定義的 29 個屬性上的得分,隨后基于一對得分的比較結(jié)果可以得到樣本點(diǎn)在每個屬性上的 “比較特征”,例如回復(fù) A 的無害性得分高于回復(fù) B,則該屬性的比較特征為 + 1,反之則為 - 1,相同時為 0。

利用所構(gòu)建的比較特征與收集到的二元偏好標(biāo)簽,研究者們可以通過擬合貝葉斯線性回歸模型的方式,以建模比較特征到偏好標(biāo)簽之間的映射關(guān)系,而擬合得到的模型中對應(yīng)于每個屬性的模型權(quán)重即可被視作該屬性對于總體偏好的貢獻(xiàn)程度。

由于該研究收集了多種不同來源的偏好標(biāo)簽,并進(jìn)行了分場景的建模,因而在每個場景下,對于每個來源(人類或特定大模型),都能夠得到一組偏好到屬性的定量分解結(jié)果。

圖 2:分析框架的總體流程示意圖

分析結(jié)果

該研究首先分析比較了人類用戶與以 GPT-4-Turbo 代表的高性能大模型在不同場景下最偏好與最不偏好的三個屬性。可以看出,人類對錯誤的敏感程度顯著低于 GPT-4-Turbo,且厭惡承認(rèn)局限性而拒絕回答的情形。此外,人類也對迎合自己主觀立場的回復(fù)表現(xiàn)出明顯的偏好,而并不關(guān)心回復(fù)中是否糾正了問詢中潛在的錯誤。與之相反,GPT-4-Turbo 則更注重回復(fù)的正確性,無害性與表達(dá)的清晰程度,并且致力于對問詢中的模糊之處進(jìn)行澄清。

圖 3:人類與 GPT-4-Turbo 在不同場景或問詢滿足的前提下最偏好與最不偏好的三個屬性

圖片

圖 4:人類與 GPT-4-Turbo 對于輕微 / 適中 / 嚴(yán)重程度的錯誤的敏感程度,值接近 50 代表不敏感。

此外,該研究還探索了不同大模型之間的偏好組分的相似程度。通過將大模型劃分為不同組并分別計算組內(nèi)相似度與組間相似度,可以發(fā)現(xiàn)當(dāng)按照參數(shù)量(<14B 或 > 30B)進(jìn)行劃分時,組內(nèi)相似度(0.83,0.88)明顯高于組間相似度(0.74),而按照其他因素劃分時則沒有類似的現(xiàn)象,表明大模型的偏好很大程度上決定于其尺寸,而與訓(xùn)練方式無關(guān)。

圖 5:不同大模型(包括人類)之間偏好的相似程度,按參數(shù)量排列。

另一方面,該研究也發(fā)現(xiàn)經(jīng)過對齊微調(diào)后的大模型表現(xiàn)出的偏好與僅經(jīng)過預(yù)訓(xùn)練的版本幾乎一致,而變化僅發(fā)生在表達(dá)偏好的強(qiáng)度上,即對齊后的模型輸出兩個回復(fù)對應(yīng)候選詞 A 與 B 的概率差值會顯著增加。

圖 6:大模型在對齊微調(diào)前后的偏好變化情況

最后,該研究發(fā)現(xiàn),通過將人類或大模型的偏好定量分解到不同的屬性,可以對基于偏好的評估結(jié)果進(jìn)行有意地操縱。在目前流行的 AlpacaEval 2.0 與 MT-Bench 數(shù)據(jù)集上,通過非訓(xùn)練(設(shè)置系統(tǒng)信息)與訓(xùn)練(DPO)的方式注入評估者(人類或大模型)的偏好的屬性均可顯著提升分?jǐn)?shù),而注入不受偏好的屬性則會降低得分。

圖 7:對 MT-Bench 與 AlpacaEval 2.0 兩個基于偏好評估的數(shù)據(jù)集進(jìn)行有意操縱的結(jié)果

總結(jié)

本研究詳細(xì)分析了人類和大模型偏好的量化分解。研究團(tuán)隊發(fā)現(xiàn)人類更傾向于直接回答問題的回應(yīng),對錯誤不太敏感;而高性能大模型則更重視正確性、清晰性和無害性。研究還表明,模型大小是影響偏好組分的一個關(guān)鍵因素,而對其微調(diào)則影響不大。此外,該研究展示了當(dāng)前若干數(shù)據(jù)集在了解評估者的偏好組分后易被操縱,表明了基于偏好評估的不足。研究團(tuán)隊還公開了所有研究資源,以支持未來的進(jìn)一步研究。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2024-02-02 21:42:41

2023-08-22 13:21:07

AI算法

2025-03-13 09:47:29

2025-04-15 08:44:43

2024-06-05 09:59:13

2024-03-05 09:00:00

大型語言模型Mistral-7b人工智能

2025-06-26 15:16:42

AI獎勵模型GPT-4.1

2023-11-13 19:35:12

訓(xùn)練數(shù)據(jù)

2024-10-23 09:00:00

2010-08-04 14:34:35

Flex編程模型

2017-08-07 11:09:19

機(jī)器學(xué)習(xí)用戶推薦轉(zhuǎn)化率

2024-08-15 15:20:00

模型生成

2023-10-20 12:17:57

AI數(shù)據(jù)

2025-07-01 07:24:56

2025-04-28 12:28:27

2025-09-16 09:35:52

2015-02-28 10:26:54

JMP

2025-03-06 07:28:31

DeepSeek大模型人工智能

2024-09-03 17:43:54

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

亚洲一区在线不卡| 免费av一区二区| 熟女少妇在线视频播放| 日本人妻丰满熟妇久久久久久| 你懂的一区二区| 91国偷自产一区二区开放时间| 欧美日韩在线精品| 久久午夜鲁丝片| 欧美禁忌电影网| 欧美午夜不卡在线观看免费| 这里只有精品66| 精品久久国产视频| 夜夜嗨av一区二区三区网站四季av| 欧美精品一区二区三区高清aⅴ| 国产精品无码av在线播放| 青青草av免费在线观看| 久久国产精品久久久久久电车| 国产亚洲精品高潮| 国产农村妇女精品久久| 国精一区二区三区| 久久亚洲综合色一区二区三区 | 亚洲av永久无码国产精品久久 | 国产网友自拍视频| 精品国产不卡| 精品少妇一区二区三区视频免付费| 欧美午夜小视频| 你懂的在线网址| 久久激情五月激情| 欧美精品久久久久a| a级在线免费观看| 日韩精品一区国产| 色欧美日韩亚洲| 亚洲黄色一区二区三区| 丰满人妻熟女aⅴ一区| 久久一区视频| 久久99精品久久久久久青青91| xxxx日本免费| 日韩欧美激情电影| 91激情五月电影| 亚洲成人动漫在线| 免费在线黄色网址| 国产精品12区| 国产精品美女网站| 国产成人免费观看视频 | 欧美大胆人体bbbb| 91欧美视频在线| 天堂中文av在线资源库| 亚洲人成在线播放网站岛国 | 国产成人a亚洲精v品无码| 久久亚洲天堂| 国产亚洲精品超碰| 精品国产乱码一区二区三区四区| 亚洲视频在线观看一区二区| 一区二区三区高清视频在线观看| 不卡av在线播放| 午夜精产品一区二区在线观看的| 国产精品视频3p| 日韩亚洲欧美一区| 国产一伦一伦一伦| 美女日批视频在线观看| 中文字幕一区在线观看视频| 茄子视频成人在线观看 | 欧美日韩一区综合| 亚洲av成人无码久久精品老人| 岛国一区二区在线观看| 91精品久久久久久久久久久| 欧美性受xxx黑人xyx性爽| 亚洲综合欧美| 情事1991在线| 久久青青草视频| 亚洲毛片av| 亚洲2020天天堂在线观看| 懂色av蜜臀av粉嫩av永久| 欧美精品系列| 亚洲香蕉av在线一区二区三区| 不卡一区二区在线观看| 婷婷综合成人| 亚洲男人av电影| 五月天丁香社区| 国产精品22p| 日韩精品一区二| 香蕉久久久久久av成人| gogo久久日韩裸体艺术| 亚洲成年人影院在线| 欧美一区二区三区影院| 一区二区三区免费在线看| 在线播放国产精品二区一二区四区| 午夜久久久精品| 99re8精品视频在线观看| 91精品国产aⅴ一区二区| 亚洲三级在线视频| 成人动漫视频| 亚洲男子天堂网| 少妇的滋味中文字幕bd| 国产精品久久久久久久久久10秀 | 成年人视频在线观看免费| 国产亚洲精品久| 这里只有精品66| 18网站在线观看| 午夜dj在线观看高清视频完整版| 久久久激情视频| 日本一区二区精品视频| 青青青青在线| 中文文精品字幕一区二区| 品久久久久久久久久96高清| 精华区一区二区三区| 国产精品久久久久久妇女6080 | 久久激情av| 亚洲人午夜色婷婷| 国产一区在线观看免费| 午夜日韩在线| 欧美一区二区.| 亚洲天堂网视频| 成人小视频在线| 日韩国产精品一区二区| а天堂中文在线官网| 亚洲成a人v欧美综合天堂| 免费国产成人av| 激情综合婷婷| 日韩av影视综合网| 亚洲aaa视频| 野花国产精品入口| 成人信息集中地欧美| 精品国产九九九| 久久久一区二区三区| 久久视频免费在线| 欧亚一区二区| 亚洲国产精品成人av| 久久久国产一级片| 亚洲精品免费观看| 国产精品流白浆视频| 日本高清视频www| 国产精品黄色在线观看| 九色自拍视频在线观看| 高清精品久久| 亚洲男人的天堂在线播放| 欧美成人一二三区| 蜜桃久久久久久| 久久国产精品一区二区三区四区| а√天堂8资源在线官网| 精品视频在线免费观看| 国产精品av久久久久久无| 另类激情亚洲| 品久久久久久久久久96高清| 欧美人体一区二区三区| 亚洲精品丝袜日韩| 欧美brazzers| 亚洲国产成人一区二区三区| 国产免费999| 精品免费av| 国产精品久久久久久av福利| 激情在线视频| 欧美午夜精品电影| 91制片厂在线| 国产一区二区三区不卡在线观看| 激情图片qvod| 日韩一二三区| 久久久免费电影| 色偷偷在线观看| 欧美日韩国产一区中文午夜| 青青草成人免费视频| 亚洲女人av| 日韩一区国产在线观看| 福利一区二区三区视频在线观看| 日韩在线观看精品| jizz中国少妇| 亚洲.国产.中文慕字在线| 国产又黄又粗又猛又爽的视频| 国产精品久久久一区二区| 欧美日韩精品免费观看| 国产精品久久久久77777丨| 久热精品视频在线观看一区| 亚洲国产成人一区二区| 天天色综合天天| 三年中国中文观看免费播放| 久久机这里只有精品| 亚洲精品无码国产| 精品影片在线观看的网站| 国产精品入口夜色视频大尺度| 欧美激情视频在线播放| 精品日产卡一卡二卡麻豆| 日韩久久中文字幕| 1区2区3区精品视频| zjzjzjzjzj亚洲女人| 久久一区二区三区四区五区| 在线免费观看一区二区三区| 白嫩白嫩国产精品| 国产精品99免视看9| 午夜dj在线观看高清视频完整版| 日韩高清a**址| 一区二区三区免费在线| 亚洲成a天堂v人片| 国产三级在线观看完整版| 国产激情视频一区二区三区欧美 | 国精一区二区三区| 一道本无吗dⅴd在线播放一区 | 亚洲天堂成人在线| av手机免费看| 色天天综合久久久久综合片| 18岁成人毛片| 久久久精品国产99久久精品芒果 | 久久中文字幕视频| 亚欧洲精品视频| 91精品国产免费| 狠狠狠狠狠狠狠| 亚洲国产精品一区二区尤物区| 能直接看的av| 91亚洲国产成人精品一区二三 | 国产三级av片| 亚洲女人****多毛耸耸8| 黄色正能量网站| 精品无人区卡一卡二卡三乱码免费卡| 日韩在线综合网| 中文字幕免费一区二区| 日产精品一线二线三线芒果| 大陆精大陆国产国语精品| 成人a级免费视频| 成人看片网页| 2019日本中文字幕| 欧美hdxxxxx| 久久亚洲精品中文字幕冲田杏梨| 青青久草在线| 日韩激情在线视频| 亚洲精品无码久久久| 6080国产精品一区二区| 波多野结衣电车痴汉| 精品久久久久久亚洲精品| 国产一级视频在线| 一区二区三区四区国产精品| 三级av在线免费观看| 国产女主播一区| 熟女俱乐部一区二区| 99久久精品一区| 成熟妇人a片免费看网站| 国产精品99久久久久久有的能看| 日韩一区二区三区久久| 日本vs亚洲vs韩国一区三区二区| heyzo国产| 99伊人成综合| 无码熟妇人妻av在线电影| 午夜av一区| 亚洲国产另类久久久精品极度| 不卡中文字幕| 亚洲成人午夜在线| 日韩一区二区在线免费| 亚洲成色最大综合在线| 成人在线免费观看网站| 色大师av一区二区三区| 欧美综合一区| 亚洲午夜精品国产| 婷婷综合视频| 国产91在线亚洲| 亚洲福利免费| 欧美在线观看成人| 国产精品视频| 日韩欧美黄色大片| 美腿丝袜亚洲三区| 91在线第一页| 成人一区二区三区| 四虎永久免费影院| 欧美激情综合五月色丁香| 三级黄色片在线观看| 亚洲欧洲综合另类| 国产精品成人aaaa在线| 色欲综合视频天天天| 国产一级片一区二区| 欧美高清视频在线高清观看mv色露露十八| 国产精品无码一区二区桃花视频| 欧美成人精品1314www| 婷婷五月综合久久中文字幕| 亚洲欧美视频在线| 欧美尤物美女在线| 欧美激情精品在线| 高潮一区二区| 成人免费自拍视频| 极品束缚调教一区二区网站| 免费99视频| 97视频热人人精品免费| cao在线观看| 免费观看在线综合| 丰满熟女人妻一区二区三区| 久久伊99综合婷婷久久伊| 亚洲精品一区二区三区在线播放| 一区二区三区国产| 精产国品一区二区| 91麻豆精品国产| 亚洲 欧美 自拍偷拍| 在线视频日本亚洲性| 性欧美ⅴideo另类hd| 青青久久aⅴ北条麻妃| 成人网av.com/| 久久亚洲一区二区| 希岛爱理一区二区三区| 波多野结衣综合网| 久久机这里只有精品| 性欧美丰满熟妇xxxx性久久久| 国产精品免费aⅴ片在线观看| 日韩激情一区二区三区| 欧美日韩一区二区三区视频| 欧美 日韩 国产 成人 在线| 中文字幕亚洲无线码在线一区| 爱啪视频在线观看视频免费| 国产日韩欧美中文| 美女av一区| 欧美黄网在线观看| 精品制服美女丁香| 日韩人妻无码一区二区三区| 亚洲精品视频在线看| 中文字幕第315页| 日韩成人av在线| 日本色护士高潮视频在线观看 | 精品久久国产一区| 欧美日韩在线精品| 亚洲激情婷婷| 欧美xxxx黑人| 国产精品国产三级国产有无不卡| 六月丁香激情综合| 精品国产乱码久久久久久图片 | aaa一区二区三区| 中文字幕精品久久久久| 在线观看网站免费入口在线观看国内| 91精品久久久久久蜜桃| 999国产精品视频| 日本熟妇人妻中出| 91在线视频播放| 日产亚洲一区二区三区| 精品日韩一区二区| 色呦呦呦在线观看| 3d蒂法精品啪啪一区二区免费| 国产精品成人一区二区不卡| 中文字幕第80页| 欧美国产精品专区| 岛国av中文字幕| 亚洲深夜福利网站| 无遮挡爽大片在线观看视频| 国产一区在线观| 亚洲免费观看| 一本加勒比波多野结衣| 欧美日韩在线视频一区二区| 婷婷久久久久久| 欧美野外猛男的大粗鳮| 希岛爱理av免费一区二区| 无码人妻丰满熟妇区96| 91在线视频在线| 毛片基地在线观看| 亚洲美腿欧美激情另类| 88xx成人免费观看视频库| 色综合久久88色综合天天提莫| 日韩—二三区免费观看av| 国产sm调教视频| 欧美视频在线观看一区二区| 色老头视频在线观看| 91久久久亚洲精品| 欧美黄色aaaa| 亚州av综合色区无码一区| 欧美性xxxxx| 国产日本在线观看| 国产美女被下药99| 欧美91大片| 中文字幕人妻一区| 欧美色播在线播放| 在线日本中文字幕| 91欧美视频网站| 亚洲大胆av| 国产特黄级aaaaa片免| 欧美性猛片aaaaaaa做受| 欧美a免费在线| 99爱精品视频| 国产日韩欧美一区在线| 免费黄在线观看| 91超碰这里只有精品国产| 黄色污污视频在线观看| 久久精品日产第一区二区三区| 日韩黄色小视频| 午夜国产福利一区二区| 欧美精品一区二区三区视频| 成人开心激情| 大地资源网在线观看免费官网| eeuss国产一区二区三区| 在线观看亚洲黄色| 九色91av视频| 久久99蜜桃| 日本黄色一级网站| 色婷婷久久久亚洲一区二区三区| 日本高清视频在线播放| 国产精品有限公司| 免费高清成人在线| 精品无码m3u8在线观看| 国产亚洲精品综合一区91| 免费精品一区二区三区在线观看| 日本福利视频在线| 成人欧美一区二区三区视频网页| 性xxxx视频| 91成人理论电影| 丝瓜av网站精品一区二区 | 蜜臀av粉嫩av懂色av| 精品污污网站免费看| 美女在线视频免费| 992tv快乐视频| 中文字幕免费观看一区|