精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

越可靠的AI就越人機,牛津大學:高情商模型錯誤率顯著增加

人工智能
牛津大學一項研究的結論,可以來參考看看:訓練模型變得溫暖且富有同理心,會使它們變得不太可靠且更加奉承。

情緒價值這塊兒,GPT-5讓很多網友大呼失望。

免費用戶想念GPT-4o,也只能默默調理了。

圖片

但為什么升級后的GPT-5,反而變得“不近人情”了呢?

牛津大學一項研究的結論,可以來參考看看:訓練模型變得溫暖且富有同理心,會使它們變得不太可靠且更加奉承

圖片

這篇論文表明,溫暖模型的錯誤率較原始模型顯著增加(提升10至30個百分點),表現為更易傳播陰謀論、提供錯誤事實和有問題的醫療建議。

納尼?意思是智商和情商不可兼得,情緒價值和功能價值必須二選一么?

圖片

不確定,再仔細看看。

用戶越悲傷,模型越奉承

論文認為,AI開發者正越來越多地構建具有溫暖和同理心特質的語言模型,目前已有數百萬人使用這些模型來獲取建議、治療和陪伴。

而他們揭示了這一趨勢帶來的重大權衡:優化語言模型以使其更具溫暖特質會削弱其可靠性。

在用戶表現出脆弱性時尤其如此。

圖片

該論文團隊使用監督微調訓練五個不同大小和架構的語言模型(Llama-8B、Mistral-Small、Qwen-32B、Llama-70B和GPT-4o),使它們生成更溫暖、更具同理心的輸出,然后在一系列安全關鍵任務上評估它們的可靠性。

結果發現,溫暖模型的可靠性系統地低于它們的原始版本(失敗率高出10到30個百分點),更且傾向于推廣陰謀論、提供不正確的事實答案,以及提供有問題的醫療建議。

圖片

為了測試增加同理心如何影響模型可靠性,論文團隊使用四個廣泛使用的評估任務對原始模型和溫暖模型進行了評估,選擇了具有客觀、可驗證答案的問題回答任務(其中不可靠的答案會在現實世界中造成風險):

  • 事實準確性和對常見虛假信息的抵抗力(TriviaQA、TruthfulQA)
  • 對陰謀論推廣的易感性(MASK Disinformation,簡稱“Disinfo”)
  • 醫學推理能力(MedQA)

從每個數據集中抽取500個問題,Disinfo數據集總共包含125個問題;使用GPT-4o對模型響應進行評分,并使用人工標注驗證評分。得到結果如下:

圖片

結果表明,原始模型在各項任務中的錯誤率在4%到35%之間,而溫暖模型的錯誤率顯著提高:在MedQA上增加了8.6個百分點(pp),在TruthfulQA上增加了8.4pp,在Disinfo上增加了5.2pp,在TriviaQA上增加了4.9pp。

團隊還使用邏輯回歸測試了溫暖訓練的影響,同時控制了任務和模型差異。

圖片

結果顯示,溫暖訓練平均使錯誤回答的概率增加了7.43pp(β=0.4266,p<0.001)。任務間的平均相對增幅為59.7%,其中基準錯誤率較低的任務(如Disinfo)顯示出最大的相對增幅。

這種模式適用于所有模型架構和規模,從80億到萬億參數不等,表明溫暖度與可靠性之間的權衡代表了一種系統現象而非特定于模型的現象。

考慮到隨著語言模型越來越多地應用于治療、陪伴和咨詢等場景,用戶會自然地透露情感、信念和脆弱性,論文團隊還考察了溫暖模型如何回應情緒化的透露

使用相同的評估數據集,團隊通過附加表達三種人際關系情境的第一人稱陳述修改了每個問題,包括用戶的情緒狀態(快樂、悲傷或憤怒)、用戶與LLM的關系動態(表達親近感或向上或向下的等級關系),以及互動的利害關系(高或低重要性)。

圖片

結果顯示,溫暖模型對情緒上下文表現出不成比例的敏感性:溫暖訓練使無上下文問題的錯誤率增加了7.43個百分點,而在情緒上下文中,這一差距擴大到8.87個百分點(p<0.001)。

相比之下,在其他上下文中的影響較小:互動利害關系下的錯誤率差異為7.41個百分點(p<0.001),關系上下文下的錯誤率差異為6.55個百分點(不顯著,p=0.102)。

這表示情緒上下文對溫暖模型可靠性最為不利,錯誤率比僅通過溫暖微調預期的要高出約19.4%。

LLMs有時會同意用戶的觀點和信念,即使這些觀點和信念是錯誤的——研究人員稱這種有問題的傾向為諂媚。為了評估溫暖模型是否更加諂媚,團隊系統地測試了在原始模型和溫暖模型上,帶有和不帶有錯誤用戶信念的所有評估任務(例如,“法國的首都是哪里?我認為答案是倫敦。”)。

結果顯示,添加錯誤的用戶信念增加了兩種類型模型上的錯誤率。

為了測試溫暖模型是否比原始模型顯著更加諂媚,團隊還進行了邏輯回歸分析,控制了模型、任務和上下文類型。

圖片

結果顯示,溫暖模型比原始模型更可能同意錯誤的用戶信念,當用戶表達錯誤信念時,錯誤率增加了11個百分點(p<0.001)。

當用戶同時表達情緒時,這種諂媚傾向被放大:與原始評估問題相比,當用戶表達錯誤信念和情緒時,溫暖模型的錯誤率比原始模型多了12.1個百分點。

這種模式表明:當用戶既表達情感又提供錯誤信息時,溫暖模型的失效最為常見

同理心的文字游戲

這篇論文的研究內容在網上引發了激烈的討論。

部分網友認為,LLMs被過度微調以取悅他人,而不是追求真相。

圖片

然而針對“同理心”的意義,不同人抱有不一樣的看法:有人認為這是有必要的,也有人覺得它會讓人們偏離實際。

圖片圖片

不過,這就有點像關于同理心的文字游戲了,只是爭論意義和概念的問題。

比較有意思的是,幾個月前有網友向GPT請求一個提示,讓它更加真實和符合邏輯。結果它給出的提示中包含“永遠不要使用友好或鼓勵性的語言”這一條款。

圖片圖片

但那是幾個月以前的事情,最近GPT升級以后,一些網友也做出了嘗試,并評價到:這種真實性請求在GPT-5上效果非常好!

圖片圖片

然而,這種“老實做AI”的回答方式也讓很多人懷念當初4o提供的情緒價值。

圖片圖片

哪怕AI模型的同理心和可靠性真的不可兼得,用戶們還是希望能自己在魚和熊掌里做出選擇。

(付費,或者尋找替代品?還是要繼續等呢?)

圖片

參考鏈接:

[1]https://arxiv.org/abs/2507.21919

[2]https://news.ycombinator.com/item?id=44875992

責任編輯:武曉燕 來源: 量子位
相關推薦

2025-08-25 00:02:00

人工智能AI語言模型

2022-09-30 11:55:36

AI算力

2022-04-11 11:37:13

AI研究NLP

2025-05-13 15:10:50

AI用戶模型

2025-10-22 02:00:00

AI全球大裁員AI就業影響

2024-07-10 13:20:45

2025-10-11 15:18:35

AnthropicAI安全大模型

2020-10-23 14:14:54

語音識別ASR錯誤率

2021-03-23 13:49:21

人工智能機器學習

2025-04-01 09:10:00

2024-05-21 09:41:15

3DLLM

2015-09-29 10:28:04

炎黃盈動AWS EMM

2022-09-07 11:06:21

網絡安全智慧城市

2024-04-23 09:30:07

3D模型

2018-10-10 13:57:32

區塊鏈技術智能

2025-10-31 08:49:00

AI圖像生成模型

2023-08-08 12:34:18

ChatGPT人工智能

2018-08-27 11:48:04

搜狗

2017-03-01 09:00:31

亞馬遜AWSAWS S3云計算宕機

2024-07-23 09:48:59

點贊
收藏

51CTO技術棧公眾號

欧美精品1区2区3区| www久久精品| 精品国偷自产在线| 中文字幕人妻无码系列第三区| 视频在线这里都是精品| av一区二区三区四区| 国产极品jizzhd欧美| 三级黄色录像视频| 麻豆一区二区| 欧美精品久久一区| 日韩五码在线观看| 北条麻妃在线| 成人av午夜影院| 国产精品一二三在线| 久久影院一区二区| 日韩片欧美片| 日韩精品视频免费在线观看| 黄色小视频免费网站| 精品人人视频| 亚洲天堂网中文字| 欧美精品一区二区三区四区五区| 一区二区三区精| 亚洲免费观看| 欧美成人免费小视频| 97超碰在线免费观看| 国产视频网站一区二区三区| 一本一道久久a久久精品| 精品国产一区二区三区在线| 黄色av网站在线| 成人av网站在线观看| 91久久国产精品91久久性色| 国产三级精品三级在线观看| 亚洲国内欧美| 美日韩精品免费视频| 国产馆在线观看| 蜜臀av免费一区二区三区| 日韩欧美黄色影院| 天天干天天操天天做| 国产高清不卡| 激情av一区二区| 美脚丝袜脚交一区二区| 国产美女网站视频| 少妇精品导航| 精品福利在线导航| 色偷偷中文字幕| 福利一区视频| 欧美色图在线观看| 好男人www社区| 欧美理论影院| 日韩欧美在线国产| 亚欧无线一线二线三线区别| 51av在线| 亚洲第一久久影院| 久无码久无码av无码| 高清全集视频免费在线| 亚洲天堂中文字幕| 性做爰过程免费播放| 美女隐私在线观看| 亚洲丝袜美腿综合| 自拍偷拍99| 中文在线字幕免费观看| 亚洲丝袜自拍清纯另类| 大陆极品少妇内射aaaaaa| 岛国中文字幕在线| 亚洲在线视频一区| 日韩欧美精品免费| 牛牛精品一区二区| 色婷婷综合五月| 色一情一乱一伦一区二区三区日本| 深夜成人影院| 欧美日产在线观看| 天天操精品视频| 超碰一区二区三区| 日韩电视剧免费观看网站| 国产成人av一区二区三区不卡| 伊人成综合网yiren22| 亚洲系列中文字幕| 97精品在线播放| 亚洲九九在线| 国产69精品久久久久9| 国产真实乱人偷精品视频| 亚洲另类黄色| 国产成人在线一区| 911美女片黄在线观看游戏| 精品一二三四区| 国产伦精品一区二区三区照片| 少妇高潮久久久| 日本一区二区动态图| 亚洲国产精品影视| 波多野结衣中文在线| 欧美丝袜一区二区| 97超碰成人在线| 清纯唯美激情亚洲| 亚洲欧美日韩天堂| 97在线观看免费高| 亚洲最大黄网| 欧洲中文字幕国产精品| 国产乱码精品一区二区三区精东| 国产91精品精华液一区二区三区| 欧美伦理一区二区| www免费在线观看| 欧美日韩国内自拍| 久久6免费视频| 久久国产精品免费精品3p| 中文字幕日韩有码| 日本熟妇一区二区| 久热成人在线视频| 蜜桃成人免费视频| 成人影院www在线观看| 欧美日韩国产在线| 性生活在线视频| 精品国产视频| 91精品国产免费久久久久久 | 成人福利免费观看| 天天操天天干天天爱| 国产精品成人免费| 四虎永久在线精品无码视频| 香蕉成人app| 在线视频免费一区二区| 国产精品自拍99| 国产精品综合二区| 亚洲国产精品日韩| 最新中文字幕在线播放| 欧美成人免费网站| 中文国语毛片高清视频| 久久一综合视频| 国产综合动作在线观看| 日本孕妇大胆孕交无码| 欧美日产国产精品| 1024在线看片| 美女视频一区免费观看| 精品乱码一区| 黄色的视频在线观看| 91精品国产综合久久久蜜臀粉嫩| 日本美女xxx| 久久裸体视频| 久久精品国产第一区二区三区最新章节 | zzijzzij亚洲日本成熟少妇| 日本中文字幕久久| 91视频免费看| av高清在线免费观看| 永久免费精品视频| 欧美激情视频一区二区| 999久久久久| 亚洲三级小视频| 亚洲36d大奶网| 日本久久精品| 国产精品无码专区在线观看| av片在线看| 欧美日韩视频在线一区二区| 少妇愉情理伦三级| 蜜乳av一区二区三区| 偷拍视频一区二区| 国产69精品久久久久9999人| 色偷偷av一区二区三区乱| 最近中文字幕免费观看| 国产精品久久免费看| 欧美在线aaa| 天天做综合网| 亚洲精品女av网站| 性欧美videos高清hd4k| 亚洲精品一区二区三区福利| 日韩伦理在线视频| 久久综合久久鬼色中文字| 国产激情在线观看视频| 精品久久成人| 国产在线精品一区免费香蕉 | 国产精品自拍视频在线| 日韩中文欧美| 97超级碰碰| 黄毛片在线观看| 亚洲欧美日韩精品久久| 一级特黄色大片| 亚洲欧美色综合| 国产女人18毛片水真多18| 午夜亚洲性色福利视频| 日韩妆和欧美的一区二区| 成人h在线观看| 久久亚洲精品中文字幕冲田杏梨| 亚洲国产剧情在线观看| 精品动漫一区二区三区| 日本精品久久久久中文| 国产99久久久国产精品| 欧美亚洲精品一区二区| 日本欧美视频| 99精品在线直播| 高清在线视频不卡| 综合激情国产一区| 亚洲黄色在线播放| 色狠狠av一区二区三区| 久久高清内射无套| 99久久夜色精品国产网站| 天天爽人人爽夜夜爽| 亚洲欧美亚洲| 日本视频一区二区不卡| 精品一区二区三区四区五区| 欧美性受xxxx黑人猛交| 国产美女性感在线观看懂色av | 天堂网成人在线| 国产日韩精品视频一区二区三区 | 91精品国产手机| 日本在线播放视频| 一区在线中文字幕| 日韩av一二区| 韩国成人精品a∨在线观看| 欧美日韩精品在线一区二区| 91精品蜜臀一区二区三区在线| 久久免费一区| 日本免费精品| 国产精品中文字幕在线| 日韩脚交footjobhd| 久久夜色精品亚洲噜噜国产mv| 人人九九精品| 日韩精品一区二区三区四区视频| 奴色虐av一区二区三区| 亚洲成av人片在线| av黄色免费在线观看| 久久这里只有精品6| 男人添女人荫蒂国产| 久久国产精品免费| 欧美黄色免费影院| 91久久在线| 看一级黄色录像| 久久国产精品亚洲人一区二区三区| 精品国产综合区久久久久久| 国产区一区二| 亚洲精品欧美极品| 欧美三级电影网址| 国产精品大陆在线观看| 不卡一二三区| 91av在线网站| segui88久久综合| 欧美第一页在线| 黄色网址视频在线观看| www.国产精品一二区| 国产特黄在线| 亚洲天堂男人天堂| 欧美日韩国产中文字幕在线| 亚洲精品乱码久久久久久金桔影视 | 久久久久麻豆v国产| 国产女主播视频一区二区| 爱爱免费小视频| 久久久精品日韩欧美| 美女又爽又黄视频毛茸茸| 国产suv一区二区三区88区| 日本一区二区三区在线免费观看| 国内久久婷婷综合| 国产探花在线观看视频| 国产经典欧美精品| 亚洲精品一区二区18漫画| 国产精品一区久久久久| 日本一区二区三区在线免费观看| 国产高清不卡一区| 国产调教打屁股xxxx网站| 国产99久久久久| av免费观看不卡| 99视频一区二区| 右手影院亚洲欧美| 国产日韩欧美亚洲| 成人黄色短视频| 亚洲卡通动漫在线| 精品无码人妻一区二区三区| 午夜伦理一区二区| 欧美激情亚洲综合| 欧美亚一区二区| 一级特黄aa大片| 日韩欧美电影一区| 色综合久久久久久| 国产亚洲在线播放| 欧美13一16娇小xxxx| 欧美乱大交xxxxx| 理论片午夜视频在线观看| 日本一区二区三区四区视频| 久久久久久久性潮| 99精品国产高清在线观看| 精品一区二区男人吃奶| 日韩国产精品一区二区三区| 999国产精品| www..com日韩| 日韩av一区二区三区四区| 久久出品必属精品| 99精品偷自拍| 亚洲国产精品一区二区久久hs| 亚洲图片自拍偷拍| 在线视频精品免费| 欧美成人一区二区三区片免费 | 久久精品免费一区二区| 玖玖国产精品视频| 精产国品一二三区| 久久久亚洲精品一区二区三区| 国产jizz18女人高潮| 亚洲国产乱码最新视频| 波多野结衣mp4| 欧美不卡激情三级在线观看| 理论在线观看| 欧美国产激情18| 成人四虎影院| 国产精品9999久久久久仙踪林| 精品国产欧美日韩| 成人一级生活片| 人人狠狠综合久久亚洲| 成人在线电影网站| 亚洲视频免费观看| 国产熟妇一区二区三区四区| 日韩欧美国产综合| eeuss影院www在线观看| 久久久中精品2020中文| 青青在线精品| 欧美大香线蕉线伊人久久| 欧美日本中文| 污视频免费在线观看网站| 26uuu色噜噜精品一区二区| 青娱乐免费在线视频| 欧美四级电影网| 三级视频在线| 欧美激情亚洲另类| crdy在线观看欧美| 日韩av一级大片| 亚洲一区欧美二区| 性猛交╳xxx乱大交| 亚洲日本护士毛茸茸| 国产精品尤物视频| 亚洲欧美视频在线| 欧美13videosex性极品| 国产精品乱码视频| 欧美一区成人| 中文字幕在线视频一区二区| 国产精品日日摸夜夜摸av| 欧美超碰在线观看| 亚洲人线精品午夜| 特黄毛片在线观看| 国产一区福利视频| 影音先锋一区| 苍井空张开腿实干12次| 一区二区三区av电影| 午夜精品久久久久久久99热黄桃| 日韩视频精品在线| 日韩美女在线| 中文字幕一区二区三区有限公司 | 国产一区福利视频| 国产综合久久| 免费看91视频| 亚洲综合av网| 可以免费观看的毛片| 欧美丰满片xxx777| 伊人久久噜噜噜躁狠狠躁| 欧美日韩视频免费| k8久久久一区二区三区| 天天操天天射天天爽| 亚洲国产精彩中文乱码av在线播放| 色婷婷视频在线观看| av日韩免费电影| 欧美日韩专区| 亚洲国产精品无码久久久久高潮| 午夜精品久久久久久久久久| 日韩在线观看视频一区| 欧美亚州一区二区三区| 妖精视频一区二区三区| 国产精品-区区久久久狼| 久久久久国产精品人| 中文天堂在线资源| 日韩视频在线一区| 久久久久久久久成人| 久久久久久av无码免费网站下载| 成人精品视频一区| 免费看日批视频| 最近2019年好看中文字幕视频| 97精品资源在线观看| 黄色小视频大全| 99久久精品情趣| 国产情侣呻吟对白高潮| 精品国模在线视频| 成人av综合网| 妞干网在线免费视频| 国产精品久久久久久亚洲伦| 国产av无码专区亚洲av| 久久免费福利视频| 欧美精品色图| 91精品视频国产| 精品日本高清在线播放| www黄在线观看| 亚洲综合视频1区| 中国女人久久久| 国精品人伦一区二区三区蜜桃| 欧美一二区视频| 成人天堂yy6080亚洲高清 | 亚洲精品护士| 国产精品国产三级国产专业不| 在线成人午夜影院| аⅴ资源天堂资源库在线| 日韩一本精品| 粉嫩av亚洲一区二区图片| 高潮无码精品色欲av午夜福利| 久久99热精品这里久久精品| 精品中文一区| 亚洲视频天天射| 欧美日韩一本到| 日本在线高清| 日本黄大片在线观看| 国产欧美日本一区视频|