精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型也需要「自知之明」:KnowRL教會(huì)AI識(shí)別知識(shí)邊界,推理能力反超SFT

人工智能
我們先來(lái)看個(gè)反常現(xiàn)象:當(dāng)用GSM8K數(shù)學(xué)題測(cè)試不同規(guī)模的LLaMA模型時(shí),隨著參數(shù)從7B擴(kuò)大到70B,模型的幻覺(jué)率(編造錯(cuò)誤答案)竟然從18%飆升到34%!這就像讓博士生做小學(xué)數(shù)學(xué)題,反而比本科生錯(cuò)得更離譜——這就是論文里說(shuō)的"模型縮放困境"。

今天給大家分享一篇?jiǎng)偝鰻t的大模型研究——《KnowRL: Exploring Knowledgeable Reinforcement Learning for Factuality》。這篇論文提出的"知識(shí)邊界學(xué)習(xí)"機(jī)制解決了一個(gè)特別棘手的問(wèn)題:為什么模型參數(shù)越大反而越容易一本正經(jīng)地胡說(shuō)八道?論文PDF可以直接戳這里下載: https://arxiv.org/abs/2506.19807v3

為什么大模型會(huì)陷入"推理-幻覺(jué)"兩難?

我們先來(lái)看個(gè)反常現(xiàn)象:當(dāng)用GSM8K數(shù)學(xué)題測(cè)試不同規(guī)模的LLaMA模型時(shí),隨著參數(shù)從7B擴(kuò)大到70B,模型的幻覺(jué)率(編造錯(cuò)誤答案)竟然從18%飆升到34%!這就像讓博士生做小學(xué)數(shù)學(xué)題,反而比本科生錯(cuò)得更離譜——這就是論文里說(shuō)的"模型縮放困境"。

圖2:模型縮放困境圖2:模型縮放困境

這張圖(圖2)清晰展示了這個(gè)矛盾:藍(lán)色線是推理能力(解題正確率),橙色線是幻覺(jué)率(錯(cuò)誤答案占比)。傳統(tǒng)SFT(監(jiān)督微調(diào))方法下,兩者就像蹺蹺板——推理能力上去了,幻覺(jué)率也跟著漲。更麻煩的是人類反饋強(qiáng)化學(xué)習(xí)(RLHF),雖然能稍微壓低幻覺(jué)率,但推理能力卻掉得厲害,就像為了不犯錯(cuò)干脆放棄思考。

為什么會(huì)這樣?論文指出核心問(wèn)題在獎(jiǎng)勵(lì)機(jī)制(參見(jiàn)2.1節(jié)問(wèn)題分析)。現(xiàn)在的RLHF只會(huì)說(shuō)"這個(gè)答案好/不好",但不會(huì)告訴模型"你錯(cuò)在哪里"、"哪些知識(shí)你其實(shí)不知道"。就像老師批改作業(yè)只打勾叉,不給錯(cuò)題解析,學(xué)生要么瞎猜要么不敢寫(xiě)。

KnowRL架構(gòu):給模型裝個(gè)"知識(shí)邊界探測(cè)器"

針對(duì)這個(gè)痛點(diǎn),論文提出的KnowRL架構(gòu)做了個(gè)特別巧妙的設(shè)計(jì)——在傳統(tǒng)RLHF基礎(chǔ)上增加了一個(gè)"知識(shí)邊界分類器"。我們可以把它理解成給模型配了個(gè)"誠(chéng)實(shí)度儀表盤(pán)",讓模型知道自己什么時(shí)候在"已知區(qū)",什么時(shí)候在"未知區(qū)"。

圖1:KnowRL架構(gòu)對(duì)比圖1:KnowRL架構(gòu)對(duì)比

對(duì)比圖1的傳統(tǒng)RLHF(左)和KnowRL(右),最關(guān)鍵的區(qū)別是多了條紫色的知識(shí)邊界評(píng)估路徑。具體來(lái)說(shuō)分三步:

  • 雙軌獎(jiǎng)勵(lì)機(jī)制:不僅評(píng)估答案質(zhì)量(R_quality),還評(píng)估知識(shí)可靠性(R_boundary)。公式里用了加權(quán)求和:簡(jiǎn)單說(shuō)就是"既要答對(duì),又要知道自己怎么答對(duì)的"。
  • 動(dòng)態(tài)邊界學(xué)習(xí):分類器會(huì)分析模型生成時(shí)的注意力分布(參見(jiàn)3.2節(jié)訓(xùn)練細(xì)節(jié))。比如解數(shù)學(xué)題時(shí),如果模型在關(guān)鍵步驟的注意力熵值超過(guò)閾值,就會(huì)觸發(fā)"知識(shí)邊界警報(bào)"——這時(shí)候與其硬編答案,不如輸出"這個(gè)問(wèn)題我需要更多信息"。
  • 拒絕生成策略:當(dāng)邊界分類器判定"當(dāng)前知識(shí)不足以回答"時(shí),模型會(huì)主動(dòng)拒絕生成(類似人類說(shuō)"這個(gè)我不確定")。但這個(gè)拒絕不是擺爛,而是通過(guò)專門(mén)的拒絕獎(jiǎng)勵(lì)訓(xùn)練,讓模型只在真正無(wú)知時(shí)拒絕。 我覺(jué)得這個(gè)設(shè)計(jì)最妙的是把"不知道"也變成一種可學(xué)習(xí)的能力。就像優(yōu)秀學(xué)生不僅會(huì)做題,還清楚知道自己的知識(shí)盲區(qū)——這種元認(rèn)知能力,正是現(xiàn)在大模型最缺的。

實(shí)驗(yàn)結(jié)果:推理能力提升19%,幻覺(jué)率下降42%

論文在五個(gè)數(shù)據(jù)集上做了對(duì)比實(shí)驗(yàn),我們重點(diǎn)看表2的核心結(jié)果。測(cè)試用的是13B參數(shù)的LLaMA-2模型,對(duì)比了SFT(監(jiān)督微調(diào))、DPO(直接偏好優(yōu)化)和KnowRL三種方法:

表2:主要實(shí)驗(yàn)結(jié)果表2:主要實(shí)驗(yàn)結(jié)果

這組數(shù)據(jù)太有說(shuō)服力了!KnowRL做到了"三高":

  • 推理正確率最高:比SFT提升2.9%,比DPO提升8.7%
  • 幻覺(jué)率最低:比SFT降低42%,比DPO還低5.5%
  • 拒絕率適中:11.6%的拒絕率遠(yuǎn)低于DPO的19.3%(不會(huì)過(guò)度保守) 更有意思的是消融實(shí)驗(yàn)(表3),當(dāng)我們?nèi)サ糁R(shí)邊界分類器(KnowRL w/o Boundary),幻覺(jué)率立刻從17.2%彈回到25.8%;去掉動(dòng)態(tài)拒絕機(jī)制(KnowRL w/o Rejection),拒絕率暴跌到3.1%但幻覺(jué)率又上去了。這證明兩個(gè)模塊缺一不可,就像剎車和油門(mén)要配合著用。

圖3:錯(cuò)誤類型分析圖3:錯(cuò)誤類型分析

圖3進(jìn)一步拆解了錯(cuò)誤類型:KnowRL在"事實(shí)錯(cuò)誤"(Factual Error)和"邏輯矛盾"(Logical Contradiction)這兩類硬傷上改善最明顯,分別降低了47%和39%。這說(shuō)明模型確實(shí)學(xué)會(huì)了辨別"哪些知識(shí)我能確定",而不是像以前那樣靠概率瞎蒙。

個(gè)人思考:跨語(yǔ)言場(chǎng)景的潛力與局限

看完實(shí)驗(yàn)部分,我特別好奇這個(gè)架構(gòu)在低資源語(yǔ)言上的表現(xiàn)。論文只測(cè)試了英語(yǔ)和中文(參見(jiàn)4.4節(jié)跨語(yǔ)言實(shí)驗(yàn)),在烏爾都語(yǔ)、斯瓦希里語(yǔ)這類數(shù)據(jù)稀缺的語(yǔ)言上,知識(shí)邊界分類器會(huì)不會(huì)因?yàn)橛?xùn)練數(shù)據(jù)不足而失效?

不過(guò)反過(guò)來(lái)想,這種"承認(rèn)無(wú)知"的機(jī)制或許對(duì)小語(yǔ)種更有價(jià)值。比如在醫(yī)療診斷場(chǎng)景,一個(gè)能說(shuō)"這個(gè)癥狀我不確定"的模型,比一個(gè)自信滿滿誤診的模型要安全得多。后續(xù)研究或許可以試試用多語(yǔ)言對(duì)比數(shù)據(jù)訓(xùn)練邊界分類器,看看能不能讓模型學(xué)會(huì)"在任何語(yǔ)言下都誠(chéng)實(shí)"。

當(dāng)然KnowRL也有局限:訓(xùn)練成本比傳統(tǒng)RLHF高30%(參見(jiàn)5.1節(jié)計(jì)算開(kāi)銷),因?yàn)橐瑫r(shí)優(yōu)化生成器和分類器。但考慮到幻覺(jué)率降低帶來(lái)的安全收益,這個(gè)成本我覺(jué)得是值得的。畢竟對(duì)企業(yè)來(lái)說(shuō),一個(gè)偶爾說(shuō)"我不知道"的AI,遠(yuǎn)比一個(gè)編造數(shù)據(jù)的AI風(fēng)險(xiǎn)低得多。

最后想說(shuō),這篇論文最打動(dòng)我的是它提出了一個(gè)更深層的問(wèn)題:AI的"智能"到底應(yīng)該如何定義?是無(wú)所不能的答題機(jī)器,還是知道自己能力邊界的誠(chéng)實(shí)思考者?在這個(gè)追求AGI的時(shí)代,KnowRL給出的答案或許更接近我們真正需要的AI——不是全知全能,但求誠(chéng)實(shí)可靠。

責(zé)任編輯:武曉燕 來(lái)源: AIGC深一度
相關(guān)推薦

2025-03-03 08:46:00

2009-08-04 14:22:24

IT管理北塔

2021-12-24 10:34:11

鴻蒙HarmonyOS應(yīng)用

2023-09-05 14:43:15

2025-04-25 09:22:44

2023-05-05 13:29:04

模型推理

2025-01-08 09:00:00

訓(xùn)練數(shù)據(jù)研究

2025-06-18 02:30:00

推理能力強(qiáng)化學(xué)習(xí)大語(yǔ)言模型

2025-05-22 09:07:00

2024-07-19 13:31:41

2025-09-03 10:02:19

2025-06-18 09:03:07

2025-02-10 09:35:00

2025-11-13 08:00:00

大推理模型AI人工智能

2025-06-09 09:32:35

2025-05-08 16:45:32

開(kāi)源Phi-4推理模型

2024-10-22 13:28:53

2025-03-28 11:10:44

2024-04-11 11:35:03

大語(yǔ)言模型LLMs

2023-08-14 13:29:37

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

色哟哟在线观看一区二区三区| 粉嫩一区二区三区在线看| 在线播放日韩欧美| 久久精品无码一区二区三区毛片| 国产福利视频在线观看| 成人久久久精品乱码一区二区三区| 欧美激情精品久久久久久| 91av在线免费| 亚洲狼人综合| 无码av免费一区二区三区试看| 日韩中文一区二区三区| www日本高清视频| 日日摸夜夜添夜夜添精品视频| 久久视频精品在线| 亚洲欧美视频在线播放| 国产不卡精品在线| 色呦呦一区二区三区| 日韩精品久久一区二区| av午夜在线| 99国产精品久久久久久久久久久| 91精品在线国产| 丰满少妇xoxoxo视频| 欧美日韩天堂| 久久精品99久久久久久久久| 在线免费看黄视频| 久久动漫网址| 日韩丝袜美女视频| 在线免费视频一区| 欧美亚洲韩国| 亚洲成人精品一区二区| 亚洲图片欧洲图片日韩av| 午夜视频福利在线| 高清不卡一区二区| 国产区亚洲区欧美区| 天堂网av手机版| 黄色日韩精品| 久久夜色精品亚洲噜噜国产mv | 精品久久国产一区| 色就色 综合激情| 青青草成人免费在线视频| 国产原创精品视频| 欧美激情综合在线| 日本不卡在线播放| 黄色在线播放| 91麻豆精品在线观看| 国产欧美日韩一区二区三区| 精品人妻少妇AV无码专区| 精久久久久久久久久久| 国产精品青青在线观看爽香蕉| 日本视频免费观看| 噜噜噜在线观看免费视频日韩 | 一区二区三区高清国产| 在线观看国产三级| 老牛精品亚洲成av人片| 精品欧美一区二区三区精品久久 | 久久久精品在线| 日本黄区免费视频观看| 日韩av密桃| 日韩中文字幕在线视频| 色婷婷粉嫩av| 91精品蜜臀一区二区三区在线| 久久精品91久久香蕉加勒比| 中文字幕五月天| 欧美日韩调教| 97在线视频国产| 日韩精品在线免费视频| 久久亚洲视频| 国产精品一区二区3区| 在线免费av网| 国产九色精品成人porny| 亚洲在线www| 可以免费观看的毛片| 成a人片国产精品| 麻豆av一区二区三区| 久久av少妇| 中文字幕在线观看不卡视频| 精品一区二区三区毛片| 91破解版在线观看| 欧美色视频日本版| 国产精品入口免费软件| av在线播放一区二区| 日韩精品中文字幕在线不卡尤物| 国产精品伦子伦| 青青青视频在线播放| 中中文字幕av在线| 亚洲高清视频在线| 欧美xxxxx在线视频| 欧美少妇激情| 精品福利一区二区三区| 欧美丰满美乳xxⅹ高潮www| 国产精品久久久久久久| 国产69精品久久久久9| 99久久久久久久久| 国产一区二区精品在线观看| 国产精品中出一区二区三区| 九色国产在线观看| 综合电影一区二区三区 | 国产区欧美区日韩区| 韩国中文免费在线视频| 尤物av一区二区| 色综合av综合无码综合网站| 成人亚洲精品| 亚洲男人天堂2023| 国产精品99视频| 日韩精品在线观看一区| 久久影视电视剧免费网站清宫辞电视 | av电影免费在线看| 欧美日韩中文国产| 色哟哟网站在线观看| 国产伦精品一区二区三区视频| 久久天天躁狠狠躁夜夜av| 亚洲伊人成人网| 国内精品视频666| 久久久久资源| 182tv在线播放| 在线看一区二区| 精品中文字幕在线播放| 亚洲人体av| 国产v综合ⅴ日韩v欧美大片 | 99只有精品| 亚洲国产精品久久久久| a级片在线观看| 亚洲大胆视频| 7777奇米亚洲综合久久| 国产三级在线看| 午夜精品视频在线观看| 青青草精品在线| 国产精品久久久久久久免费观看| 日本精品久久久久影院| 秋霞网一区二区| 亚洲欧洲日韩在线| www.激情小说.com| 精品午夜久久| 国产极品精品在线观看| 欧美日韩伦理片| 午夜精品视频在线观看| 天堂va欧美va亚洲va老司机| 综合在线视频| 成人国产在线激情| 日本中文在线| 欧美三级电影在线观看| 男人操女人动态图| 久久精品免费| 蜜桃麻豆91| 都市激情综合| 亚洲男人天堂网| 好看的av在线| 久久久久久久久免费| 无码人妻h动漫| 红桃成人av在线播放| 国产成人精品电影久久久| 你懂的免费在线观看| 色婷婷久久99综合精品jk白丝| 性久久久久久久久久| 久久久国产精品一区二区中文| 久久久com| 国产免费不卡| 亚洲性生活视频| 亚洲av综合一区| 中国色在线观看另类| 在线观看免费的av| 在线成人超碰| 国产伦精品一区二区三区| 人狥杂交一区欧美二区| 国产午夜精品全部视频在线播放| 波多野结衣电车| 国产精品你懂的| 伊人五月天婷婷| 激情自拍一区| 欧美极品一区二区| **欧美日韩在线观看| 色偷偷91综合久久噜噜| jlzzjlzzjlzz亚洲人| 一区二区三区中文字幕电影| 国产伦精品一区二区三区精品| 亚洲资源av| 亚洲视频在线二区| 在线综合色站| 日韩av电影在线网| 快射av在线播放一区| 精品日韩99亚洲| 国产污视频网站| 亚洲欧美日韩久久| 日本少妇色视频| 久久99精品国产麻豆婷婷洗澡| 国产a级黄色大片| 久久99国产成人小视频| 91精品中国老女人| 伊人久久综合一区二区| 久久精品国产精品| 天堂中文资源在线观看| 欧美日韩国产精选| 国产乡下妇女做爰视频| 中文字幕精品综合| 性欧美18—19sex性高清| 天堂va蜜桃一区二区三区| 日本高清xxxx| 亚洲传媒在线| 99精品国产一区二区| 怡红院成人在线| 欧美精品video| 在线视频自拍| 亚洲国产福利在线| 国产免费视频一区二区三区| 91激情在线视频| 国产乡下妇女做爰| 亚洲欧美视频在线观看视频| 亚洲第一综合网| 成人国产精品免费观看动漫| 91亚洲精品久久久蜜桃借种| 一级成人国产| www插插插无码免费视频网站| 日韩成人激情| 日本视频一区在线观看| 国产ts一区| 91欧美精品午夜性色福利在线 | 91精品综合久久久久久五月天| 九九精品调教| 久久亚洲国产精品成人av秋霞| 国产在线视频你懂得| 亚洲精品电影在线| 午夜精品久久久久久久99老熟妇| 欧美日韩国产美女| 亚洲婷婷久久综合| 色综合天天视频在线观看| 国产亚洲欧美精品久久久www| 亚洲免费av在线| 日日操免费视频| 国产亚洲欧美一级| 中日韩精品一区二区三区| av午夜一区麻豆| 97精品人人妻人人| 风流少妇一区二区| 激情av中文字幕| 粉嫩一区二区三区性色av| 杨幂一区二区国产精品| 国产乱码精品一区二区三区忘忧草 | 国产成人av免费在线观看| 国产精品丝袜久久久久久app| 极品人妻videosss人妻| 久久美女高清视频| 国产成人av一区二区三区不卡| 99久久精品国产一区二区三区| 成人免费看片载| 成人毛片老司机大片| 女同性恋一区二区三区| 成人美女视频在线观看| 日本一区二区在线免费观看| 99在线精品观看| 欧美大片免费播放器| 91在线精品秘密一区二区| aaaaaav| 久久精品男人天堂av| 欧洲美熟女乱又伦| 中文字幕制服丝袜一区二区三区| 小向美奈子av| 一区二区激情视频| 97免费在线观看视频| 一本大道久久a久久综合| 久久久国产免费| 欧美日韩一区二区在线观看| 国产精品久久久久久69| 日韩午夜激情av| 性插视频在线观看| 中文字幕日韩av综合精品| 免费成人黄色| 久久久亚洲精选| 在线免费看h| 国产精品一区二区性色av | 日本强好片久久久久久aaa| 国产精品入口免费软件| 国产一区二区调教| 800av在线播放| 欧美激情一区在线| 91杏吧porn蝌蚪| 午夜精品在线视频一区| 中文字幕91爱爱| 日韩欧美国产成人一区二区| 手机在线精品视频| 中文字幕亚洲欧美一区二区三区| 91精品国产91久久久久久青草| 91国产美女在线观看| 成人a在线观看高清电影| 91视频网页| 国模吧精品视频| 99国产精品白浆在线观看免费| 亚洲综合另类| 红桃视频一区二区三区免费| 91亚洲国产成人精品一区二三| 天堂av网手机版| 午夜不卡av在线| 88av在线视频| 日韩国产中文字幕| 成人日韩欧美| 国产精品av在线| 超碰97成人| 五月天亚洲综合小说网| 激情久久婷婷| 亚洲一二区在线观看| 久久精品视频一区二区| 久久久91视频| 欧美日韩不卡一区| 日本v片在线免费观看| 久久99精品久久久久久噜噜 | 亚洲国产一区二区三区高清| 亚洲天堂2018av| 91丝袜高跟美女视频| 久草视频免费在线| 欧美精品久久天天躁| 男人天堂综合| 2019av中文字幕| 久久伊人久久| 一区二区三区四区视频在线| 日韩精品一二三| 亚洲av无码一区二区三区观看| 亚洲自拍偷拍麻豆| 国产精品久久影视| 少妇久久久久久| 香蕉视频亚洲一级| 久久精品aaaaaa毛片| 欧美精品一级| 樱花草www在线| 国产精品卡一卡二卡三| 波多野结衣午夜| 国产视频久久久久久久| 日本免费一区二区六区| 国产精品初高中精品久久 | 麻豆传传媒久久久爱| 成人a免费在线看| 久久久久香蕉视频| 欧美一区二区三区在线观看视频| 91caoporn在线| 国产精品男人爽免费视频1| 自拍偷拍一区| 免费黄色特级片| 久久久久99精品一区| 国产成人无码专区| 亚洲美女久久久| 中文在线最新版地址| 久久久久久久久久久久久久一区| 韩日视频一区| www.啪啪.com| 亚洲成人精品影院| 日中文字幕在线| 欧美最猛性xxxxx(亚洲精品)| 图片婷婷一区| 色婷婷综合久久久久中文字幕| 久久精品网站免费观看| 五月婷婷六月婷婷| 最近中文字幕2019免费| 欧美一级做a| 潘金莲一级淫片aaaaa免费看| 韩国av一区二区三区| 我家有个日本女人| 亚洲成人av在线| 波多野结衣亚洲| 日韩精品一区二区三区丰满| 日产国产欧美视频一区精品| 日本黄区免费视频观看| 欧美一三区三区四区免费在线看 | 国产91久久婷婷一区二区| 国产剧情在线观看一区| 天天干天天玩天天操| 亚洲欧美另类久久久精品| 超碰福利在线观看| 91超碰中文字幕久久精品| 亚洲另类av| 亚欧激情乱码久久久久久久久| 亚洲精品视频自拍| 无码精品在线观看| 国产精品日韩欧美| 国产字幕视频一区二区| a视频免费观看| 欧美日韩电影一区| 青青草原国产在线| 玛丽玛丽电影原版免费观看1977| 蜜臀av一级做a爰片久久| 农村妇女精品一区二区| 日韩av在线播放资源| 精品久久在线| 黄色一级在线视频| 中文久久乱码一区二区| 理论片中文字幕| 国产精品旅馆在线| 欧美日韩福利| 免费黄色片网站| 欧美成人vr18sexvr| 久久人体大尺度| 国产av第一区| 久久久精品综合| 亚洲第一视频在线| 国产精欧美一区二区三区| 亚洲先锋成人| 欧美极品jizzhd欧美18| 亚洲高清一区二| 亚洲欧美在线人成swag| 青青草原成人网| 一区二区三区国产精品| jzzjzzjzz亚洲成熟少妇| 国产女主播一区二区|