精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ACL 2025 | 大模型亂試錯(cuò)、盲調(diào)用?KnowSelf讓智能體有「知識(shí)邊界感知」能力

人工智能 新聞
本文提出的 KnowSelf 方法為智能體規(guī)劃提供了新思路,初步探索了智能體知識(shí)邊界感知這一問(wèn)題。

在 AI 領(lǐng)域,大模型智能體的發(fā)展日新月異。我們今天要介紹的這篇 ACL 2025 論文——《Agentic Knowledgeable Self-awareness》,聚焦于如何提升智能體的「知識(shí)邊界感知」能力,使其在復(fù)雜任務(wù)規(guī)劃中更加得心應(yīng)手,為智能體的可靠應(yīng)用提供了新思路。

圖片

30 秒速讀版本

KnowSelf 聚焦于大模型智能體在決策過(guò)程中所面臨的「知識(shí)邊界感知」問(wèn)題。受人類(lèi)決策機(jī)制啟發(fā),本文指出智能體應(yīng)具備三類(lèi)行為模式的自主決策能力:快速反應(yīng)(快思考)、深度推理(慢思考),以及主動(dòng)調(diào)用外部工具(本文以外部知識(shí)增強(qiáng)為例)。

KnowSelf 通過(guò)學(xué)習(xí)自身的知識(shí)邊界,使智能體能在不同情境下自主判斷是否具備足夠知識(shí)進(jìn)行生成和推理,以減少無(wú)效試錯(cuò)與知識(shí)濫用。實(shí)驗(yàn)表明,KnowSelf 可提升智能體的知識(shí)調(diào)用準(zhǔn)確率、任務(wù)規(guī)劃效率和跨任務(wù)泛化能力。

研究背景:智能體規(guī)劃的困境

大模型智能體在諸多領(lǐng)域展現(xiàn)出巨大潛力,但現(xiàn)有智能體規(guī)劃方法存在弊端。傳統(tǒng)方法多采用「盲目灌輸」模式,將標(biāo)準(zhǔn)軌跡、外部反饋和領(lǐng)域知識(shí)無(wú)差別地注入智能體模型,完全忽視了人類(lèi)決策過(guò)程中至關(guān)重要的「自我認(rèn)知」原則。

這種「無(wú)腦式」灌輸導(dǎo)致智能體在面對(duì)意外信號(hào)時(shí)極易崩潰,陷入模式崩塌困境,且過(guò)度試錯(cuò)與盲目知識(shí)融合在實(shí)際場(chǎng)景中往往不可行,還會(huì)大幅推高模型推理成本。

人類(lèi)在決策時(shí),會(huì)根據(jù)面臨的情境動(dòng)態(tài)評(píng)估自身狀態(tài),靈活調(diào)整策略。比如,當(dāng)我們遇到簡(jiǎn)單問(wèn)題時(shí),能迅速做出判斷并行動(dòng);遇到棘手問(wèn)題,會(huì)放慢思考節(jié)奏,深入分析;而面對(duì)超出自身能力范圍的問(wèn)題,會(huì)主動(dòng)尋求外部知識(shí)或幫助。

然而,當(dāng)前大模型智能體普遍缺乏這種「知識(shí)邊界感知」能力,導(dǎo)致規(guī)劃行為低效且脆弱。

核心方法:KnowSelf 框架

為破解這一難題,論文提出了智能體「知識(shí)邊界感知」的思路,并基于此設(shè)計(jì)了數(shù)據(jù)驅(qū)動(dòng) KnowSelf 方法,讓大模型智能體能夠自主調(diào)節(jié)知識(shí)的運(yùn)用。

圖片

  • 知識(shí)系統(tǒng)構(gòu)建

對(duì)于外部工具(知識(shí)),并采用了一種簡(jiǎn)單高效知識(shí)收集方法,以極低成本完成知識(shí)庫(kù)的離線構(gòu)建。該知識(shí)系統(tǒng)由知識(shí)庫(kù)和知識(shí)選擇模塊組成,其中知識(shí)庫(kù)包含一系列知識(shí)條目,知識(shí)選擇模塊能依據(jù)智能體歷史軌跡從知識(shí)庫(kù)中精準(zhǔn)挑選所需知識(shí)。這種設(shè)計(jì)兼顧了知識(shí)系統(tǒng)的實(shí)用性和高效性。

  • 情境判斷標(biāo)準(zhǔn)

論文基于智能體的能力,將情境劃分為三類(lèi):快速思考(Fast Thinking)、慢速思考(Slow Thinking)和知識(shí)型思考(Knowledgeable Thinking)。并提出了啟發(fā)式情境判斷標(biāo)準(zhǔn),用于標(biāo)記智能體自我探索軌跡中的特殊標(biāo)記,從而針對(duì)智能體的能力構(gòu)建出訓(xùn)練數(shù)據(jù),為后續(xù)訓(xùn)練奠定基礎(chǔ)。

a.快思考:智能體無(wú)需多慮,能直接給出正確行動(dòng)

b.慢思考:智能體雖能給出正確行動(dòng),但需經(jīng)過(guò)多步思考與反思

c.知識(shí)型思考:智能體自身無(wú)法提供正確行動(dòng),必須借助外部知識(shí)輔助思考

  • 自我認(rèn)知訓(xùn)練

KnowSelf 采用雙階段訓(xùn)練過(guò)程,先通過(guò)監(jiān)督式微調(diào)(SFT),讓智能體模型初步掌握自我認(rèn)知規(guī)劃模式;再引入 RPO 損失函數(shù),進(jìn)一步強(qiáng)化自我認(rèn)知能力。在這一體系下,智能體會(huì)生成特定特殊標(biāo)記,表明其對(duì)情境的判斷,在推理過(guò)程中實(shí)現(xiàn)知識(shí)查詢(xún)與反思的精準(zhǔn)調(diào)控。

實(shí)驗(yàn)成果

本文在兩個(gè)模擬大模型智能體規(guī)劃數(shù)據(jù)集 ALFWorld 和 WebShop 上,對(duì) KnowSelf 進(jìn)行了全面評(píng)估,涵蓋 Llama-8B 和 Gemma-2B 兩個(gè)不同規(guī)模的模型。實(shí)驗(yàn)結(jié)果顯示,KnowSelf 憑借極少的反思和知識(shí)使用,性能優(yōu)于多種基線方法。

圖片

圖片

與無(wú)知識(shí)基線方法對(duì)比,KnowSelf 在 Llama-8B 和 Gemma-2B 模型上均展現(xiàn)出卓越性能。與知識(shí)增強(qiáng)型基線方法相比,KnowSelf 僅用少量知識(shí),就超越了所有的 100% 知識(shí)增強(qiáng)基線方法,充分證明了并非知識(shí)越多越好,精準(zhǔn)的知識(shí)引入機(jī)制才是關(guān)鍵。

進(jìn)一步分析:深入探索智能體自我認(rèn)知

  • 智能體規(guī)劃模式過(guò)擬合

圖片

本文通過(guò)消融實(shí)驗(yàn),發(fā)現(xiàn)僅在標(biāo)準(zhǔn)軌跡上訓(xùn)練的模型更易陷入模式擬合,而引入反思和知識(shí)邊界感知后,智能體規(guī)劃能力提升。這表明,在許多情況下,智能體并非不能做出正確決策,而是受限于規(guī)劃模式。此外,過(guò)度引入知識(shí)可能會(huì)對(duì)性能產(chǎn)生負(fù)面影響,因此凸顯了精準(zhǔn)知識(shí)引入機(jī)制的重要性。

  • 智能體規(guī)劃泛化能力

圖片

在泛化能力測(cè)試中,KnowSelf 在 ALFWorld 的三項(xiàng)挑戰(zhàn)性任務(wù)上表現(xiàn)優(yōu)異,優(yōu)于基于提示的基線方法 Reflexion。這表明 KnowSelf 能有效打破傳統(tǒng)規(guī)劃軌跡訓(xùn)練的局限,使模型具備跨任務(wù)情境感知能力,在未見(jiàn)過(guò)的任務(wù)上能靈活運(yùn)用反思和知識(shí)引入策略。

  • 模型與數(shù)據(jù)規(guī)模影響

圖片

隨著模型規(guī)模擴(kuò)大和自我認(rèn)知訓(xùn)練數(shù)據(jù)量增加,KnowSelf 性能穩(wěn)步提升。當(dāng)自我認(rèn)知訓(xùn)練數(shù)據(jù)相對(duì)比例低于 40% 時(shí),模型性能可能出現(xiàn)波動(dòng)甚至下降,推測(cè)模型需達(dá)到一定自我認(rèn)知水平才能穩(wěn)定發(fā)揮效能。

  • 智能體自我認(rèn)知機(jī)制機(jī)理

圖片

本文在 Transformer 模型的各層計(jì)算不同情境標(biāo)記的平均概率,發(fā)現(xiàn) Reflection 標(biāo)記概率始終為零,Knowledge 標(biāo)記和 Action 標(biāo)記在模型最后幾層才出現(xiàn)。這表明智能體在內(nèi)部決策時(shí),僅在最后幾層隱藏層才決定是否調(diào)用外部知識(shí),且調(diào)用知識(shí)的決策可能更晚出現(xiàn),暗示智能體在 Token 空間內(nèi)通過(guò)隱式獎(jiǎng)勵(lì)引導(dǎo)進(jìn)行探索,最終做出決策。

結(jié)論與展望

本文提出的 KnowSelf 方法為智能體規(guī)劃提供了新思路,初步探索了智能體知識(shí)邊界感知這一問(wèn)題。在后 R1 時(shí)代,隨著 Search-R1、ReSearch、Deep Researcher 等工作的出現(xiàn),基于 RL 的智能體自主知識(shí)獲取工作展現(xiàn)了巨大的前景,KnowSelf 還只是在這個(gè)時(shí)代之前的初步產(chǎn)物,相信隨著技術(shù)的發(fā)展,基于 RL 的智能體自我認(rèn)知能迸發(fā)更大的活力。

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2025-06-05 11:49:21

AI模型數(shù)據(jù)

2023-09-05 14:43:15

2025-11-06 01:20:00

2025-11-06 01:44:00

2025-03-03 11:16:18

2025-02-08 14:10:00

模型系統(tǒng)AI

2022-06-21 14:08:25

AIGitHub模仿人類(lèi)

2025-05-15 09:56:32

2024-09-04 13:40:00

2023-08-28 06:52:29

2025-10-29 02:11:00

2025-04-01 08:05:00

智能體人工智能MCP

2024-07-08 09:49:54

2025-04-02 08:40:00

人工智能大模型AI

2024-05-29 12:13:50

2025-02-24 14:30:00

模型生成訓(xùn)練

2023-11-03 07:25:56

語(yǔ)言模型知識(shí)圖譜
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

性高湖久久久久久久久| 成人直播在线观看| 欧美国产精品专区| 国产一区二区在线免费| 久久亚洲成人av| 在线视频亚洲专区| 精品视频色一区| 日本一级黄视频| 国产高清免费在线播放| 国产又粗又猛又爽又黄91精品| 欧美激情一区二区三区久久久| 欧美高清性xxxx| www.久久草.com| 午夜欧美大尺度福利影院在线看| 色综合电影网| 蜜桃av鲁一鲁一鲁一鲁俄罗斯的 | 99久久99久久久精品齐齐| 欧美在线日韩在线| www.色小姐com| 精品国产乱码久久久久久1区2匹| 日韩精品专区在线| 国产视频手机在线播放| 国产网红在线观看| 中文字幕中文字幕在线一区| 精品国产日本| 成人免费观看在线视频| 蜜桃视频在线观看一区二区| 欧美亚洲另类激情另类| 久草网在线观看| 91麻豆国产自产在线观看亚洲| 日韩av影视在线| 97免费公开视频| 福利一区二区三区视频在线观看| 五月婷婷欧美视频| 好吊色视频988gao在线观看| 亚乱亚乱亚洲乱妇| 久久精品水蜜桃av综合天堂| 成人午夜电影免费在线观看| 国产毛片毛片毛片毛片| 日本视频一区二区| 国产成人一区三区| 天天操天天操天天操天天| 影音先锋在线一区| 欧美激情精品久久久久久黑人| 久草视频手机在线| 亚洲成人免费| 欧美不卡视频一区发布| www欧美com| 中文字幕一区二区三区欧美日韩 | 91精品蜜臀在线一区尤物| 别急慢慢来1978如如2| 永久免费毛片在线播放| 午夜欧美一区二区三区在线播放| 国产freexxxx性播放麻豆| 国产激情视频在线| 亚洲美女在线一区| 欧美做受777cos| 在线h片观看| 亚洲综合av网| 精品视频在线观看一区| 超碰在线视屏| 欧美视频免费在线观看| 无码人妻丰满熟妇区毛片18| 亚洲校园激情春色| 色94色欧美sute亚洲线路一ni| 成人在线免费播放视频| 久久野战av| 欧美日韩一二三| 欧美视频亚洲图片| 一区二区三区视频免费视频观看网站| 日韩欧美一级精品久久| 亚洲一区二区三区四区av| 国产日韩三级| 亚洲欧美另类自拍| 日本污视频网站| 亚洲国产一区二区在线观看| 欧美国产视频一区二区| 日本一级淫片色费放| 久久av在线| 国产玖玖精品视频| 亚洲精品成人电影| 久久男人中文字幕资源站| 天堂资源在线亚洲视频| а√中文在线8| 午夜激情一区二区三区| 日韩视频第二页| 91麻豆精品国产综合久久久| 欧美成人女星排行榜| 大地资源二中文在线影视观看 | 一本一道久久a久久综合精品| 男人在线资源站| 伊人一区二区三区| 乱妇乱女熟妇熟女网站| 99久久精品一区二区成人| 日韩久久久久久| 久久美女免费视频| 中文字幕一区二区三区在线视频| 97精品国产97久久久久久| 国产真人无遮挡作爱免费视频| 精品一区二区在线播放| 国产在线播放一区二区| 网友自拍视频在线| 亚洲国产日日夜夜| 天天操天天爱天天爽| 91成人在线精品视频| 一区二区三区视频免费在线观看| 久久久久国产精品夜夜夜夜夜| 久久久久久久高潮| 91在线观看欧美日韩| 日韩一二三四| 亚洲精品大片www| 麻豆传传媒久久久爱| 91精品短视频| 久久亚洲精品成人| 91青青草视频| 99久久99久久综合| 日产精品久久久久久久蜜臀| 国产精品久久乐| 日韩av在线免费播放| 男人晚上看的视频| 天堂av在线一区| 国产亚洲欧美一区二区三区| 黄色网址在线免费| 在线看日韩精品电影| 给我免费观看片在线电影的| 亚洲色图插插| 国产精品一区二区久久精品| 欧洲综合视频| 欧美日韩精品在线| 欧美双性人妖o0| 欧美在线日韩| 成人日韩av在线| 日本视频在线| 欧美日精品一区视频| 黄色片网站免费| 免费日韩一区二区| 久久久精品动漫| 国产社区精品视频| 亚洲成人网在线观看| 久青草免费视频| 国产成人精品在线看| 99久re热视频精品98| 99精品美女视频在线观看热舞| 亚洲最新在线视频| 日批视频免费观看| 国产喷白浆一区二区三区| 无码aⅴ精品一区二区三区浪潮| 久久中文字幕导航| 97视频在线观看免费高清完整版在线观看| 超碰在线人人干| 亚洲国产成人tv| 北岛玲一区二区| 亚洲在线日韩| 欧洲精品亚洲精品| 成人自拍视频网| 三级精品视频久久久久| 91欧美日韩麻豆精品| 亚洲欧美另类久久久精品2019| 99九九99九九九99九他书对| 久久中文亚洲字幕| 国产日韩欧美视频在线| 18+视频在线观看| 欧美一二三区在线| 国产午夜精品无码一区二区| 99视频一区二区三区| 日本精品一区二区三区四区| 精品国产一区二区三区香蕉沈先生| 国产91在线高潮白浆在线观看| 番号集在线观看| 91超碰这里只有精品国产| 九九视频免费在线观看| 91亚洲精品乱码久久久久久蜜桃 | 亚洲精品大尺度| 狠狠人妻久久久久久| 国产亚洲成aⅴ人片在线观看| 国产九九热视频| 国内精品嫩模av私拍在线观看| 国产嫩草一区二区三区在线观看| 免费福利视频一区二区三区| 神马久久久久久| 欧美一区二区三区黄片| 色激情天天射综合网| 在线观看黄网址| 不卡影院免费观看| 国产区二区三区| 国产一区二区三区四区三区四| 久久久久久久有限公司| 久久亚洲国产精品尤物| 色综合色综合久久综合频道88| 三区在线视频| 91精品综合久久久久久| 欧美日韩综合在线观看| 中文字幕一区二区三区四区不卡 | 97视频在线免费观看| 91社区在线观看播放| 欧美r级在线观看| 国产一级片免费在线观看| 一区二区三区四区蜜桃| 能免费看av的网站| 国产精品18久久久久| 日本熟妇人妻中出| 精品成人国产| 久久免费视频2| 日韩欧美国产大片| 91嫩草视频在线观看| 欧美不卡高清一区二区三区| 色综合久综合久久综合久鬼88| 久久久久久久久亚洲精品| 日韩一级完整毛片| 亚洲性猛交富婆| 亚洲精品v日韩精品| 久久久久久久久福利| www..com久久爱| 久久精品一二三四| 秋霞午夜鲁丝一区二区老狼| 人妻夜夜添夜夜无码av| 久久久久久久久丰满| 日韩亚洲视频| 亚洲婷婷伊人| 精品伊人久久大线蕉色首页| 精品视频在线播放一区二区三区| 国产精品久久久久福利| 色戒汤唯在线观看| 欧美激情精品久久久久久变态| 欧美一区二区三区| 中文字幕亚洲一区在线观看 | 中文在线观看av| 精品久久久久久久久久久久| 欧美日韩免费做爰视频| 亚洲色图在线看| 免费看一级黄色| 国产精品色哟哟网站| 老熟妇一区二区| 久久精品夜色噜噜亚洲aⅴ| 亚洲男女在线观看| aaa亚洲精品| 在线中文字日产幕| 成人网页在线观看| 国产xxxx视频| 波多野结衣一区二区三区 | 亚洲中文字幕无码不卡电影| 亚洲茄子视频| 欧美日韩在线一| 在线综合亚洲| 国产极品美女高潮无套久久久| 99视频一区| 国产精品免费观看久久| 久久久久久久高潮| 欧美综合在线观看视频| 久久久久欧美精品| 已婚少妇美妙人妻系列| 日韩av一区二| 无尽裸体动漫2d在线观看| 久久国内精品自在自线400部| 亚洲精品性视频| 国产精品一区二区91| 4438x全国最大成人| 懂色av中文一区二区三区| 折磨小男生性器羞耻的故事| 成人毛片在线观看| 在线免费观看a级片| 久久久久青草大香线综合精品| 蜜桃无码一区二区三区| 中文在线一区二区| 亚洲女人久久久| 亚洲一区二区三区中文字幕| 91浏览器在线观看| 欧美午夜精品一区| 国产av精国产传媒| 亚洲国产天堂网精品网站| 久久国产精品高清一区二区三区| 中文字幕久久亚洲| av免费在线免费观看| 久久久中文字幕| 国精产品一区二区三区有限公司| 国产色综合天天综合网| 成人av动漫| 日本不卡一区| 欧美在线高清| 精品久久久久av| 狠狠色丁香九九婷婷综合五月| 美国黄色一级视频| 久久久久久久久久久电影| 蜜桃av.com| 午夜私人影院久久久久| 国产在线一级片| 日韩美女在线视频| 国产在线视频网| 欧美日韩爱爱视频| 欧美影视资讯| 国产精品区一区二区三在线播放 | 麻豆一二三区精品蜜桃| 国产一区免费在线观看| 日韩精品电影| www.com毛片| 国产精品一二三在| 国产免费无遮挡吸奶头视频| 亚洲一区自拍偷拍| 亚洲一区二区色| 亚洲国产美女久久久久| 黄色一级大片在线免费看产| 欧美孕妇毛茸茸xxxx| 欧美影院精品| 艳色歌舞团一区二区三区| 宅男噜噜噜66一区二区| 一卡二卡三卡四卡五卡| 国产网站一区二区| www日韩精品| 精品免费一区二区三区| 91在线不卡| 国产精品91视频| 欧美18xxxx| 欧美这里只有精品| 激情国产一区二区| 性猛交娇小69hd| 狠狠干狠狠久久| 国产成人三级在线观看视频| 久久精品99无色码中文字幕| 国产日韩另类视频一区| 久久精品成人一区二区三区蜜臀 | 欧美激情一区二区三区成人| 91精品福利观看| 亚洲免费在线精品一区| 久久精品国产清高在天天线| 国产黑丝一区二区| 亚洲一区二区三区免费视频| 一区不卡在线观看| 中文字幕亚洲一区在线观看| 久久sese| 欧美国产二区| 免费在线播放第一区高清av| 精品影片一区二区入口| 亚洲第一成人在线| 亚洲va天堂va欧美ⅴa在线| 久久av中文字幕| 国产一区二区三区精品在线观看| 手机看片福利永久国产日韩| 久久这里有精品15一区二区三区| 亚洲精品乱码久久久久久不卡| 亚洲高清视频的网址| 丰满人妻一区二区三区免费| 久久99亚洲精品| caoporn成人免费视频在线| 欧美日韩激情四射| 国产99久久久国产精品潘金 | 欧美边添边摸边做边爱免费| 国产美女扒开尿口久久久| 91视频久久| 国产毛片久久久久久| 亚洲欧美另类综合偷拍| www.香蕉视频| 久久久久久亚洲精品中文字幕| silk一区二区三区精品视频| 人妻久久久一区二区三区| www.日韩精品| 欧美 日韩 精品| 在线播放亚洲激情| 国产一区二区三区国产精品| 人妻互换免费中文字幕| av福利精品导航| 精品人妻一区二区三区潮喷在线| 中文字幕成人精品久久不卡| 国产免费区一区二区三视频免费| 日本老太婆做爰视频| 成人免费va视频| 丰满少妇xoxoxo视频| 中文字幕亚洲精品| 精品欧美视频| www国产精品内射老熟女| 国产欧美一区二区三区在线看蜜臀 | 国自产拍偷拍福利精品免费一| 韩国三级hd两男一女| 欧美视频在线观看免费| 大地资源中文在线观看免费版| 成人黄色av网站| 在线精品亚洲| 日本一级免费视频| 91精品国产综合久久蜜臀| segui88久久综合| 日韩av电影免费播放| 国产一区二区久久| 精品欧美一区二区三区免费观看| 怡红院精品视频| 亚洲国产欧美国产第一区| 欧美成人xxxxx| 最新国产精品久久精品| 姝姝窝人体www聚色窝| 国产精品爽爽爽| 在线日本成人| 林心如三级全黄裸体| 亚洲成**性毛茸茸| julia一区二区三区中文字幕| 日b视频免费观看| 国产天堂亚洲国产碰碰| 国产不卡av在线播放| 国产99久久精品一区二区 夜夜躁日日躁| 91麻豆国产自产在线观看亚洲| 青青草视频播放| 正在播放亚洲一区| 美女写真久久影院|