精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Anthropic:怎么才能控制模型的行為,做好Agents?

人工智能
提示工程關(guān)注的是“怎么寫好提示詞”,上下文工程關(guān)注的是“怎么管理整個上下文狀態(tài)”——包括系統(tǒng)指令、工具、外部數(shù)據(jù)、消息歷史、MCP等所有信息。

嘿,大家好!這里是一個專注于前沿AI和智能體的頻道~

Anthropic 最近又發(fā)了一篇關(guān)于 AI Agents 的博客,過去幾個月已經(jīng)連續(xù)好幾篇了。

我覺得他們關(guān)于Agents的內(nèi)容整體都挺好的,寫的也很有實踐意義。

今天的分享,圍繞一個核心問題:如何配置上下文,才能讓模型持續(xù)輸出期望的行為。

TLDR:

上下文是有限資源,存在 Context Rot現(xiàn)象。 好的上下文工程 = 找到最小的高信號 token 集,最大化期望結(jié)果。

長時間任務(wù)三板斧:壓縮、結(jié)構(gòu)化筆記、子智能體。

新的趨勢是 Just-in-time策略:不預(yù)處理所有數(shù)據(jù),而是維護(hù)輕量級標(biāo)識符(文件路徑、鏈接),運(yùn)行時動態(tài)加載。

混合策略是實踐共識,Claude Code 采用混合模型:CLAUDE.md 直接放入上下文(預(yù)處理),glob/grep 讓 Agent 即時探索。

什么是上下文工程?

先說清楚概念。上下文指的是調(diào)用大模型時包含的所有 token。

而上下文工程就是在 LLM 固有約束下,優(yōu)化這些 token,以實現(xiàn)預(yù)期結(jié)果的工程問題。

簡單來說:提示工程關(guān)注的是“怎么寫好提示詞”,上下文工程關(guān)注的是“怎么管理整個上下文狀態(tài)”——包括系統(tǒng)指令、工具、外部數(shù)據(jù)、消息歷史、MCP等所有信息。

圖片圖片

早期,大多數(shù)用例是一次性的分類或文本生成任務(wù),寫好提示詞就夠了。

但現(xiàn)在我們要構(gòu)建的是能在多輪推理、長時間運(yùn)行的 Agent,這些 Agent 每次循環(huán)都會生成更多可能相關(guān)的數(shù)據(jù),這些信息必須被持續(xù)精煉。

為什么上下文很珍貴!

Anthropic的核心insight是:上下文是有限資源,邊際收益遞減

盡管模型能處理越來越大的上下文窗口,但研究發(fā)現(xiàn)了一個現(xiàn)象叫 Context Rot——隨著上下文 token 數(shù)量增加,模型準(zhǔn)確召回信息的能力會下降。

這不是某個模型的問題,而是所有模型的共性。

原因在于 Transformer 架構(gòu)本身:每個 token 都要關(guān)注(attend)其他所有 token,這產(chǎn)生了 n2 的兩兩關(guān)系。上下文越長,模型捕獲這些關(guān)系的能力就越被稀釋。

這意味著:好的上下文工程就是找到最小的、高信號的 token 集合,最大化期望結(jié)果的可能性。

上下文的構(gòu)成

Anthropic 給出了覆蓋上下文的各個組成部分:

System Prompts

要極其清晰,使用簡單直接的語言,并且要在正確的高度呈現(xiàn)想法。

那什么叫正確的高度?Anthropic 指出了兩個極端的失敗模式:

  • 一個是把復(fù)雜的、脆弱的 if-else 邏輯硬編碼進(jìn)提示詞
  • 另一個是提供模糊的、高層次的指導(dǎo),無法給 LLM 具體信號

最優(yōu)的高度在中間:足夠具體以有效引導(dǎo)行為,又足夠靈活讓模型獲得強(qiáng)啟發(fā)式指導(dǎo)。

圖片圖片

建議用 XML 標(biāo)簽或 Markdown 標(biāo)題組織提示詞(如 <background_information>## Tool guidance 等),但格式也逐漸變得不那么重要,因為模型越來越強(qiáng)了。

核心原則是:追求完整可以概述預(yù)期行為的最小集合。但是,最小不等于短——仍然需要給 Agent 足夠的前置信息。

Tools

工具讓 Agent 能與環(huán)境交互、拉取新上下文。

最常見的失敗模式是:工具集臃腫,覆蓋太多功能,或?qū)е率褂媚膫€工具的決策點(diǎn)模糊不清。

如果人都無法明確說出某個情況該用哪個工具,AI Agent 更做不到。

Examples

Few-shot prompting 是公認(rèn)的有效方法。

但 Anthropic 提到,不建議把一堆邊緣案例塞進(jìn)提示詞,試圖闡述 LLM 應(yīng)該遵循的每條規(guī)則。

相反,應(yīng)該想辦法構(gòu)建一組多樣的、典型的示例,有效展示 Agent 的預(yù)期行為。

對 LLM 來說,示例就是一圖勝千言。

從預(yù)處理到即時策略

傳統(tǒng)做法是用基于向量的檢索在推理前就把相關(guān)上下文準(zhǔn)備好。

但現(xiàn)在越來越多人在用 Just-in-time 上下文策略。

核心思路:不預(yù)處理所有相關(guān)數(shù)據(jù),而是維護(hù)輕量級標(biāo)識符(文件路徑、存儲查詢、網(wǎng)頁鏈接等),用工具在運(yùn)行時動態(tài)加載數(shù)據(jù)到上下文。

Anthropic 自己的 Claude Code 就是這么做的。模型可以寫目標(biāo)查詢、存儲結(jié)果,利用 Bash 命令如 head 和 tail 分析大量數(shù)據(jù),而不用把完整數(shù)據(jù)對象加載到上下文。

這種方式模仿人類認(rèn)知:我們不會記住整個信息語料庫,而是引入外部組織和索引系統(tǒng)(文件系統(tǒng)、收件箱、書簽)按需檢索相關(guān)信息。

這種方法還實現(xiàn)了 Progressive Disclosure ——讓 Agent 通過探索逐步發(fā)現(xiàn)相關(guān)上下文。

每次交互產(chǎn)生的上下文為下一個決策提供信息:文件大小暗示復(fù)雜度;命名規(guī)范暗示用途;時間戳可以代表相關(guān)性。

當(dāng)然,這有權(quán)衡:運(yùn)行時探索比檢索預(yù)計算數(shù)據(jù)慢。

而且需要有非常精妙的工程,確保 LLM 有正確的工具和啟發(fā)式方法來有效找到信息。

最有效的 Agent 可能采用混合策略:部分?jǐn)?shù)據(jù)預(yù)先檢索以提高速度,部分由 Agent 自主探索。

Claude Code 就是混合模型:CLAUDE.md 文件會直接放入上下文,而 glob 和 grep 等原語讓它能即時導(dǎo)航環(huán)境、檢索文件。

長時間任務(wù)的上下文工程

對于需要幾十分鐘到幾小時連續(xù)工作的長時間任務(wù),Agent 需要專門技術(shù)來應(yīng)對上下文窗口限制。

Anthropic 提供了三個策略:

Compaction

把接近上下文窗口限制的對話進(jìn)行總結(jié),用摘要重新啟動新的上下文窗口。這通常是上下文工程的第一個杠桿。

在 Claude Code 中,會把消息歷史傳給模型總結(jié)壓縮關(guān)鍵細(xì)節(jié)。模型保留架構(gòu)決策、未解決的 bug、實現(xiàn)細(xì)節(jié),同時丟棄冗余的工具輸出或消息。然后 Agent 用壓縮后的上下文加最近訪問的 5 個文件繼續(xù)工作。

壓縮的藝術(shù)在于選擇保留什么、丟棄什么。過度激進(jìn)的壓縮可能丟失微妙但關(guān)鍵的上下文。

Structured Note-taking

也叫智能體記憶。Agent 定期把筆記寫到上下文窗口外的持久化內(nèi)存中,之后再拉回上下文窗口。

Claude Code 創(chuàng)建待辦清單,或你的自定義 Agent 維護(hù) NOTES.md 文件,這種簡單模式讓 Agent 跨復(fù)雜任務(wù)追蹤進(jìn)度,維護(hù)原本會在幾十次工具調(diào)用中丟失的關(guān)鍵上下文和依賴。

Sub-agent Architectures

與其讓一個 Agent 維護(hù)整個項目的狀態(tài),不如讓專門的子智能體處理有清晰上下文窗口的聚焦任務(wù)。

主 Agent 用高層計劃協(xié)調(diào),子智能體執(zhí)行深度技術(shù)工作或使用工具查找相關(guān)信息。

每個子智能體可能廣泛探索,使用大量 token,但只返回結(jié)果的精簡總結(jié)(通常 1,000-2,000 token)。

這實現(xiàn)了清晰的關(guān)注點(diǎn)分離——詳細(xì)搜索上下文隔離在子智能體內(nèi),主 Agent 專注于綜合和分析結(jié)果。

實踐建議

在上下文的不同組成部分(系統(tǒng)提示、工具、示例、消息歷史等)都要深思熟慮,保持信息豐富但緊湊。

選擇哪種方法取決于任務(wù)特征:

  • 上下文壓縮適合需要大量來回的任務(wù),保持對話流
  • 記筆記適合有清晰里程碑的迭代開發(fā)
  • 多智能體架構(gòu)適合并行探索有回報的復(fù)雜研究和分析

如何在擴(kuò)展交互中,保持連貫性,是構(gòu)建 Agent 的核心。

最后

Anthropic 在 Sonnet 4.5 發(fā)布時,還在 Claude Developer Platform 上發(fā)布了公開測試版的記憶工具,地址在:http://anthropic.com/news/context-management

通過基于文件的系統(tǒng)讓存儲和查詢上下文窗口外的信息變得更容易。同時也有記憶和上下文管理 cookbook,地址在:https://github.com/anthropics/claude-cookbooks/blob/main/tool_use/memory_cookbook.ipynb。

責(zé)任編輯:武曉燕 來源: 探索AGI
相關(guān)推薦

2024-12-19 09:48:59

2011-11-18 09:16:20

團(tuán)隊管理

2009-07-06 18:24:51

IT資產(chǎn)運(yùn)維管理廣通信達(dá)科技

2020-10-22 20:45:37

辦公

2023-12-27 14:06:00

模型訓(xùn)練

2022-04-11 15:05:32

元宇宙虛擬工作空間虛假身份注冊

2017-02-09 08:35:37

2024-11-21 13:53:09

微軟AI技術(shù)

2024-10-31 13:40:24

GitHubCopilot人工智能

2009-01-12 11:16:58

控制器控制器行為行為結(jié)果

2024-04-11 13:34:37

大語言模型

2010-09-25 12:51:45

DHCP Relay

2023-11-05 15:09:35

模型AI

2010-03-02 14:41:00

WCF行為控制

2024-04-18 08:30:00

留存分析模型數(shù)據(jù)分析

2023-02-01 23:00:42

大數(shù)據(jù)

2025-01-10 10:30:00

大模型統(tǒng)計評估

2010-02-25 09:36:28

WCF行為控制

2014-02-18 09:37:57

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

日本中文字幕在线| 在线精品一区二区三区| av大全在线| 成人丝袜高跟foot| 欧洲s码亚洲m码精品一区| 成人黄色a级片| 日韩黄色av| 欧美午夜片在线免费观看| 亚洲不卡中文字幕| 国产精品玖玖玖| 一区二区三区福利| 久久久国产精品亚洲一区| 久久久久久婷婷| 青青国产精品| 疯狂欧美牲乱大交777| 亚洲在线视频一区二区| 手机在线观看毛片| 黑人精品欧美一区二区蜜桃| 97香蕉久久超级碰碰高清版| 性生交大片免费全黄| 女同另类激情重口| 777xxx欧美| 男女午夜激情视频| 午夜影院免费在线| 国产精品麻豆一区二区 | 久久精品一二区| 五月激情综合| 一本色道久久综合狠狠躁篇怎么玩 | а√资源新版在线天堂| 91在线观看高清| 99r国产精品视频| 一级黄色小视频| 噜噜噜躁狠狠躁狠狠精品视频| 色综合视频一区中文字幕| 1024手机在线观看你懂的| 久久综合五月婷婷| 日韩欧美国产电影| 天天色天天综合网| 成人免费在线观看视频| 色综合天天综合网国产成人综合天 | 99九九视频| 国产毛片一区二区三区va在线| 久久一区二区三区四区五区| 久久久亚洲福利精品午夜| 夫妻性生活毛片| 天天影视天天精品| 色香阁99久久精品久久久| 国产一区二区三区四区五区六区| 欧美freesex8一10精品| 亚洲第一天堂无码专区| 国产xxxx视频| 美女一区2区| 亚洲精品大尺度| 国产精品久久不卡| 亚洲警察之高压线| 亚洲精品永久免费| a级片在线观看| 免费国产自久久久久三四区久久| 精品亚洲夜色av98在线观看| 国产人妻黑人一区二区三区| 久久精品色播| 日韩精品视频观看| 国产免费看av| 欧美色就是色| 精品国内亚洲在观看18黄| 国产精品成人69xxx免费视频| 久久精品国产68国产精品亚洲| 日韩在线观看免费网站| 三级在线观看免费大全| 欧美黄在线观看| 国产做受高潮69| 天天综合网入口| 三级影片在线观看欧美日韩一区二区| 日韩美女福利视频| 中文字幕人妻精品一区| 国产真实乱偷精品视频免| 97超级碰碰| 五月婷在线视频| 欧美经典一区二区| 亚洲av首页在线| 9999精品成人免费毛片在线看 | 国产欧美精品一区| 中文字幕欧美日韩一区二区三区| 中文字幕有码在线观看| 婷婷国产在线综合| 中国黄色片免费看| 香蕉免费一区二区三区在线观看| 日韩电影中文字幕在线| 欧美亚洲色综久久精品国产| 欧美色图麻豆| 日韩女优在线播放| 国产福利第一页| 91免费视频观看| 中文字幕色一区二区| av资源一区| 欧美三片在线视频观看| 亚洲精品成人无码毛片| 精品国产91| 欧美日本国产在线| 国产成人a v| 高清av一区二区| 亚洲一卡二卡| 性国裸体高清亚洲| 欧美一卡二卡三卡四卡| 扒开jk护士狂揉免费| 欧美日韩岛国| 国产精品看片资源| 少妇av在线播放| 中文字幕亚洲在| 国产精品亚洲a| 亚洲国产欧美在线观看| 国产一区二区日韩精品欧美精品| 欧美日韩激情在线观看| 青青草91视频| 欧美xxxx黑人又粗又长精品| 深夜国产在线播放| 欧美精品一二三| 美女爆乳18禁www久久久久久| 欧美成人亚洲| 91免费精品国偷自产在线| 精品影院一区| 精品久久久久久久大神国产| 深爱五月综合网| 日韩欧美1区| 国产精品黄页免费高清在线观看| 天堂在线视频免费| 亚洲一区在线播放| 美女被艹视频网站| 天天影视欧美综合在线观看| 国产精品扒开腿爽爽爽视频| 日本一卡二卡四卡精品| 亚洲成va人在线观看| 宇都宫紫苑在线播放| 日韩啪啪电影网| 国产精品第二页| 日本成人一区二区三区| 婷婷亚洲久悠悠色悠在线播放| 一级日本黄色片| 五月婷婷六月综合| 国产日韩在线免费| 日本精品在线| 欧美三级电影在线观看| 国产伦理片在线观看| 国产午夜久久| 久久综合九色欧美狠狠| 51漫画成人app入口| 亚洲成人a级网| 日韩av一区二区在线播放| 福利一区二区在线| 日韩亚洲欧美视频| 欧美日韩导航| 欧美亚洲另类制服自拍| 香蕉视频国产在线| 黑人巨大精品欧美一区免费视频| 第四色在线视频| 亚洲一区不卡| 日本高清一区| 欧美成人xxxx| 久久久成人精品| 国产成人免费看一级大黄| 亚洲美女免费在线| 亚洲欧美综合视频| 国产亚洲激情| 日本一区视频在线播放| 日韩高清不卡| 久久夜色精品国产| 亚洲国产日韩在线观看| 亚洲成人自拍网| 欧美老熟妇乱大交xxxxx| 日本强好片久久久久久aaa| 一区国产精品| 国产精品xxx在线观看| 欧美一级片免费在线| 搞黄视频免费在线观看| 911国产精品| 国产精品500部| 欧美国产一区二区| 性久久久久久久久久久久久久| 激情久久婷婷| 亚洲精品一区二区三区av| 欧美成年网站| 奇门遁甲1982国语版免费观看高清 | 免费看毛片网站| 中文字幕一区二区三区乱码在线| 日韩精品国产一区| 久久精品人人| 日日噜噜夜夜狠狠久久丁香五月| 欧美偷窥清纯综合图区| 国产有码一区二区| 日韩伦理在线| 久久精品国产91精品亚洲| 国精品人妻无码一区二区三区喝尿 | 卡通动漫国产精品| 国产精品免费在线免费| 日韩av激情| 国产一区二区三区久久精品| 国产高潮在线观看| 日本道精品一区二区三区| 日韩在线观看视频一区二区| www激情久久| 台湾佬美性中文| 奇米一区二区三区av| 国产成a人亚洲精v品在线观看| 国产一区二区三区网| 官网99热精品| 亚洲三级在线| 国产97在线|日韩| 国产高清视频色在线www| 久久精品国产96久久久香蕉| 美丽的姑娘在线观看免费动漫| 日韩视频免费观看高清完整版在线观看 | 9色在线观看| 日韩成人在线电影网| 国产suv一区二区| 欧美亚洲图片小说| 欧美黑人一区二区| 亚洲一区二区欧美激情| 成年人二级毛片| 国产精品午夜在线| av直播在线观看| 99久久久国产精品免费蜜臀| 欧美性猛交乱大交| 久久电影网电视剧免费观看| 国产成人久久777777| 99pao成人国产永久免费视频| 蜜臀在线免费观看| 国产精品久久久久蜜臀 | 中文字幕一区二区人妻在线不卡| 国产成人8x视频一区二区 | 久久青青草原亚洲av无码麻豆 | 国产亚洲综合性久久久影院| 北京富婆泄欲对白| 国产成人精品亚洲777人妖 | 91久久国产综合久久91| 五月天久久比比资源色| 一区二区三区免费高清视频| 亚洲人成网站精品片在线观看| 中文字幕在线观看二区| 国产精品区一区二区三| 美国一级黄色录像| 欧美激情一二三区| 中国美女黄色一级片| 中文乱码免费一区二区| 色撸撸在线视频| 国产精品免费人成网站| 91香蕉视频污在线观看| 国产精品国模大尺度视频| 欧美xxxooo| 亚洲柠檬福利资源导航| 欧美成人三级在线观看| 一区二区成人在线视频| 毛片aaaaa| 亚欧色一区w666天堂| 国产成人在线免费观看视频| 欧美视频中文字幕在线| 蜜臀精品一区二区三区| 91成人免费电影| 91精品中文字幕| 91精品国产综合久久久蜜臀粉嫩| av中文字幕在线免费观看| 日韩免费看网站| 色哟哟中文字幕| 亚洲欧美日韩中文在线| 1024免费在线视频| 欧美成人免费视频| 国产乱码在线| 国产91色在线免费| 999精品嫩草久久久久久99| 亚洲最大福利网| 神马久久影院| 亚洲伊人婷婷| 在线成人亚洲| 日本熟妇人妻中出| 国产精品自拍网站| 国产ts丝袜人妖系列视频 | 亚洲国产日韩欧美在线图片| 日韩偷拍自拍| 日韩在线观看免费高清| h片视频在线观看| 国产精品激情av电影在线观看| 国产一区二区三区免费在线| 国产精品国色综合久久| 精品久久久中文字幕| 欧美 亚洲 视频| 天堂久久久久va久久久久| 欧美性猛交xxxx乱大交91| 91在线精品一区二区三区| 中文字幕观看av| 天天综合网天天综合色| 亚洲综合五月天婷婷丁香| 精品国产一区二区在线观看| eeuss影院www在线观看| 欧美大片免费看| 黄页免费欧美| 九9re精品视频在线观看re6| 欧美最新另类人妖| 97在线国产视频| 久久精品国产99久久6| 精品无码国产一区二区三区51安| 国产精品视频第一区| 久草国产精品视频| 欧美一区二区日韩| 黄色av网站在线免费观看| 久久97久久97精品免视看| 精品亚洲美女网站| 国产精品视频免费一区二区三区| 日韩精品诱惑一区?区三区| 精品视频在线观看一区| 激情五月婷婷综合网| 午夜时刻免费入口| 无码av免费一区二区三区试看 | 国产电影精品久久禁18| 日本人亚洲人jjzzjjz| 狠狠躁天天躁日日躁欧美| www.黄色av| 久久久精品中文字幕| 四虎成人在线| 久久人人九九| 亚洲国产高清一区二区三区| 久久久精品高清| 国产精品久久久久久福利一牛影视| 91蜜桃视频在线观看| 日韩欧美在线观看一区二区三区| 中文字幕在线视频区| 青青草一区二区| 外国成人在线视频| 国产九九九九九| 成人免费观看视频| 久久久久亚洲av无码专区| 91精品国产91久久综合桃花| 色多多视频在线观看| 国产精品www色诱视频| 国产亚洲电影| 国产第一页视频| 久久免费的精品国产v∧| 久久久久久少妇| 亚洲精品按摩视频| 麻豆mv在线观看| 精品国产乱码久久久久久蜜柚| 国产精品豆花视频| 极品白嫩的小少妇| 亚洲影视在线播放| 黄色一级大片在线免费看国产一| 九色精品美女在线| 国产成人精品亚洲线观看| 18禁裸男晨勃露j毛免费观看| 国产丶欧美丶日本不卡视频| 青娱乐免费在线视频| 精品国产电影一区二区| 草草在线观看| 久久精品日产第一区二区三区乱码 | theporn国产在线精品| 无码人妻少妇伦在线电影| 不卡的电视剧免费网站有什么| 日产精品久久久久| 亚洲女成人图区| 成人四虎影院| 免费看污污视频| 高清不卡一区二区在线| 日韩三级免费看| 亚洲男人天堂2023| 精品久久久网| 久久久久久久9| 91视频免费看| 中文字幕无码乱码人妻日韩精品| 日韩在线视频二区| 亚洲精品不卡在线观看| 草草久久久无码国产专区| 国产三级一区二区三区| 国产又粗又长又大视频| 久久久久国产精品www| 久久91精品| 图片区乱熟图片区亚洲| 亚洲国产乱码最新视频| 国产在线观看黄| 91在线观看免费高清完整版在线观看| 国内自拍一区| 日本少妇xxxxx| 日韩欧美色综合网站| 一根才成人网| 日本一级淫片演员| 91免费视频网| 国产黄色一级大片| 青青精品视频播放| 欧美伊人久久| 男人操女人动态图| 欧美一区二区三区四区久久| 欧美日韩在线观看首页| 最新欧美日韩亚洲| 99re在线精品| 99精品在线视频观看| 日本精品久久电影| 欧美/亚洲一区| 少妇无套高潮一二三区| 日韩精品在线一区二区| 日韩精品一区二区三区| 大西瓜av在线| 亚洲婷婷在线视频| 可以在线观看的av网站| 99re资源|