精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

你的AI Agent為何總“犯傻”?構(gòu)建生產(chǎn)級(jí)Agent所需的六大工程原則

人工智能
當(dāng)你被 Agent 的行為所困擾時(shí),記住,問(wèn)題很可能出在缺失的工具、模糊的提示或不足的上下文,而不是模型本身的局限性。

隨著 AI Agent 技術(shù)的興起,許多開(kāi)發(fā)者都投入到構(gòu)建智能體的浪潮中,但很快就會(huì)發(fā)現(xiàn),讓 Agent 穩(wěn)定、可靠地工作遠(yuǎn)非想象中容易。它們時(shí)而產(chǎn)生幻覺(jué),時(shí)而偏離軌道,時(shí)而做出一些令人費(fèi)解的“愚蠢”行為。最近,來(lái)自 app.build 的 Arseni Kravchenko 分享了他們?cè)跇?gòu)建生產(chǎn)級(jí) AI Agent 過(guò)程中總結(jié)出的六大核心工程原則。這些原則摒棄了虛無(wú)縹緲的“提示詞黑魔法”,回歸到堅(jiān)實(shí)的軟件工程基礎(chǔ)。對(duì)于正在或計(jì)劃使用 Go 構(gòu)建 AI Agent 的開(kāi)發(fā)者來(lái)說(shuō),這是一份寶貴的實(shí)踐指南。

圖片

原則一:投資你的系統(tǒng)提示 (System Prompt)

許多人對(duì)“提示詞工程”持懷疑態(tài)度,認(rèn)為它充滿了“我奶奶快不行了,請(qǐng)幫幫我”之類的奇技淫巧。然而,作者指出,現(xiàn)代 LLM 真正需要的是直接、詳細(xì)、清晰且無(wú)矛盾的上下文,而非情感操控。

對(duì)于開(kāi)發(fā)者而言,你要做的就是不要耍小聰明,要把系統(tǒng)提示當(dāng)作給 Agent 的API 文檔來(lái)寫(xiě)。

當(dāng)你為 Agent 提供一個(gè)通過(guò) os/exec 調(diào)用的工具時(shí),不要只告訴它工具的名字。在系統(tǒng)提示中清晰地說(shuō)明:

  • 工具的完整命令是什么。
  • 每個(gè)參數(shù)的含義、類型和格式
  • 預(yù)期的輸出格式以及如何解析它。
  • 前置條件和錯(cuò)誤情況

一個(gè)詳盡的系統(tǒng)提示是 Agent 可靠行為的基石。

原則二:拆分上下文 (Split the Context)

“上下文工程”是比“提示詞工程”更重要的概念。巨大的、單一的上下文不僅成本高、延遲大,還會(huì)導(dǎo)致模型出現(xiàn)“注意力衰減”,忽略掉關(guān)鍵信息。

作者建議大家:默認(rèn)只提供最少必要知識(shí),并通過(guò)工具讓 Agent 在需要時(shí)主動(dòng)獲取更多上下文。

與其在初始提示中塞入整個(gè)項(xiàng)目的源代碼,不如:

  • 提供文件列表:在提示中只給出項(xiàng)目的文件樹(shù)結(jié)構(gòu)。
  • 提供 read_file 工具:讓 Agent 在需要時(shí),通過(guò)調(diào)用這個(gè)工具來(lái)讀取特定文件的內(nèi)容。
  • 上下文壓縮:在 Agent 的反饋循環(huán)中,主動(dòng)使用工具(甚至另一個(gè) LLM)來(lái)壓縮和總結(jié)日志、工具輸出等動(dòng)態(tài)信息,避免上下文無(wú)限膨脹。


圖片


如上圖所示,將一個(gè)龐大的任務(wù)分解為多個(gè)具有專注上下文的、可編排的子任務(wù),是構(gòu)建高效 Agent 的關(guān)鍵。

原則三:精心設(shè)計(jì)你的工具 (Design Tools Carefully)

工具是 AI Agent 的核心。設(shè)計(jì)給 Agent 用的工具,比設(shè)計(jì)給人用的 API 更具挑戰(zhàn)性,因?yàn)?LLM 不會(huì)“讀心術(shù)”,它們會(huì)毫不留情地濫用你留下的任何漏洞。

作者建議:把你的 Agent 當(dāng)成一個(gè)聰明但容易分心的初級(jí)開(kāi)發(fā)者,為它設(shè)計(jì) API:

  • 保持粒度一致:工具(函數(shù))應(yīng)該有相似的抽象層次。不要混用一個(gè) read_byte 和一個(gè) deploy_to_kubernetes
  • 限制數(shù)量和參數(shù):一個(gè)典型的工程 Agent 通常只有不到 10 個(gè)核心工具,每個(gè)工具只有 1-3 個(gè)嚴(yán)格類型的參數(shù)。
  • 追求冪等性:盡可能讓工具是冪等的,這可以極大地簡(jiǎn)化 Agent 的狀態(tài)管理和錯(cuò)誤恢復(fù)邏輯。
  • 清晰、無(wú)歧義、無(wú)冗余:確保沒(méi)有兩個(gè)工具的功能是重疊的,這會(huì)讓 LLM 感到困惑。

原則四:設(shè)計(jì)一個(gè)反饋循環(huán) (Design a Feedback Loop)

一個(gè)沒(méi)有驗(yàn)證和反饋的 Agent 是不可靠的。優(yōu)秀的 Agent 系統(tǒng)總是將 LLM 的創(chuàng)造力與傳統(tǒng)軟件的嚴(yán)格性結(jié)合起來(lái),形成一個(gè)“演員-評(píng)論家”(Actor-Critic)模型:讓 LLM Actor 自由創(chuàng)造,讓嚴(yán)格的 Critic 程序來(lái)驗(yàn)證。

對(duì)于開(kāi)發(fā)者來(lái)說(shuō),這是一個(gè)天然的優(yōu)勢(shì)領(lǐng)域!

  • Actor (LLM):負(fù)責(zé)生成代碼、配置文件或執(zhí)行計(jì)劃。
  • Critic:負(fù)責(zé)執(zhí)行一系列自動(dòng)化驗(yàn)證:
  • 代碼能否編譯通過(guò)
  • 代碼能否通過(guò)測(cè)試
  • 代碼是否符合靜態(tài)檢查規(guī)范
  • 領(lǐng)域特定不變量:例如,如果 Agent 修改了訂單系統(tǒng),是否依然滿足“訂單總價(jià)等于所有商品價(jià)格之和”這個(gè)業(yè)務(wù)規(guī)則?

這個(gè)反饋循環(huán)不僅能過(guò)濾掉錯(cuò)誤的輸出,更是 Agent 學(xué)習(xí)和改進(jìn)的基礎(chǔ)。

原則五:用 LLM 驅(qū)動(dòng)錯(cuò)誤分析

當(dāng) Agent 失敗時(shí),手動(dòng)排查海量的日志是不現(xiàn)實(shí)的。我們可以構(gòu)建一個(gè)“meta Agent”來(lái)解決這個(gè)問(wèn)題,即讓另一個(gè) LLM 來(lái)分析失敗 Agent 的日志,找出問(wèn)題的根源。

流程

  1. 建立一個(gè)基線版本的 Agent。
  2. 部署多個(gè)實(shí)例并收集它們的執(zhí)行軌跡和日志。
  3. 將失敗的日志喂給一個(gè)具有更大上下文窗口(如 Gemini 1.5 Pro)的 LLM進(jìn)行分析。
  4. 根據(jù) LLM 的分析洞察,改進(jìn)基線 Agent 的系統(tǒng)提示、工具或上下文管理。

圖片


這個(gè)元循環(huán)能高效地發(fā)現(xiàn)我們自己可能忽略的系統(tǒng)性問(wèn)題。

原則六:令人沮喪的行為是系統(tǒng)問(wèn)題的信號(hào)

當(dāng) Agent 做出一些“愚蠢”的行為,比如忽略你的明確指令,或者用一種奇怪的方式繞過(guò)問(wèn)題時(shí),我們的第一反應(yīng)通常是“這個(gè)模型真笨”。

但作者建議:先調(diào)試你自己的系統(tǒng),再怪罪模型。

作者分享了一個(gè)親身經(jīng)歷:他明確要求 Agent 使用一個(gè)集成工具來(lái)獲取數(shù)據(jù),但 Agent 卻固執(zhí)地使用模擬的隨機(jī)數(shù)據(jù)。在憤怒地檢查日志后,他發(fā)現(xiàn)自己忘了給 Agent 配置正確的 API 密鑰。Agent 嘗試調(diào)用工具,連續(xù)失敗,最后只能選擇一個(gè)它能走的通的、但卻是錯(cuò)誤的路徑。

因此,當(dāng)你的 Agent 行為異常時(shí),請(qǐng)檢查一下:

  • 工具是否缺失? 它是否需要一個(gè) write_file 的能力而你沒(méi)有提供?
  • 提示是否模糊? 你是否清晰地解釋了工具的用法和邊界?
  • 上下文是否充分? 它是否因?yàn)槿鄙俦匾畔ⅲū热缫粋€(gè) API 密鑰或文件權(quán)限)而無(wú)法執(zhí)行任務(wù)?

小結(jié)

構(gòu)建有效的 AI Agent,關(guān)鍵不在于尋找一個(gè)能解決所有問(wèn)題的“銀彈”提示或高級(jí)框架。它回歸到了系統(tǒng)設(shè)計(jì)和嚴(yán)謹(jǐn)?shù)能浖こ?/span>

作為開(kāi)發(fā)者,我們應(yīng)該聚焦于:

  • 清晰的指令(通過(guò)系統(tǒng)提示)
  • 精簡(jiǎn)的上下文管理(通過(guò)工具和壓縮)
  • 健壯的工具接口(簡(jiǎn)單、冪等、無(wú)歧義)
  • 自動(dòng)化的驗(yàn)證循環(huán)(編譯、測(cè)試、靜態(tài)檢查)

當(dāng)你被 Agent 的行為所困擾時(shí),記住,問(wèn)題很可能出在缺失的工具、模糊的提示或不足的上下文,而不是模型本身的局限性。將錯(cuò)誤分析視為開(kāi)發(fā)過(guò)程中的一等公民,我們的目標(biāo)不是構(gòu)建一個(gè)從不犯錯(cuò)的完美 Agent,而是構(gòu)建一個(gè)可靠的、可恢復(fù)的、能夠優(yōu)雅地失敗并被我們迭代改進(jìn)的Agent。

責(zé)任編輯:武曉燕 來(lái)源: TonyBai
相關(guān)推薦

2025-06-03 01:43:00

2025-01-17 09:30:21

2018-02-23 17:04:00

AI時(shí)代需求漸旺工作崗位

2025-07-04 07:21:49

2024-12-19 09:50:04

2024-07-30 11:21:17

TTSAIAgent

2025-08-08 02:11:12

AI誤區(qū)PPT

2025-05-08 07:54:24

2017-04-21 07:10:12

谷歌AI芯片理由

2022-11-24 11:20:12

2025-06-05 01:55:00

AIAgent技術(shù)

2025-07-29 19:20:20

2025-06-03 01:04:00

MCPAI架構(gòu)

2025-04-01 08:05:00

智能體人工智能MCP

2024-07-22 13:58:33

2022-08-07 23:37:53

測(cè)試軟件開(kāi)發(fā)自動(dòng)化

2012-02-07 13:29:25

云計(jì)算HP

2024-07-02 11:16:21

2025-07-08 08:34:04

2012-07-18 19:31:43

IBMWebSphere徐剛
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

蜜臀av免费一区二区三区| 成av人片在线观看www| 免费观看成人av| 最新国产精品拍自在线播放| 国产美女18xxxx免费视频| 日本在线免费中文字幕| 懂色av一区二区三区免费观看| 国内精品400部情侣激情| 免费黄色在线视频| 69堂精品视频在线播放| 一区二区三区不卡视频在线观看| 国产精品一区二区三区在线 | 亚洲xxx在线观看| 中文av资源在线| 久久综合九色综合97_久久久| 国产欧美韩国高清| 日韩欧美在线视频播放| 豆花视频一区二区| 欧美视频三区在线播放| 亚洲爆乳无码精品aaa片蜜桃| 青青草av免费在线观看| 精品一区二区三区在线播放| 2019中文字幕在线观看| 男人在线观看视频| 自拍偷拍欧美一区| 日韩欧美专区在线| 天天碰免费视频| av剧情在线观看| 中文字幕亚洲不卡| 久久综合中文色婷婷| 91麻豆视频在线观看| 国产亚洲高清视频| 久久99精品国产99久久6尤物| 欧美熟妇激情一区二区三区| 欧美18免费视频| 在线综合亚洲欧美在线视频| 日韩av一二三四| 91九色美女在线视频| 亚洲同性同志一二三专区| 日产精品久久久一区二区| 欧美一区二区公司| 国产一区二区日韩精品| 国产欧美一区二区三区久久人妖| 无码人妻av免费一区二区三区 | 久久久久久久久久久免费| 日韩欧美国产成人精品免费| 97人人精品| 最近2019年日本中文免费字幕| 天天躁日日躁aaaxxⅹ| 综合亚洲色图| 亚洲美女av黄| 色噜噜日韩精品欧美一区二区| 欧美日韩一区二区三区四区不卡| 亚洲第一网中文字幕| 国产一精品一aⅴ一免费| 日韩成人视屏| 精品日产卡一卡二卡麻豆| 精品人妻一区二区乱码| 99久热在线精品视频观看| 欧美三级电影在线看| 日本激情视频在线| 91大神在线观看线路一区| 色一情一乱一乱一91av| 看欧美ab黄色大片视频免费| 免费观看成人性生生活片| 色综合天天综合狠狠| 99热一区二区三区| 国产精品刘玥久久一区| 亚洲欧洲无码一区二区三区| 亚洲日本精品一区| 夜级特黄日本大片_在线| 国产日韩欧美亚洲| 国产一区二区不卡视频在线观看 | 日韩精品中文字| 精品视频站长推荐| 欧美一区二区三区红桃小说| 日韩精品视频在线播放| 免费观看av网站| 亚洲日本三级| 日韩大片在线观看视频| 中文字幕av久久爽一区| 大片网站久久| 日韩一区二区在线视频| 国产乱子轮xxx农村| 国产精品国内免费一区二区三区| 日韩有码在线观看| 天天色影综合网| 亚洲国产精品91| 欧美成人午夜视频| xxxx 国产| 国产亚洲激情| 日韩免费不卡av| 特级西西444www高清大视频| 久久99国产乱子伦精品免费| 亚洲自拍av在线| 日韩在线观看视频一区二区三区| 91蝌蚪porny九色| 日韩视频精品| 国产精品剧情一区二区在线观看| 亚洲精品成人在线| 91九色丨porny丨国产jk| 国产精品亚洲一区二区三区在线观看| 欧美嫩在线观看| 亚洲av无码久久精品色欲| 欧美精品国产白浆久久久久| 在线观看欧美www| 免费成人深夜夜行网站| 狠狠入ady亚洲精品| 91成人在线视频| 亚洲自拍第二页| 国产99久久久国产精品潘金| 国产成人一区二区三区免费看| 国产福利在线看| 亚洲愉拍自拍另类高清精品| 毛片一区二区三区四区| 精品精品视频| 亚洲免费一在线| 免费在线观看黄色小视频| 亚洲精品一二| 川上优av一区二区线观看| 日韩在线观看视频网站| 国产欧美日韩三级| 免费av观看网址| 成人噜噜噜噜| 亚洲欧美日韩精品久久亚洲区| 五月天av网站| 日韩在线一二三区| 成人三级视频在线观看一区二区| 国产日韩精品在线看| 一区二区三区在线免费观看 | www.av视频| 青青草成人在线观看| 国产综合动作在线观看| 久久亚洲天堂| 丰满岳妇乱一区二区三区| 日本一区二区免费视频| 欧美1级片网站| 亲子乱一区二区三区电影| 国产高潮在线观看| 中文在线一区二区 | av黄色免费在线观看| 亚洲一区二区三区免费在线观看| 97自拍视频| 日本免费中文字幕在线| 日本高清无吗v一区| 天堂www中文在线资源| 性欧美69xoxoxoxo| 国产精品久久97| 亚洲美女性生活| 亚洲最色的网站| 亚洲天堂av一区二区三区| 国产欧美日韩精品一区二区免费| 97久久精品国产| 国产成人手机在线| 一区二区三区产品免费精品久久75| 激情黄色小视频| 日韩精品免费一区二区在线观看| 青青久久av北条麻妃海外网| 狠狠躁日日躁夜夜躁av| 亚洲国产wwwccc36天堂| 动漫av在线免费观看| 欧美1区2区3区| 91午夜在线播放| 国产在线观看a视频| 欧美日韩卡一卡二| 精品欧美一区二区久久久| 性娇小13――14欧美| av日韩免费电影| 不卡的av影片| 亚洲国产精品热久久| 日韩高清免费av| 福利一区二区在线观看| 欧美一级片免费播放| 红杏aⅴ成人免费视频| 97av在线播放| 青青草娱乐在线| 色女孩综合影院| 无码人妻丰满熟妇啪啪欧美| 日本伊人色综合网| 亚洲免费久久| 视频精品一区| 久久黄色av网站| 日韩中文字幕观看| 日韩欧中文字幕| 女人黄色一级片| 久久机这里只有精品| 三年中国中文在线观看免费播放| 日韩第一区第二区| 国内精品久久影院| 看电影就来5566av视频在线播放| 色综合久久综合| 亚洲少妇xxx| 国产很黄免费观看久久| 久久精品国产sm调教网站演员| 亚洲肉体裸体xxxx137| 成人国产精品久久久久久亚洲| 色噜噜狠狠狠综合欧洲色8| 亚洲精品国精品久久99热| 草莓视频18免费观看| 国产精品美女久久久久aⅴ国产馆| 99九九精品视频| 激情综合自拍| 日本精品一区二区三区不卡无字幕| 欧美日韩精品免费观看视完整| 免费97视频在线精品国自产拍| 农村少妇久久久久久久| 91电影在线观看| 青青操国产视频| 久久精品欧美一区二区三区麻豆 | 岛国片在线免费观看| 国产盗摄女厕一区二区三区| 欧美污视频网站| 中文字幕人成人乱码| 粉嫩av四季av绯色av第一区| 欧美日韩激情电影| 欧美精品www| av在线播放网站| 欧美一区二区三区视频在线| 免费在线不卡av| 亚洲国产综合91精品麻豆| 色婷婷在线影院| 国产成人免费视频网站高清观看视频 | xxxx18国产| 欧美少妇xxx| 中文字幕亚洲精品一区| 一区二区免费在线| 国产主播av在线| www.亚洲免费av| 色综合五月婷婷| 日韩电影一区二区三区| 国产欧美日韩小视频| 色天天综合网| 欧美日韩国产综合在线| 日韩成人在线电影| 国产精品第8页| 久久青草伊人| 欧美国产日韩二区| 3p在线观看| 亚洲欧美激情精品一区二区| 免费观看a视频| 欧美一二三区在线观看| 一级爱爱免费视频| 欧美日韩精品二区第二页| 天码人妻一区二区三区在线看| 一区二区三区四区高清精品免费观看| 天天干天天舔天天操| 久久一二三国产| 97人妻精品一区二区三区免费| 国产在线国偷精品产拍免费yy| 无需播放器的av| 久久亚洲电影| 无码精品国产一区二区三区免费| 亚洲经典在线看| 69精品丰满人妻无码视频a片| 亚洲国产一区二区在线观看 | 免费短视频成人日韩| 国产日韩一区二区三区| eeuss鲁片一区二区三区| 国产又爽又黄的激情精品视频| 亚洲精品大片| 国产日韩在线播放| 日韩一级视频| 91热精品视频| 国产亚洲观看| 91亚洲精品久久久| 欧美日韩黄网站| 91夜夜揉人人捏人人添红杏| 国产一区二区视频在线看| 国产精品久久久久久久天堂 | 欧美日韩免费观看一区=区三区| 精品一区二区成人免费视频| 欧美91精品| 国产视频在线观看网站| 欧美在线1区| 男人日女人下面视频| 亚洲免费婷婷| 成人在线免费播放视频| 人人狠狠综合久久亚洲| 91精品无人成人www| 激情五月播播久久久精品| 色七七在线观看| 国产成人啪免费观看软件| 日本久久久久久久久久| 91日韩精品一区| av手机在线播放| 1024亚洲合集| 久久久精品99| 亚洲国产欧美日韩另类综合 | 少妇熟女视频一区二区三区| 成人福利在线看| 日本高清www| 1024成人网| 精品无码久久久久久久| 欧美性色黄大片| 91theporn国产在线观看| 精品日韩成人av| 免费播放片a高清在线观看| 爽爽爽爽爽爽爽成人免费观看| 午夜激情在线| 97超级碰碰人国产在线观看| 黄色综合网址| 99一区二区三区| 国产剧情一区| 免费看黄色a级片| 国产偷自视频区视频一区二区| 欧美三级午夜理伦三级富婆| 国产福利精品导航| 色www亚洲国产阿娇yao| 亚洲国产一区视频| 波多野结衣视频网址| 日韩午夜三级在线| 九色在线播放| 欧美大片欧美激情性色a∨久久| 国产成人精品一区二三区在线观看 | 日韩电影在线一区二区三区| 久久久久久久久久毛片| 久久夜色精品国产噜噜av| 欧美人妻一区二区| 在线免费亚洲电影| 人妻一区二区三区免费| 色偷偷av一区二区三区| www.色在线| 成人午夜在线视频一区| 蜜臀av免费一区二区三区| 免费国产黄色网址| 极品少妇xxxx偷拍精品少妇| 中文人妻一区二区三区| 一区二区三区成人在线视频| 在线观看国产精品入口男同| 亚洲精品中文字幕有码专区| 女女色综合影院| 国产精品女视频| 青青操综合网| 日韩黄色片在线| 精品一区二区三区免费视频| 扒开jk护士狂揉免费| 亚洲欧美电影一区二区| 一区二区美女视频| 亚洲欧美变态国产另类| 国产不卡人人| 粉嫩高清一区二区三区精品视频 | 天堂网一区二区三区| 日韩欧美国产综合在线一区二区三区 | 欧美老女人性生活视频| 日韩欧美国产激情| 色网站免费观看| 欧美精品videos性欧美| 日韩在线视频一区二区三区| 天天综合五月天| 免费看欧美美女黄的网站| 亚洲欧洲综合网| 欧美日韩免费观看一区三区| 国产乱视频在线观看| 日韩免费精品视频| 欧美亚洲国产日韩| 福利视频免费在线观看| 99精品国产91久久久久久 | 狠狠爱在线视频一区| 日本黄色大片视频| 欧美激情伊人电影| 超碰成人免费| 欧美 日韩 国产在线观看| 成人av片在线观看| 国产大片aaa| 亚洲国产精品视频在线观看| heyzo一区| 精品无人区一区二区三区| 一区在线免费| 人妻av一区二区| 都市激情亚洲色图| 久久电影中文字幕| 国产精品对白刺激| 日韩av密桃| 亚欧美一区二区三区| 一区二区在线观看不卡| 成人毛片在线精品国产| 欧美精品精品精品精品免费| 成人性生交大片免费看96| 成人毛片一区二区| 成人av电影在线网| 国内av在线播放| 久久精品最新地址| 91精品导航| 97在线免费公开视频| 91年精品国产| 国产精品久久久久久免费| 欧美人与性动交| 欧美a一欧美| 男女视频一区二区三区| 国产精品伦理一区二区| 国产欧美日韩综合精品一区二区三区| 欧美成人性生活| 曰本一区二区三区视频| 亚洲欧洲日本精品| 一区二区三区在线观看国产| 亚洲欧美另类视频| 国产精品久久久久久超碰| 欧美一区国产在线| 亚洲图片欧美另类| 欧美日韩视频在线观看一区二区三区|