精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

可「自主進化」的Agent?首個端到端智能體符號化訓練框架開源了

人工智能 新聞
來自波形智能的研究團隊借鑒連接主義訓練神經網絡 (connectionist learning) 的基本方式,即反向傳播和梯度下降。

本文主要作者來自波形智能、浙江大學、和北京航空航天大學。共同一作中,周王春澍是波形智能的聯合創始人和 CTO,歐翌昕是浙江大學碩士二年級,丁盛為為北京航空航天大學四年級本科生。文章的通訊作者為周王春澍和姜昱辰,姜昱辰是波形智能的聯合創始人和 CEO。

隨著各類大模型 API 的迭代以及各類 AI Agent 框架的開源,基于大模型的智能體在學術界和工業界收獲了廣泛的關注、研究、和應用。

盡管基于大模型的智能體 (AI Agent) 在很多場景都取得了不錯的效果,并且在一些場景下已經能夠實際落地應用,AI Agent 的研究和開發的進展仍然局限于 “expert-centric”,或者說 “engineering-centric” 的范式中。也就是說,現在的 Agent 的創建和調優過程還是幾乎完全依賴人類專家 (算法工程師) 的人力和經驗來設計智能體的 promtps, tools,和 workflow。這樣的過程費時費力,并且注定了無法使用海量數據對智能體的這些符號化元素進行學習和訓練。而大部分智能體依賴于閉源的 API 調用,無法對大模型基座本身進行優化,即使使用開源大模型,對模型基座本身的優化也在大部分 AI 智能體的應用場景中受到資源、算力、穩定性等原因而無法實際進行。因此現在的智能體還處于 “專家系統” 的發展階段。

眾所周知,神經網絡成為機器學習 / 人工智能的基礎范式的重要原因正是因為可以高效地使用海量數據進行訓練和優化,而不需要手工設計復雜的結構和學習算法。因此,來自波形智能的研究人員們認為,AI Agent 從以專家經驗為核心 (expert-centric) 到以數據為核心 (data-centric) 的轉變,將會是基于大模型的智能體的一個重要發展方向。

為了實現這個目標,來自波形智能的研究團隊借鑒連接主義訓練神經網絡 (connectionist learning) 的基本方式,即反向傳播和梯度下降,將 AI Agent 和神經網絡進行類比,使用文本和大模型建模損失函數、梯度、和優化器,模擬反向傳播和梯度下降算法,實現對 Agent 的端到端的符號化訓練算法,構建了一套可以對 AI 智能體進行端到端訓練的算法框架,代碼已經開源在 GitHub。

圖片

  • 論文地址:https://arxiv.org/pdf/2406.18532
  • 代碼倉庫:https://github.com/aiwaves-cn/agents

具體來說,團隊首先將基于大模型的智能體解構為三個主要元素,即 prompts, tools, 和 agent pipeline (workflow)。接著,框架中將一個 Agent 系統看作是一個 “符號化” 神經網絡,將 Agent workflow 中的每一個 node 看作是網絡中的一個 layer,而將每個節點中的 prompts 和 tools 看作是這個 layer 的 weights,智能體的 workflow/pipeline 則可以看作是網絡的計算圖。這樣下來,智能體系統可以看作是一個權重從數字 / 張量空間變成離散符號空間 (文字,代碼都是符號化的表示) 的神經網絡,而這種網絡的訓練自然也就可以參考傳統神經網絡的優化方式,即反向傳播和梯度下降。

圖 1: Agent Symbolic Learning 框架示意圖

要使傳統的反向傳播和梯度下降能夠處理符號化的權重空間,agent symbolic learning 框架中通過文本和大模型 + 提示詞的方式建模了損失,損失函數,反向傳播的流程,梯度,以及基于梯度的優化器。具體來說,前向傳播過程中,框架會將每一層的輸入、權重、和輸出都保存在計算圖中。接下來,通過大模型 + 提示詞的方式,在提示詞中結合當前樣本的輸入,輸出,和整體任務的描述,之后由大語言模型輸出對當前樣本任務完成情況的評價和總結。得到的文本形式的評價 / 總結,正如神經網絡中的 loss 一樣,用來衡量任務完成的好壞,研究團隊將其稱為 “文本形式的損失”,即 language-based loss。

之后,該研究通過大語言模型和精心設計的提示詞工程,來生成智能體流程中對最后一個節點的 “反思”。反思中包括模型的輸出應該怎樣變化才能更符合要求,以及提示詞和工具調用應該如何優化才能使輸出朝這樣的方向發生變化。這一內容和神經網絡優化中梯度的作用剛好一致,都是包含了參數應該如何調整才能最小化整個模型的損失的信息,因此研究團隊將這樣的反思稱作 “文本形式的梯度”,即 language-based gradient。

接下來要做的就是從后向前,得到每一層的梯度,這對于神經網絡的優化至關重要。受到神經網絡中基于鏈式法則的公式的反向傳播的啟發,波形智能的研究人員通過文本和大模型,用一套精心設計的 prompt 來模擬了傳統神經網絡優化的鏈式法則。具體來說,這套 prompts 讓大模型基于上一層的梯度信息 (即對上一層執行任務的反思) 以及本層的輸入、輸出、以及權重 (這些輸入和反向傳播公式中的參數完全對應),輸出對當前節點的 prompt/tool usage 的反思,即當前層的 language-based gradient。這樣基于文本的反向傳播的方案使得該研究能夠得到一個包含多個節點和復雜 workflow 的智能體中每一節點 / 層的參數的梯度,也就可以直接優化每一個 prompt 和 tool 對整個智能體性能的作用,從而實現 end-to-end 的 joint optimization。

最后,得到了每組參數的 language-based gradient 之后,框架中使用基于大模型的 optimizer,使用精心設計的 prompt,以每一層的提示詞和工具調用,以及基于文本的梯度作為輸入,輸出優化過后的 prompts 和 tools,從而實現對智能體參數的更新。

除此之外,框架中還支持了對網絡結構,即 agent workflow 的優化。具體來說,框架中將 agent workflow 以特定的編程語言進行表示,這樣就將智能體網絡的 “計算圖” 也處理成了符號化的權重。之后通過一個單獨設計的基于大模型的優化器,以當前智能體的工作流和工作流中的各個節點的文本形式的梯度為輸入來對智能體的工作流進行更新。這在神經網絡中訓練中可以類比自動網絡結構搜索相關的研究。

圖片

圖 2: Agent Symbolic Learning 算法流程

圖片

圖 3 大模型評測任務上的實驗結果

圖片

圖 4 智能體級別評測任務的實驗結果

波形智能的研究人員在大模型和智能體的一系列 benchmark 上對該算法進行了評估,如圖 3 和圖 4 所示,agent symbolic learning 相比 DSpy 和傳統的沒有學習能力的智能體框架相比,在各類任務上都有了明顯的提升,在一些任務上甚至使用 GPT-3.5 也能和其他智能體框架使用 GPT-4 的表現類似。而簡單的對智能體中每一個節點中的提示詞使用局部的基于大語言模型的提示詞自動優化算法 (AutoPE) 則無法取得很明顯的效果。另外,如圖 5 所示,該算法在創意寫作任務中,從初始的只基于一個提示詞進行寫作的單節點智能體,自主進化到了支持寫作 + 編輯的工作流,并且將寫作節點的提示詞進行了更新和優化。

圖片

圖 5 Agent Symbolic Learning 框架學習效果展示 (以創意寫作任務為例)

波形智能的研究團隊介紹了 Agent Symbolic Learning 的兩種應用場景。首先,該框架可以用于開發者或研究人員創建和調優智能體系統中。像神經網絡的訓練一樣,開發者和研究人員可以對指定的任務收集(或者使用框架中提供的自動生成)大量的樣本,之后使用該框架在大量數據上完成 “data-centric” 的智能體的訓練和優化,在之后像普通智能體的部署一樣,在產品生產環境中以靜態的方式部署優化過后的智能體。

除此之外,該框架的另一個重要應用場景是支持能夠在環境 / 交互中自主進化的 Agent。具體來說,因為該訓練框架本身只需要調用大模型的能力而不需要復雜的基于 GPU 的訓練和部署,因此一個 Agent 可以將該訓練框架作為其自身可以調用的一個工具,通過在環境中探索或者和人類進行交互的過程中,不斷收集新的訓練樣本,定期或者主動調用智能體訓練的算法工具,對自身的 prompts, tools, 和 workflow 進行更新。波形智能在 AIWaves Agents 的開源代碼庫中也支持了這樣的部署邏輯,實現了首個可以在被部署到實際產品和生產環境中之后,依然可以不斷自主進化、自我迭代的智能體系統。

Agent Symbolic Learning 框架將 AI Agent 視作由復雜 workflow 中的 prompts 和 tools 連接而成的符號化 “神經網絡”,通過基于自然語言模擬反向傳播和梯度下降,使得基于大模型的智能體可以自主對自身的 “網絡參數”,即 prompts 和 tools,以及 “網絡結構”,即 agent workflow,進行優化,從而實現了能夠高效利用大量數據和經驗,進行 “data-centric learning” 的智能體框架,讓能夠持續自主進化的智能體系統變成了可能。目前,該框架已經在波形智能的多個產品和應用中發揮作用,解決了 Agent 人工優化和評測困難的問題。為了推進 “Data-centric Agent” 和 “Agent Learning” 的發展和研究,波形智能的研究團隊也將算法的全部代碼開源,期待智能體領域學術界和工業界一起探索更多更有趣的算法和應用。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-06-20 09:00:00

智能體訓練模型

2025-04-01 09:10:00

2025-03-10 12:09:37

2025-06-03 08:09:00

AI智能體模型

2025-04-30 08:57:55

2020-05-15 12:27:33

RPA人工智能

2021-05-26 10:04:09

人工智能AI深度學習

2025-01-27 09:51:24

AI模型開源

2025-07-22 08:24:15

2023-06-16 20:50:13

大模型

2010-03-20 09:32:34

LTE試驗網端到端服務華為

2021-05-21 10:32:56

Mendix

2024-09-30 14:40:00

AI強化學習框架

2025-08-13 09:13:00

2025-06-10 09:28:31

智能體開發工具

2025-09-28 08:52:00

2025-06-05 08:46:00

2025-06-25 01:00:00

智能體蒸餾AI

2025-11-06 01:44:00

點贊
收藏

51CTO技術棧公眾號

看一级黄色录像| 91国产一区在线| 五月天激情播播| 青春草免费在线视频| 成人sese在线| 欧美一级视频在线观看| 国产一区二区三区四区在线| 国产在线一区不卡| 欧美性黄网官网| 亚洲一区二区三区精品在线观看| www.国产免费| 日韩精品久久理论片| 久久中文久久字幕| 日韩精品卡通动漫网站| 成人免费视频观看| 五月婷婷欧美视频| 亚洲高清在线观看一区| 性色av蜜臀av| 青草国产精品久久久久久| 欧美激情精品久久久久久大尺度| 日本一级免费视频| 亚洲码欧美码一区二区三区| 欧美亚洲综合网| www.av毛片| 欧美精品hd| 久久久久成人黄色影片| 高清视频一区二区三区| 特级西西444www大胆免费看| 亚洲毛片一区| 欧美理论片在线观看| 一级特黄曰皮片视频| 色狠狠久久av综合| 精品国产区一区| 中文字幕亚洲影院| 97人人做人人爽香蕉精品| 精品国产91久久久久久| 91嫩草国产丨精品入口麻豆| 北岛玲日韩精品一区二区三区| 成人美女视频在线观看| 91精品美女在线| 伊人网av在线| 久久亚洲电影| 欧美一级电影在线| 日本中文字幕免费| 欧美福利影院| 九九热精品在线| 乱h高h女3p含苞待放| 久久国产影院| 国产视频亚洲视频| 精品成人av一区二区三区| a级日韩大片| 精品福利视频一区二区三区| 97人人模人人爽人人澡| 日韩高清在线观看一区二区| 欧美一级一级性生活免费录像| 久久久久久久久久一区二区| japansex久久高清精品| 337p亚洲精品色噜噜狠狠| 亚洲精品永久视频| 成人网av.com/| 日韩精品在线网站| 91porn在线| 日韩欧美黄色| 亚洲人精选亚洲人成在线| 性高潮久久久久久久| 国产亚洲欧美日韩在线观看一区二区 | 国产91亚洲精品久久久| 91久久精品一区二区| jizzzz日本| 久久9999免费视频| 精品国产乱码久久久久久图片 | 国产成人精品亚洲男人的天堂| 欧美一区影院| 欧美精品亚州精品| 国产免费无遮挡吸奶头视频| 日韩伦理一区| 久久不射电影网| 免费在线一区二区三区| 激情五月***国产精品| 欧美激情成人在线视频| 天堂资源在线播放| 亚洲影视一区| xxx欧美精品| 久久香蕉精品视频| 亚洲精品一二| 国产精品成人va在线观看| 69视频免费看| 韩国视频一区二区| 国产福利久久| 污视频网站在线播放| 国产高清精品久久久久| 精品国产乱码久久久久软件 | 国产精品一区在线| 国产欧美一区二区视频| 偷拍精品一区二区三区| 久久免费的精品国产v∧| 四虎影院一区二区三区| fc2ppv国产精品久久| 亚洲国产欧美在线| www.日日操| 国产999精品在线观看| 亚洲成年人在线播放| 亚洲自拍偷拍一区二区| 久久精品国产亚洲夜色av网站 | 欧美mv日韩mv亚洲| v8888av| 天天精品视频| 91精品国产乱码久久久久久久久 | 国产在线精品播放| 国产av无码专区亚洲a∨毛片| 成人黄色av电影| 日韩欧美国产二区| 成人福利在线观看视频| 日韩欧美福利视频| theporn国产精品| 日韩美女国产精品| 久热在线中文字幕色999舞| 国产成人精品片| 国产一区999| 欧美一卡2卡3卡4卡无卡免费观看水多多| 在线视频1区2区| 色婷婷久久久久swag精品| 亚洲成人av免费观看| 免费黄色成人| 欧美精品九九久久| 中文字幕在线网站| 91视频.com| 国产女教师bbwbbwbbw| 亚洲电影有码| 日韩久久午夜影院| 老司机精品免费视频| 葵司免费一区二区三区四区五区| 97在线电影| 三区四区在线视频| 欧美性xxxx极品高清hd直播| 熟女人妻一区二区三区免费看| 欧美成人自拍| 欧美在线观看视频| 熟妇人妻系列aⅴ无码专区友真希| 国产精品久久久久影院亚瑟| 亚洲欧洲日产国码无码久久99| 九色精品蝌蚪| 欧美成人剧情片在线观看| 中文字幕日韩三级| 久久久久9999亚洲精品| 浮妇高潮喷白浆视频| 日韩精品一级| 欧美成人一区在线| 国产精品区在线观看| 中文一区在线播放| 亚洲自偷自拍熟女另类| 色愁久久久久久| 51久久精品夜色国产麻豆| 国产自产一区二区| 亚洲曰韩产成在线| 熟妇女人妻丰满少妇中文字幕| 国产精品毛片久久| 国产精品入口夜色视频大尺度| 国自产拍在线网站网址视频| 欧美午夜激情在线| 国产福利在线观看视频| 久久狠狠婷婷| 品久久久久久久久久96高清| 日韩av中字| 亚洲视屏在线播放| 高潮无码精品色欲av午夜福利| 国产午夜一区二区三区| 久久精品视频91| 精品久久一区| 国产欧美一区二区三区四区 | 欧美俄罗斯乱妇| 亚洲AV无码乱码国产精品牛牛 | 亚洲男人av在线| 亚洲天堂一区在线观看| 久久一区二区视频| 熟女少妇精品一区二区| 青青草国产成人a∨下载安卓| 国产精品99蜜臀久久不卡二区| 国产午夜在线观看| 欧美色图一区二区三区| 久久高清内射无套| 久久99精品国产麻豆婷婷洗澡| 大桥未久一区二区三区| 9l亚洲国产成人精品一区二三| 亚州精品天堂中文字幕| 日韩精品视频在线观看一区二区三区| 色综合久久综合中文综合网| 国产丝袜视频一区| 99电影在线观看| 第一福利在线| 欧美群妇大交群中文字幕| 美国黄色片视频| 国产精品一卡二卡在线观看| 久久香蕉视频网站| 激情视频极品美女日韩| 久久久亚洲成人| 天堂在线视频免费观看| 91国偷自产一区二区三区成为亚洲经典 | 水蜜桃精品av一区二区| 91在线直播亚洲| av伦理在线| 亚洲丝袜av一区| 国产三级第一页| 精品福利在线视频| 黄色一级大片在线免费看产| 丝袜亚洲精品中文字幕一区| 日韩欧美视频一区二区| 国产999精品在线观看| 午夜精品久久久久久99热| 色婷婷激情视频| 91tv精品福利国产在线观看| 国产精品国产精品国产专区不卡| 在线看片福利| 久久精品国产精品| 日韩中文字幕免费观看| 在线精品亚洲一区二区不卡| 国产suv精品一区二区68| 菠萝蜜视频在线观看一区| 天天操天天爱天天爽| 国内自拍一区| 亚洲一区二区三区涩| 日韩mv欧美mv国产网站| 国产人妖伪娘一区91| 欧美三级网站| 欧美国产日本高清在线| 97电影在线看视频| 亚洲国产又黄又爽女人高潮的| 伊人网视频在线| 色综合久久天天| 日本学生初尝黑人巨免费视频| 国产精品久久久久aaaa| 无码人妻精品一区二区三应用大全| 国产麻豆一精品一av一免费| 久在线观看视频| 一区二区三区午夜视频| 三区精品视频观看| 色天下一区二区三区| 成人欧美一区二区三区在线观看 | 狠狠精品干练久久久无码中文字幕| 欧美**字幕| 国产女人水真多18毛片18精品| 懂色av色香蕉一区二区蜜桃| 国产成人97精品免费看片| sm捆绑调教国产免费网站在线观看| 久久国产一区二区三区| 日韩av资源| 亚洲日本中文字幕免费在线不卡| 日本激情视频网站| 日韩欧美电影一二三| 国产精品探花视频| 欧美日韩一区二区三区在线看| 韩国av中文字幕| 五月综合激情婷婷六月色窝| 久久久久性色av无码一区二区| 亚洲精品欧美激情| 久久久久久视频| 亚洲精品老司机| 性色av无码久久一区二区三区| 国产精品三级电影| 国产一区二区三区视频播放| 欧美国产成人在线| 国产sm调教视频| 国产色91在线| 欧美亚洲色综久久精品国产| 中文字幕不卡的av| 妖精视频在线观看免费| 日本一区二区免费在线观看视频| 国产高清一区二区三区四区| 国产亚洲成av人在线观看导航| 西西444www无码大胆| 国产免费成人在线视频| 免费看91的网站| 欧美国产日韩一二三区| 亚洲午夜精品久久久久久高潮| 中文字幕免费不卡在线| 一色道久久88加勒比一| 国产视频一区在线观看| 色欲狠狠躁天天躁无码中文字幕| 国产午夜精品在线观看| 少妇一级黄色片| 自拍偷自拍亚洲精品播放| 91高清免费看| 午夜视频一区在线观看| 成人免费a视频| 欧美性高清videossexo| 最近中文字幕免费观看| 欧美日本在线看| 国产精品久久久久久久免费 | 奇米777四色影视在线看| 国产精品99一区二区三| a级网站在线观看| 今天的高清视频免费播放成人| 亚洲国产精品久久久久婷蜜芽| 天堂成人免费av电影一区| 亚洲视频一二三四| 成人免费视频一区二区| www.久久国产| 亚洲欧洲日韩综合一区二区| 妺妺窝人体色www聚色窝仙踪| 亚洲国产毛片aaaaa无费看| 成人黄色免费网| 欧美成人精品3d动漫h| 欧洲成人av| 久久精品欧美视频| 午夜伦理福利在线| 成人福利视频网| 超碰成人免费| 午夜精品视频在线观看一区二区| 欧洲福利电影| 岳毛多又紧做起爽| 国产麻豆视频一区| 国产三级av在线播放| 亚洲美女少妇撒尿| 国产免费一级视频| 日韩欧美一级在线播放| 国产乱子伦三级在线播放| 欧美成人精品在线播放| 中文不卡1区2区3区| 91精品啪aⅴ在线观看国产| 亚洲图区在线| 成人av在线播放观看| 日韩中文字幕av电影| 动漫美女无遮挡免费| 国产精品久久久久精k8| 中文字幕一区在线播放| 亚洲国产精品一区二区三区| 欧美激情二区| 国产成人jvid在线播放| 加勒比久久高清| 中文字幕一区二区三区四区五区人| 午夜亚洲福利在线老司机| 午夜影院免费版| 国产精品电影院| 国产女同在线观看| 精品国产91久久久久久久妲己| aⅴ在线视频男人的天堂| 91精品国产色综合久久不卡98| 玖玖精品一区| 咪咪色在线视频| 美女视频一区在线观看| 在线观看日本中文字幕| 亚洲制服丝袜在线| 午夜免费福利视频| 美女精品久久久| 羞羞视频在线观看一区二区| 欧美视频小说| 香蕉久久a毛片| 黄色污在线观看| 午夜一区二区三区视频| 中文字幕日产av| 久久精品免费播放| 国产精品99久久免费| 中文字幕中文字幕99| 麻豆精品在线播放| 国产又粗又猛又爽又黄的视频小说| 日本乱人伦aⅴ精品| 亚洲三区在线播放| 日韩av高清不卡| 一区二区三区韩国免费中文网站| 国产淫片免费看| 久久人人爽爽爽人久久久| 少妇太紧太爽又黄又硬又爽| 日韩精品免费在线视频| 亚洲h片在线看| 国产精品视频免费一区二区三区| 精品国产一区二区三区四区四 | 日韩大片在线| 黄色动漫在线免费看| 成人动漫一区二区三区| 国产亚洲欧美精品久久久久久 | 日韩av手机在线| 亚洲欧洲色图| 粗暴91大变态调教| 欧美激情综合网| 一级特黄aa大片| 欧美成人在线免费| 老司机在线精品视频| 丝袜老师办公室里做好紧好爽| 26uuu亚洲| 在线观看视频中文字幕| 美女精品视频一区| 盗摄牛牛av影视一区二区| 久久久久久久久久久99| 99国内精品久久| 中文字幕 亚洲视频| 久久影院免费观看| 国产成人夜色高潮福利影视| 免费无码国产v片在线观看| 国产拍揄自揄精品视频麻豆| 97超视频在线观看| 欧美激情精品久久久久| 黄色网一区二区| 9久久婷婷国产综合精品性色 | 91电影在线观看| 国产日产一区二区| 精品999在线观看| 日本视频一区二区| wwwav国产| 精品在线观看国产| 视频91a欧美|