精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型智能體如何突破規(guī)模化應(yīng)用瓶頸,核心在于Agentic ROI

人工智能 新聞
上海交通大學聯(lián)合中科大在本文中指出:現(xiàn)階段大模型智能體的主要障礙不在于模型能力不足,而在于其「Agentic ROI」尚未達到實用化門檻。

本文第一作者為上海交通大學計算機學院副教授劉衛(wèi)文,研究方向為大模型智能體,大語言模型,個性化算法等。

近年來,隨著大語言模型的快速發(fā)展,基于其構(gòu)建的大模型智能體(LLM Agents)正逐步從技術(shù)演示走向?qū)嶋H應(yīng)用部署。然而,真正實現(xiàn)規(guī)模化應(yīng)用仍面臨諸多瓶頸。使用范圍主要集中于專業(yè)領(lǐng)域,如代碼生成、科研輔助等。在大眾、高頻、日常的應(yīng)用場景(如電商、個人助理)中,普及率依然較低。這一現(xiàn)象引發(fā)了一個關(guān)鍵問題:

當前制約大模型智能體實際可用性的真正原因是什么?

上海交通大學聯(lián)合中科大在本文中指出:現(xiàn)階段大模型智能體的主要障礙不在于模型能力不足,而在于其「Agentic ROI」尚未達到實用化門檻。

圖片

Agentic ROI:大模型智能體實現(xiàn)規(guī)模化應(yīng)用的關(guān)鍵瓶頸

研究團隊提出 Agentic ROI(Agentic Return on Investment)這一核心指標,用于衡量一個大模型智能體在真實使用場景中所帶來的「信息收益」與其「使用成本」之間的比值:

圖片

  • Information Quality:指智能體所生成的信息質(zhì)量,包括準確性、完整性等。
  • Quality Threshold:指最低可接受的信息質(zhì)量閾值(注:根據(jù)上下文推斷)。
  • Human Time和 Agent Time:分別指人類與智能體完成對應(yīng)任務(wù)所需的時間。
  • Interaction Time:指用戶與智能體交互所需要的時間,如用戶進行任務(wù)描述、驗證結(jié)果過程中所消耗的時間。
  • Expense:指用戶經(jīng)濟成本,如模型調(diào)用、API 使用的開銷。

只有當信息質(zhì)量超過一定閾值,且智能體所節(jié)省的時間和成本之比足夠高時,智能體才真正具備可用性。

圖片

如上圖所示,當前大部分 LLM 智能體集中應(yīng)用于人類任務(wù)時間成本高的信息密集型場景(如科研、編程),此類任務(wù)本身就需要大量人力投入,因此即便智能體部分替代也能顯著提高效率。然而,在用戶量龐大的日常場景中(如電商、搜索、助理等),任務(wù)本身較為簡單,交互成本低(如點擊、下滑操作),智能體提升的邊際價值不明顯,反而可能引入額外的交互成本和延遲,從而導(dǎo)致 Agentic ROI 較低。

因此,當前高用戶需求與低 Agentic ROI 之間的矛盾,反映了智能體在日常應(yīng)用中的實用性不足,需進一步優(yōu)化信息價值、智能體任務(wù)完成時間、及交互時間以填補市場空白。

優(yōu)化 Agentic ROI 智能體發(fā)展的「之字形」軌跡

研究團隊提出,LLM 智能體的發(fā)展路徑并非線性增長,而是呈現(xiàn)出一種「先規(guī)模化、后輕量化」的「之字形」發(fā)展模式:首先規(guī)模化(scaling up)參數(shù)規(guī)模、訓練數(shù)據(jù)、推理能力以提升信息質(zhì)量;之后在保證信息質(zhì)量的前提下,輕量化(scaling down)進行模型壓縮、蒸餾、推理優(yōu)化以減少智能體所用時間與調(diào)用成本。我們正處于智能體規(guī)模化發(fā)展的高峰階段,優(yōu)先提升信息質(zhì)量。

基礎(chǔ)模型如 OpenAI 系列模型的發(fā)展也體現(xiàn)了這一「之字形」發(fā)展趨勢:同系列模型如 o1-mini 到 o1 模型表現(xiàn)顯著增強,而新一代小模型如 o3-mini 則在持平 o1 性能的同時顯著降低了推理費用和延遲。

圖片

規(guī)模化提升信息質(zhì)量(Scaling Up)

預(yù)訓練規(guī)模化(Pre-training Scaling)

 預(yù)訓練階段通過擴大模型規(guī)模、數(shù)據(jù)量和計算資源,使智能體在語言理解、推理和世界知識等基礎(chǔ)能力方面獲得穩(wěn)步提升。而規(guī)模化使用包含任務(wù)結(jié)構(gòu)和操作流程的文檔數(shù)據(jù)(如操作手冊、工作流程指南)能夠幫助模型學習實際任務(wù)的分解邏輯和執(zhí)行順序。此外,隨著上下文窗口的擴展和記憶機制的引入,智能體可以處理更長的交互歷史和用戶偏好,從而提升多輪任務(wù)執(zhí)行的能力。

后訓練規(guī)模化(Post-training Scaling)

 后訓練階段(如監(jiān)督微調(diào)和強化學習)使智能體更貼近人類的需求與價值觀。同時,智能體性能提升還依賴于大規(guī)模復(fù)雜環(huán)境(網(wǎng)頁、API 接口)交互軌跡數(shù)據(jù),使用外部工具進行操作決策。此外,在真實部署中積累的用戶反饋、任務(wù)完成記錄和錯誤修復(fù)數(shù)據(jù),構(gòu)成了智能體持續(xù)學習與演化的基礎(chǔ),形成智能體的數(shù)據(jù)飛輪,使其在真實使用中不斷優(yōu)化行為。

推理時規(guī)模化(Test-time Scaling)

 推理時規(guī)模化包括:

  • 規(guī)模化推理步驟(Scaling reasoning process),以應(yīng)對復(fù)雜任務(wù)并生成更可靠的輸出;
  • 規(guī)模化多智能體系統(tǒng)(Scaling multi-agent system),通過協(xié)作完成任務(wù)分解與執(zhí)行;
  • 擴展工具調(diào)用(Scaling tool calling),通過多次工具調(diào)用使智能體能夠逐步驗證中間結(jié)果;
  • 擴展推理時訓練(Scaling test-time training),通過利用無標簽測試數(shù)據(jù)實時更新快速適應(yīng)新任務(wù)或用戶需求
  • 有約束條件下直接優(yōu)化 Agentic ROI(Scaling towards Agentic ROI under budget constraints),智能體可在給定預(yù)算約束(如時間、API 成本)下動態(tài)評估每一步操作信息收益,直接整體優(yōu)化 Agentic ROI。

構(gòu)建世界模型(Building World Model)

 構(gòu)建真實的「世界模型」對于實現(xiàn)真正規(guī)模化數(shù)據(jù)合成、智能體評估至關(guān)重要。世界模型應(yīng)支持多模態(tài)交互(語言、圖像、文檔、音頻),具備處理多步驟、長時程任務(wù)的能力,并能模擬用戶的多樣化偏好與反饋機制。此外,它還應(yīng)反映現(xiàn)實世界中的不確定性,例如信息不完全、用戶意圖變化、環(huán)境干擾等。

確保魯棒性與安全性(Ensuring Robustness & Security)

 確保智能體行為的穩(wěn)健性與安全性也是提升信息質(zhì)量的重要一環(huán)。魯棒性方面,智能體應(yīng)防止獎勵機制被利用,避免出現(xiàn)「獎勵黑客」現(xiàn)象;安全性方面,需要防范訓練數(shù)據(jù)污染、防止反饋被篡改和后門攻擊等。在運行過程中,智能體應(yīng)配備異常檢測和事實核查能力,確保輸出內(nèi)容的準確性與一致性。同時,構(gòu)建行為審計機制和可解釋性工具,可以提升智能體的可控性和可靠性。

輕量化降低智能體時間與成本(Scaling Down)

減少智能體任務(wù)完成時間

引入記憶機制: 引入記憶機制是提高效率的重要手段。具備記憶能力的智能體可以跳過重復(fù)計算,直接調(diào)用以往任務(wù)中積累的知識,從而加快處理速度。這種方式模擬人類專家的行為,依靠經(jīng)驗而非實時推理來完成任務(wù)。模型壓縮: 通過模型壓縮或蒸餾來減少計算資源和推理延遲,是另一個核心方向。借助模型蒸餾等技術(shù),可以將大模型的能力遷移到更小的模型中,從而在不顯著降低性能的前提下,顯著縮短響應(yīng)時間、減少部署成本。

優(yōu)化推理策略: 智能體的時間消耗不僅來源于計算,還受到推理鏈條長度的影響。如果推理過程過于復(fù)雜或冗余,例如頻繁的自我反思、遞歸規(guī)劃等,可能會延長任務(wù)完成時間而未帶來質(zhì)的提升。因此,更高效的智能體應(yīng)具備「少而精」的思維能力,能夠通過最短路徑達成最優(yōu)解。

基礎(chǔ)設(shè)施優(yōu)化: 硬件層面的升級,如 Groq 和 Cerebras 等新型 AI 芯片,以及軟件層面的優(yōu)化,如 vLLM 和 FlashAttention 等推理引擎,都能顯著提升模型運行速度。只有軟硬件協(xié)同進化,才能真正滿足低延遲、實時響應(yīng)的實際需求,從而提升智能體的整體可用性。

降低成本

降低交互時間: 當前的智能體往往要求用戶提供冗長、明確的指令,這帶來了較高的使用門檻與認知負擔。為此,智能體的交互方式應(yīng)從被動解析輸入,轉(zhuǎn)向主動理解用戶意圖,具備一定程度的目標推理與任務(wù)自完成能力。這種轉(zhuǎn)變不僅可以減少用戶的操作負擔,也有助于提升整體使用體驗。此外,產(chǎn)品設(shè)計上的新范式也有助于進一步降低用戶交互時間。

降低開銷: 智能體的運行費用可能因模型規(guī)模、推理深度、調(diào)用外部工具等因素而迅速上升。尤其在大規(guī)模部署或持續(xù)運行場景下,成本問題尤為突出。因此,未來的智能體需要更智能地管理上下文,合理控制推理復(fù)雜度與工具調(diào)用頻率,確保在保證性能的前提下,盡可能降低資源消耗與使用開銷。

Agentic ROI 提供了一個衡量智能體真實可用性的系統(tǒng)框架,幫助我們超越模型性能的單一維度,轉(zhuǎn)向「實際效益」導(dǎo)向的設(shè)計與評價邏輯。智能體的「可用性」不應(yīng)僅以模型性能定義,而應(yīng)以綜合效益衡量。在實際部署中,Agentic ROI 為我們提供了一個更貼近真實世界的評價維度,幫助我們識別系統(tǒng)中被忽視的「隱藏成本」,并指導(dǎo)我們構(gòu)建真正高效、可用、可負擔的智能體系統(tǒng)。


責任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2025-06-30 07:07:00

智能體大型語言模型LLM

2022-01-06 22:29:35

人工智能機器人自動化

2024-03-06 09:00:00

大語言模型人工智能

2025-05-07 16:27:23

2025-01-08 07:02:00

人工智能GenAI美妝領(lǐng)域

2012-08-29 14:35:17

2025-11-04 02:22:00

AgenticAI多智能

2022-11-10 08:02:08

2022-02-11 10:16:53

5G通信數(shù)字化轉(zhuǎn)型

2020-12-22 16:10:43

人工智能

2025-09-24 09:10:24

2023-09-25 07:31:19

算力AI框架

2025-11-06 01:44:00

2010-01-12 10:14:05

龍芯
點贊
收藏

51CTO技術(shù)棧公眾號

国产精品海角社区在线观看| 欧美大片在线观看一区二区| 亚洲精品成人久久久998| 国产情侣呻吟对白高潮| 亚洲国产成人精品女人| 亚洲精品在线一区二区| 日本久久久精品视频| 二人午夜免费观看在线视频| 久久99精品久久久久久久久久久久| 欧美精品性视频| 亚洲国产果冻传媒av在线观看| 国产国产一区| 一区二区成人在线| 日韩精品一区二区三区丰满| 国产精品一级视频| 99精品视频免费观看| 国产一区二区精品丝袜| 丰满人妻一区二区三区大胸| xxx欧美xxx| 亚洲女人的天堂| 裸模一区二区三区免费| 国产欧美久久久| 久久久久国产精品午夜一区| 九九热精品在线| 久久久久久久毛片| 成人三级毛片| 69堂国产成人免费视频| 国产aaa一级片| 91香蕉在线观看| 欧美激情在线免费观看| 国模一区二区三区私拍视频| 最近中文字幕av| 99亚洲一区二区| 超碰91人人草人人干| 亚洲一区二区三区日韩| 91成人精品在线| 欧美久久久久中文字幕| 国产精品无码专区av在线播放 | 一区二区精品国产| 午夜视频福利在线| 国产精品香蕉一区二区三区| 国产精品视频专区| 欧美一区二区三区不卡视频| 在线电影一区| 久久99视频精品| 免费成人深夜夜行网站| 国产一区二区三区四区五区 | 欧美孕妇孕交| 91污在线观看| 狠狠色综合欧美激情| 国产白浆在线观看| 国产乱色国产精品免费视频| 国产欧美日韩高清| 中文字幕一区二区三区四区视频| 先锋影音久久久| 欧美主播福利视频| 女人十八岁毛片| 亚洲三级影院| 97国产精品人人爽人人做| 国产在线一区视频| 狠狠色丁香久久综合频道| 欧美精品亚州精品| 精品午夜福利在线观看| 国产综合激情| 欧美日韩爱爱视频| 青娱乐国产精品| 国产精品va| 久久噜噜噜精品国产亚洲综合 | 成人黄色av网站| 91肉色超薄丝袜脚交一区二区| 日本亚洲三级在线| 国产一区二区视频在线观看| 一二三四区在线| 国产揄拍国内精品对白| 999视频在线免费观看| 亚洲成人一级片| 99国产精品久久久久久久久久 | 亚洲伊人伊色伊影伊综合网| 久久精品无码中文字幕| 福利在线免费视频| 色婷婷综合久久久中文一区二区 | 成人美女视频| 欧美天堂亚洲电影院在线播放| 久久撸在线视频| 国产中文欧美日韩在线| 精品美女被调教视频大全网站| 秘密基地免费观看完整版中文| 精品按摩偷拍| 亚洲欧美制服另类日韩| 免费成人深夜蜜桃视频| 午夜视频精品| 欧美亚洲成人免费| 在线视频播放大全| 成人自拍视频在线观看| 日韩精品久久久免费观看| 黄av在线播放| 欧美性猛交xxxx免费看| 蜜臀一区二区三区精品免费视频 | 久久久久久高清| 97电影在线观看| 一区二区三区不卡视频在线观看| 欧美极品欧美精品欧美| 成人在线高清| 精品91自产拍在线观看一区| 日韩一级片在线免费观看| 欧美日韩网站| 国产精品福利片| 亚洲av无码一区二区乱子伦| 久久久夜色精品亚洲| 二级片在线观看| 亚洲欧美一区二区三区| 91精品国产综合久久精品性色 | 国产精品久久久久久久免费看| 成人午夜伦理影院| 神马影院午夜我不卡影院| 怡红院在线观看| 91久久精品一区二区| 国产成人精品综合久久久久99| 国产永久精品大片wwwapp| 欧美乱大交xxxxx| 黄色av一区二区| jiyouzz国产精品久久| 亚洲一区二区三区加勒比| 国产白浆在线免费观看| 在线综合亚洲欧美在线视频 | 中文字幕在线观看不卡视频| 欧美亚洲精品一区二区| 日韩精品久久久久久久软件91| 亚洲色在线视频| 久久精品视频国产| 国产一区二区在线视频| 五月天丁香综合久久国产 | 97精品国产一区二区三区 | 久青草视频在线播放| 日日夜夜一区| 国产亚洲欧洲高清| 福利网址在线观看| av一本久道久久综合久久鬼色| 一级全黄肉体裸体全过程| 国产成人午夜性a一级毛片| 国产午夜精品久久久| 日韩精品视频免费看| 国产精品一区在线观看你懂的| 亚洲精品国产一区| 岛国精品在线| 一区二区欧美久久| 亚洲国产精品无码久久久| 97aⅴ精品视频一二三区| 国产一二三区在线播放| 欧美2区3区4区| 久久精品久久久久电影| 久久久999久久久| 国产午夜一区二区三区| 黄色片视频在线免费观看| 欧美1区2区3区4区| 97视频在线观看视频免费视频 | 欧美三级一区二区三区| 99国产精品一区| 亚洲熟女乱色一区二区三区| 最新亚洲精品| 国产成人综合亚洲| shkd中文字幕久久在线观看| 欧美写真视频网站| 99久久99久久精品免费看小说. | 国产精品扒开腿爽爽爽视频| 国产在线视频资源| 欧美四级电影网| 三级影片在线观看| 国产剧情一区在线| 成人av在线不卡| 老牛影视av一区二区在线观看| 韩国19禁主播vip福利视频| 手机在线观看免费av| 精品久久久一区| 日本欧美一区二区三区不卡视频| 久久精品久久99精品久久| 伊人久久av导航| 日韩精品中文字幕吗一区二区| 欧美精品www在线观看| 天天综合网在线观看| 日本精品一级二级| 人人澡人人澡人人看| 国产成人精品亚洲日本在线桃色| 2019日韩中文字幕mv| 日韩精品丝袜美腿| 国产精品久久久久影院日本| 快射av在线播放一区| 精品日产卡一卡二卡麻豆| 国产精品一区二区6| 国产网站一区二区三区| 91pony九色| 亚洲三级观看| 中文字幕日韩精品一区二区| 成人爽a毛片免费啪啪红桃视频| 国产91成人在在线播放| 午夜毛片在线| 亚洲丁香婷深爱综合| jizz国产在线| 一区二区三区久久久| 蜜桃av免费看| 国产麻豆成人传媒免费观看| 精品一区二区中文字幕| 我不卡影院28| 玖玖玖精品中文字幕| 精品一区视频| 国产精品va在线播放| 免费不卡av| 这里精品视频免费| 三级网站在线看| 91精品国产一区二区| 亚洲av无码精品一区二区| 一区二区三区精品久久久| 天堂久久精品忘忧草| 国产91精品精华液一区二区三区 | 亚洲国产欧美一区二区丝袜黑人 | 青青国产91久久久久久| 免费一级特黄毛片| 97精品视频在线看| 日本一区高清不卡| 欧美三级电影在线| 99国产视频在线| 久久国内精品| 日韩免费在线播放| av中文字幕电影在线看| 久久亚洲影音av资源网| 福利在线视频导航| 日韩成人在线网站| 成人无码一区二区三区| 欧美老女人第四色| 中国a一片一级一片| 欧美三级免费观看| 日韩伦理在线视频| 亚洲精品日产精品乱码不卡| 日本二区在线观看| 久久综合久久99| 精品影片一区二区入口| 国产成人日日夜夜| 性鲍视频在线观看| 狠狠色狠狠色合久久伊人| 中文字幕天天干| 日韩中文字幕亚洲一区二区va在线 | 亚洲欧美日韩三级| 蜜臀av性久久久久蜜臀aⅴ| 99久久久无码国产精品6| 亚洲一区二区伦理| 亚洲不卡中文字幕无码| 亚洲第一伊人| 日本欧美视频在线观看| 在线看片一区| 欧美男女爱爱视频| 亚洲精选一区| 欧美老熟妇喷水| 久久国产99| 99精品人妻少妇一区二区| 99综合视频| 能在线观看的av| 亚洲一卡久久| 日韩毛片在线免费看| 日韩成人精品在线观看| mm131亚洲精品| 精品一区二区三区视频 | 久久精品国产av一区二区三区| 亚洲午夜精品网| 日韩手机在线观看| 色综合天天综合| 中文天堂在线视频| 在线播放欧美女士性生活| 99久久久国产精品无码网爆| 日韩精品资源二区在线| 五月婷婷六月丁香综合| 精品网站999www| 超碰免费在线| 久久艹在线视频| 牛牛精品一区二区| 国产精品aaaa| 成人国产精品久久| 国产精品一区而去| 经典一区二区| 潘金莲一级淫片aaaaa免费看| 国产在线欧美| 欧美 日韩 国产 激情| 国产一区视频在线看| 国产chinese中国hdxxxx| 国产女人aaa级久久久级| 日本视频一区二区在线观看| 免费av中文字幕| 一本大道久久a久久综合婷婷| 在线播放国产一区| 欧美va亚洲va| 黄色影院在线播放| 日韩专区在线播放| www中文字幕在线观看| 国产精品狠色婷| 丁香五月缴情综合网| 日本一区二区三区在线视频| 一本精品一区二区三区| 精品国产免费av| 久久99深爱久久99精品| 国产清纯白嫩初高中在线观看性色| 狠狠网亚洲精品| 国产艳俗歌舞表演hd| 国产精品久久久久毛片软件| 麻豆视频在线观看| 亚洲图片欧美色图| 91精品国产乱码久久久| 欧美一区二区三区视频| 三级在线播放| 久久韩国免费视频| 深夜福利视频一区二区| 91天堂在线观看| 欧美大片网址| 欧美国产综合视频| 欧美午夜精品| 网站一区二区三区| 91丨porny丨最新| 久久中文免费视频| 欧美性少妇18aaaa视频| 亚洲精品久久久久久久久久| 国产亚洲欧洲黄色| 波多野结衣在线播放| 国产精品午夜一区二区欲梦| 粉嫩一区二区三区四区公司1| 少妇特黄a一区二区三区| 最新亚洲激情| 一级在线免费视频| 久久久国产精品不卡| 久久激情免费视频| 欧美一级艳片视频免费观看| 高清性色生活片在线观看| 久久久久久这里只有精品| 超碰国产精品一区二页| 亚洲精品小视频在线观看| 99久久伊人精品影院| 久久免费影院| 精品无码久久久久国产| 1024日韩| 无套白嫩进入乌克兰美女| 日本一区二区三区dvd视频在线| 国产精品久久久久久99| 欧美成人免费网站| av网址在线免费观看| 国产精品视频网站| 尤物tv在线精品| 不卡影院一区二区| a在线欧美一区| 日韩黄色在线视频| 欧美精品一区二区三区久久久| 黄色在线播放网站| 日韩美女中文字幕| 激情视频极品美女日韩| 成人免费在线网| 国产精品88888| 国产亚洲成人精品| 欧美一二三四在线| 手机在线免费av| 亚洲综合色激情五月| 久久社区一区| 欧美激情国内自拍| 亚洲欧洲国产日韩| 99精品人妻无码专区在线视频区| 日日狠狠久久偷偷四色综合免费 | 国产91成人在在线播放| 久久a爱视频| www.com毛片| 久久综合一区二区| 国产成人精品一区二三区| 亚洲美女av在线| 亚洲第一会所001| 国产a级片免费看| 激情久久久久久久久久久久久久久久| 中文字幕在线有码| 欧美一级高清片| 色操视频在线| 久久久久资源| 日韩专区中文字幕一区二区| 国产性生活大片| 日韩精品一区二区三区中文精品 | 免费精品国产的网站免费观看| 欧美日韩在线免费播放| 亚洲国产精品av| 中文字幕视频免费观看| 久久99久国产精品黄毛片入口| 大型av综合网站| 亚洲一区二区蜜桃| 最近中文字幕一区二区三区| 欧美 日韩 国产 成人 在线 91| 7777kkkk成人观看| 亚洲精品白浆高清| 国产精品久久久久久9999| 亚洲综合色丁香婷婷六月图片| 男人天堂资源在线| 国产日韩欧美在线视频观看| 亚洲国产影院| 久久久久久久毛片| 91精选在线观看| 91老司机福利在线| 欧美在线一二三区| 国产成人免费视频网站| 日本一区二区三区精品| 久久久国产一区二区三区|