精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

無直接數據可用,AI怎么學會「干活」?微軟團隊揭秘AI從語言到行動的進化之路

人工智能 新聞
微軟團隊首次提出了一種完整的方法體系,詳盡描述了在無直接可用數據的情況下如何從零開始訓練一個大行動模型(Large Action Model, LAM),并將其逐步構建為可在真實環境中完成任務的智能體。

該技術報告的主要作者 Lu Wang, Fangkai Yang, Chaoyun  Zhang, Shilin He, Pu Zhao, Si Qin 等均來自 Data, Knowledge, and Intelligence (DKI) 團隊,為微軟 TaskWeaver, WizardLLM, Windows GUI Agent UFO 的核心開發者。

近年來,大語言模型(Large Language Models, LLMs)的迅猛發展推動了自然語言處理(NLP)領域的技術進步。這些模型在對話生成、文本翻譯、知識問答和代碼生成等任務中展現出卓越的性能。

然而,盡管 LLMs 可以通過語言生成為用戶提供信息支持,其功能仍局限于文本層面,無法主動與物理或數字環境交互,或因缺乏領域知識和數據而導致生成的「動作」效果不佳。這種「語言 - 行動斷層」阻礙了人工智能(AI)在許多實際場景中的廣泛應用。

為解決這一核心問題,微軟團隊首次提出了一種完整的方法體系,詳盡描述了在無直接可用數據的情況下如何從零開始訓練一個大行動模型(Large Action Model, LAM),并將其逐步構建為可在真實環境中完成任務的智能體。

這一工作為 LAM 模型訓練的奠定了基礎,還為 AI 從被動語言生成主動行動生成的轉變提供了新思路。

圖片

  • 技術報告鏈接:Large Action Models: From Inception to Implementation
  • 數據處理代碼鏈接:https://github.com/microsoft/UFO/tree/main/dataflow
  • 完整的技術文檔鏈接:https://microsoft.github.io/UFO/dataflow/overview/ 

從語言到行動的必要演化

LLMs 的局限性

傳統 LLMs,如 OpenAI 的 GPT 系列和 Mistral-7B,能夠生成富有邏輯性和創意的文本內容,廣泛應用于問答系統、代碼補全、文案生成等任務中。然而,當用戶的需求超越語言生成層面,例如操作軟件、完成復雜的工作流程或直接操控物理設備時,這些模型便暴露出明顯的不足。

這一局限性源于 LLMs 的設計初衷:它們被優化用于生成語言內容,而非執行行動。雖然 LLMs 在任務規劃和意圖理解方面表現出色,但它們缺乏行動生成所需的任務分解、環境交互和多步執行能力。 

LAM(大行動模型)具備三大特性:

  • 用戶意圖理解,能從多種輸入(語言、語音、圖像等)中準確解析意圖并轉化為具體可執行計劃;
  • 行動生成能力,可根據環境將用戶需求轉化為 GUI 操作、API 調用、物理動作等多種形式的具體步驟;
  • 動態規劃與適應,能夠分解復雜任務,靈活應對環境變化,實時調整計劃以完成目標。這些特性使 LAM 在復雜任務執行中表現出色。

圖片

 圖 1:從 LLM 到 LAM 的演化

從 LLMs 到 LAMs 的挑戰

如圖 1 所示,構建 LAMs 的核心挑戰在于如何將模型從一個被動的文本生成器轉變為能夠在真實環境中執行復雜任務的主動行動生成器。這一轉變不僅需要重新定義模型能力,還涉及從數據、訓練方法到評估方式的全面革新:

  • 數據積累的難題

數據獲取是訓練 LAM 的最大挑戰。LAM 需要大量任務 - 行動對數據來學習如何在不同環境中執行操作。然而,這類數據在實際應用中往往難以獲取或批量收集。

  • 模型訓練的重大轉化

LAM 的開發需要從僅生成文本的 LLMs 轉化為具備任務規劃、動態執行和調整能力的模型。這不僅需要對模型架構進行深度改造,還需要采用全新的訓練方法,以賦予模型行動生成與環境適配的能力。

  • 離線評估的局限性

在靜態、受控環境中測試 LAM 的性能是必要的一步,用以驗證其基礎能力。然而,僅止步于離線評估無法真實反映模型在實際復雜場景中的表現。

  • 環境適配與線上評估的復雜性

LAM 需要實時與復雜、多樣的數字或物理環境交互。這要求模型具備動態適應性,能夠根據實時反饋調整行動。此外,在真實環境中進行線上評估,測試 LAM 的準確性、效率和任務完成效果,是驗證其實際性能的關鍵環節。

針對上述挑戰,微軟團隊首次提出并實現了一套完整的從 0 到 1 訓練 LAM 模型的流程,涵蓋了從數據積累、模型訓練到實際部署的所有步驟。

該團隊的方法不僅解決了「無數據」的初始瓶頸,還通過逐步迭代的方式,讓模型從簡單的任務規劃能力成長為具備復雜行動生成能力的智能體。這一研究填補了現有領域的空白,為 LAMs 的開發提供了首個實踐范例。

數據積累

從無到有構建 LAM 的第一步

在訓練 LAM(大行動模型)時,數據積累是關鍵。與 LLMs(大語言模型)訓練需要大量文本數據類似,LAM 的開發依賴高質量的任務 - 行動數據。

然而,這類數據在實際應用中非常稀缺,特別是領域專屬和可執行的數據。為了克服這一瓶頸,該團隊設計了一套從無到有的數據收集與處理流程,分為兩大階段:任務 - 計劃數據收集任務 - 行動數據收集

圖片

圖 2:任務 - 計劃數據的收集過程

階段一:任務 - 計劃數據收集

如圖 2 所示,任務 - 計劃數據以用戶請求為起點,生成任務描述及其對應的詳細操作步驟。該團隊從多種開源資源中收集任務 - 計劃對,包括應用幫助文檔(如 Microsoft Word 的幫助頁面)、WikiHow 任務教程,以及用戶的搜索查詢記錄。

通過這些來源,該團隊構建了包含 76,672 對任務與計劃的初始數據集,其中 29,182 對是直接獲取的,47,490 對通過數據擴展技術生成。

此外,他們采用數據增強技術生成更多任務 - 計劃對。通過 GPT-4o 演化原始任務,增加復雜性和約束條件,同時生成相應的計劃,擴展數據集規模至原來的 150%。例如,「在 Excel 中創建下拉菜單」被演化為「創建依賴下拉菜單,并根據第一列選擇過濾第二列內容」,從而提高模型對復雜任務的適應能力。

圖片

圖 3:任務 - 行動數據收集過程

階段二:任務 - 行動數據收集

任務 - 計劃數據雖然用于高層次規劃,但不能直接執行。如圖 3 所示,為填補從規劃到執行的差距,該團隊通過以下步驟生成任務 - 行動數據:

1. 實例化任務:利用預定義模板(如 Word 文檔樣例),將任務描述具體化,將抽象的計劃步驟轉化為具體的行動序列(如「點擊菜單欄中的「設計」選項」)。

2. 執行驗證:在真實環境中執行實例化的任務,捕獲執行軌跡和環境反饋,確保行動序列的可操作性和正確性。

3. 評估與后處理:使用 GPT-4o 對執行結果進行驗證,僅保留與任務目標一致的成功軌跡,并記錄詳細元數據(如環境狀態和執行時間),最終生成結構化的任務 - 行動對。

這一流程最終生成了覆蓋廣泛操作場景的任務 - 行動數據集,為 LAM 訓練提供了精確的行動模板,顯著提升了模型在真實環境中的任務執行能力。

通過兩階段的逐步積累,成功地從「無數據」狀態出發,構建了 LAM 訓練所需的高質量任務 - 行動數據。這一方法不僅解決了數據稀缺問題,還通過引入真實環境交互和動態驗證,確保數據的高效性和適用性,為從 LLMs 到 LAMs 的轉變提供了堅實基礎。

方法:從 0 到 1,逐步構建 LAM

如圖 4 所示,構建 LAM 的過程分為四個階段,涵蓋了從數據積累到模型訓練的完整工作流。

圖片

圖 4:LAM 的訓練過程

第一階段:任務計劃預訓練

為了讓模型具備基本的任務規劃能力,首先訓練模型生成任務分解計劃。數據來源為任務 - 計劃數據。模型的目標是根據輸入任務生成正確的任務分解計劃。例如,「在 Word 中插入表格」被分解為「點擊插入菜單」、「選擇表格選項」、「輸入表格行列數」等步驟。這一階段讓模型掌握了任務分解的基本能力,為后續的行動生成打下了基礎。

第二階段:專家知識學習

盡管第一階段的模型可以生成任務計劃,但仍缺乏執行這些計劃的能力。為此,需要利用收集到的任務 - 行動數據,并通過模仿學習訓練模型執行具體操作。經過訓練,模型從一個被動的計劃生成器轉變為能夠執行計劃的主動行動生成器。

第三階段:自我探索提升

專家數據的覆蓋范圍有限,無法囊括所有可能的任務場景。為此,該團隊設計了自我探索機制,將 LAM 部署在 UFO 中,UFO 是一個開源 GUI Agent 框架,能夠通過交互 Windows 操作系統中的圖形用戶界面(GUI)元素來完成任務。讓 LAM 嘗試完成之前失敗的任務,并從中積累新的成功經驗。

1. 任務挑戰:模型嘗試完成 2,284 個由 GPT-4 未解決的任務,通過動態探索生成可能的成功軌跡。

2. 數據擴展:在自我探索中,模型生成了 496 條新成功軌跡,將其與之前的專家數據合并形成擴展數據集。

3. 模型迭代:通過再次微調,模型進一步提升了處理復雜任務的能力,增強了對未知環境的適應性。

這一階段實現了從無數據到新數據的自動生成與積累,擴展了訓練數據的覆蓋范圍。

第四階段:獎勵模型優化

為了進一步提升模型的行動質量,在此引入了獎勵模型(Reward Model, RM),同時利用正負反饋,通過強化學習優化 LAM 的決策能力。

實驗結果

離線實驗結果

圖片

表格 1:不同 LAM 訓練階段的離線實驗結果

為了驗證訓練方法的有效性,該團隊在 435 個任務上對不同階段的 LAM 模型進行了離線測試。如表格 1 的實驗結果顯示,LAM 的各階段的訓練都帶來了模型性能提升。

環境適配

圖片

圖 5:LAM 智能體架構

如圖 5 所示,經過訓練的 LAM 模型被集成到 GUI 智能體 UFO 的 AppAgent 中作為推理引擎,后者充當橋梁,將 LAM 預測的動作「著地」為可執行的實際操作。

線上實驗結果

圖片

表格 2:LAM 的線上實驗結果

如表格 2 所示,LAM 在線上實驗任務中成功率(TSR)方面表現優異,達到 71.0%,在文本輸入模式下超越了基線模型(GPT-4o 和 GPT-4o Mini)。

效率對比

LAM 在任務完成時間和平均步時延上展現了顯著優勢:

1. 任務完成時間:LAM 完成單個任務平均耗時僅 30.42 秒,相比之下,無視覺輸入的 GPT-4o 耗時 86.42 秒,約為 LAM 的 2.84 倍,而帶視覺輸入的 GPT-4o 耗時更長,為 96.48 秒。

2. 平均步時延:LAM 的每步時延為 5.41 秒,顯著優于無視覺輸入的 GPT-4o(12.84 秒)和帶視覺輸入的 GPT-4o(19.36 秒)。

更多細節,請參閱技術報告原文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-09-03 09:05:00

2025-10-28 02:33:00

2025-06-03 16:23:05

2025-09-29 02:00:00

RAGAgentAI

2022-05-09 11:29:42

架構數據

2024-09-26 10:29:56

數據中臺數據飛輪

2024-08-12 18:11:52

2025-10-30 08:00:00

SaaSAI自動化

2020-09-01 15:08:11

新華三

2025-06-20 09:06:00

AI模型訓練

2024-09-21 08:59:52

2019-08-19 08:50:56

2021-08-11 11:17:42

人工智能奧運會機器人

2011-01-04 17:08:10

匯編語言

2023-03-14 13:08:33

微軟AI風險評估

2025-01-14 13:04:08

2025-03-10 12:00:00

AIManus大模型

2025-11-03 10:58:41

點贊
收藏

51CTO技術棧公眾號

欧美日韩国产区| 91久久综合| 欧美色图在线观看| 视频一区免费观看| 羞羞色院91蜜桃| 色综合狠狠操| 精品少妇一区二区三区日产乱码 | 日韩国产一区三区| 99精品人妻少妇一区二区| 亚洲aaaaaaa| 蜜臀精品久久久久久蜜臀| 日韩视频第一页| 亚洲成a人无码| 丝袜美腿一区| 亚洲色图一区二区| 国产精品一区二区三区不卡| 青青视频在线免费观看| 天天久久综合| 亚洲高清色综合| 久热免费在线观看| www.久久ai| 国产v日产∨综合v精品视频| 欧美综合激情网| 国产在线免费av| 日韩毛片网站| 亚洲国产成人tv| 亚洲看片网站| 免费观看国产视频| 蜜桃视频在线观看一区二区| 欧美激情一区二区三区久久久| 精品少妇人妻一区二区黑料社区 | 国产在线中文字幕| 国产一区二区在线免费观看| 91精品国产91久久久久福利| 久久久免费看片| 乱中年女人伦av一区二区| 欧美午夜片在线看| 国产欧美在线一区| 国产色在线观看| 国产亚洲欧美中文| 国产精品一区二区三区精品| 国产精品久久久久久在线| 国产精品日本| 欧美国产极速在线| 欧美视频一区二区在线| 天天久久夜夜| 亚洲国产精品资源| 欧美精品久久久久久久久25p| caoporn国产精品免费视频| 99久久婷婷国产综合精品| 成人国产在线视频| 波多野结衣影片| 99精品福利视频| 欧美成人第一页| 少妇高潮惨叫久久久久| 国产一区国产二区国产三区| 日韩av在线免费| 亚洲乱妇老熟女爽到高潮的片| 久久福利在线| 欧美色精品天天在线观看视频| 黄色免费视频大全| 久操视频在线免费播放| 国产日韩一级二级三级| 久久er99热精品一区二区三区| av资源免费看| 极品美女销魂一区二区三区免费 | 日韩三级小视频| 久久久久久久久丰满| 在线看日韩欧美| 男人网站在线观看| youjizz欧美| 精品国产乱码91久久久久久网站| 欧洲美女亚洲激情| 日本免费成人| 日韩三级在线观看| 精品人妻无码中文字幕18禁| 精品中文字幕一区二区三区四区| 欧美高清视频一二三区| 黄色aaaaaa| 电影一区中文字幕| 欧美一激情一区二区三区| 污污视频在线免费| 一区二区三区免费在线看| 欧美tk丨vk视频| 日本少妇xxxx| 亚洲精品播放| 一本一本久久a久久精品牛牛影视| 中文字幕免费视频| 亚洲视频分类| 中日韩美女免费视频网站在线观看| 午夜时刻免费入口| 日韩欧美二区| 视频在线一区二区| 国产免费无码一区二区视频| 亚洲成人资源| 热草久综合在线| 伊人成人在线观看| 国产在线观看免费一区| 国产精品一 二 三| 日韩精品视频在线观看一区二区三区| av在线一区二区| 免费国产在线精品一区二区三区| 日韩偷拍自拍| 久久久美女艺术照精彩视频福利播放| 日韩精品久久久| gogo在线高清视频| 亚洲成av人片在线| 激情综合网俺也去| 国产在线视频欧美一区| 精品精品欲导航| 国产三级视频网站| 久久在线免费| 国内精品久久久久伊人av| 无码视频在线观看| 粉嫩绯色av一区二区在线观看| 国产视频不卡| avtt亚洲| 精品久久久久久国产91| 国产一伦一伦一伦| 国产精品丝袜在线播放| 中文字幕久久久av一区| 精品在线免费观看视频| 日本欧美加勒比视频| 91精品久久久久久蜜桃| 日本不卡视频一区二区| 亚洲欧美综合色| 国产又大又硬又粗| 香蕉大人久久国产成人av| 日韩风俗一区 二区| 国产wwwwxxxx| 丝袜诱惑制服诱惑色一区在线观看 | 无码人妻精品一区二区三应用大全| 成人激情免费视频| 97国产精品视频人人做人人爱| 色婷婷久久综合中文久久蜜桃av| 成人免费福利片| 人人妻人人澡人人爽精品欧美一区| 久草在线中文最新视频| 欧美一级片在线看| 欧美激情 一区| 亚洲一区成人| 亚洲免费在线| 中文字幕第一页久久| 亚洲一区三区在线观看| 高端美女服务在线视频播放| 欧美激情成人在线| 欧美激情啊啊啊| 一级黄色免费片| 国产亚洲综合色| 麻豆传传媒久久久爱| 久久91麻豆精品一区| 国产91露脸中文字幕在线| 欧洲免费在线视频| 色琪琪一区二区三区亚洲区| 精品人妻一区二区三区视频| 久久高清免费观看| 日韩中文字幕一区| 另类一区二区| 欧美另类暴力丝袜| 免费av一级片| 欧美日韩在线视频一区二区| 国产成人av一区二区三区不卡| 日韩激情在线观看| 亚洲人成网站在线播放2019| 99视频这里有精品| 九九热精品视频| 色欲av永久无码精品无码蜜桃| 欧美日韩久久久久| 日本人亚洲人jjzzjjz| 美腿丝袜亚洲一区| 强开小嫩苞一区二区三区网站| 国产一区二区视频在线看| 久久久久久国产精品美女| 天堂在线观看免费视频| 欧美性极品xxxx娇小| 国产精品美女高潮无套| 久久99精品久久只有精品| 91视频 - 88av| 欧美日韩破处| 国产精品永久在线| 一区二区三区伦理| 日韩高清免费在线| 亚洲影院一区二区三区| 一区二区三区精品在线| 亚洲av无码一区二区三区观看| 日韩高清一级片| 欧美a级黄色大片| 亚洲人和日本人hd| 92福利视频午夜1000合集在线观看| 国产蜜臀av在线播放| 亚洲性日韩精品一区二区| 国产a级免费视频| 色噜噜狠狠色综合欧洲selulu| 免费在线观看a级片| fc2成人免费人成在线观看播放 | 欧美日韩欧美一区二区| 国产极品国产极品| 久久久久久久国产精品影院| 五月天六月丁香| 久久久久看片| 国产91porn| 欧美伦理在线视频| 国产精品嫩草在线观看| 国产69精品久久久久按摩| 久久免费视频在线观看| 在线观看国产原创自拍视频| 亚洲精品wwwww| 一区二区日韩在线观看| 色综合色综合色综合色综合色综合 | 国产精品亚发布| 女海盗2成人h版中文字幕| 久久精品久久精品亚洲人| 日本中文字幕一区二区有码在线| 337p亚洲精品色噜噜狠狠| 九九九在线观看| 亚洲综合一区二区三区| 亚洲欧洲综合网| 国产三区在线成人av| 小毛片在线观看| 国产在线观看一区二区| 538任你躁在线精品免费| 国产精品尤物| 国产一级爱c视频| 欧美一区综合| 中文字幕一区二区三区四区五区 | 国产美女视频一区二区| 国产精品电影网站| 另类专区亚洲| 91国产视频在线| 麻豆mv在线看| 97久久久久久| av第一福利在线导航| 精品中文字幕在线| 黄色网页网址在线免费| 色噜噜狠狠色综合网图区| 国产高清视频在线播放| 亚洲人成人99网站| 欧美欧美欧美| 亚洲天堂免费在线| 国产剧情在线观看| 亚洲深夜福利在线| 韩国免费在线视频| 亚洲午夜久久久影院| 久久电影视频| 国产亚洲一区精品| av基地在线| 色偷偷91综合久久噜噜| 婷婷在线视频| 久久天天躁狠狠躁夜夜爽蜜月 | 亚洲精品欧美激情| 97在线观看免费高| 亚洲欧美日韩国产综合| 国产午夜手机精彩视频| 一区二区三区四区不卡视频| 久久精品99国产精| 亚洲成va人在线观看| 日韩经典在线观看| 精品久久久久久久久久久| 国产无套丰满白嫩对白| 在线看不卡av| 一级成人免费视频| 日韩一区二区视频在线观看| 亚洲第一成人av| 日韩成人av在线| 蝌蚪视频在线播放| 久久精品国产精品| av免费网站在线观看| 久久99久久99精品中文字幕| 成年人国产在线观看| 国产91精品久| 欧美电影网址| 91在线免费视频| 国产色噜噜噜91在线精品 | 日本天堂在线| 中文字幕免费国产精品| 超碰在线caoporn| 久久久久久亚洲精品中文字幕 | 国产精品日韩欧美大师| av国产精品| 久久青青草原一区二区| 日本高清视频精品| 一级特黄aaaaaa大片| 欧美一区二区三区播放老司机| 丁香六月天婷婷| 亚洲欧美日韩图片| 美女国产在线| 97精品欧美一区二区三区| 日韩欧美一区二区三区在线观看 | 国产在线观看第一页| 欧美二区三区的天堂| 蜜臀久久久久久999| 一区二区在线视频| 影音先锋在线播放| 国产精品盗摄久久久| 91在线一区| 亚洲精品视频一二三| 欧美日韩hd| 国产真人无码作爱视频免费| 国产高清一区日本| 欧美黄色一级生活片| 一级中文字幕一区二区| 凹凸精品一区二区三区| 亚洲电影天堂av| 日本不卡视频| 26uuu国产精品视频| 国产精品99久久免费| 欧美下载看逼逼| 国产精品v亚洲精品v日韩精品| 久久久久国产精品熟女影院| 成人免费观看av| 粉嫩av性色av蜜臀av网站| 日本韩国精品一区二区在线观看| 性生活三级视频| xxxx欧美18另类的高清| 亚洲天堂av在线| 国产精品美女久久久久av福利| 日韩精品永久网址| 久久网站免费视频| 国产成人免费视频| 亚洲区一区二区三| 日本久久精品电影| 天堂网www中文在线| 欧美韩国理论所午夜片917电影| 欧美黄色成人| 先锋影音欧美| 日日夜夜免费精品| 少妇毛片一区二区三区| 午夜激情久久久| 亚洲精品字幕在线| 欧美高清视频在线| 久久久久亚洲精品中文字幕| 亚洲v欧美v另类v综合v日韩v| 久久电影一区| 香蕉视频黄色在线观看| 狠狠躁夜夜躁久久躁别揉| 丰满人妻一区二区三区无码av | 日韩欧美一区二区三区免费观看| 极品尤物一区二区三区| 在线成人www免费观看视频| 又黄又爽又色的视频| 亚洲欧美国产三级| 国产欧美一区二区三区视频在线观看| 中文字幕日韩精品有码视频| a成人v在线| 亚洲天堂电影网| 九一九一国产精品| 精品亚洲乱码一区二区| 欧美久久久久久久久久| 免费人成在线观看播放视频| 国产区精品视频| 色综合久久一区二区三区| 日本中文字幕影院| 亚洲欧洲国产日韩| 国产精品久久欧美久久一区| 久久这里有精品视频| 精品入口麻豆88视频| 国产日韩欧美大片| 国产精品一区二区在线播放| 九九视频在线观看| 精品国产一区二区三区av性色 | 91精品亚洲| 性生活一级大片| 亚洲成精国产精品女| 神马精品久久| 国产精品久久久久久一区二区| 色偷偷综合网| 绯色av蜜臀vs少妇| 精品久久久久久电影| 精品美女视频在线观看免费软件 | 亚洲国产视频一区二区| 日本免费不卡视频| 国产97色在线| 久久久久久久久国产一区| 日本wwwxx| 精品久久久久久中文字幕大豆网| h视频在线播放| 99re视频| 日韩精品电影在线观看| 日本一级片免费| 亚洲国产精品中文| 久久亚洲精品中文字幕| 精品无码一区二区三区爱欲| 久久人人97超碰com| ,一级淫片a看免费| 97国产suv精品一区二区62| 精品国产美女| 波多野吉衣在线视频| 日本高清无吗v一区| 宅男在线观看免费高清网站| 久久久久久九九| 精品亚洲国产成人av制服丝袜 | av网站网址在线观看| 国产精品视频免费一区| wwwwwxxxx日本| 久久久久久久高潮| 国产精品麻豆一区| 精品久久久久久久久久久久久久久 | 日韩精品视频在线观看视频 | 日本一区二区三不卡| 精品一区二区三区在线观看|