精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

312條軌跡激發(fā)241%性能!上交大與SII開源電腦智能體,超越 Claude 3.7

人工智能 新聞
來自上海交通大學(xué)和 SII 的最新研究卻給出了一個非共識答案:僅需 312 條人類標注軌跡,使用 Claude 3.7 Sonnet 合成更豐富的動作決策,就能激發(fā)模型?241%?的性能。

自 Anthropic 推出 Claude Computer Use,打響電腦智能體(Computer Use Agent)的第一槍后,OpenAI 也相繼推出 Operator,用強化學(xué)習(RL)算法把電腦智能體的能力推向新高,引發(fā)全球范圍廣泛關(guān)注。

業(yè)界普遍認為,需要海量的軌跡數(shù)據(jù)或復(fù)雜的強化學(xué)習才能實現(xiàn)電腦智能體的水平突破——這可能意味著大量的人工軌跡標注,以及大規(guī)模虛擬機環(huán)境的構(gòu)建,以支撐智能體的學(xué)習與優(yōu)化。

然而,來自上海交通大學(xué)和 SII 的最新研究卻給出了一個非共識答案:僅需 312 條人類標注軌跡,使用 Claude 3.7 Sonnet 合成更豐富的動作決策,就能激發(fā)模型 241% 的性能,甚至超越 Claude 3.7 Sonnet extended thinking 模式,成為 Windows 系統(tǒng)上開源電腦智能體的新一代 SOTA。

圖片


  • 論文標題:Efficient Agent Training for Computer Use
  • 論文地址:https://arxiv.org/abs/2505.13909
  • 代碼地址:https://github.com/GAIR-NLP/PC-Agent-E
  • 模型地址:https://huggingface.co/henryhe0123/PC-Agent-E
  • 數(shù)據(jù)地址:https://huggingface.co/datasets/henryhe0123/PC-Agent-E

這一發(fā)現(xiàn)傳遞出一個關(guān)鍵信號:當前大模型已經(jīng)具備了使用電腦完成任務(wù)的基礎(chǔ)能力,其性能瓶頸主要在于長程推理(long-horizon planning)能力的激發(fā),而這一能力使用極少量高質(zhì)量軌跡即可顯著提升。

PC Agent-E:如何用極少量軌跡訓(xùn)練出強大的電腦智能體?

數(shù)據(jù)從哪來?人類提供原始操作軌跡

與以往依賴大規(guī)模人工標注或復(fù)雜自動化合成的方式不同,團隊的方法只需 312 條真實的人類操作軌跡。這些軌跡由團隊開發(fā)的工具 PC Tracker 收集而來,僅由兩位作者花一天時間操作自己的電腦,就完成了原始軌跡數(shù)據(jù)的收集。每條軌跡包含任務(wù)描述、屏幕截圖以及鍵盤鼠標操作,并確保了數(shù)據(jù)的正確性。

圖片312 條軌跡在不同軟件上的分布

思維鏈補全:讓「動作」有「思考」的支撐

人類執(zhí)行每一個動作,往往都有一定的理由或「思考過程」。但在收集的原始軌跡數(shù)據(jù)中,這部分「思維鏈」是缺失的。于是,團隊對人類動作進行了「思維鏈補全」(Thought Completion),為每一個動作步驟添加了背后的思考邏輯(符合于 ReAct 范式)。此時的數(shù)據(jù)已足以用于智能體訓(xùn)練,但團隊并未止步于此——接下來的關(guān)鍵一步,進一步大幅提升了軌跡質(zhì)量。

軌跡增強:讓 AI 幫你「腦洞大開」

 接下來,團隊提出了一個關(guān)鍵創(chuàng)新點:軌跡增強(Trajectory Boost),這正是使用極少軌跡讓模型超越 Claude 3.7 Sonnet(thinking)的關(guān)鍵。

其核心觀察為:每個電腦任務(wù)其實可以通過多種路徑完成。也就是說,除了人類采取的動作以外,軌跡中的每一步其實都有多個「合理的動作決策」。為了捕捉這種軌跡內(nèi)在的多樣性,團隊利用前沿模型 Claude 3.7 Sonnet,為軌跡的每一步合成更多的動作決策。團隊注意到,軌跡中每一步記錄的數(shù)據(jù),作為「環(huán)境快照(environment snapshot)」,已足以為人類或智能體提供決策信息。于是,團隊將這些快照提供給 Claude 3.7 Sonnet,采樣多個包含思考過程的動作決策。這一過程極大豐富了軌跡數(shù)據(jù)的多樣性。

圖片

思維鏈補全與軌跡增強

模型訓(xùn)練:少量數(shù)據(jù)也能訓(xùn)出強大模型

最終,團隊在開源模型 Qwen2.5-VL-72B 的基礎(chǔ)上進行訓(xùn)練,得到 PC Agent-E 智能體。作為一款原生智能體模型(native agent model),PC Agent-E 無需依賴復(fù)雜的工作流設(shè)計,即可實現(xiàn)端到端的任務(wù)執(zhí)行。令人驚喜的是,在僅使用 312 條人工標注軌跡的情況下,模型性能便達到了訓(xùn)練前的 241%,展現(xiàn)出極高的樣本效率。

團隊在 WindowsAgentArena-V2 上進行評測——這是對原始 WindowsAgentArena 存在問題進行改進后的新版本。實驗結(jié)果顯示,PC Agent-E 的表現(xiàn)甚至超過了 Claude 3.7 Sonnet 的「extended thinking」模式,而用于數(shù)據(jù)合成的 Claude 3.7 Sonnet 并未啟用這一模式。這標志著 PC Agent-E 成為當前 Windows 系統(tǒng)上開源電腦智能體的新一代 SOTA!與此同時,PC Agent-E 在 OSWorld 上也表現(xiàn)出不俗的跨平臺泛化性能。

圖片

不同電腦智能體在 WindowsAgentArena-V2 上的評估結(jié)果

軌跡增強方法的有力驗證

論文的關(guān)鍵創(chuàng)新之一——軌跡增強方法在人類軌跡的每一步補充了 9 個合成動作決策。為了進一步驗證該方法的效果,團隊調(diào)整訓(xùn)練時使用的合成動作數(shù)量,并觀察其對模型性能的影響。

如圖所示,隨著合成動作數(shù)量的增加,模型性能顯著提升,并展現(xiàn)出良好的拓展趨勢。相比僅使用人類軌跡訓(xùn)練(性能提升僅 15%),PC Agent-E 在引入合成動作后實現(xiàn)了高達 141% 的性能飛躍,充分證明了軌跡增強方法對智能體能力突破的關(guān)鍵作用。

圖片

模型能力隨訓(xùn)練數(shù)據(jù)中動作決策的擴展倍數(shù)的變化

結(jié)論與展望

實驗結(jié)果有力證明了一個關(guān)鍵觀點:少量高質(zhì)量軌跡,就足以激發(fā)智能體強大的長程推理(long-horizon planning)能力。無需海量人類標注,就能訓(xùn)練出當前最優(yōu)(SOTA)的電腦智能體。

目前,即使是最前沿的電腦智能體,其能力與人類相比仍有明顯差距。在這種情況下,在預(yù)訓(xùn)練和監(jiān)督微調(diào)階段引入一定的人類認知,仍然是為后續(xù)強化學(xué)習打下堅實基礎(chǔ)的必要步驟。

團隊方法提供了一種新的思路:在人類標注軌跡注定有限的情況下,可以通過提高軌跡質(zhì)量來實現(xiàn)高效的性能提升。這不僅降低了數(shù)據(jù)需求,也為未來構(gòu)建更智能、更自主的數(shù)字代理鋪平了道路。PC Agent-E 只是一個開始。通往真正能理解并自如操作數(shù)字世界的智能代理之路,仍在繼續(xù)。

責任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2025-06-23 08:56:00

2025-02-07 09:00:00

2023-11-13 19:35:12

訓(xùn)練數(shù)據(jù)

2022-12-12 11:31:39

數(shù)據(jù)學(xué)習

2025-07-02 08:50:00

AI智能體模型

2024-12-25 09:06:44

2025-11-20 08:35:59

2025-08-18 08:30:00

AI模型開源

2024-10-28 10:00:00

蘋果AI

2025-10-27 09:00:09

2025-10-10 02:10:00

2024-03-11 00:20:00

模型論文

2021-07-22 15:25:14

開源技術(shù) 框架

2025-06-06 14:17:11

模型訓(xùn)練AI

2024-10-15 17:28:05

2025-07-14 03:22:00

2024-11-25 09:35:00

AI測試
點贊
收藏

51CTO技術(shù)棧公眾號

欧美日韩国产不卡| 国产精品视频线看| 69av在线视频| 日本污视频网站| 色噜噜成人av在线| 亚洲第一福利一区| 热re99久久精品国产99热| 中文字幕 视频一区| 午夜精品网站| 亚洲午夜精品久久久久久久久久久久 | www.xxxx国产| 久久久水蜜桃av免费网站| 日韩中文在线不卡| 你懂得在线视频| 99热这里有精品| 日韩欧美第一页| 日韩一二区视频| 久草福利在线视频| 国产精品888| 国产精品你懂得| 日韩欧美一级视频| 欧美在线二区| 在线观看日韩www视频免费| 黄色国产在线视频| 91麻豆精品国产综合久久久 | 国产精品乱人伦| 国产一区二区三区色淫影院 | 激情五月激情综合网| 欧美影院在线播放| 国产精品二区一区二区aⅴ| 国产国产精品| 中文字幕免费精品一区高清| 奇米777第四色| 亚洲91网站| 欧美日韩国产精品成人| 茄子视频成人免费观看| 亚洲综合伊人久久大杳蕉| 国产精品午夜电影| 亚洲高清视频在线观看| 免费a在线观看| 91天堂素人约啪| 国产精品一区二区在线观看| 国产成人免费看一级大黄| 麻豆精品新av中文字幕| 国产精品黄视频| 久久久黄色大片| 国产精品久久久亚洲一区| 欧美激情亚洲自拍| 波多野结衣亚洲一区二区| 成人激情免费视频| 亚洲香蕉av在线一区二区三区| 亚洲黄色小说在线观看| 99国内精品久久久久| 欧美精品久久99久久在免费线 | 国产黄色片免费看| 亚洲免费影视| 国产精品白嫩美女在线观看| 91黑人精品一区二区三区| 老色鬼久久亚洲一区二区| 国产精品黄色影片导航在线观看| 亚洲精品无码久久久久| 久久精品国产99国产| 国产综合久久久久久| 国产精品视频第一页| 国产一区二区三区视频在线播放| 国产中文字幕亚洲| 国产成人精品av在线观| 国产999精品久久| 国产女主播一区二区三区| 色av男人的天堂免费在线| 久久男人中文字幕资源站| 欧美午夜欧美| 老司机福利在线视频| 一级做a爱片久久| 国产深夜男女无套内射| 日韩欧美精品电影| 在线成人免费视频| 午夜免费福利影院| 精品国产123区| 久久精品国产亚洲精品| 精品一区免费观看| 久久一区中文字幕| 亚洲xxx自由成熟| 亚洲欧美综合一区二区| 国产欧美视频一区二区三区| 国产对白在线播放| 91福利在线免费| 欧美亚洲国产一区二区三区va| 视频免费1区二区三区| y111111国产精品久久久| 亚洲欧美日本另类| 免费三级在线观看| 久久xxxx| 91九色国产社区在线观看| 日韩一级片免费在线观看| 久久久午夜精品理论片中文字幕| 在线观看欧美一区| 色戒汤唯在线观看| 欧美高清精品3d| 美女又爽又黄视频毛茸茸| 婷婷久久国产对白刺激五月99| 韩国福利视频一区| 91国在线视频| 26uuu精品一区二区| avove在线观看| 国产精品伦理| 精品国产一区二区三区不卡 | 亚洲国产成人av好男人在线观看| 91av俱乐部| 风间由美一区二区av101| 中文字幕亚洲情99在线| 久久久久久久极品| 国产精品一区一区| 亚洲国产日韩美| 自拍一区在线观看| 欧美α欧美αv大片| 成人无码精品1区2区3区免费看| 亚洲美女一区| 91九色偷拍| 69av亚洲| 在线国产亚洲欧美| 野外性满足hd| 怡红院精品视频在线观看极品| 91中文在线视频| h视频在线免费| 色天使久久综合网天天| 艳妇乳肉亭妇荡乳av| 欧美久久一级| 川上优av一区二区线观看| av在线收看| 色婷婷综合在线| 精品无码在线视频| 亚洲日韩成人| 国产欧美日韩一区| 女同一区二区免费aⅴ| 91精品国产综合久久久久久久| 亚洲精品色午夜无码专区日韩| 国产欧美三级| 欧美极品一区| 欧美momandson| 亚洲色图欧美制服丝袜另类第一页| 国产稀缺真实呦乱在线| 国产v综合v亚洲欧| 妺妺窝人体色777777| 9l视频自拍九色9l视频成人| 欧美激情按摩在线| 亚洲精品久久久久久久久久久久久久 | 亚洲一二三区在线| 国产乱子精品一区二区在线观看| 亚洲四色影视在线观看| 国产精品成人久久久| 国产女主播一区| 国产高清视频网站| 国产精品7m凸凹视频分类| 成人免费在线视频网站| 黄色在线播放网站| 日韩美女一区二区三区四区| 久久免费播放视频| 99国产精品久| 日韩精品免费播放| 日韩av自拍| 91影视免费在线观看| 后进极品白嫩翘臀在线播放| 亚洲成人精品av| 日韩精品一区二区亚洲av| 久久新电视剧免费观看| 三级视频中文字幕| 欧美韩日精品| 久久精品日产第一区二区三区精品版 | 久久久这里只有精品视频| 少妇又色又爽又黄的视频| 欧美日韩国内自拍| 性爱在线免费视频| 国产精品一区二区黑丝| 免费成人午夜视频| 欧美少妇性xxxx| 91久久精品国产91久久性色tv| 免费在线观看的电影网站| 日韩美女av在线| 在线观看中文字幕2021| 一区二区三区在线视频免费| 最近日本中文字幕| 美女网站一区二区| 91黄色在线看| 日韩成人精品一区| 国产66精品久久久久999小说| 天堂在线中文网官网| 日韩在线观看你懂的| 亚洲精品18在线观看| 色乱码一区二区三区88| 一起操在线播放| 久久久噜噜噜久久人人看 | 91丝袜高跟美女视频| 亚洲另类第一页| 最新亚洲视频| 美女黄色片网站| 亚洲警察之高压线| 亚洲综合小说区| 韩日精品一区二区| 欧美国产在线视频| 91社区在线观看| 亚洲精品456在线播放狼人| 黄色一区二区视频| 亚洲成人一区二区在线观看| 五月天免费网站| 26uuu另类欧美亚洲曰本| wwwxxxx在线观看| 奇米影视7777精品一区二区| 91动漫在线看| 91精品国产成人观看| 欧美日韩三区四区| 国产精品调教| 亚洲最大的免费| 欧美与亚洲与日本直播| 久久久久亚洲精品| 永久免费网站在线| 丝袜情趣国产精品| 日本天堂影院在线视频| 欧美精品一区男女天堂| 国产精品久久久久精| 在线观看免费视频综合| 国产69精品久久久久久久久久| 亚洲精品视频在线观看免费| 成人在线观看免费高清| 国产亚洲欧洲一区高清在线观看| 欧亚乱熟女一区二区在线| 国产精品影视网| 三级黄色片免费观看| 久色婷婷小香蕉久久| 免费看国产黄色片| 天堂精品中文字幕在线| 国产97在线 | 亚洲| 亚洲高清自拍| av在线观看地址| 国内自拍视频一区二区三区| 色中文字幕在线观看| 欧美顶级大胆免费视频| 亚洲视频在线二区| 色综合天天爱| 杨幂一区欧美专区| 久久综合电影| 宅男av一区二区三区| 色喇叭免费久久综合| 亚洲一区二三| 久久久久亚洲| 色哺乳xxxxhd奶水米仓惠香| h色网站在线观看| 首页综合国产亚洲丝袜| 国产真实乱子伦| 肉肉av福利一精品导航| 妓院一钑片免看黄大片| 日日夜夜一区二区| 亚洲欧美自偷自拍另类| 久久草av在线| 自拍一级黄色片| 国产成人aaa| 国产又粗又猛又色| 亚洲啊v在线免费视频| 国产精品免费视频久久久| 欧美成人aaa| 亚洲伊人第一页| www.神马久久| 欧美一区二区综合| 欧美wwwww| 日韩久久久久久久久久久久| 伊人精品成人久久综合软件| 日本少妇高潮喷水视频| 日韩电影免费在线| 亚洲精品无码久久久久久久| 国产91富婆露脸刺激对白| 99久久人妻无码中文字幕系列| 久久综合九色综合97婷婷| 91精品久久久久久久久久久久| 中文字幕五月欧美| 精品少妇久久久久久888优播| 午夜精品视频在线观看| 黄色av一区二区| 日韩欧美一区在线| 三级在线电影| 久久精品国产清自在天天线| 福利影院在线看| 国产精品69久久久久| 精品国产亚洲一区二区三区在线| 国产精品夜夜夜一区二区三区尤| 国产欧美一区| 久久福利一区二区| 美女精品在线观看| 免费看的av网站| 久久久91精品国产一区二区精品| 中国一区二区三区| 26uuu亚洲电影| 国产在线观看精品| 红杏成人性视频免费看| 日韩中文一区| 国产一区二区三区自拍| 日本在线观看a| 国产伦精品一区二区三区免费迷 | 在线观看免费中文字幕| 欧美成人一区二区三区在线观看 | ,一级淫片a看免费| 亚洲成avwww人| 色网站在线看| 91av在线播放| 精品视频在线播放一区二区三区 | 国产日韩精品在线| 欧美日韩看看2015永久免费| 色中文字幕在线观看| 亚洲综合日本| 91精品人妻一区二区三区四区| 国产日本亚洲高清| 国产精品一区二区6| 91精品欧美一区二区三区综合在 | 国产美女永久免费| 亚洲香蕉成视频在线观看| 欧美精品videosex| 91精品国产自产在线老师啪| 无码一区二区三区在线观看| 亚洲男人天堂av网| 中国女人真人一级毛片| 亚洲韩国欧洲国产日产av| 在线三级电影| 国产日韩欧美一二三区| 国产成人精品免费视| 成人免费观看cn| 欧美视频第一| 国产一区二区三区直播精品电影| 日本中文字幕中出在线| 亚洲一区二区少妇| 久久综合电影| 亚洲一级片网站| 久久精品亚洲乱码伦伦中文| 好吊妞视频一区二区三区| 精品少妇一区二区三区在线视频| 激情影院在线观看| 国产在线观看精品一区二区三区| 欧美日韩一二三四| 毛葺葺老太做受视频| 久久久噜噜噜久噜久久综合| 国产精品va无码一区二区三区| 亚洲精品电影网站| 美女的胸无遮挡在线观看 | 丰满人妻一区二区三区无码av| 久久久av网站| 精品国产亚洲一区二区在线观看 | 视频一区视频二区视频| 首页亚洲欧美制服丝腿| 日韩女同一区二区三区| 欧美少妇bbb| 麻豆视频在线观看免费| 成人在线视频网站| 久久久久久久久久久9不雅视频| 日本不卡一区二区在线观看| 国产精品国产精品国产专区不蜜| 一区二区自拍偷拍| 日韩在线欧美在线| 久久久久久爱| 日韩成人三级视频| 99精品欧美一区| 欧美一区二区三区不卡视频| 一区二区中文字幕| 日韩在线你懂得| 成年人深夜视频| av在线不卡免费看| 免费的毛片视频| 色哟哟网站入口亚洲精品| 国产激情精品一区二区三区| 999一区二区三区| 91女厕偷拍女厕偷拍高清| 国产精品乱码一区二区视频| 日韩资源在线观看| 日韩免费高清视频网站| 欧美三级一级片| 国产精品情趣视频| 国产黄色高清视频| 7777kkkk成人观看| 日韩dvd碟片| 日本一区二区在线观看视频| 色婷婷综合久色| 3d玉蒲团在线观看| 蜜桃av色综合| 国产一区三区三区| 欧美bbbbbbbbbbbb精品| 一本色道久久综合亚洲精品小说| 成人网av.com/| 男人天堂1024| 成人欧美一区二区三区小说| 亚洲欧美国产高清va在线播放| 日韩av片免费在线观看| 911久久香蕉国产线看观看| 星空大象在线观看免费播放| 欧美中文字幕一区二区三区| 伊人精品影院| 日韩高清av| 成人免费va视频| 在线观看国产成人| 性色av香蕉一区二区| 久久精品高清| 免费观看一级一片| 日韩亚洲国产中文字幕欧美| 免费亚洲电影|