精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Mobile-Agent-v2:GPT4v + 多Agent提高40%準確率 精華

發布于 2024-6-7 12:17
瀏覽
0收藏

1. Mobile-Agent-V2是什么?

Mobile-Agent-v2是一款通過多Agent合作實現有效導航的移動設備操作助手。它包含三個專業角色:規劃Agent、決策Agent和反思Agent。

? 規劃Agent負責根據歷史操作生成任務進度,并通過設計的記憶單元保存歷史屏幕中的焦點內容。

? 決策Agent在生成操作時會參考記憶單元,并檢查屏幕上的焦點內容,同時更新記憶。

? 反思Agent則觀察決策代理操作前后屏幕的變化,評估操作是否達到預期,并在必要時采取措施重新執行。

三個角色在進度、決策和反思階段各司其職,共同協作,以簡化導航的復雜性。

Mobile-Agent-v2:GPT4v + 多Agent提高40%準確率-AI.x社區圖片

Mobile-Agent-v2 的運作是循環迭代的,其流程上圖。為了提升代理對屏幕的識別力和從歷史記錄中導航焦點內容的能力,特別設計了視覺感知模塊和記憶單元。規劃代理首先更新任務進度,決策代理據此導航當前任務的發展。決策代理隨后根據任務進度、屏幕狀態以及前一次操作的反饋(如果有誤)來執行任務。操作后,反思代理會對比操作前后的屏幕,判斷操作是否達到預期效果。

1.1 視覺感知模塊

即便是最先進的 MLLMs,在端到端處理屏幕識別時也面臨挑戰。為此,集成了視覺感知模塊來強化這一功能。該模塊包含三種工具:文本識別、圖標識別和圖標描述。將截屏輸入模塊,可以提取出屏幕上的文本和圖標信息及其坐標。

1.2 記憶模塊

Mobile-Agent-v2:GPT4v + 多Agent提高40%準確率-AI.x社區圖片

鑒于規劃代理產出的任務進度以文本形式展現,從歷史屏幕中導航焦點內容依舊充滿挑戰。為應對這一難題,構建了一個記憶模塊,用以保存與當前任務相關聯的歷史屏幕焦點內容。此記憶單元作為短期記憶模塊,伴隨任務進展而實時更新。在涉及多個應用的復雜場景中,記憶單元發揮著關鍵作用。例如,在上圖展示的情形中,決策代理所捕捉的天氣信息將在后續步驟中發揮作用,此時,與天氣應用頁面相關的信息會被同步更新至記憶單元。

1.3 規劃Agent

Mobile-Agent-v2:GPT4v + 多Agent提高40%準確率-AI.x社區圖片

為了降低決策過程中對冗長歷史操作的依賴,引入了獨立的規劃代理。盡管每次操作發生在不同的頁面且各有差異,但許多操作的目標往往是一致的。以上圖中的例子為例,前四次操作均旨在查找比賽結果。因此,設計了規劃代理,旨在歸納歷史操作并追蹤任務的進展。

1.4 決策Agent

決策代理在決策階段運行,生成操作動作并在設備上執行它們,同時還負責更新記憶單元中的焦點內容。

操作空間:為了降低操作的復雜性,作者設計了一個操作空間,并限制決策代理僅從此空間中選擇操作。對于自由度較高的操作,如點擊和滑動,引入了一個額外的參數空間來定位或處理特定內容。以下是操作空間的詳細描述:

? 打開應用(應用名稱)。如果當前頁面是主頁,可以使用此操作打開名為“應用名稱”的應用。

? 點擊(x,y)。此操作用于點擊坐標為(x,y)的位置。

? 滑動(x1,y1),(x2,y2)。此操作用于從坐標為(x1,y1)的位置滑動到坐標為(x2,y2)的位置。

? 輸入(文本)。如果當前鍵盤處于激活狀態,可以使用此操作在輸入框中輸入“文本”的內容。

? 主頁。此操作用于從任何頁面返回到主頁。

? 停止。如果決策代理認為所有要求都已滿足,可以使用此操作來終止整個操作過程。

記憶單元更新:由于決策代理所做的每項操作都與任務高度相關,并基于當前頁面的視覺感知結果,因此非常適合在屏幕頁面內觀察與任務相關的焦點內容。因此,賦予了決策代理更新記憶單元的能力。在做出決策時,決策代理會被提示觀察當前屏幕頁面內是否有與任務相關的焦點內容。如果觀察到此類信息,決策代理會將其更新到記憶中,供后續決策參考。

1.5 反思Agent

盡管配備了視覺感知模塊,Mobile-Agent-v2 有時仍會執行出人意料的操作。在某些特定情境下,即便是頂尖的 MLLM 如 GPT-4V,也可能引發嚴重的誤判。為此,作者引入了反思代理,用以監測決策代理操作前后屏幕的變化,判斷操作是否達到預期效果。

參照上面的架構圖,反思代理在執行操作后會得出三種反思結果:錯誤操作、無效操作和正確操作。以下是對這三種結果的具體說明:

? 錯誤操作:指引導設備進入與任務無關頁面的操作。比如,代理本想在通訊應用中與聯系人 A 發消息,卻誤入了聯系人 B 的聊天界面。

? 無效操作:指對當前頁面未產生任何變化的操作。比如,代理意圖點擊某個圖標,卻誤觸了圖標旁邊的空白區域。

? 正確操作:指符合決策代理預期,并向完成用戶指令邁進的操作。

遇到錯誤操作時,頁面將回退至操作前的狀態;遇到無效操作時,頁面保持不變。無論是錯誤還是無效操作,都不會被記錄在操作歷史中,以避免代理重復無效的行為。而當操作正確時,相關信息將被更新至操作歷史,頁面狀態也將同步更新。

2. 效果測評

2.1 任務完成度評估

Mobile-Agent-v2:GPT4v + 多Agent提高40%準確率-AI.x社區圖片

Mobile-Agent-v2:GPT4v + 多Agent提高40%準確率-AI.x社區圖片

上面兩個表分別展示了Mobile-Agent-v2在非英語和英語環境下的性能表現。相較于Mobile-Agent,Mobile-Agent-v2在基礎和高級指令的執行上均有顯著提升。得益于多代理架構的支持,即便面對極具挑戰性的高級指令,**Mobile-Agent-v2的成功率也能達到55%**,遠高于Mobile-Agent的20%。在英語環境下,Mobile-Agent-v2同樣實現了顯著的性能提升,其成功率平均提高了27%,即便在Mobile-Agent本就表現較好的英語場景中。

2.2 反思能力評估

即便在知識注入的情況下,**決策準確率可能無法達到100%,但完成率卻能達到100%**。這說明即便有外部知識輔助,Mobile-Agent-v2在決策時仍可能犯錯,正如人類一樣,完全避免決策錯誤是困難的。這突顯了反思代理的重要性。

2.3 應用類型評估

綜合各項指標,可以發現所有方法在系統應用上的性能普遍優于第三方應用。從多應用的評估結果來看,Mobile-Agent-v2在成功率和完成率上相較于Mobile-Agent分別提升了37.5%和44.2%。與單一應用任務相比,跨應用任務更依賴于歷史操作和焦點內容的檢索。這一顯著的性能提升證明了Mobile-Agent-v2的多代理架構和記憶單元在其中扮演了重要角色

2.3 操作知識注入評估

Mobile-Agent-v2:GPT4v + 多Agent提高40%準確率-AI.x社區圖片

Mobile-Agent-v2:GPT4v + 多Agent提高40%準確率-AI.x社區圖片

從上面兩個表的知識注入結果來看,操作知識能顯著提高Mobile-Agent-v2的性能,表明人工注入的操作知識有助于克服代理在操作上的局限。這一發現意味著知識注入能夠擴展Mobile-Agent-v2的應用范圍,因為即便是復雜任務,也可以通過人工編寫的操作教程來指導代理完成。這為移動設備自動化腳本測試提供了新思路,表明通過自動化生成高質量的操作知識,可以進一步提升Mobile-Agent-v2的性能。此外,知識注入的成功也為未來移動應用測試開辟了新的可能性。目前移動應用測試多依賴于手工腳本編寫,這限制了測試的普及性并提高了用戶使用門檻。通過將自然語言測試程序注入Mobile-Agent-v2,可以在移動界面元素大小或顏色發生變化時,保持系統的穩定運行,同時語言描述也省去了腳本編寫中所需的知識庫。

2.4 MLLMs性能評估

Mobile-Agent-v2:GPT4v + 多Agent提高40%準確率-AI.x社區圖片

在上表中,對Mobile-Agent-v2框架下不同MLLMs的性能進行了評估。由于部分模型不擅長處理序列輸入,特別挑選了特定指令,并調整了每一步,使其成為獨立的單步任務。因此,僅評估了成功率(等同于決策準確率)。我們還評估了繞過代理架構,直接使用GPT-4V進行端到端操作的效果。結果顯示,直接使用GPT-4V作為移動設備操作助手幾乎不可行。結合代理架構使用的GPT-4V,仍然是實現操作能力的最優配置

3. 使用案例

在WhatApp上回復消息:

Mobile-Agent-v2:GPT4v + 多Agent提高40%準確率-AI.x社區圖片

在社交媒體X上搜索明星并關注:

Mobile-Agent-v2:GPT4v + 多Agent提高40%準確率-AI.x社區圖片

在Tiktok上搜索視頻并評論:

Mobile-Agent-v2:GPT4v + 多Agent提高40%準確率-AI.x社區圖片

在小紅書上搜索內容:

Mobile-Agent-v2:GPT4v + 多Agent提高40%準確率-AI.x社區圖片

根據微博內容發表評論:

Mobile-Agent-v2:GPT4v + 多Agent提高40%準確率-AI.x社區圖片

在b站搜索大v并關注:

Mobile-Agent-v2:GPT4v + 多Agent提高40%準確率-AI.x社區圖片


? 論文原文: https://arxiv.org/abs/2406.01014

Mobile-Agent-v2:GPT4v + 多Agent提高40%準確率-AI.x社區

本文轉載自??大語言模型論文跟蹤??,作者:HuggingAGI 

已于2024-6-7 12:27:33修改
收藏
回復
舉報
回復
相關推薦
日本少妇xxx| 国语自产精品视频在线看一大j8 | 欧美日韩中文字幕一区| 大桥未久一区二区三区| 午夜视频在线免费播放| 蜜臀av一区二区| 欧美黑人狂野猛交老妇| b站大片免费直播| 日韩成人18| 色94色欧美sute亚洲线路一ni| 这里只有精品66| 色综合久久久久久| 国产午夜无码视频在线观看 | 亚洲高清一区二区三区| 欧美激情视频一区二区三区| 国产色片在线观看| 久久久久国产精品午夜一区| 蜜臀久久99精品久久久久久宅男 | 曰本三级日本三级日本三级| 婷婷激情一区| 精品国产乱码久久久久久天美| 在线免费观看成人网| 久久久久国产精品嫩草影院| 精品亚洲aⅴ乱码一区二区三区| 日本一区二区在线播放| 久草福利资源在线观看| 日韩精品久久| 国产一区二区三区直播精品电影 | 国产欧美视频一区二区三区| 国产成人免费电影| 国产乱人乱偷精品视频| 秋霞午夜av一区二区三区| 91大神在线播放精品| 久久网一区二区| 一区二区三区四区日韩| 色七七影院综合| 一级黄色片网址| 国产欧美日韩免费观看| 亚洲男人天堂2024| 亚洲av片不卡无码久久| 欧美巨大xxxx| 精品99999| 精品人妻二区中文字幕| 日韩精品三级| 日韩欧美一级在线播放| 女人扒开双腿让男人捅| 日韩欧美另类中文字幕| 欧美一区二区三区日韩| 激情成人在线观看| 另类视频一区二区三区| 日韩三级免费观看| av在线天堂网| 精品资源在线| 精品亚洲国产成av人片传媒| 人妻少妇精品视频一区二区三区| 日韩成人午夜| 亚洲女同精品视频| 国产精品一区二区入口九绯色| 日韩av网站在线免费观看| 日韩精品中文字幕视频在线| 爱爱的免费视频| 奇米色欧美一区二区三区| 国产亚洲精品综合一区91| www..com.cn蕾丝视频在线观看免费版| 欧美日韩一区二区三区四区不卡| 日韩av中文字幕在线免费观看| 六十路息与子猛烈交尾| 美女毛片一区二区三区四区| 在线免费看av不卡| 亚洲国产成人精品综合99| 国产一区日韩欧美| 8050国产精品久久久久久| 日韩在线视频不卡| 精品一区免费av| 国产精品免费一区二区三区四区| 天天爱天天干天天操| 国产色婷婷亚洲99精品小说| 性欧美18一19内谢| 成av人片在线观看www| 在线一区二区三区四区| 一卡二卡三卡四卡五卡| 国产一区二区三区不卡av| 精品一区二区三区电影| 99国产精品无码| 亚洲中文无码av在线| 高清在线一区二区| 精品国产伦一区二区三区观看体验 | 2018天天弄| 夜久久久久久| 国产精品免费观看在线| 亚洲精品久久久久久无码色欲四季 | 国产精品尤物| 成人国产精品一区| 熟妇高潮一区二区三区| 国产欧美精品国产国产专区| 男人的天堂成人| 蜜桃av在线| 欧美日韩高清一区二区| 你懂的在线观看网站| 日韩一区亚洲二区| 91精品国产91久久久久久吃药 | 美女久久久精品| 99国产超薄丝袜足j在线观看| 日韩精品123| 亚洲桃色在线一区| 日韩亚洲在线视频| 风间由美性色一区二区三区四区| 亚洲视频在线观看视频| 久久综合色综合| 麻豆精品新av中文字幕| 久久99精品久久久久久久久久 | 亚洲第一成人在线| 国模私拍视频在线观看| 亚洲区小说区图片区qvod按摩| 久久久国产精品视频| 免费av网站在线| 国产99久久久久| 免费观看黄色大片| 91另类视频| 亚洲美女视频网| 国产无遮挡又黄又爽| 国产精品996| 自拍视频一区二区三区| 男人操女人免费| 黄色国产网站在线播放| 一本一道综合狠狠老| 亚洲欧美综合视频| 天天影视欧美综合在线观看| 国产精品av免费在线观看| 少妇无码一区二区三区| 夜色激情一区二区| 日韩av影视大全| 国产韩日影视精品| 国产精品亚洲欧美导航| 韩国福利在线| 色吊一区二区三区| 最近中文字幕免费视频| 国产模特精品视频久久久久| 国产一区二区三区色淫影院| 人人澡人人添人人爽一区二区| 欧美一区午夜视频在线观看| 亚洲女人久久久| 蜜臀av一区二区三区| 日韩国产在线一区| 97精品国产99久久久久久免费| 亚洲欧美在线x视频| 久久一区二区三区视频| 久久色在线视频| 黄色一级片播放| 蜜桃一区二区| 国产va免费精品高清在线观看| 日本一二三区在线视频| 色婷婷精品大在线视频| 在哪里可以看毛片| 天堂影院一区二区| 亚洲丰满在线| 四虎国产精品免费久久| 久久久精品亚洲| 国产aⅴ爽av久久久久成人| 亚洲免费观看高清完整版在线观看 | 香蕉久久久久久| 美女性感视频久久久| 成人毛片在线精品国产| 舔着乳尖日韩一区| 全黄一级裸体片| 奇米一区二区三区av| www亚洲国产| 影音先锋欧美激情| 91精品国产亚洲| 国产一级二级三级在线观看| 欧美日韩一级片网站| 精品视频www| 在线看的片片片免费| 国产suv精品一区二区883| www..com日韩| 国产精品欧美三级在线观看| 国产在线久久久| 黄页在线观看免费| 亚洲欧美一区二区三区四区| 亚洲香蕉在线视频| 亚洲国产日韩一区二区| 一道本在线观看| 国产一区欧美日韩| 草草久久久无码国产专区| 久久精品国产www456c0m| 91文字幕巨乱亚洲香蕉| 在线看的毛片| 美女av一区二区三区| 四虎影院在线播放| 91.麻豆视频| 在线精品免费视| 亚洲色图欧洲色图| 亚洲成人日韩在线| 国产一区二区美女| 99久久国产宗和精品1上映| 天天做天天爱综合| 久久免费一区| 综合激情久久| 国产精品日韩精品| 国产白浆在线免费观看| 久久精品国产欧美激情| 日本成人一区| 日韩你懂的在线观看| 国产精品第6页| 亚洲一区二区三区四区五区黄 | 人妻一区二区三区四区| 欧美专区日韩专区| 久久影院一区二区| 日韩久久一区二区| 国产jjizz一区二区三区视频| 国产成人高清视频| www.色就是色.com| 久久一区欧美| 国产老熟妇精品观看| 欧美激情综合| 樱花www成人免费视频| 中文字幕中文字幕精品| 黄色国产精品一区二区三区| 91九色成人| 国产精品丝袜一区二区三区| 天堂√中文最新版在线| 欧美激情中文网| 国产素人视频在线观看| 中文综合在线观看| 免费在线一级视频| 亚洲精品电影久久久| 91在线精品视频| 黄色在线网站噜噜噜| 欧美噜噜久久久xxx| 亚洲成人三级| 伊人亚洲福利一区二区三区| 五月天婷婷视频| 欧美精品一区二区三区蜜臀| 亚洲精品一区二区三区新线路| 制服丝袜亚洲色图| 一道本无吗一区| 欧美亚洲综合色| 日批视频免费观看| 在线视频中文字幕一区二区| 亚洲欧美综合自拍| 色欧美乱欧美15图片| 欧美精品一二三四区| 欧美三级免费观看| 亚洲午夜18毛片在线看| 亚洲激情自拍视频| 久久97人妻无码一区二区三区| 亚洲色图19p| 人妻少妇精品一区二区三区| 亚洲色大成网站www久久九九| 日韩国产第一页| 亚洲免费电影在线| 久久免费在线观看视频| 午夜精品久久久久久| 99热在线观看免费精品| 91福利视频在线| 亚洲图片小说视频| 日韩一区和二区| 国产成人手机在线| 精品呦交小u女在线| 精品推荐蜜桃传媒| 中文字幕亚洲色图| 久操视频在线| 久久久久久久久国产| 中文字幕人成乱码在线观看 | 久久综合九色综合欧美就去吻| 国产福利在线观看视频| 久久久久久99久久久精品网站| 亚洲天堂视频一区| 国产精品成人免费在线| 国产这里有精品| 欧美午夜激情在线| 一级片aaaa| 亚洲国产精品小视频| 国产高清美女一级毛片久久| 久久久精品一区二区| 国产美女福利在线观看| 国产999精品| 日韩欧美中文在线观看| 欧美激情一区二区三区在线视频 | 欧美贵妇videos办公室| 黄色aa久久| 国产欧美日韩专区发布| 在线视频第一页| 国产成人av福利| 午夜理伦三级做爰电影| 国产精品成人免费| 欧美激情亚洲综合| 欧美一区二区免费观在线| 视频二区在线| 久久视频这里只有精品| 欲香欲色天天天综合和网| 成人久久一区二区三区| 特黄特色欧美大片| 日本久久高清视频| 丝袜美腿亚洲一区| 91精品国产高清91久久久久久| 国产女同互慰高潮91漫画| 久草视频在线资源站| 精品视频在线免费| 天堂av资源网| 久久香蕉国产线看观看av| 在线日韩影院| 成人做爰66片免费看网站| 欧美日韩在线观看视频小说| 男女啪啪免费视频网站| 美女免费视频一区二区| 欧美bbbbb性bbbbb视频| 一区二区三区精品久久久| 中国女人一级一次看片| 日韩av在线播放资源| 日韩三级免费| 国产日本欧美一区二区三区在线| 日韩福利视频一区| 日韩一级片一区二区| 蜜臀av一区二区| 国产三级av在线播放| 天天色图综合网| 亚洲国产精品18久久久久久| 色婷婷综合久久久久中文字幕1| 欧美电影免费观看| 狠狠色综合一区二区| 好看的日韩av电影| 天天色天天干天天色| 中文字幕制服丝袜成人av| 久久久久久亚洲av无码专区| 日韩精品极品视频免费观看| 人妖欧美1区| 91黄色精品| 欧美日韩午夜| 国产免费无码一区二区| 一区二区三区在线观看动漫| 一区二区三区日| 色婷婷综合久久久久中文字幕1| 成人综合网站| 神马影院我不卡| 日本aⅴ亚洲精品中文乱码| 亚洲乱码国产乱码精品精大量 | 无码日韩精品一区二区| 日韩精品亚洲视频| 97天天综合网| 精品欧美日韩在线| 亚洲欧洲日本mm| www.日本高清| 欧美性jizz18性欧美| 黄上黄在线观看| 国产精品第100页| 日韩理论电影院| 欧美大片久久久| 亚洲欧美视频在线观看视频| 国产日韩欧美一区二区东京热| 久久中文久久字幕| 欧美视频精品全部免费观看| 黄色一级片国产| 成人午夜在线视频| 国产 日韩 欧美 在线| 亚洲美女av在线| 国产第一精品| 大桥未久一区二区三区| 一本一道久久a久久| 中文字幕自拍vr一区二区三区| 你懂得影院夜精品a| 午夜精品电影在线观看| 韩国一区二区在线观看| 久久国产一级片| 亚洲国产精品人人爽夜夜爽| 国产超碰精品| 一区二区精品在线| 国产iv一区二区三区| 黄色在线免费观看| 中文字幕亚洲无线码在线一区| 国产激情一区| av在线播放天堂| 久久精品人人做人人综合| 91好色先生tv| 韩国国内大量揄拍精品视频| 国产成人1区| 古装做爰无遮挡三级聊斋艳谭| 亚洲成av人片| 国产高清在线观看| 亚洲aⅴ日韩av电影在线观看| 伊人久久综合| 神马久久久久久久久久久| 日韩一区二区三区电影| 绿色成人影院| 在线成人性视频| 99re视频精品| 国产美女精品视频国产| 18一19gay欧美视频网站| 久久中文字幕av一区二区不卡| 麻豆av免费看| 日韩美一区二区| 亚洲婷婷丁香| 国产三级三级三级看三级| 国产精品麻豆久久久| 黄色片一区二区| 国产精品美女在线| 在线日韩中文| 成人免费视频国产免费观看| 日韩精品欧美国产精品忘忧草| 青草综合视频|