精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI像人一樣操控電腦:多模態AI Agents和屏幕交互新范式 原創

發布于 2024-11-20 10:11
瀏覽
0收藏

編者按: 未來我們與計算機的交互方式將發生怎樣的變革?當 AI 能像人類一樣自如地操控電腦和手機,我們的工作方式會有什么改變?

本文深入剖析了 Anthropic、微軟和蘋果三大科技巨頭在突破這一瓶頸上的最新進展。通過解讀他們各自獨特的技術路線 —— 從 Anthropic 采用像素計數方式實現精準導航,到微軟將界面解析為結構化數據,再到蘋果專注于移動端的多模態交互方案,文章為我們展現了 AI 驅動屏幕交互的未來圖景。

作者 | Tula Masterman

編譯 |?岳揚

01 引言:AI Agent 領域的持續變革

Anthropic、微軟和蘋果的最新動態正在重塑我們對 AI Agents 的認知。目前,“AI Agent” 這一概念已被廣泛提及 —— 幾乎每一項與人工智能相關的公告都會涉及 AI Agents,但其先進程度和實用性卻有著天壤之別。

在這個領域的一端,我們看到了一些能夠進行多輪規劃、工具操作和目標評估的先進 AI Agents。它們通過不斷迭代來完成特定任務,甚至能夠建立和利用“記憶(memories)”,從過往的錯誤中吸取教訓,以推動未來的成功。如何打造一個高效的 AI Agents,是當前人工智能研究的熱點之一。這涉及到探究成功 Agents 應該具備哪些特性(例如,AI Agents 的規劃方式、記憶運用、工具選擇以及任務跟蹤能力)以及如何構建一個高效的 AI Agents 團隊。

而在另一端,是一些執行的任務目的單一、幾乎無需推理的 AI Agents。這些 AI Agents 往往更側重于特定的工作流程(例如,專門負責生成文檔摘要并保存結果的 Agent)。由于這些 Agents 的應用場景較為明確,因此它們通常更容易實現,不需要過多的規劃和跨工具協調,也無需處理復雜的決策問題。

隨著 Anthropic、微軟和蘋果的最新動態不斷發布,我們目睹了基于文本的 AI Agents 向多模態轉變。這一變化意味著我們可以通過書面或口頭指令來指導 AI Agents,使其能夠流暢地在手機或電腦上執行任務。這一技術有很大的潛力可以提升跨設備使用的便利性,然而,與此同時,這種技術也伴隨著重大的風險。Anthropic 關于 computer use 技術的相關公告強調了 AI 不受限制訪問用戶屏幕的潛在風險,并提出了一系列降低風險措施,例如在專用的虛擬機或容器中運行 Claude,將互聯網訪問限制在允許的域名列表中,進行人工干預檢查,并避免讓模型接觸敏感數據。他們還強調,通過 API 提交的內容不會被用于模型訓練。

02 Anthropic、微軟和蘋果最新公告亮點

2.1 Anthropic推出Claude 3.5 Sonnet:賦予人工智能使用計算機的能力

  • 概述:Computer Use 的目標是讓 AI 能夠像人類一樣操作計算機。在理想狀態下,Claude 能夠實現文檔的打開與編輯、點擊頁面的各個區域、內容的滾動閱讀,以及命令行代碼的運行和執行等多種操作。目前,Claude 已能按照人類指令在屏幕上移動光標、點擊指定區域,并在虛擬鍵盤上輸入文字。在 OSWorld 基準測試[1]中,Claude取得了 14.9% 的成績,雖然超過了同基準測試中的其他 AI 模型,但與人類 70–75% 的平均得分相比,仍有不小的差距。

  • 工作原理:Claude 通過查看用戶上傳的屏幕截圖,并計算像素位置來確定光標移動的位置,從而完成指定任務。研究人員提到,為了安全起見,在訓練過程中并未給予 Claude 互聯網訪問權限,但 Claude 能夠將從使用計算器和文本編輯器等簡單任務的訓練中學習到的知識,應用到更為復雜的任務上。在任務執行失敗時,它還會進行重試。Computer Use 功能包含了三個由 Anthropic 定義的工具:computer、text editor 和 bash。其中,computer 工具用于屏幕上的導航,text editor 用于文本文件的查看、創建和編輯,而 bash 則用于執行 bash shell 命令。

  • 面臨的挑戰:盡管 Claude 的能力表現良好,但還有很長的路要走。目前,它在頁面滾動、整體穩定性方面存在問題,且對提示詞注入攻擊較為敏感。

  • 使用指南:公眾可通過 Anthropic API 體驗公共測試版。Computer Use 功能可以與常規工具結合使用。

2.2 微軟的OmniParser & GPT-4V:讓AI能夠理解和操作屏幕

  • 概述:OmniParser 用于解析用戶界面截圖,并將其轉換成結構化的數據輸出。這些輸出可以被傳遞給 GPT-4V 這樣的模型,以便根據檢測到的屏幕元素生成相應的操作動作。在包括專為 Windows 系統設計的 Windows Agent Arena[2] 在內的多種基準測試中,OmniParser 與 GPT-4V 的組合得分約為20%。這些測試任務旨在評估 AI Agents 在規劃、理解屏幕內容和使用工具方面的能力。
  • 工作原理:OmniParser 通過整合多個經過微調的模型來解析屏幕內容。它采用了微調后的可交互圖標/區域檢測模型(YOLOv8[3])、圖標描述模型(BLIP-2[4] 或 Florence2[5])以及 OCR 模塊。這些模型被用于識別圖標和文本,并在生成內容描述后,將輸出數據發送給 GPT-4V,由 GPT-4V 決定如何利用這些信息與屏幕交互。
  • 面臨的挑戰:目前,當 OmniParser 檢測到重復的圖標或文本并將其傳遞給 GPT-4V 時,GPT-4V 經常無法正確點擊目標圖標。此外,OmniParser 的準確性受 OCR 輸出影響,如果邊界框定位不準確,整個系統可能無法正確點擊鏈接區域。還有,對于某些圖標的理解也存在挑戰,因為同一個圖標有時會被用來表示不同的含義(例如,三個點可能代表加載中,也可能代表菜單選項)。
  • 使用指南:OmniParser 可在 GitHub[6] 和 HuggingFace[7] 上獲取。您需要安裝必要的依賴項,并從 HuggingFace 加載模型。之后,您可以嘗試運行 demo notebooks,了解 OmniParser 如何分析圖像。

2.3 蘋果的Ferret-UI:將多模態智能引入移動端

  • 概述:蘋果的 Ferret(任意時間、任意地點、任意粒度下引用和定位任何事物)技術早在 2023 年便已問世。近期,蘋果推出了 Ferret-UI,這是一款 MLLM(多模態大語言模型),能夠在移動設備端用戶界面上執行“引用、定位和推理”任務。這些任務包括小部件的分類和圖標的識別(引用任務),以及尋找特定圖標或文本(定位任務)。Ferret-UI 能夠理解用戶界面并根據指令進行交互。
  • 工作原理:Ferret-UI 在 Ferret 的基礎上進行了優化,通過訓練來適應不同分辨率的圖像,從而更好地掌握移動端用戶界面的細節。每張圖像都被分割成兩張子圖像,并生成各自的特征。大語言模型(LLM)結合全圖像、兩張子圖像、區域特征和文本嵌入信息來生成響應。
  • 面臨的挑戰:Ferret-UI 的相關論文指出,模型在某些情況下會預測目標附近的文本,而不是目標文本,或者當屏幕上出現拼寫錯誤的單詞時,會預測出正確的單詞,而不是屏幕上顯示的錯誤單詞,有時還會錯誤地識別用戶界面的屬性。
  • 使用指南:蘋果在 GitHub[8] 上公開了 Ferret-UI 的數據和代碼,僅供研究目的使用。蘋果發布了兩個 Ferret-UI 模型版本,一個基于 Gemma-2b,另一個基于 Llama-3–8B。這些模型遵循 Gemma 和 Llama 的許可協議,而數據集則允許非商業用途。

2.4 總結:AI 驅動屏幕導航的三種策略

總的來說,這些系統分別展示了構建多模態 AI Agents 的不同路徑,它們能夠代表我們與電腦或手機進行交互。

Anthropic 推出的 Claude 3.5 Sonnet 著眼于一般的計算機交互,通過像素計數來實現屏幕上的精準導航。微軟的 OmniParser 則專注于解決將用戶界面拆分為結構化輸出的難題,隨后這些信息會被傳遞至 GPT-4V 等模型以決定下一步操作。而蘋果的 Ferret-UI 則是針對移動端用戶界面設計的,它能識別圖標、文字和小部件,并能執行與用戶界面相關的開放式指令。

這三種系統的工作流程一般包括兩個主要階段:一是解析視覺信息,二是思考如何與之交互。精確解析屏幕內容對于規劃交互方式以及確保系統穩定執行任務至關重要。

03 結語:打造更智能、更安全的AI Agents

依我之見,這些進步最激動人心的地方在于多模態功能與推理框架正逐步融合。雖然這些工具展現出巨大的潛力,但與人類的表現相比仍有較大差距。此外,在部署能夠訪問屏幕的 AI Agents 系統時,還必須正視和解決一系列 AI 安全方面的問題。

智能體系統的一大優勢在于它們能夠通過將任務細分為多個部分,從而克服單個模型在認知方面的局限性。這些系統的構建方式多種多樣。有時候,用戶面前看似單一的智能體,實際上可能是由多個子智能體組成的團隊 —— 每個子智能體擁有不同的職責,比如規劃(planning)、屏幕交互(screen interaction)或記憶存儲管理(memory management)。比如,負責推理的智能體可能會與專門處理屏幕數據的智能體協作,同時另一個智能體則負責整理記憶存儲,以提高未來的表現。

另外,這些功能也可以集成在一個全能的智能體中。在這種情況下,智能體可能包含多個內部規劃模塊 —— 一個專注于屏幕操作的規劃,另一個則負責整個任務的管理。盡管構建智能體的最佳方案尚待探索,但我們的目標始終不變:那就是創造出能夠在不同模態下長期穩定工作,并能無間適應用戶需求的智能體。

Thanks for reading!
Hope you have enjoyed and learned new things from this blog!

END

本期互動內容 ??

?如果讓 AI 來操作你的設備,你最擔心什么問題?安全、隱私還是其他?

??文中鏈接??

[1]https://os-world.github.io/

[2]https://microsoft.github.io/WindowsAgentArena/

[3]https://yolov8.com/

[4]https://arxiv.org/abs/2301.12597

[5]https://arxiv.org/abs/2311.06242

[6]https://github.com/microsoft/OmniParser/

[7]https://huggingface.co/microsoft/OmniParser

[8]https://github.com/apple/ml-ferret/tree/main/ferretui

原文鏈接:

https://towardsdatascience.com/computer-use-and-ai-agents-a-new-paradigm-for-screen-interaction-b2dcbea0df5b

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2024-11-20 10:22:06修改
收藏
回復
舉報
回復
相關推薦
亚洲天堂狠狠干| av免费播放网站| 不卡视频观看| 中文字幕+乱码+中文字幕一区| 国产精品视频自在线| 精品99在线观看| 少妇一区二区视频| 欧美成人猛片aaaaaaa| 免费大片在线观看| av片在线观看永久免费| 99国产精品久久久久| 国产欧美精品va在线观看| 日本五十路女优| 国产精品久久久久久久久妇女| 精品久久久久久久久久久久久久久| www日韩在线观看| 黄污视频在线观看| 国产精品久久777777| 国产精品日韩一区二区三区| 伊人影院中文字幕| 中文亚洲免费| 久久久噜噜噜久久中文字免| 黄色片网站在线播放| 日本精品影院| 日韩欧美国产wwwww| 欧美日韩亚洲自拍| 涩涩av在线| 亚洲午夜久久久久中文字幕久| 亚洲一区二区三区午夜| 毛片免费在线播放| 成人国产精品免费观看视频| 国产在线久久久| 中文字幕一区二区人妻电影| 亚洲精品乱码| 国语自产在线不卡| 久操视频免费在线观看| 亚洲情侣在线| 久久亚洲电影天堂| 久草福利资源在线| 日本女优一区| 国产一区二区三区在线播放免费观看 | 精品人妻少妇嫩草av无码| 精品国模一区二区三区欧美 | 夜夜精品视频一区二区 | 国产精品免费区二区三区观看| 91国内精品久久久| 美女网站视频久久| 国产精品亚洲аv天堂网| 国产成人麻豆免费观看| 水野朝阳av一区二区三区| 欧美一级大胆视频| 成人毛片在线播放| 视频一区二区三区在线| 日本亚洲欧洲色α| 91porny九色| 蜜桃av噜噜一区| 成人淫片在线看| 国产suv精品一区二区69| 国产一区不卡在线| 96国产粉嫩美女| www.五月婷婷| 不卡的看片网站| 精品午夜一区二区三区| 少妇性bbb搡bbb爽爽爽欧美| 91免费版在线看| 日韩av一级大片| 视频三区在线| 亚洲精品成人少妇| 欧美精品久久久久久久自慰| 日本在线啊啊| 欧美三级日韩在线| 捷克做爰xxxⅹ性视频| 亚洲精品a区| 日韩久久精品电影| 亚洲理论片在线观看| 欧美成人激情| 久久久久国产精品www| 伊人手机在线视频| 久久国产精品无码网站| 99精品欧美一区二区三区| 日本激情视频网站| 国产欧美日韩亚州综合| 99精品视频网站| h片在线观看下载| 色美美综合视频| 亚洲男人天堂2021| 亚洲理论电影片| 日韩在线中文视频| 日产亚洲一区二区三区| 日本 国产 欧美色综合| 成人免费视频网站入口| 国产三级视频在线看| 依依成人综合视频| 午夜精品久久久内射近拍高清 | 欧美精品久久一区| 国产十八熟妇av成人一区| 日韩理论电影大全| 97国产精品免费视频| 亚洲午夜无码久久久久| 成人爽a毛片一区二区免费| 日本一区二区三区免费观看| 在线中文字幕电影| 在线视频你懂得一区| caopor在线| 清纯唯美亚洲综合一区| 97在线免费观看| 国产欧美久久久精品免费| 91蜜桃网址入口| 男女激情免费视频| 久久亚洲精品人成综合网| 亚洲国产精品电影| 天天鲁一鲁摸一摸爽一爽| 免费亚洲视频| 国产成人精品福利一区二区三区 | 国偷自产视频一区二区久| 色妞久久福利网| 亚洲不卡在线视频| 不卡的看片网站| 国产一区二区三区播放| 国产成人亚洲一区二区三区| 精品亚洲永久免费精品 | 91福利在线导航| 国产伦精品一区三区精东| 欧美.日韩.国产.一区.二区| 国产免费观看久久黄| 九色在线视频蝌蚪| 欧美日韩一区二区精品| 一级黄色免费视频| 一区二区三区午夜探花| 国产精品影院在线观看| 国产精品秘入口| 一本久道中文字幕精品亚洲嫩| 色悠悠在线视频| 黄色综合网站| 翡翠波斯猫1977年美国| av色综合久久天堂av色综合在| 欧美日韩夫妻久久| 国精品人伦一区二区三区蜜桃| 天堂蜜桃91精品| 日本一区二区三区视频在线播放 | 国产无套精品一区二区| 三级资源在线| 精品国产网站在线观看| 青娱乐91视频| 国产不卡视频在线观看| 69精品丰满人妻无码视频a片| 成人自拍视频| 久久精品视频导航| 国产美女裸体无遮挡免费视频| 亚洲天堂精品视频| 国产又粗又猛又爽又黄| 激情另类综合| 免费成人看片网址| 激情开心成人网| 色青青草原桃花久久综合| 伊人网综合在线| 亚洲精选视频在线| 欧美久久久久久久久久久| 夜夜嗨网站十八久久| 欧美日韩综合网| 日韩三区免费| 久久精品人人爽| 国产 日韩 欧美 精品| 亚洲成人av资源| 香蕉网在线播放| 日本在线观看不卡视频| 综合操久久久| 国产福利一区二区精品秒拍| 欧美最猛性xxxx| av在线收看| 欧美一区二区三区视频免费 | 免费在线亚洲欧美| 日韩视频精品| 国产色99精品9i| 8x海外华人永久免费日韩内陆视频| 日本一区二区三区在线观看视频| 在线观看国产一区二区| 艳妇荡乳欲伦69影片| www.欧美亚洲| 邪恶网站在线观看| 韩国自拍一区| 日本在线播放一区| 精品视频一区二区三区在线观看| 亚洲91av视频| 伦xxxx在线| 亚洲精品国精品久久99热| 中文字幕欧美在线观看| 亚洲国产视频直播| 性猛交娇小69hd| 成人深夜在线观看| 午夜免费看视频| 激情久久五月| 99re99热| 久草精品在线| 91嫩草视频在线观看| 久久久一本精品| 孩xxxx性bbbb欧美| 成人日韩欧美| 亚洲一区二区福利| 欧美 日韩 中文字幕| 欧美日韩午夜在线| youjizz在线视频| 一区二区不卡在线视频 午夜欧美不卡在 | 日韩综合久久| 日韩女优人人人人射在线视频| av免费在线观看网址| 亚洲视频在线播放| 理论片中文字幕| 欧美日韩在线不卡| 国产免费av一区| 亚洲国产一区二区视频| 午夜精品一区二区三级视频| 26uuu精品一区二区三区四区在线| 日本网站在线看| 蜜桃在线一区二区三区| 北条麻妃69av| 在线国产精品一区| 国产一二三四区在线观看| 成人3d精品动漫精品一二三| 久久婷婷开心| 久久精品凹凸全集| 99中文字幕| 日本精品视频| 91色精品视频在线| 欧美美女被草| 国产精品一区二区三区免费视频| 欧美成人性网| 欧洲亚洲免费在线| 五月天av在线| 国产91ⅴ在线精品免费观看| 成人三级小说| 久久久久久久久网站| a毛片在线观看| 久久亚洲精品中文字幕冲田杏梨| avtt亚洲| 最近的2019中文字幕免费一页| 国产小视频在线观看| 精品视频在线播放免| 色视频在线观看| 精品视频偷偷看在线观看| 手机亚洲第一页| 亚洲男人7777| 国产毛片av在线| 亚洲欧美日韩一区二区在线 | 日本999视频| 日韩精品一二三区| 婷婷丁香激情网| 奇米色777欧美一区二区| 中文字幕av专区| 国内不卡的二区三区中文字幕| 五月天婷婷影视| 国产电影精品久久禁18| 中文字幕99页| 91在线视频观看| av男人的天堂av| 国产精品美女久久久久久久久久久| 一本在线免费视频| 亚洲三级理论片| 精品深夜av无码一区二区老年| 亚洲国产美女搞黄色| 可以在线观看av的网站| 欧美性猛交xxxx久久久| 无码人妻黑人中文字幕| 欧美日韩一区二区电影| 国产视频一区二区三| 精品欧美黑人一区二区三区| 男人天堂网在线视频| 亚洲人成在线观看| 久操视频在线观看| 欧美国产视频日韩| 新版的欧美在线视频| 国产精品久久久久久久久久尿| 欧美另类激情| 国产伦理久久久| 国产亚洲一区二区三区不卡| 手机成人av在线| 亚洲日产国产精品| www日韩视频| 国产一区二区三区在线观看免费视频 | 精品少妇theporn| 色婷婷精品久久二区二区蜜臂av| 亚洲午夜激情视频| 亚洲成人精品视频在线观看| 久草视频视频在线播放| 免费97视频在线精品国自产拍| 国产伦久视频在线观看| 国产精品欧美久久久| 中文无码日韩欧| 色噜噜一区二区| 欧美精品大片| 午夜免费福利在线| 岛国av在线一区| 亚洲天堂最新地址| 亚洲成人在线网站| 怡红院男人天堂| 亚洲第一福利网| 免费在线你懂的| 青青精品视频播放| 中文字幕日韩在线| 亚洲免费视频一区| 99人久久精品视频最新地址| 97超碰人人爽| 久久精品一区二区三区四区| 欧美丰满艳妇bbwbbw| 欧美性色黄大片手机版| 深夜福利视频网站| 久久影院免费观看| 欧美va在线观看| 九色91在线视频| 欧美91福利在线观看| 99视频在线视频| 久久亚洲综合av| 国产一级二级三级视频| 欧美日韩一区二区三区在线看| 女人18毛片一区二区三区| 麻豆国产va免费精品高清在线| 快播电影网址老女人久久| 国产区一区二区| 欧美日韩爆操| 宇都宫紫苑在线播放| 国产精品麻豆视频| www.久久精品视频| 日韩成人在线电影网| 色呦呦在线播放| 91老司机在线| 国产精品x453.com| 欧美性猛交xxx乱久交| 久久色在线视频| 亚洲伊人成人网| 精品少妇一区二区三区在线播放| 久久久久久国产精品免费无遮挡| 国产精品国产三级国产aⅴ9色| 天堂资源在线亚洲| 久久成人免费观看| 99久久免费视频.com| 国产91av视频| 亚洲精品电影在线观看| 丁香花在线电影| 国产精品露出视频| 亚洲高清资源| 一级欧美一级日韩片| 婷婷丁香久久五月婷婷| 五月婷婷综合久久| 91精品国产高清自在线看超| 欧洲亚洲视频| 欧美日韩亚洲一| 久久久99免费| 亚洲免费视频二区| 色偷偷9999www| 欧美爱爱视频| 先锋影音男人资源| 国模无码大尺度一区二区三区| 91视频综合网| 亚洲精品在线免费观看视频| 啊啊啊久久久| 欧美精品欧美精品系列c| 日韩va亚洲va欧美va久久| 特级西西www444人体聚色| 欧美日韩在线播| 国产激情视频在线观看| 豆国产97在线| 天堂成人国产精品一区| 网站永久看片免费| 日韩一区国产二区欧美三区| 日韩特级毛片| 久久这里精品国产99丫e6| 视频一区欧美日韩| 国产精品麻豆免费版现看视频| 日韩欧美你懂的| 亚洲精品mv| 中文字幕一区二区三区精彩视频| 国产精品亚洲一区二区三区在线| 久久精品视频9| 亚洲欧美制服第一页| 视频欧美精品| 国产不卡一区二区视频| 国产欧美日韩视频在线观看| 国产手机av在线| 97色在线视频| 欧美残忍xxxx极端| 波多野结衣影院| 欧美人动与zoxxxx乱| av资源一区| 亚洲一区尤物| 91免费国产视频网站| 一本到在线视频| 97人洗澡人人免费公开视频碰碰碰| 日韩一级毛片| 国产精品扒开腿做爽爽爽a片唱戏| 91成人网在线| av影片在线| 男女啪啪的视频| 久久久www成人免费无遮挡大片| 国产三级午夜理伦三级| 欧美制服第一页| 午夜精彩国产免费不卡不顿大片| 国产综合精品在线| 精品欧美一区二区久久| 欧美成人毛片| 国产成人无码一二三区视频|