精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

美團(tuán)提出首個(gè)語(yǔ)音交互GUI智能體,端到端語(yǔ)音訓(xùn)練能力優(yōu)于傳統(tǒng)文本訓(xùn)練

人工智能 新聞
由美團(tuán)和浙江大學(xué)聯(lián)合推出的GUIRoboTron-Speech——讓用戶(hù)解放雙手,直接對(duì)計(jì)算機(jī)“發(fā)號(hào)施令”。

只需要?jiǎng)觿?dòng)嘴就可以驅(qū)動(dòng)GUI代理?

由美團(tuán)和浙江大學(xué)聯(lián)合推出的GUIRoboTron-Speech——讓用戶(hù)解放雙手,直接對(duì)計(jì)算機(jī)“發(fā)號(hào)施令”。

圖片

這是首個(gè)能夠直接利用語(yǔ)音指令和設(shè)備屏幕截圖進(jìn)行端到端(End-to-End)決策的自主GUI智能體,旨在為用戶(hù)提供更直接、高效且無(wú)障礙的交互體驗(yàn)。

圖片

從文本到語(yǔ)音,智能代理的下一次進(jìn)化

當(dāng)前,以大型語(yǔ)言模型(LLMs)為核心的自主GUI智能體,已能通過(guò)文本指令自動(dòng)執(zhí)行跨應(yīng)用、多步驟的復(fù)雜任務(wù),極大地提升了用戶(hù)的工作效率。但這種對(duì)文本的依賴(lài),限制了其在更廣泛場(chǎng)景下的應(yīng)用。

試想一個(gè)常見(jiàn)的家庭場(chǎng)景:在對(duì)家中的公用電腦發(fā)出指令“打開(kāi)我的瀏覽器”時(shí),一個(gè)僅能理解文本的智能體將不知所措——它無(wú)法分辨指令發(fā)出者是家庭中的哪一位成員,自然不知道什么是“我的”瀏覽器。

然而,一個(gè)能夠直接處理語(yǔ)音的智能體,則可以通過(guò)分析獨(dú)特的聲紋特征,準(zhǔn)確識(shí)別指令發(fā)出者的身份,并打開(kāi)該成員的個(gè)性化Google瀏覽器界面。

這正是語(yǔ)音模態(tài)所蘊(yùn)含的獨(dú)特價(jià)值——它不僅傳遞了指令內(nèi)容,更包含了身份、情緒等豐富的非言語(yǔ)線索,而這些對(duì)于實(shí)現(xiàn)真正個(gè)性化和智能化的交互至關(guān)重要。

圖片

傳統(tǒng)的解決方案,如采用“語(yǔ)音識(shí)別(ASR)模型轉(zhuǎn)錄+文本GUI代理”的級(jí)聯(lián)方式,不僅會(huì)增加系統(tǒng)的計(jì)算負(fù)擔(dān)和延遲,更會(huì)在轉(zhuǎn)錄過(guò)程中丟失寶貴的聲學(xué)信息。

而GUIRoboTron-Speech通過(guò)構(gòu)建端到端的語(yǔ)音GUI代理,可直接利用語(yǔ)音指令和設(shè)備屏幕截圖進(jìn)行決策。

構(gòu)建端到端的語(yǔ)音GUI代理

GUIRoboTron-Speech團(tuán)隊(duì)設(shè)計(jì)了一套嚴(yán)謹(jǐn)而創(chuàng)新的研發(fā)路徑,其核心方法可概括為以下幾個(gè)關(guān)鍵步驟:

圖片

第一步,高質(zhì)量語(yǔ)音數(shù)據(jù)集的生成

面對(duì)業(yè)界缺乏用于訓(xùn)練GUI智能體的語(yǔ)音指令數(shù)據(jù)集的挑戰(zhàn),研究團(tuán)隊(duì)提出并驗(yàn)證了一種高效的解決方案。他們利用一個(gè)先進(jìn)的隨機(jī)音色文本轉(zhuǎn)語(yǔ)音(TTS)模型,將現(xiàn)有的大規(guī)模文本指令數(shù)據(jù)集,轉(zhuǎn)換為包含多種說(shuō)話人風(fēng)格和音色的高質(zhì)量語(yǔ)音指令數(shù)據(jù)集。這一策略不僅成功解決了數(shù)據(jù)稀缺的難題,也為后續(xù)模型的訓(xùn)練奠定了堅(jiān)實(shí)的基礎(chǔ)。

第二步,漸進(jìn)式訓(xùn)練框架:分階段賦能

為了讓模型逐步掌握復(fù)雜的能力,GUIRoboTron-Speech的訓(xùn)練過(guò)程被劃分為兩個(gè)核心階段:

基礎(chǔ)Gounding階段(Grounding TrainingStage):在此階段,模型的核心任務(wù)是學(xué)習(xí)建立語(yǔ)音指令與GUI界面視覺(jué)元素之間的精確對(duì)應(yīng)關(guān)系。即當(dāng)聽(tīng)到“點(diǎn)擊‘確定’按鈕”時(shí),模型需要準(zhǔn)確理解指令的意圖,并在截圖中定位到“確定”按鈕的視覺(jué)特征與坐標(biāo)。

規(guī)劃Planning階段(Planning Training Stage):在掌握了基礎(chǔ)的“聽(tīng)說(shuō)看”能力后,模型進(jìn)入規(guī)劃與推理訓(xùn)練。在這一階段,它將學(xué)習(xí)如何理解并執(zhí)行多步驟的復(fù)雜任務(wù),例如“先登錄賬號(hào),然后找到最新的郵件并打開(kāi)附件”,展現(xiàn)出作為智能代理的邏輯推理與任務(wù)規(guī)劃能力。

第三步,啟發(fā)式混合指令訓(xùn)練策略

由于預(yù)訓(xùn)練的基座模型(Foundation Models)大多在以文本為核心的數(shù)據(jù)上進(jìn)行訓(xùn)練,存在著嚴(yán)重的模態(tài)不平衡(Modality Imbalance)問(wèn)題,即模型可能在訓(xùn)練中傾向于依賴(lài)其更為熟悉的文本信息,而忽略新引入的語(yǔ)音模態(tài)。

為解決此問(wèn)題,研究團(tuán)隊(duì)獨(dú)創(chuàng)了一種啟發(fā)式混合指令訓(xùn)練策略(Heuristic Mixed-instruction Training Strategy)。該策略在訓(xùn)練過(guò)程中,巧妙地混合使用語(yǔ)音指令和文本指令。

通過(guò)這種方式,強(qiáng)制模型同等地關(guān)注并處理來(lái)自?xún)煞N不同模態(tài)的輸入,有效緩解了模態(tài)偏見(jiàn),確保模型能夠穩(wěn)健地從語(yǔ)音信號(hào)中直接提取和理解指令意圖。

性能評(píng)估

圖片

使用不同模態(tài)的指令進(jìn)行g(shù)rounding能力訓(xùn)練,通過(guò)性能對(duì)比可以看到,直接使用speec-based指令相比text-based指令會(huì)低1.6%的平均定位精度,而使用混合指令訓(xùn)練策略可以緩解預(yù)訓(xùn)練多模態(tài)基座的模態(tài)不平衡現(xiàn)象,相比text指令甚至取得了更好的性能。

圖片

在planning能力訓(xùn)練上,基于grounding階段混合指令訓(xùn)練得到的checkpoint,speech-based指令相比text-based指令也取得了更好的性能。

圖片圖片

此外,GUIRoboTro-Speech在與同參數(shù)量級(jí)和訓(xùn)練數(shù)據(jù)源的基線對(duì)比下,同樣取得了領(lǐng)先的地位。

在AndroidControlLow上使用公共數(shù)據(jù)時(shí),GUIRoboTron-Speech在所有方法中實(shí)現(xiàn)了最高的平均成功率(+1.3%),在AndroidControl-High上,它在所有SOTAs中實(shí)現(xiàn)了最高的平均成功率(+7.8%)。在GUI-Odyssey上,它的排名僅次于使用內(nèi)部數(shù)據(jù)的UI-TARS。

這些結(jié)果表明,GUIRoboTron-Speech作為接受用戶(hù)語(yǔ)音指令的GUI代理,具有很高的可行性,能夠通過(guò)多輪推理和動(dòng)作預(yù)測(cè)實(shí)現(xiàn)用戶(hù)目標(biāo)。這表明speech-based指令在GUI Agent這類(lèi)用戶(hù)意圖清晰的場(chǎng)景下的可能性。

圖片

最后,GUIRoboTro-Speech團(tuán)隊(duì)還針對(duì)指令長(zhǎng)度對(duì)GUI Agent任務(wù)執(zhí)行成功率的影響做了分析,發(fā)現(xiàn)在指令長(zhǎng)度較短(用戶(hù)意圖清晰)的場(chǎng)景,speech-based指令相比text-based指令能取得更好的表現(xiàn),然而隨著指令長(zhǎng)度上升,text-based指令展現(xiàn)出其承載復(fù)雜用戶(hù)意圖的特質(zhì)。

如何更好的承載復(fù)雜的用戶(hù)指令以取得穩(wěn)定的任務(wù)成功率,將是speech-based GUI Agent未來(lái)的方向之一。

論文鏈接:https://arxiv.org/abs/2506.11127

Github倉(cāng)庫(kù)鏈接:https://github.com/GUIRoboTron/GUIRoboTron-Speech


責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2024-07-22 08:30:00

神經(jīng)網(wǎng)絡(luò)AI

2025-07-22 08:50:00

AI模型框架

2025-07-02 09:46:30

2023-11-14 12:07:43

美團(tuán)沙龍

2025-07-16 10:12:35

2022-06-16 14:59:34

端到端語(yǔ)音翻譯系統(tǒng)對(duì)話翻譯翻譯模型

2024-09-19 18:49:54

完全同態(tài)加密FHE機(jī)器學(xué)習(xí)

2025-06-12 08:58:00

2021-03-01 10:01:22

開(kāi)發(fā)技能編碼

2025-09-03 14:05:11

瀏覽器智能體AI

2024-09-30 14:40:00

AI強(qiáng)化學(xué)習(xí)框架

2023-09-20 08:37:33

語(yǔ)音翻譯同傳翻譯

2020-09-18 15:12:41

達(dá)摩院語(yǔ)音AI

2021-09-16 10:00:45

神經(jīng)網(wǎng)絡(luò)AI算法

2012-08-24 09:34:58

戴爾
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

久久久久久黄色| 国产盗摄x88av| av大大超碰在线| 国产成人午夜精品影院观看视频 | 亚洲一区二区三区国产| 精品久久久久久一区二区里番| www五月天com| 亚洲欧美亚洲| 亚洲欧美日韩网| www.午夜av| 高潮在线视频| 中文字幕在线观看不卡| 国产精品一区免费观看| 日韩在线 中文字幕| 久久久久午夜电影| 亚洲精品短视频| www.超碰97.com| 91jq激情在线观看| 国产精品婷婷午夜在线观看| 99视频免费观看蜜桃视频| www.久久视频| 国产精品mm| 正在播放欧美一区| 国产精品成人99一区无码| 91精品国产经典在线观看| 亚洲综合色成人| 亚洲欧洲日本国产| 日本在线丨区| 成人免费视频app| 国产一区二区丝袜| 少妇高潮av久久久久久| 在线欧美三区| 欧美国产亚洲精品久久久8v| 蜜桃av.com| 免费av一区| 亚洲第一网站男人都懂| 男人午夜视频在线观看| 免费成人美女女| 午夜精品福利一区二区三区av| 亚洲最新免费视频| 国产女主播在线写真| 99久久综合狠狠综合久久| 96sao精品视频在线观看| 老熟妇一区二区三区啪啪| 亚洲在线黄色| 91国在线精品国内播放| 日本特黄一级片| 欧美日韩免费| 色与欲影视天天看综合网| 人妻熟人中文字幕一区二区| 女人丝袜激情亚洲| 亚洲国产精品久久91精品| 日韩精品视频网址| 日韩黄色在线| 欧美精品久久久久久久久老牛影院| 黑鬼大战白妞高潮喷白浆| 麻豆网站免费在线观看| 午夜电影一区二区三区| 精品视频在线观看一区二区| 性欧美猛交videos| 亚洲精品视频一区| 中日韩在线视频| 黄色在线免费| 亚洲激情六月丁香| 国产日本在线播放| 男人天堂1024| 极品美乳网红视频免费在线观看| 91视频国产资源| 蜜桃精品久久久久久久免费影院| 日本一本草久在线中文| 91丝袜美腿高跟国产极品老师| 久久久99国产精品免费| 日本高清中文字幕二区在线| 久久日一线二线三线suv| 欧美中文娱乐网| av在线资源网| 亚洲婷婷综合色高清在线| 中国一级黄色录像 | 久久躁日日躁aaaaxxxx| 东方av正在进入| 欧美先锋影音| 日韩免费观看网站| 91tv国产成人福利| 国产成人精品午夜视频免费| 成人黄色777网| 国产ts一区二区| 在线视频 中文字幕| 国产一区 二区 三区一级| 97国产超碰| 蜜桃视频在线观看网站| 国产精品色婷婷| 日韩精品一区二区三区四| 九色porny丨国产首页在线| 欧美性猛交xxxx乱大交3| 性欧美1819| 97青娱国产盛宴精品视频| 亚洲精品在线观看网站| 91l九色lporny| 欧美日本一区| 日韩av成人在线观看| 91麻豆视频在线观看| av综合在线播放| 亚洲一区二区免费视频软件合集 | 国内伊人久久久久久网站视频| 亚洲成人第一网站| 精品一区二区国语对白| 国产一区二区高清不卡| 在线a人片免费观看视频| 亚洲成人精品影院| 中文字幕亚洲乱码| 欧美三级电影在线| 久色乳综合思思在线视频| 中文字幕激情小说| 国产麻豆精品theporn| 欧美尤物一区| 成人女同在线观看| 欧美日本国产视频| 亚洲午夜久久久久久久久红桃| 亚洲精品国产首次亮相| 国产999精品| 囯产精品久久久久久| 国产精品久久久久久久久搜平片 | 亚洲精品国产综合区久久久久久久| 成人午夜免费影院| 久久av一区二区三区| 97超级碰碰| 日本三级在线视频| 在线亚洲精品福利网址导航| 国产精品麻豆入口| 欧美精品首页| 91老司机精品视频| 丁香在线视频| 欧美丝袜一区二区| 午夜剧场免费看| 黑人一区二区三区四区五区| 91精品在线看| 日本视频在线免费观看| 欧美视频一区二区三区四区 | 日韩av在线中文| 一本久久青青| 茄子视频成人在线| 四虎影视精品成人| 香蕉久久一区二区不卡无毒影院| 久久精品一二三四| 先锋资源久久| 成人欧美一区二区三区黑人| 98在线视频| 欧美亚一区二区| 乐播av一区二区三区| 亚洲一区成人| 欧美性天天影院| 久久精品女人天堂av免费观看| 精品视频一区在线视频| 成年人免费高清视频| 97久久人人超碰| 97在线免费公开视频| 九九亚洲视频| 国产精品久久久999| 成人av电影观看| 欧美日韩你懂的| 91视频综合网| 成人性视频网站| 男人日女人逼逼| 免费一区二区三区视频导航| 国产精品69av| 日p在线观看| 91精品国产一区二区三区蜜臀| 成人性生活毛片| 福利电影一区二区三区| 日韩黄色片在线| 欧美日韩一区二区三区在线电影 | 国产亚洲高清一区| 欧美激情视频在线免费观看 欧美视频免费一 | 欧洲第一无人区观看| 风间由美性色一区二区三区| 国产青青在线视频| 少妇精品久久久一区二区三区 | 中文字幕手机在线视频| 中文字幕第一区二区| 91sa在线看| 貂蝉被到爽流白浆在线观看 | 国产精品视频精品视频| 久草资源在线观看| 亚洲精品一区二区三区福利| av一级在线观看| 中文字幕在线视频一区| 稀缺小u女呦精品呦| 美女视频一区免费观看| 中文字幕一区二区三区有限公司 | av日韩一区| 午夜精品福利在线观看| 青青草超碰在线| 欧美老人xxxx18| 一级片免费网址| 国产精品视频你懂的| 一区二区三区四区影院| 久久国产精品亚洲77777| 日韩在线精品视频| 成人免费无遮挡无码黄漫视频| 免播放器亚洲一区| 亚洲色成人www永久在线观看 | 国产在线拍揄自揄拍无码| 欧美性生活一级片| 国产日韩欧美一二三区| 国产免费拔擦拔擦8x在线播放| 社区色欧美激情 | 熟妇高潮一区二区三区| 欧美色爱综合网| 欧美成人精品欧美一级乱黄| 中文字幕在线不卡一区二区三区| 国产视频久久久久久| 久久99精品久久久久婷婷| 国产成人黄色片| 国产中文一区| 一区二区三区|亚洲午夜| 偷窥自拍亚洲色图精选| 亚洲在线免费看| 成人久久网站| 青青久久av北条麻妃海外网| 欧美性video| 久久精品av麻豆的观看方式| 日韩三级电影网站| 国产精东传媒成人av电影| 91沈先生作品| 欧美日韩va| 国产精品国产三级国产专播精品人| free性欧美| 欧美黑人一区二区三区| 免费黄色网页在线观看| 中文字幕精品国产| 黄色av网站在线免费观看| 亚洲激情久久久| 色婷婷视频在线| 精品国产一区二区三区忘忧草 | 激情小说亚洲| 国产精品aaaa| 粉嫩一区二区三区| 日本sm极度另类视频| 欧美男男tv网站在线播放| 欧美日韩精品电影| 在线免费观看视频黄| 欧美日一区二区在线观看| 浴室偷拍美女洗澡456在线| 日韩片欧美片| 亚洲高清精品中出| 成人a'v在线播放| 午夜精品一区二区三区在线观看| 精品大片一区二区| 日韩高清av| 成人影院在线| 在线视频欧美一区| 91精品亚洲| 男人天堂a在线| 亚洲伦理精品| 久久久久久久少妇| 日韩成人dvd| 五月婷婷之婷婷| 国产高清久久久久| 日本在线不卡一区二区| 9久草视频在线视频精品| 特级西西人体wwwww| 久久日韩精品一区二区五区| 国产一区二区三区四区五区六区| 日本一区二区三区在线不卡| 国产精品综合激情| 亚洲欧美一区二区三区国产精品| 青青草原免费观看| 性感美女极品91精品| 丰满少妇xoxoxo视频| 欧美色网一区二区| 97在线公开视频| 精品国产一区二区三区不卡 | 91porny九色| 欧美日韩在线亚洲一区蜜芽| 国产免费的av| 亚洲第一中文字幕| 国产视频精选在线| 久久久国产精品一区| a级片在线免费观看| 日本视频久久久| 成人亚洲精品| 久久久久无码国产精品一区| 色999日韩| 久久99久久99精品| 石原莉奈在线亚洲二区| 成人亚洲免费视频| 成人黄色小视频在线观看| 久久精品—区二区三区舞蹈| 国产精品国产馆在线真实露脸| 久久久久亚洲av无码专区| 精品久久久久久久久久久久久| 真实的国产乱xxxx在线91| 日韩视频在线你懂得| 欧美偷拍视频| 欧美成人免费小视频| 成人片免费看| 动漫一区二区在线| 日韩av免费大片| 国产午夜福利在线播放| 极品少妇一区二区三区精品视频| 日本一区二区在线观看视频| 国产精品美女久久久久久2018| 久久精品这里有| 欧美久久一二三四区| 日本黄在线观看| 欧美高跟鞋交xxxxxhd| 巨胸喷奶水www久久久免费动漫| 国产精品青青草| 五月综合激情| 午夜欧美福利视频| 成人sese在线| 国产精品白嫩白嫩大学美女| 91福利视频久久久久| 黄色三级网站在线观看| 久久久国产精彩视频美女艺术照福利| 亚洲成人人体| 久久资源av| 影音先锋日韩资源| 四虎1515hh.com| 国产精品视频一区二区三区不卡| 在线天堂中文字幕| 欧美va日韩va| 69成人在线| 成人精品视频久久久久| av一区二区高清| 成年人网站大全| 91麻豆.com| 超碰中文字幕在线| 精品少妇一区二区三区免费观看| 快射av在线播放一区| 国产精品久久久av| 奇米色欧美一区二区三区| 欧美日韩二三区| 成人黄色网址在线观看| 久久久久久久久艹| 日韩一区二区在线观看视频播放| av网站无病毒在线| 国产精品久久91| 日韩欧美伦理| 一区二区免费av| 国产精品免费网站在线观看| 亚洲中文无码av在线| 亚洲午夜色婷婷在线| 自拍偷自拍亚洲精品被多人伦好爽 | 久久a级毛片毛片免费观看| 国产精品va在线观看无码| 国产美女一区二区| 久草视频在线资源站| 日韩欧美成人午夜| 国产精品探花在线| 国内精品视频免费| 亚洲中字黄色| 中文字幕av久久爽一区| 欧洲精品在线观看| 伊人免费在线| 91欧美精品成人综合在线观看| 91精品99| 久久精品aⅴ无码中文字字幕重口| 亚洲精品免费在线观看| 国产精品嫩草影院精东| 九九久久国产精品| 精品国产乱子伦一区二区| 国产精品亚发布| 不卡的av影片| 韩日午夜在线资源一区二区| 亚洲欧美高清| 美国美女黄色片| 日韩一区二区免费在线电影| 国产第一页在线| 欧美午夜精品理论片a级大开眼界 欧美午夜精品久久久久免费视 | jizz一区二区| aaa在线视频| 久久综合伊人77777蜜臀| 精品久久97| 国产精品乱码久久久久| 国产精品久久久久一区二区三区 | 欧美福利在线播放网址导航| 欧美aⅴ在线观看| 国产精品久久久一本精品 | 久久综合亚洲精品| 成人精品小蝌蚪| 无码人妻精品一区二区三区蜜桃91 | 亚洲自拍偷拍第一页| 国产情侣一区| 日本女人性生活视频| 精品久久99ma| av高清一区| 欧美性猛交内射兽交老熟妇| 97久久人人超碰| 国产乱人乱偷精品视频| 91成人在线视频| 亚洲国产精品91| 女~淫辱の触手3d动漫| 4438x成人网最大色成网站| a国产在线视频| 99热都是精品| 国产日韩欧美激情| 亚洲精品综合久久| 国产欧美日韩中文字幕在线| 最新亚洲一区|