精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

UI-R1 | 僅136張截圖,vivo開源DeepSeek R1式強化學習,提升GUI智能體動作預測

人工智能 新聞
vivo 與香港中文大學的研究團隊受到 DeepSeek-R1 的啟發,首次將基于規則的強化學習(RL)應用到了 GUI 智能體領域。

基于規則的強化學習(RL/RFT)已成為替代 SFT 的高效方案,僅需少量樣本即可提升模型在特定任務中的表現。

該方法通過預定義獎勵函數規避人工標注成本,如 DeepSeek-R1 在數學求解中的成功應用,以及多模態領域在圖像定位等任務上的性能突破(通常使用 IOU 作為規則 reward)。

vivo 與香港中文大學的研究團隊受到 DeepSeek-R1 的啟發,首次將基于規則的強化學習(RL)應用到了 GUI 智能體領域。

圖片

  • 論文標題:UI-R1: Enhancing Action Prediction of GUI Agents by Reinforcement Learning
  • 論文地址:https://arxiv.org/abs/2503.21620
  • 項目主頁:https://yxchai.com/UI-R1/
  • 項目代碼:https://github.com/lll6gg/UI-R1

簡介

本研究創新性地將規則 RL 范式拓展至基于低級指令的 GUI 動作預測任務。具體實現中,多模態大語言模型為每個輸入生成包含推理標記和最終答案的多條響應軌跡,在訓練和測試時的 prompt 設計如下:

圖片

隨后通過我們設計的獎勵函數評估每條響應,并采用 GRPO 等策略優化算法更新模型參數。該獎勵函數包含三個維度:

  • 動作類型獎勵:根據預測動作與真實動作的匹配度計算;
  • 動作參數獎勵(聚焦點擊操作):通過預測坐標是否落入真實邊界框評估;
  • 格式規范獎勵:評估模型是否同時提供推理過程和最終答案。

數據制備方面,僅依據難度、多樣性和質量三原則篩選 130 余個移動端訓練樣本,展現出卓越的數據效率。實驗表明,UI-R1 在桌面端和網頁平臺等跨領域(OOD)數據上均取得顯著性能提升,印證了規則 RL 處理跨領域復雜 GUI 任務的潛力。

方法:強化學習驅動的 GUI 智能體

圖片

我們提出的 UI-R1 模型采用了三個關鍵創新:

1. 獨特的獎勵函數設計

研究團隊設計了專門針對 GUI 任務的獎勵函數:R = R_T + R_C + R_F

  • R_T:行為類型獎勵(點擊、滑動、返回等)
  • R_C:坐標準確度獎勵(點擊位置是否準確)
  • R_F:格式獎勵(輸出的格式是否正確)

2. 精心篩選的高質量數據

與其使用大量普通數據,我們提出采用了「質量優先」的策略,從三個維度精選訓練數據:

  • 質量:選擇標注準確、對齊良好的樣本
  • 難度:專注于基礎模型難以解決的「困難」樣本
  • 多樣性:確保涵蓋各種行為類型和元素類型

最終只使用了 136 個高質量樣本,比傳統方法少了幾百甚至上千倍,就能夠訓練得到比 SFT 方式更優的效果。

3. 群體相對策略優化算法

UI-R1 采用了一種名為 GRPO(Group Relative Policy Optimization)的算法。這種算法不需要額外的評論家模型,而是通過比較同一問題的多個不同回答來學習什么是「好」的回答。

實驗結果

1. 域內效果提升明顯

圖片

在 AndroidControl 基準測試上,UI-R1-3B 與基礎模型 Qwen2.5-VL-3B 相比:

  • 行為類型準確率提高了 15%
  • 定位準確率提高了 10.3%

2. 域外泛化能力驚人

圖片

圖片

UI-R1 在從未見過的桌面 PC 端和網頁界面上表現同樣出色:

  • 在 ScreenSpot 測試中,UI-R1-3B 的平均準確率達到 78.6%,超越 CogAgent-18B 等大模型。
  • 在專業高分辨率環境 ScreenSpot-Pro 測試中,UI-R1-3B 達到 17.8% 的平均準確率,提升了與使用 76K 數據訓練的 OS-Atlas-7B(18.9%)性能相當。

分析

我們關于 UI-R1 做了一系列分析,研究發現:在 GRPO 的強化學習微調的方式下,數據質量比數據數量重要

圖片

  • 困難樣本更有價值按難度選擇的方法比隨機選擇的性能顯著更好。
  • 數據增長收益遞減:隨著訓練數據量增加,性能提升趨于平緩。
  • 精選小數據集比大數據集更有效:三階段數據選擇方法優于使用整個數據集或者隨機篩選相同數量的子集。

此外,我們還發現動作預測的難度與思考的長度之間存在關聯:思考長度越長,準確率越低(說明問題越難),但通過 UI-R1 形式的強化學習微調之后,對于難樣本的成功率提升也更加明顯。

圖片

這一現象證明了強化微調的價值,通過讓模型自主思考來提升難樣本的準確率,這個特性是之前的監督微調所難以獲得的。

未來探索方向

UI-R1 初步探索了大模型強化學習和推理技術在 GUI Agent 領域的應用。下一步,我們將嘗試將 UI-R1 從 RFT 拓展到 SFT + RFT 的組合,實現大規模 UI 數據下統一的思考、決策、規劃的 GUI Agent 大模型。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-04-09 09:15:00

數據模型AI

2025-01-27 12:30:07

2025-02-20 15:32:28

2025-03-04 17:27:05

2025-02-07 13:10:06

2025-09-11 06:57:11

2025-07-08 08:53:00

2025-03-06 09:55:49

2025-04-25 13:34:53

R1DeepSeekAgent

2025-02-11 08:35:30

2025-02-25 08:20:50

AI程序員DeepSeek

2025-02-12 12:12:59

2025-02-08 11:31:17

DeepseekR1模型

2025-02-20 09:11:28

2025-02-15 08:15:04

聯想DeepSeek

2025-02-26 11:16:18

2025-07-04 09:08:00

AI模型架構

2018-09-30 11:53:39

開源 操作系統功能

2025-03-12 13:55:05

2025-02-08 17:47:08

點贊
收藏

51CTO技術棧公眾號

中文无码av一区二区三区| 少妇精品无码一区二区免费视频| 国产99re66在线视频| 99re热视频精品| 国产精品白丝jk喷水视频一区 | 8x8x华人在线| 五月婷婷激情在线| 激情综合网av| 欧美又大又硬又粗bbbbb| 亚洲色图27p| 欧美亚洲色图校园春色| 884aa四虎影成人精品一区| 777精品久无码人妻蜜桃| 91最新在线| 99久久亚洲一区二区三区青草| 国产精品老女人精品视频| 国产一级免费av| 日韩精品免费一区二区在线观看 | 色嗨嗨av一区二区三区| 国产制服91一区二区三区制服| 欧美午夜黄色| 国产寡妇亲子伦一区二区| 国产精品av网站| 特一级黄色大片| 狠狠入ady亚洲精品经典电影| 在线观看国产欧美| 国产精品1000部啪视频| 成人av影音| 欧美一级片免费看| 九九热99视频| 日本精品另类| 91精品91久久久中77777| 日韩伦理在线免费观看| 亚洲欧美成人影院| 国产精品久久综合| 亚洲v国产v在线观看| 日本私人网站在线观看| 成人国产精品免费观看动漫| 亚洲mm色国产网站| 国产情侣激情自拍| 麻豆成人久久精品二区三区小说| 国产999精品久久久| 中日韩精品视频在线观看| 欧美日韩一区二区高清| 欧美xxxx18国产| 四虎影院中文字幕| 亚洲中无吗在线| 在线成人一区二区| 久久久久亚洲AV成人无在 | 在线码字幕一区| 98在线视频| 国产精品卡一卡二| 一区二区三区在线观看www| sese一区| 中文字幕一区二区三区在线不卡 | 欧美一区二区日韩| 免费黄频在线观看| 韩国三级成人在线| 日韩亚洲欧美成人一区| 午夜福利123| 日韩欧美久久| 精品国产第一区二区三区观看体验 | 蜜臀av在线| 午夜视频在线观看一区二区| 国产免费黄色一级片| 免费在线小视频| 一本一道久久a久久精品综合蜜臀| 丰满少妇被猛烈进入高清播放| 亚洲欧洲高清| 欧美写真视频网站| 日本一二三区在线| gogo人体一区| 日韩经典一区二区三区| 97超碰在线资源| 91亚洲自偷观看高清| 久久精品国产久精国产思思| 免费中文字幕在线| 99国产精品视频免费观看一公开| 欧美性做爰毛片| 最近中文字幕av| 狠狠v欧美v日韩v亚洲ⅴ| 91免费在线观看网站| 五月婷在线视频| 国产精品三级av在线播放| 熟妇熟女乱妇乱女网站| www.综合网.com| 91国偷自产一区二区开放时间| 小明看看成人免费视频| 白嫩白嫩国产精品| 一区二区三区视频观看| 久草视频手机在线观看| 国产精品色网| 91亚洲va在线va天堂va国 | 中文字幕欧美日韩精品| 真实国产乱子伦对白在线| 99在线精品视频在线观看| 国产精品偷伦一区二区| 亚洲精品成人电影| 国产欧美精品一区二区色综合| 久久久国产精华液999999| sm在线观看| 欧美精品乱人伦久久久久久| 黄色录像a级片| 99国产**精品****| 57pao成人国产永久免费| 91麻豆成人精品国产免费网站| 99精品久久只有精品| 一区二区不卡视频| 亚洲精品中文字幕| 欧美不卡123| 国产又色又爽又高潮免费| 99国产精品| 91免费版黄色| 秋霞a级毛片在线看| 天天操天天综合网| 国产chinesehd精品露脸| 国产欧美日韩| 97超级碰碰碰| 成 人 黄 色 片 在线播放| 国产精品污网站| 欧美日韩亚洲一| 1769国产精品视频| 麻豆国产va免费精品高清在线| 无码人妻一区二区三区线| 成人小视频在线| 国产精品啪啪啪视频| 本网站久久精品| 亚洲男人天堂视频| 亚洲欧美在线视频免费| 国产精品一卡二卡在线观看| 中文字幕制服丝袜在线| 日韩av大片站长工具| 亚洲激情视频在线播放| 黄网站免费在线| 国产成人小视频| 日韩一二区视频| 亚洲在线资源| 久久天天躁狠狠躁夜夜爽蜜月| 97人妻精品视频一区| 久久久亚洲精品石原莉奈| 亚洲 欧美 日韩 国产综合 在线 | 麻豆精品在线看| 日韩精品欧美专区| 午夜无码国产理论在线| 亚洲欧美中文日韩在线| 天堂网视频在线| 久久综合av免费| 91av俱乐部| 日本欧美肥老太交大片| 国产精品美乳在线观看| 亚洲xxxxxx| 欧美精品自拍偷拍| 国内偷拍精品视频| 成人在线综合网| 成人午夜精品久久久久久久蜜臀| 韩国女主播一区二区三区| 久久久久久免费精品| 日本美女一级视频| 好吊成人免视频| 五月天综合视频| 美美哒免费高清在线观看视频一区二区| 日韩av不卡播放| 久久亚洲国产精品尤物| 久久精品久久久久久| www.成人精品| 午夜私人影院久久久久| www在线观看免费视频| 秋霞午夜av一区二区三区| 一级做a爰片久久| 无码国模国产在线观看| 午夜精品久久久久久99热| 亚州av在线播放| 欧美日韩免费一区二区三区| 日本在线一级片| www..com久久爱| 国产精品天天av精麻传媒| 97色伦图片97综合影院| 成人毛片网站| 日本精品不卡| 欧美另类高清videos| 婷婷久久久久久| 欧洲国内综合视频| 欧美黄色一区二区三区| 91在线云播放| 亚洲日本黄色片| 在线日本高清免费不卡| 日韩欧美精品一区二区三区经典| 国产精品视频一区视频二区| 69av在线播放| 免费黄色电影在线观看| 亚洲国产中文字幕在线观看| 怡春院在线视频| 亚洲一区二区三区美女| 亚洲一二三四视频| 菠萝蜜视频在线观看一区| 亚洲xxxx2d动漫1| 99精品视频免费| 这里只有精品66| 亚洲资源网你懂的| 亚洲综合精品一区二区| 日韩精品三区| 国a精品视频大全| 日本天堂在线观看| 亚洲欧美一区二区三区久久| 亚洲xxx在线| 欧美精品日韩精品| 久久精品五月天| 亚洲国产日韩在线一区模特| 国产精品久久久免费看| 久久久综合视频| 91成人在线观看喷潮蘑菇| 麻豆精品久久精品色综合| www.av中文字幕| 欧美激情麻豆| 在线视频亚洲自拍| 精品美女久久| 欧美亚洲一级二级| 国产精品视频3p| 亚洲一区二区三区sesese| 天堂久久午夜av| 国内自拍欧美激情| 97超碰资源站在线观看| 最近2019年好看中文字幕视频| 欧美日韩在线精品一区二区三区激情综 | 蜜臀av一区| av蓝导航精品导航| 久久wwww| 国产在线精品一区免费香蕉| 日韩毛片一区| 国产成人精品综合| 欧美成人资源| 91爱视频在线| 日本不卡网站| 午夜精品久久久久久久99热浪潮| 先锋成人av| 久久99亚洲热视| 怡红院av在线| 欧美精品日韩三级| 超碰个人在线| 久久91精品国产91久久久| 久草免费在线观看| 日韩视频永久免费观看| 久cao在线| 日韩在线观看免费网站| 日本中文字幕在线视频| 久久好看免费视频| 黄网页免费在线观看| 久久天天躁狠狠躁夜夜av| 成人福利片网站| 色综合五月天导航| 欧美巨大xxxx做受沙滩| 久久久久久这里只有精品| 欧美另类tv| 欧美又大粗又爽又黄大片视频| av高清不卡| 国产精品十八以下禁看| 美女久久久久久| 亚洲一区二区中文| 成人av地址| 欧美日韩综合久久| 日韩黄色大片| 97超碰人人爱| 亚洲二区免费| 日韩精品一区二区三区不卡| 日本vs亚洲vs韩国一区三区二区| 天天操狠狠操夜夜操| 高潮精品一区videoshd| 捆绑裸体绳奴bdsm亚洲| 久久精品人人做人人爽97| 在线视频这里只有精品| 亚洲精品欧美二区三区中文字幕| 99精品久久久久| 精品动漫一区二区| 中文字幕欧美人妻精品| 精品乱码亚洲一区二区不卡| 色就是色亚洲色图| 日韩中文字幕在线精品| 黑人极品ⅴideos精品欧美棵| 欧美一级在线播放| 亚洲狼人综合| 国产亚洲一区二区三区在线播放| 狠狠综合久久av一区二区蜜桃| 致1999电视剧免费观看策驰影院| 国产综合精品| 91日韩视频在线观看| 国产精品 欧美精品| 日本xxxx裸体xxxx| 亚洲欧美怡红院| 日韩 欧美 中文| 9191久久久久久久久久久| 噜噜噜久久,亚洲精品国产品| 国产一区二区三区欧美| 午夜羞羞小视频在线观看| 国产成人在线精品| 99精品中文字幕在线不卡 | 久久人人爽人人爽人人片| 国产精品久久久久久久久久久免费看 | 美女又黄又免费的视频| 久久精品日韩一区二区三区| 久久免费视频精品| 欧美日韩精品一区二区三区| 国产91绿帽单男绿奴| 日韩在线视频免费观看| 日韩大片免费观看| 成人欧美一区二区三区视频| 四虎8848精品成人免费网站| 内射国产内射夫妻免费频道| 国产在线播精品第三| 一道本在线观看| 香蕉av福利精品导航| 国产男女无套免费网站| 亚洲欧美国产视频| 大黄网站在线观看| 91啪国产在线| 青青草91久久久久久久久| 黄色av网址在线播放| 国产成人亚洲综合色影视| 日本黄色录像视频| 欧美日韩美女一区二区| 巨骚激情综合| 91爱爱小视频k| 国产66精品| 久久这里只有精品18| 国产一区二区毛片| 亚洲色图100p| 欧美日韩免费一区二区三区 | 欧美裸身视频免费观看| 精品肉辣文txt下载| 欧美激情一区二区三区在线视频| 极品日韩av| 稀缺呦国内精品呦| 亚洲午夜电影网| 亚洲奶汁xxxx哺乳期| 欧美裸体xxxx极品少妇| 久久九九精品视频| 国产高清免费在线| 黑人巨大精品欧美一区| 极品美妇后花庭翘臀娇吟小说| 欧美图区在线视频| 国产福利在线看| 国产精品欧美日韩久久| 日韩www.| 亚洲美女性囗交| 亚洲精品日韩专区silk| 精品毛片一区二区三区| 欧美丰满老妇厨房牲生活 | 日韩资源av在线| 日一区二区三区| 神马久久久久久久久久久| 欧美三区在线观看| 亚洲精品承认| 51蜜桃传媒精品一区二区| 欧美私人啪啪vps| 青青草视频网站| 欧美日韩国产综合新一区| 视频午夜在线| 国产精品嫩草影院一区二区 | 国产视频一视频二| 91美女片黄在线| 久久精品偷拍视频| 日韩一区视频在线| 亚洲三区欧美一区国产二区| 99在线精品免费视频| 久久精品视频在线免费观看| 亚洲无码久久久久久久| 欧美成人精品影院| 欧美人妖在线观看| www.99av.com| 亚洲男人的天堂在线观看| 黄色小视频免费观看| 日本aⅴ大伊香蕉精品视频| 成人影视亚洲图片在线| 亚洲欧美一区二区三区不卡| 午夜日韩在线电影| 韩国中文字幕2020精品| 91免费高清视频| 99精品视频免费| 91香蕉视频污在线观看| 亚洲第一页自拍| 成人深夜福利| 国产免费裸体视频| 国产日韩综合av| а√天堂资源在线| 国产成人精品视| 国产主播一区| 丁香六月激情综合| 精品久久久久久久久久久院品网 | cao在线视频| 亚洲国产高清国产精品| 懂色av中文一区二区三区| 欧美brazzers| 久久久免费精品视频| 欧美日韩一二| 国产女人18毛片水真多18| 欧美日精品一区视频| 欧美另类老肥妇| 看一级黄色录像| 中文无字幕一区二区三区| 欧洲成人一区二区三区| 国产日韩换脸av一区在线观看|