精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

谷歌復用30年前經(jīng)典算法,CV引入強化學習,網(wǎng)友:視覺RLHF要來了?

人工智能 新聞
模型預測和預期使用之間存在錯位,不利于 CV 模型的部署,來自谷歌等機構(gòu)的研究者用強化學習技術(shù)的獎勵函數(shù),從而改善了計算機視覺任務。

ChatGPT 的火爆有目共睹,而對于支撐其成功背后的技術(shù),監(jiān)督式的指令微調(diào)以及基于人類反饋的強化學習至關(guān)重要。這些技術(shù)也在逐漸擴展到其他 AI 領(lǐng)域,包括計算機視覺(CV)。?

我們知道,在處理計算機視覺中的復雜輸出時,成功的主要標準不在于模型對訓練目標的優(yōu)化程度,而在于預測能力與任務的吻合程度,即模型在預期用途上的表現(xiàn)效果。

為了追求這種一致性,有研究者在模型架構(gòu)、數(shù)據(jù)、優(yōu)化、采樣、后處理等方面進行了一些改進。例如,在物體檢測任務中,研究人員使用了 NMS(non-maximum suppression )、基于集合的全局損失(set-based global loss)以及改變輸入數(shù)據(jù)來獲得在測試時具有改進行為的模型。雖然這些方法帶來了顯著的收益,但它們往往只對特定任務有用,僅僅是間接地對任務風險進行了優(yōu)化。?

不僅 CV,包括自然語言處理(NLP)、強化學習(RL)等領(lǐng)域也在廣泛研究這一現(xiàn)象。在這些領(lǐng)域中,對于目標不太明確的任務,如翻譯或生成摘要,制定優(yōu)化目標非常困難。在處理這類問題時,一種流行的方法是學習模仿例子的輸出,然后進行強化學習,使模型與獎勵函數(shù)保持一致。使用這種方法,NLP 領(lǐng)域產(chǎn)生了令人興奮的結(jié)果,該方法使用大型預訓練語言模型和由人類反饋定義的獎勵來處理原本難以指定的任務。

此外,同樣的方法被廣泛用于圖像字幕任務中,其中 CIDEr(Vedantam 等人 2015 年提出)被用來作為獎勵。盡管如此,據(jù)了解,獎勵優(yōu)化以前還沒有在(非文本)計算機視覺任務中進行過探索。

近日,谷歌大腦團隊的研究者在論文《Tuning computer vision models with task rewards》中證明了,使用 REINFORCE 算法(Williams 于 1992 提出)來調(diào)整(Tuning)具有獎勵函數(shù)的預訓練模型可以開箱即用地用于各種計算機視覺任務

其實許多關(guān)于強化學習任務的研究都會提及 Williams 的 REINFORCE 算法,可見這個算法的重要性。可以說 REINFORCE 算法是策略梯度乃至強化學習的典型代表。

論文地址:https://arxiv.org/pdf/2302.08242v1.pdf?

圖 1 展示了一些關(guān)鍵結(jié)果,主要包括目標檢測、全景分割和圖像著色的獎勵優(yōu)化帶來的定量和定性改進。該研究所提出的方法在處理各種 CV 任務上簡單而有效,證明了它的多功能性和適應性。盡管本文主要采用評估指標形式的獎勵,但這些初步結(jié)果顯示了該方法用來優(yōu)化計算機視覺模型也不失為一種有效途徑,這些模型具有更復雜和更難指定的獎勵,例如人的反饋或整體系統(tǒng)性能。

圖片

推特網(wǎng)友對這篇文章給了一個比較全面的總結(jié),即本文實現(xiàn)的功能是使用 RL 調(diào)整預訓練視覺模型。研究的動因是受到 LLM 強化學習成功的啟發(fā);其效果是在目標檢測、全景分割等方面性能大幅提升。并表示,這項研究可能是實現(xiàn)視覺 RLHF (Reinforcement Learning from Human Feedback)的有效途徑。

圖片

圖源:https://twitter.com/johnjnay/status/1627009121378598912

獎勵?

在不喪失泛化性的情況下,該研究將 CV 任務描述為學習一個函數(shù)的過程,該函數(shù)將輸入 x(即圖像)映射到輸出 y = [y_1, y_1,……, y_n](文本 token 序列、bounding box 序列等)。該研究旨在學習以 θ 為參數(shù)的條件分布 P (y|x, θ),使獎勵函數(shù) R 最大化。用抽象的公式來形容,就是本文要解決以下優(yōu)化問題。

圖片

問題有了,接下來就是怎么解決了,本文分兩步走:首先用最大似然估計對模型進行預訓練;然后使用 REINFORCE 算法對模型進行 Tuning 。下面我們看看這兩步的具體過程:

最大似然預訓練?

首先使用最大似然原理估計參數(shù) θ 并捕獲訓練數(shù)據(jù)的分布。實現(xiàn)這一目標可采用梯度下降算法,該算法通過最大化訓練數(shù)據(jù)的 log-likelihood

圖片來實現(xiàn)。算法 1 和圖 2 描述了 MLE(最大似然估計)優(yōu)化步驟,這是訓練模型最常用的方法。完成這一步將得到 MLE 模型。

圖片

REINFORC 算法將獎勵最大化 ?

為了更好的優(yōu)化 MLE 模型以適應任務風險,還需要最大化獎勵函數(shù)。對于給定輸入 x,該研究利用 REINFORCE 算法來估計對給定 x 期望獎勵的梯度,公式如下所述:

圖片

算法 2 提供了偽代碼,圖 3 說明了該過程:

圖片


圖片

實驗結(jié)果

接下來我們看看本文提出的方法在視覺任務上的表現(xiàn)。

全景分割

如下表 1 所示,Tuning 過程顯著改善了 MLE 模型。視覺檢查(visual inspection)后的結(jié)果表明,Tuning 后的模型在避免不連貫預測方面更好,特別是對于小尺度物體,可參見圖 1。

圖片

目標檢測

表 2 顯示,通過優(yōu)化,該研究將原始 MLE 模型的 mAP 分數(shù)從 39.2% 大幅提高到 54.3%。在 Pix2seq 中,具有稍大的 1333×1333 分辨率和許多啟發(fā)式的相同大小的 ViT-B 模型達到了 47.1%。當使用更大的 ViT-L 主干時,Pix2seq 報告的最佳目標檢測結(jié)果為 50.0%。

圖片

上色?

圖 4 給出的定性結(jié)果清楚地表明,新模型始終能產(chǎn)生更豐富多彩的圖像。

圖片

圖像描述

圖片

表 3 結(jié)果表明,應用所提出的方法可以改進 MLE 模型,這與先前文獻中的觀察結(jié)果一致,證明了該方法針對特定任務風險進行 tuning 的有效性。

圖片

責任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2024-08-09 14:51:00

2023-05-25 09:00:00

人工智能ChatGPTOpenAI

2024-07-22 08:22:00

2025-05-15 09:04:00

2024-08-06 14:07:40

2024-12-23 14:40:00

AI模型訓練

2023-06-25 11:30:47

可視化

2018-08-29 08:13:22

Google 學習框架技術(shù)

2023-02-27 13:57:43

ChatGPTAI繪畫

2022-11-02 14:02:02

強化學習訓練

2020-01-23 15:33:07

AI 數(shù)據(jù)人工智能

2024-03-19 00:15:00

機器學習強化學習人工智能

2023-08-05 12:50:18

AI技術(shù)

2024-08-09 12:46:04

2025-04-18 10:01:41

2021-04-29 14:53:14

谷歌強化學習開發(fā)

2020-02-21 15:33:44

人工智能機器學習技術(shù)

2022-12-21 17:27:30

強化學習AI

2024-10-12 17:14:12

2021-01-28 16:58:12

數(shù)字貨幣加密貨幣區(qū)塊鏈
點贊
收藏

51CTO技術(shù)棧公眾號

日本一区二区久久精品| 欧美韩国理论所午夜片917电影| 91视频最新入口| 欧美色18zzzzxxxxx| 日韩二区三区在线观看| 中文字幕一精品亚洲无线一区 | 欧美男同视频网| 欧美在线小视频| 欧美三级午夜理伦三级老人| 国产精品女人久久久| 亚洲午夜在线| 亚洲午夜国产成人av电影男同| 国产一区二区在线观看免费视频| 米奇精品一区二区三区| 99视频在线观看一区三区| 国产精品高清在线| 五月天丁香激情| 欧美美乳视频| 欧美一区二区三区色| 国产99久久九九精品无码| 精品孕妇一区二区三区| 26uuu精品一区二区三区四区在线 26uuu精品一区二区在线观看 | 黄色一级片网址| 天天综合网在线观看| 久草热8精品视频在线观看| 久久久久久久久网站| 懂色av蜜桃av| 免费看久久久| 日韩欧美一区二区不卡| 亚洲乱码国产一区三区| 黑人精品视频| 国产精品国产馆在线真实露脸| 国产在线精品一区免费香蕉| 精品免费囯产一区二区三区| 欧美日韩免费| 日韩在线中文视频| 丰腴饱满的极品熟妇| 国产精品任我爽爆在线播放| 欧美久久久久中文字幕| aa视频在线播放| 69av亚洲| 国产精品久久久久久久久动漫| 欧美午夜精品久久久久免费视| 五十路在线观看| 99久久伊人精品| 久久精品人成| 四虎精品在线| 国产九一精品| 亚洲国产精品久久久久秋霞蜜臀| 国产无套精品一区二区三区| 欧美经典一区| 精品美女一区二区| 中文在线观看免费视频| 国产成人aa在线观看网站站| 欧美精品一区二区三| 91传媒理伦片在线观看| 国产91精品入| 精品中文字幕久久久久久| 欧美多人猛交狂配| 精品国产91乱码一区二区三区四区| 亚洲欧美制服丝袜| 成人无码av片在线观看| 日韩国产一区二区| 久久福利网址导航| 国产一级在线观看视频| 国产亚洲精品v| 奇米成人av国产一区二区三区| 日韩精品成人免费观看视频| 日韩av一区二| 91视频最新| 欧洲精品久久一区二区| 久久久无码精品亚洲日韩按摩| 日本一区不卡| 1区2区在线观看| 亚洲风情在线资源站| 97成人在线观看视频| 亚洲四虎影院| 欧美成人激情免费网| 日本黄色免费观看| 日韩成人综合网站| 欧美一级专区免费大片| 亚洲自拍偷拍精品| 欧美综合一区| 欧美黄色片在线观看| www.国产com| 韩国欧美国产一区| 久久大片网站| 久久久久久久久免费视频| 亚洲影视在线播放| 毛葺葺老太做受视频| 激情五月综合婷婷| 亚洲精品日韩在线| 国产黄色的视频| 国产农村妇女精品一二区| 国产精选久久久久久| 人妻与黑人一区二区三区| 久久精品亚洲精品国产欧美| 日韩a级黄色片| 一个人www视频在线免费观看| 在线不卡中文字幕| aaaa黄色片| 亚洲色图国产| 国产成人精品在线观看| 欧美一级性视频| 国产精品麻豆99久久久久久| 日本网站免费在线观看| 日韩专区视频网站| 亚洲欧美中文日韩在线v日本| 日本一级二级视频| 日本成人中文字幕| 久久精品女人的天堂av| 啪啪免费视频一区| 欧美日韩亚洲综合一区| 久久中文字幕人妻| 国产综合婷婷| 91久热免费在线视频| 国产视频精品久久| 岛国精品视频在线播放| 91成人在线观看喷潮蘑菇| 久久国产电影| 国产精品福利在线| 欧洲一区av| 久久女同精品一区二区| 国产免费裸体视频| 亚洲影视资源| 正在播放国产一区| 99久久久无码国产精品免费蜜柚| 99久久国产综合精品麻豆| 日本一本草久p| 亚洲精品无播放器在线播放| 国产亚洲精品高潮| 免费看一级视频| 99视频一区二区三区| 2018国产在线| 九色丨蝌蚪丨成人| 91精品国产91久久久久久吃药| 成人午夜免费福利| 亚洲va欧美va人人爽| 一级少妇精品久久久久久久| 极品中文字幕一区| 国产精品一区二区a| 欧美韩日亚洲| 精品国产一区二区三区久久久蜜月 | 欧美精品一区免费| 欧美a一欧美| 亚洲**2019国产| 女人18毛片一区二区三区| 一区二区三区久久| 亚洲精品性视频| 久久密一区二区三区| 国产日韩在线亚洲字幕中文| 成全电影播放在线观看国语| 在线免费观看成人短视频| 免费福利视频网站| 日本视频在线一区| 亚洲砖区区免费| 欧美亚洲福利| 久久影院在线观看| 性中国古装videossex| 亚洲3atv精品一区二区三区| avtt香蕉久久| 日精品一区二区| 伊人久久青草| julia中文字幕一区二区99在线| 久久人人爽人人爽人人片av高请| 无码精品人妻一区二区三区影院| 一本色道久久综合亚洲aⅴ蜜桃| 精品国产无码在线观看| 久久精品国产99| avove在线观看| 粉嫩的18在线观看极品精品| 欧美一级淫片丝袜脚交| 中文字幕在线观看日本| 日韩一区二区三区三四区视频在线观看| 三级影片在线看| 91在线观看一区二区| 欧美精品性生活| 午夜精品免费| 蜜桃麻豆91| 韩国三级成人在线| 日本aⅴ大伊香蕉精品视频| 久久精品视频观看| 亚洲精品国产美女| 国产精品福利电影| 精品久久久久久| 国产精品69久久久久孕妇欧美| 成人在线综合网站| 久久久精品麻豆| 亚洲午夜在线| 亚洲看片网站| 巨人精品**| 91视频国产精品| 伊人久久视频| 欧美黑人性视频| www.国产精品.com| 亚洲第一男人天堂| 7777久久亚洲中文字幕| 精品久久久久久亚洲精品| 欧美风情第一页| 久久久美女艺术照精彩视频福利播放| 久久精品视频在线观看免费| 亚洲综合激情| 无码人妻精品一区二区蜜桃网站| 日韩激情在线| 欧美一级片免费观看| 99久久人爽人人添人人澡 | 成人盗摄视频| 国产精品自拍网| 精精国产xxxx视频在线播放| 九色成人免费视频| av资源种子在线观看| 亚洲精品一区二区网址| 亚洲国产精品久久人人爱潘金莲 | 欧美日韩国产一中文字不卡| 欧美被狂躁喷白浆精品| 国产精品国产馆在线真实露脸| 精品国产无码在线观看| 97久久精品人人做人人爽| 99视频在线观看视频| 蜜桃视频一区二区| 久久美女福利视频| av成人国产| 成人毛片一区二区| 在线看片欧美| 国产一区二区四区| 午夜精品久久久久99热蜜桃导演| 中文字幕一区二区三区最新| 日韩一区二区在线| 日韩一区二区电影在线观看| 国产剧情在线观看一区| 免费观看成人高| 日韩大尺度在线观看| 国内精品二区| 加勒比色老久久爱综合网| 成人免费看片网站| av毛片精品| 国产精品一区二区三区四区五区 | 一二三在线视频| 午夜国产一区二区| 在线视频一区观看| 欧美高清视频在线观看mv| 亚洲一区二区三区色| 国产精品成人av| 一二三四中文字幕| 欧美三级在线| 老太脱裤子让老头玩xxxxx| 在线免费高清一区二区三区| 日韩免费视频播放| 久久国产精品99国产| 男人女人黄一级| 久久国产精品99久久久久久老狼| 99久久99精品| 国产jizzjizz一区二区| 完美搭档在线观看| 久久中文字幕电影| av手机在线播放| 亚洲女人的天堂| 日韩欧美不卡视频| 欧美小视频在线| 精品乱码一区内射人妻无码| 欧美日本不卡视频| 99热这里只有精| 亚洲第一网站男人都懂| 六十路在线观看| 久久精品亚洲94久久精品| 欧美卡一卡二| 秋霞成人午夜鲁丝一区二区三区| 福利视频一区| 91嫩草在线| 一本久久青青| 一区二区日本伦理| 亚洲午夜在线| 日韩一级理论片| 国产精品69久久久久水密桃| 中文字幕影片免费在线观看| 亚洲国产精品精华液2区45| 国产精品 欧美激情| 亚洲h精品动漫在线观看| 黄色污污网站在线观看| 欧美一级日韩一级| 日本午夜在线| 久久国产精品久久久久| 欧美极品videos大乳护士| 91精品久久久久久久久久久久久| 天堂av一区| 日韩欧美亚洲精品| 欧美精品福利| 在线观看国产中文字幕| 丰满白嫩尤物一区二区| 少妇太紧太爽又黄又硬又爽小说 | 在线视频精品免费| 日韩午夜激情电影| 都市激情一区| 国内自拍欧美激情| 2020国产精品小视频| 欧美一区亚洲二区| 精品999网站| 日韩av片专区| 国产区在线观看成人精品| 久久久久无码精品国产| 欧美日韩亚洲综合在线| 欧美欧美欧美| 久久久久久国产三级电影| 欧美一级做一级爱a做片性| 久久av免费观看| 国产在线日韩| 99999精品| 国产精品免费网站在线观看| 日韩精品在线免费视频| 欧美成人高清电影在线| 在线观看的av| 国产999精品久久久| 国产在线播放精品| 国产 国语对白 露脸| 久久国产婷婷国产香蕉| 午夜时刻免费入口| 色综合天天综合色综合av| 丰满人妻av一区二区三区| 久久久成人av| 欧美aaa级| 天天爽天天狠久久久| 亚洲欧美卡通另类91av| 懂色av粉嫩av蜜乳av| 亚洲综合久久久| 精品人妻一区二区三区四区不卡 | 韩国三级电影一区二区| 蜜桃av免费观看| 欧美无砖砖区免费| 国产69久久| 国产精品久久久久久久久久久不卡| 九一国产精品| 中国丰满人妻videoshd | 日本综合视频| 日本免费高清不卡| 久久精品免费| 亚洲理论片在线观看| 日本久久电影网| 触手亚洲一区二区三区| 国产精品激情av在线播放| 国产一区二区观看| 向日葵污视频在线观看| 国产精品久久久爽爽爽麻豆色哟哟| 黄色大全在线观看| 中文字幕日本精品| 日韩成人免费av| 91成人在线视频观看| 国产精品一级片| 久久久久久久国产精品毛片| 欧美精品一区二区久久婷婷| 色吧亚洲日本| 久久精品一区二区三区不卡免费视频| 国产乱码精品| 婷婷丁香综合网| 4438成人网| 毛片在线导航| 欧美亚洲另类久久综合| 蜜臀av性久久久久蜜臀av麻豆| 呻吟揉丰满对白91乃国产区| 337p亚洲精品色噜噜狠狠| 天天色天天射天天综合网| 国产精品久久久久久久天堂第1集| 99国内精品| 无码人妻丰满熟妇啪啪欧美| 91麻豆精品国产自产在线 | 亚洲成人精品| 亚洲欧美综合视频| 色一情一伦一子一伦一区| 日韩黄色影院| 国产欧美欧洲| 日韩精品视频网站| 久草网站在线观看| 亚洲精品ady| 草民电影神马电影一区二区| 国产美女视频免费| 99精品黄色片免费大全| 中文字幕 国产| 欧美激情精品久久久久久久变态| 色婷婷精品视频| 99国产精品久久久久久| 午夜精品一区二区三区免费视频 | 国产精选久久久久久| 亚洲网站啪啪| 免费一级特黄3大片视频| 日韩视频在线观看一区二区| 在线天堂资源www在线污| 天天综合中文字幕| 99精品久久久久久| 国产极品999| 国产成人精品免费久久久久| 一区二区影院| 免费看91的网站| 亚洲第一精品久久忘忧草社区| 巨胸喷奶水www久久久免费动漫| 黄网站色视频免费观看 | 激情五月色婷婷| 日韩在线观看视频免费| 欧美人妖视频| 伊人五月天婷婷| 欧美综合一区二区三区| √8天堂资源地址中文在线|