精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

<strike id="a2k0o"></strike>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

Open Vocabulary Detection 開(kāi)放世界目標(biāo)檢測(cè)競(jìng)賽 2023獲勝團(tuán)隊(duì)方案分享

作者：王斌 2023-11-27 07:14:51

由中國(guó)圖象圖形學(xué)學(xué)會(huì)與360人工智能研究院舉辦的Open Vocabulary Detection Contest - 開(kāi)放世界目標(biāo)檢測(cè)競(jìng)賽已經(jīng)正式結(jié)束，本文在征集各個(gè)競(jìng)賽團(tuán)隊(duì)的許可后，對(duì)部分優(yōu)勝團(tuán)隊(duì)的技術(shù)方案匯總并公開(kāi)分享。

OVD技術(shù)簡(jiǎn)介

目標(biāo)檢測(cè)是計(jì)算機(jī)視覺(jué)領(lǐng)域中的一項(xiàng)核心任務(wù)，其主要目標(biāo)是讓計(jì)算機(jī)能夠自動(dòng)識(shí)別圖片中目標(biāo)的類別，并準(zhǔn)確標(biāo)示每個(gè)目標(biāo)的位置。目前，主流的目標(biāo)檢測(cè)方法主要針對(duì)閉集目標(biāo)的開(kāi)發(fā)，即在任務(wù)開(kāi)始之前需要對(duì)待檢測(cè)目標(biāo)進(jìn)行類別定義，并進(jìn)行人工數(shù)據(jù)標(biāo)注，通過(guò)有監(jiān)督模型的訓(xùn)練來(lái)實(shí)現(xiàn)目標(biāo)檢測(cè)。這種方法通常適用于待檢測(cè)目標(biāo)數(shù)量較少的情況，一般限定在幾十個(gè)類別以內(nèi)。然而，當(dāng)待檢測(cè)目標(biāo)的類別數(shù)量增加到幾千甚至萬(wàn)級(jí)時(shí)，以上述方式進(jìn)行數(shù)據(jù)標(biāo)注已經(jīng)無(wú)法滿足需求。同時(shí)，已經(jīng)訓(xùn)練好的模型也無(wú)法應(yīng)對(duì)新出現(xiàn)的類別。當(dāng)新的類別出現(xiàn)時(shí)，需要手動(dòng)進(jìn)行標(biāo)注并重新訓(xùn)練模型，整體效率較低。

開(kāi)放詞集目標(biāo)檢測(cè)（Open Vocabulary Detection, OVD），亦即開(kāi)放世界目標(biāo)檢測(cè)，提供了解決上述問(wèn)題的新思路。借助于現(xiàn)有跨模態(tài)模型（CLIP[1]、ALIGN[2]、R2D2[3] 等）的泛化能力，OVD可以實(shí)現(xiàn)以下功能：1）對(duì)已定義類別的few shot檢測(cè)；2）對(duì)未定義類別的zero-shot檢測(cè)。OVD技術(shù)的出現(xiàn)吸引了計(jì)算機(jī)視覺(jué)研究者們的廣泛關(guān)注，首先，對(duì)于已定義類別的few shot檢測(cè)，OVD的強(qiáng)大泛化能力可以讓算法在僅有少量樣本的情況下，準(zhǔn)確地識(shí)別出新的目標(biāo)類別。其次，對(duì)于未定義類別的zero-shot檢測(cè)，OVD的能力更是令人驚嘆。通過(guò)學(xué)習(xí)各種物體的視覺(jué)特征和語(yǔ)義信息，OVD可以在沒(méi)有見(jiàn)過(guò)的類別中進(jìn)行目標(biāo)檢測(cè)，進(jìn)一步將語(yǔ)言大模型技術(shù)引入OVD，將會(huì)進(jìn)一步提升OVD對(duì)未知類別的檢測(cè)能力。OVD技術(shù)有望成為未來(lái)目標(biāo)檢測(cè)算法開(kāi)發(fā)的新范式。

競(jìng)賽介紹

OVD技術(shù)的研究在國(guó)內(nèi)尚處于起步階段，為了促進(jìn)國(guó)內(nèi)OVD技術(shù)的發(fā)展，并加強(qiáng)OVD技術(shù)的生態(tài)社區(qū)建設(shè)，360人工智能研究院聯(lián)合中國(guó)圖象圖形學(xué)學(xué)會(huì)于ICIG2023大會(huì)上開(kāi)設(shè)了Open Vocabulary Detection Contest - 開(kāi)放世界目標(biāo)檢測(cè)2023競(jìng)賽。大賽于4月12日啟動(dòng)報(bào)名，報(bào)名期間吸引了來(lái)自新加坡南洋理工大學(xué)、清華大學(xué)、北京大學(xué)、香港大學(xué)、中國(guó)科學(xué)院自動(dòng)化研究所紫東太初大模型研究中心、鵬城實(shí)驗(yàn)室、華中科技大學(xué)、字節(jié)跳動(dòng)、滴滴等知名大學(xué)與公司機(jī)構(gòu)共140支隊(duì)伍參加競(jìng)賽。此次大賽所使用的賽題數(shù)據(jù)、競(jìng)賽提交平臺(tái)與賽題設(shè)置均由360人工智能研究院提供支持。

賽題數(shù)據(jù)主要涵蓋了服裝、數(shù)碼產(chǎn)品等眾多商品類目，對(duì)于一件商品，均給出了它的圖片以及對(duì)應(yīng)的檢測(cè)框標(biāo)注信息作為訓(xùn)練數(shù)據(jù)。商品數(shù)據(jù)在互聯(lián)網(wǎng)搜索、推薦中具有重要價(jià)值，是非常貼近業(yè)務(wù)場(chǎng)景的實(shí)用數(shù)據(jù)。其次商品數(shù)據(jù)集的難度較大，同類別商品之間普遍存在一些細(xì)節(jié)差異，而這一點(diǎn)也限制了傳統(tǒng)目標(biāo)檢測(cè)技術(shù)的泛化能力，進(jìn)而體現(xiàn)出OVD技術(shù)的優(yōu)勢(shì)性。

賽題設(shè)置：參賽者運(yùn)用OVD相關(guān)的方法，對(duì)圖像中的商品目標(biāo)進(jìn)行檢測(cè)。對(duì)于一件商品，主辦方會(huì)給出它的圖片以及bbox作為訓(xùn)練數(shù)據(jù)。目標(biāo)類別有兩類：base類和novel類。類別均為中文商品詞組。base類的目標(biāo)提供少量已標(biāo)注的訓(xùn)練樣本，novel類的目標(biāo)則沒(méi)有訓(xùn)練樣本。評(píng)測(cè)分別在base類的測(cè)試集和novel類的測(cè)試集上進(jìn)行，評(píng)測(cè)指標(biāo)為novel和base類的mAP@50，競(jìng)賽按照novel和base類別的整體mAP@50排序。

競(jìng)賽共分為初賽與復(fù)賽兩個(gè)階段，由初賽到復(fù)賽，賽題難度逐步提升，考驗(yàn)選手對(duì)開(kāi)放世界目標(biāo)檢測(cè)賽題的熟悉程度與靈活應(yīng)變能力。比賽中，各位選手的方案追逐激烈，最終前三名團(tuán)隊(duì)的復(fù)賽分?jǐn)?shù)十分接近。經(jīng)過(guò)初賽與復(fù)賽的層層選拔，最終有6支隊(duì)伍脫穎而出，由來(lái)自南洋理工大學(xué)的吳思澤團(tuán)隊(duì)摘得桂冠。獲得二等獎(jiǎng)的是來(lái)自華中科技大學(xué)的STAR團(tuán)隊(duì)與來(lái)自中國(guó)科學(xué)院自動(dòng)化研究所紫東太初大模型研究中心的咱們組有名稱嗎團(tuán)隊(duì)，獲得三等獎(jiǎng)的是來(lái)自北京大學(xué)的OVD團(tuán)隊(duì)、來(lái)自哈爾濱工業(yè)大學(xué)的wzmwzr團(tuán)隊(duì)與來(lái)自武漢郵電科學(xué)研究院的藍(lán)色閃團(tuán)隊(duì)。Open Vocabulary Detection Contest - 開(kāi)放世界目標(biāo)檢測(cè)競(jìng)賽的官網(wǎng)鏈接：開(kāi)放世界目標(biāo)檢測(cè)競(jìng)賽2023 (360cvgroup.github.io)

在各個(gè)競(jìng)賽團(tuán)隊(duì)的積極參與、中國(guó)圖象圖形學(xué)學(xué)會(huì)與360人工智能研究院的大力支持下，Open Vocabulary Detection Contest - 開(kāi)放世界目標(biāo)檢測(cè)競(jìng)賽已經(jīng)正式結(jié)束，在征集各個(gè)競(jìng)賽團(tuán)隊(duì)的許可后，我們將部分優(yōu)勝團(tuán)隊(duì)的技術(shù)方案匯總并公開(kāi)分享，詳見(jiàn)本文下半部分。

[1] A. Radford, J. W. Kim, C. Hallacy, A. Ramesh, G. Goh, S. Agarwal, G. Sastry, A. Askell, P. Mishkin, J. Clark, et al. Learning transferable visual models from natural language supervision. In International Conference on Machine Learning, pages 8748–8763. PMLR, 2021.

[2] C. Jia, Y. Yang, Y. Xia, Y.-T. Chen, Z. Parekh, H. Pham, Q. V. Le, Y. Sung, Z. Li, and T. Duerig. Scaling up visual and vision-language representation learning with noisy text supervision. In International Conference on Machine Learning, 2021.

[3] Xie C, Cai H, Song J, et al. Zero and R2D2: A Large-scale Chinese Cross-modal Benchmark and A Vision-Language Framework[J]. arXiv preprint arXiv:2205.03860, 2022.

冠軍方案講解

團(tuán)隊(duì)介紹

來(lái)自南洋理工大學(xué)的博士生吳思澤

賽題分析

1、數(shù)據(jù)集

本次主辦方提供的是商品數(shù)據(jù)集，總共466個(gè)物體類別，其中訓(xùn)練中可見(jiàn)的有233個(gè)base類別，測(cè)試時(shí)檢測(cè)器需要能夠同時(shí)識(shí)別base類的物體意見(jiàn)另外233個(gè)novel類別的物體。數(shù)據(jù)集中圖片以網(wǎng)購(gòu)商品圖為主，背景通常較為簡(jiǎn)單，每張圖物體數(shù)量不多，存在大量以物體為中心（object-centric）的圖片，訓(xùn)練集中平均每張圖的物體標(biāo)注數(shù)量<2。

2、解決思路

根據(jù)數(shù)據(jù)集屬性，可知互聯(lián)網(wǎng)中存在大量包含新類別的商品圖片，由于圖片場(chǎng)景簡(jiǎn)單，物體單一，在圖像層級(jí)（image-level）上學(xué)習(xí)新類別的表征，可很好泛化到檢測(cè)上。因此選擇基礎(chǔ)方案為Detic，使用爬蟲(chóng)獲取帶有新類別tag的圖片，用于image-level的訓(xùn)練。

方案總覽

采用Detic[1]的訓(xùn)練策略，同時(shí)使用目標(biāo)檢測(cè)數(shù)據(jù)（base類）和圖像分類數(shù)據(jù)（base類+novel類）訓(xùn)練檢測(cè)器。

方案流程介紹

1、數(shù)據(jù)處理

選擇百度圖片為爬取對(duì)象，索引關(guān)鍵詞為”[中文名稱] 商品圖片”，為保證類別平衡，novel和base類別均爬取40頁(yè)(大約1000張)。每個(gè)類別爬取到的圖片存到一個(gè)路徑下，這些圖片只有類別Tag，沒(méi)有物體框標(biāo)注。

2、類別名稱翻譯

為方便使用現(xiàn)有的開(kāi)源模型（CLIP），需要將466個(gè)中文名稱均翻譯成英文，我們使用google translator翻譯每個(gè)名稱并人工校對(duì)。

3、模型介紹

選擇ResNet50和SwinB作為檢測(cè)器backbone，檢測(cè)器結(jié)構(gòu)為CenterNet2，使用Detic公開(kāi)的在公開(kāi)數(shù)據(jù)集LVIS和ImageNet上預(yù)訓(xùn)練的模型權(quán)重作為初始化。CLIP模型選擇ViT-L-14（只用text encoder）來(lái)得到類別名稱的embeddings。分類的損失函數(shù)為BCE Loss。

4、Learnable Prompt

為了獲取類別名稱的text embeddings，在訓(xùn)練過(guò)程中學(xué)習(xí)一組長(zhǎng)度為4的learnable prompt以獲得更好的text表征。具體方案參考了coop[2]。

5、重要參數(shù)

模型初始化：使用LVIS和ImageNet上預(yù)訓(xùn)練的模型作為初始化。
總迭代次數(shù)：18000。
image-level分支的batch size: 8x96，檢測(cè)分支batch size: 8x4。
image-level的權(quán)重：1.2，det分支權(quán)重：1.0。
圖像分辨率：image-level分支448，檢測(cè)分支 896。

6、測(cè)試結(jié)果

這里介紹的測(cè)試結(jié)果是隨著我們模塊和參數(shù)改變的變化，我們初始使用R50 backbone作為baseline, image-level分支的batch size為32，訓(xùn)練資源8xV100，增加到64之后需要8xA100 （或者整體batch size縮小，迭代數(shù)增加）。以下結(jié)果均來(lái)自初賽。

ADetecting Twenty-thousand Classes using Image-level Supervision, Zhou et.al ECCV 2022.
Prompt Learning for Vision-Language Models, Zhou et.al IJCV 2022.

亞軍方案講解（第二名）

團(tuán)隊(duì)介紹

來(lái)自華中科技大學(xué)的團(tuán)隊(duì)，成員有冷福星，易成龍。

賽題分析

1、數(shù)據(jù)集

訓(xùn)練數(shù)據(jù)：233類已知類別的目標(biāo)檢測(cè)框
初賽：7401張圖像
復(fù)賽：14802張圖像

數(shù)據(jù)特點(diǎn)：

全部是電商類的商品圖像
單張圖像中的目標(biāo)類別相同
存在部分有效的OCR信息

2、解決思路

利用前景檢測(cè)器對(duì)圖片進(jìn)行目標(biāo)定位，利用LLM來(lái)擴(kuò)充文本信息，最后結(jié)合ChineseCLIP進(jìn)行多模態(tài)圖文對(duì)齊生成類別信息。

方案總覽

如圖所示，是本次比賽中提出的算法 pipeline，不需要使用提供的類別信息，不引入額外的數(shù)據(jù)，即可進(jìn)行任意商品類別的目標(biāo)檢測(cè)：

前景檢測(cè)器（Foreground Detector）：不需要使用提供的233類類別信息，只使用位置坐標(biāo)訓(xùn)練一個(gè)前景檢測(cè)器，整個(gè) pipeline 中只有這里進(jìn)行梯度更新；
提示詞工程（prompt engineering）：使用大語(yǔ)言模型（LLM）進(jìn)行半自動(dòng)化的提示詞工程，輸入類別 c，給定模板規(guī)范，生成更多風(fēng)格多樣的提示詞；
多模態(tài)圖文對(duì)齊：使用 Chinese CLIP 進(jìn)行圖文特征對(duì)齊，進(jìn)行類別分類，使用提示詞集成（prompt ensemble）提高性能；

方案流程介紹

1、前景檢測(cè)器

當(dāng)前主流的檢測(cè)器如圖所示，主要包括 Anchor Based 和 Anchor Free 兩類檢測(cè)器，前者精度高但速度慢，后者精度略差但速度快；

前景 proposal 使用 WBF（Weighted Boxes Fusio）集成了CBNetV2_Swin，CascadeRCNN_Convnext，CascadeRCNN_Hornet，CascadeRCNN_resnext101，DetecotoRS_r101，VFNet_resnext101；實(shí)際使用CBNetV2_Swin單個(gè)檢測(cè)器分?jǐn)?shù)不低，集成在分?jǐn)?shù)提升大概1個(gè)點(diǎn)；
使用訓(xùn)練好的前景檢測(cè)器檢測(cè)目標(biāo)，進(jìn)行多尺度裁剪（外擴(kuò)+0，+30像素），并加入全圖（利用有效的OCR信息，如圖2中右上角的陶笛文本）一起進(jìn)行圖文對(duì)齊，將3個(gè)尺度的輸出 logits 進(jìn)行平均；

2、提示詞工程

CLIP模型是雙塔結(jié)構(gòu)，直接使用類別信息進(jìn)行文本對(duì)齊的效果不是最佳的，為了充分挖掘文本 encode 的潛力，需要進(jìn)行一定的提示詞工程；在實(shí)驗(yàn)中，使用 “c” 和一張“c”的圖片，驗(yàn)證集上后者分?jǐn)?shù)高5個(gè)點(diǎn)；

可以使用 ChahtGPT/LLMA 2 進(jìn)行交互，逐步引導(dǎo) LLM 生成想要的提示詞模板；最后得到多條 prompts，可以進(jìn)行 prompt ensemble，ensemble 的方法有以下三種，實(shí)際只使用了最簡(jiǎn)單的 Uniform averaging；

Uniform averaging
Weighted averaging
Majority Voting

3、消融實(shí)驗(yàn)與實(shí)驗(yàn)結(jié)果

驗(yàn)證集：初賽訓(xùn)練集，（訓(xùn)練中沒(méi)有使用類別信息，用來(lái)評(píng)測(cè)CLIP模型分類能力）

PE：prompt engineering
CME：CLIP model ensemble（0.7*VIT-H@224+0.3*VIT-L@336）

4、拓展思路

上述提出的 pipeline 使用了位置信息進(jìn)行訓(xùn)練，使用 CLIP 也可不進(jìn)行訓(xùn)練進(jìn)行任意目標(biāo)檢測(cè)：

將圖像分成小 patch，滑動(dòng)窗口 crop 圖像送入 CLIP 模型提取圖文相似性。每個(gè)窗口根據(jù)閾值判斷目標(biāo)類別，也可以將當(dāng)前窗口圖像置0，看整圖類別相似性哪個(gè)下降最多。但該方法，滑動(dòng)窗口的方式替代 proposal 的檢出比較耗時(shí)，實(shí)測(cè)精度也沒(méi)有上述方法高；

季軍方案講解（第三名）

團(tuán)隊(duì)介紹

“我們組有名稱嗎”團(tuán)隊(duì)來(lái)自中國(guó)科學(xué)院自動(dòng)化研究所紫東太初大模型研究中心，紫東太初大模型研究中心致力于構(gòu)建低功耗萬(wàn)億突觸多模態(tài)認(rèn)知大模型，建立面向開(kāi)放復(fù)雜環(huán)境的可解釋、可信、可演化的多模態(tài)人工智能基礎(chǔ)平臺(tái)，建成新一代人工智能重大基礎(chǔ)設(shè)施，形成創(chuàng)新應(yīng)用生態(tài)。比賽團(tuán)隊(duì)由兩名博士生（詹宇飛、楊帆）、一名碩士生（趙弘胤）和一名本科生（王天琦）組成，在朱優(yōu)松老師指導(dǎo)下共同完成本次比賽，目前團(tuán)隊(duì)主要研究方向?yàn)橐曈X(jué)大模型、目標(biāo)檢測(cè)、開(kāi)放詞匯目標(biāo)檢測(cè)及長(zhǎng)尾目標(biāo)檢測(cè)等。

賽題分析

1、數(shù)據(jù)集

在開(kāi)放詞匯目標(biāo)檢測(cè)的研究中，端到端訓(xùn)練方法由于其在訓(xùn)練速度的優(yōu)勢(shì)和公平對(duì)比的要求獲得了更為廣泛的使用。在本次商品場(chǎng)景下的開(kāi)放世界目標(biāo)檢測(cè)競(jìng)賽中，主要存在以下四個(gè)問(wèn)題：

噪聲大---數(shù)據(jù)標(biāo)注噪聲大，各類別均存在誤標(biāo)、漏標(biāo)等情況，標(biāo)注方式不統(tǒng)一；
定位難---少樣本訓(xùn)練設(shè)定下，端到端微調(diào)精準(zhǔn)定位和分類效果差；
易混淆---類別細(xì)粒度程度高，且多為商品數(shù)據(jù)，類內(nèi)方差大，通用中文圖文模型無(wú)法有效區(qū)分；
主體判斷難---該場(chǎng)景設(shè)定下，每張圖中只可識(shí)別出主要商品，共同出現(xiàn)的其他商品需被抑制。

2、解決思路

為解決上述問(wèn)題，通過(guò)對(duì)數(shù)據(jù)的類別分布和實(shí)例位置分布的分析，我們發(fā)現(xiàn)圖片的實(shí)例以單類別形式出現(xiàn)，且居中分布，具備任務(wù)解耦的基礎(chǔ)。因此，我們選擇雙階段的方法，將框回歸和商品物體分類進(jìn)行剝離，分別實(shí)現(xiàn)類別無(wú)關(guān)的框回歸以解決定位難和主題判斷難得問(wèn)題，和基于CLIP特征的零樣本和少樣本分類以解決噪聲大和易混淆得問(wèn)題。且將任務(wù)拆分為兩個(gè)子任務(wù)，分別迭代，有效提高了優(yōu)化速度。

方案總覽

方案整體框架下圖所示，按照子任務(wù)拆分，我們將訓(xùn)練分為檢測(cè)器訓(xùn)練和圖文模型優(yōu)化兩部分，將最終優(yōu)化好的模型在推理階段進(jìn)行組合，在推理規(guī)則的輔助下完成對(duì)場(chǎng)景中的少樣本和零樣本類別的檢測(cè)。

方案流程介紹

1、用于目標(biāo)定位的數(shù)據(jù)補(bǔ)充

為抑制模型產(chǎn)生大框的傾向和糾正在部分情況下錯(cuò)誤產(chǎn)生部件框造成得定位難問(wèn)題，我們額外爬取659張Base類別商品圖片，利用訓(xùn)練好的模型打偽標(biāo)簽的形式構(gòu)建，選取置信度大于0.8的預(yù)測(cè)框并采用人工校驗(yàn)的方式進(jìn)行清洗過(guò)濾，去掉其中的局部框等，構(gòu)建了包含659張圖片的糾正數(shù)據(jù)子集，用于模型的微調(diào)。

2、目標(biāo)定位模塊

在商品目標(biāo)定位部分，考慮到在開(kāi)放詞匯目標(biāo)檢測(cè)任務(wù)下，檢測(cè)器首先應(yīng)當(dāng)定位出所有可能的物體，其中包括不具備檢測(cè)標(biāo)注的novel類別。因此，我們選擇將檢測(cè)器訓(xùn)練為二分類商品檢測(cè)器，用于提取圖片中可能存在的商品。我們選擇Cascade-RCNN訓(xùn)練二分類的商品檢測(cè)模型，利用多個(gè)級(jí)聯(lián)的回歸分支提升模型對(duì)于物體的識(shí)別與定位能力。為提高模型的特征提取能力，我們選擇以Swin-Transformer Small為骨干網(wǎng)絡(luò)，Neck默認(rèn)使用了FPN融合高層語(yǔ)義特征與低層的細(xì)節(jié)特征，最后輸出物體得分大于0.1的候選框中選擇排名前100個(gè)檢測(cè)框。

3、用于目標(biāo)分類的數(shù)據(jù)補(bǔ)充

為解決低數(shù)據(jù)量下的噪聲和混淆問(wèn)題，在開(kāi)放詞匯任務(wù)設(shè)定的啟發(fā)下，我們分別采用關(guān)鍵字“類別名稱商品圖片”搜索和相似圖片搜索的方式，從百度、谷歌、電商平臺(tái)等網(wǎng)絡(luò)數(shù)據(jù)中收集了70w的數(shù)據(jù)用于模型的微調(diào)，并利用ChatGLM對(duì)類別和圖片生成描述，提高圖文對(duì)的語(yǔ)義豐富度，進(jìn)而增強(qiáng)模型的判別能力，如圖2所示。通過(guò)對(duì)微調(diào)方式的對(duì)比，我們對(duì)比了目前較優(yōu)的三種微調(diào)方式Finetune、Lora及LiT，如表1所示，發(fā)現(xiàn)Lora進(jìn)行微調(diào)時(shí)能夠更準(zhǔn)確的識(shí)別novel類別，當(dāng)采用全量微調(diào)時(shí)能夠，能夠獲得更好的base類別識(shí)別效果，因此在最終的模型中我們將這兩者進(jìn)行融合。

4、目標(biāo)分類模塊

在商品目標(biāo)分類部分，通過(guò)對(duì)當(dāng)前開(kāi)源的中文圖文模型的調(diào)研，我們選擇目前性能最優(yōu)的中文圖文模型Chinese-CLIP，該模型繼承于OpenCLIP，視覺(jué)分支采用ViT結(jié)構(gòu)，文本分支采用RoBERTa結(jié)構(gòu)，我們選擇ViT-H-224的模型進(jìn)行微調(diào)。

5、推理優(yōu)化

在推理階段，我們將數(shù)據(jù)先驗(yàn)（單一類別、圖文并茂）以規(guī)則的形式加入其中，設(shè)計(jì)了全局概率融合、OCR輔助推理和類別一致性校正三條規(guī)則，進(jìn)一步解決數(shù)據(jù)的易混淆和主體判斷難問(wèn)題。我們將規(guī)則和模型整理為如下的推理流程：

RPN候選框推理：使用訓(xùn)練好的定位模型，對(duì)測(cè)試集中的每張圖進(jìn)行推理，得到每張圖的候選框；
圖文特征提?。簩?duì)每一張圖，根據(jù)（1）中產(chǎn)生的候選框結(jié)果，截取對(duì)應(yīng)的感興趣區(qū)域，與全圖共同送入訓(xùn)練好的CLIP模型中提取區(qū)域特征和類別文本特征；
全局特征融合：對(duì)每一個(gè)候選框產(chǎn)生的區(qū)域特征，按照8：2的比例與全局特征相加，校正得到最終的區(qū)域特征，與文本特征計(jì)算余弦相似度；
OCR輔助校正：對(duì)于每一個(gè)候選框的分類概率，結(jié)合全圖的OCR結(jié)果，根據(jù)所設(shè)計(jì)的OCR規(guī)則進(jìn)行類別概率校正；
類別一致性校正：對(duì)所有的候選框的分類結(jié)果和全圖的分類結(jié)果進(jìn)行對(duì)比，若候選框中存在與全圖類別一致的候選框，則輸出一致候選框，若無(wú)則輸出所有框中分?jǐn)?shù)最高的候選框作為該圖片的最終結(jié)果。

6、測(cè)試結(jié)果

通過(guò)模型優(yōu)化和規(guī)則設(shè)計(jì)，我們的方案在零樣本類別上實(shí)現(xiàn)了50.08%的AP50，在少樣本類別上實(shí)現(xiàn)了54.16%的AP50，最終識(shí)別效果如下：

責(zé)任編輯：姜華來(lái)源： DataFunTalk

大模型人工智能

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

久久久久这里只有精品| 永久亚洲成a人片777777| 国产精品99久久| 欧美人xxxx| 免费在线看黄色片| 欧美大片aaa| 美女尤物国产一区| 欧美理论片在线观看| 特大黑人巨人吊xxxx| 国产极品嫩模在线观看91精品| 亚洲婷婷综合久久一本伊一区| 波多野结衣一区二区三区在线观看| 中文字幕av影院| 天天插综合网| 亚洲国产美女精品久久久久∴| 久久久久免费精品| 免费污视频在线观看| 国产欧美日韩卡一| 国产精品视频入口| 一级黄色大毛片| 国产欧美在线| 欧美xxxx18性欧美| 99久久久久久久久久| av在线精品| 色婷婷综合久久久久中文| 美女在线免费视频| 每日更新av在线播放| 国产很黄免费观看久久| 国产精品美腿一区在线看| 五月天综合在线| 久久人体视频| 亚洲性无码av在线| 亚洲永久无码7777kkk| 伊人精品综合| 欧美高清www午色夜在线视频| 久久精品香蕉视频| av免费不卡| 亚洲免费在线视频| 夜夜爽www精品| 日本韩国一区| www.成人网.com| 成人情视频高清免费观看电影| 亚洲字幕av一区二区三区四区| 久久先锋影音| 热久久这里只有精品| 日本少妇在线观看| 在线不卡亚洲| 久久久亚洲欧洲日产国码aⅴ| 麻豆视频在线免费看| 日韩夫妻性生活xx| 中文字幕欧美视频在线| 国产特黄级aaaaa片免| 欧美aaaaa级| 亚洲国产精品久久久久| 91精品啪在线观看国产| 伊色综合久久之综合久久| 日韩女优av电影在线观看| 亚洲18在线看污www麻豆| 亚洲福利影视| 欧美剧情电影在线观看完整版免费励志电影 | 在线视频精品一| 91视频免费观看网站| 校花撩起jk露出白色内裤国产精品| 亚洲精品在线电影| 精品一区二区视频在线观看| 国产精品qvod| 日韩av在线免费观看一区| 国产精品无码网站| 久草成人资源| 综合国产在线观看| frxxee中国xxx麻豆hd| 天天精品视频| 久久久之久亚州精品露出| 久久精品国产av一区二区三区| 欧美日韩一区二区国产| 国自在线精品视频| www欧美在线| 日韩在线观看一区二区| 91精品久久久久久久久青青| www.国产黄色| 91免费视频网址| 亚洲乱码日产精品bd| 欧美在线激情网| 美女又爽又黄免费视频| 老牛影视一区二区三区| 国产精品久久一区主播| av中文在线观看| 成人高清免费观看| 欧美一区二区三区四区夜夜大片| av电影在线观看网址| 中文字幕一区二区三区乱码在线| 2021国产视频| 原纱央莉成人av片| 欧美另类一区二区三区| 动漫美女无遮挡免费| 蜜桃成人av| 精品国产一区二区三区久久狼5月| 国产盗摄x88av| 国产精品久久久久久模特| 国产精品91久久久久久| 99热这里只有精| 99久精品国产| 男人的天堂成人| 女人高潮被爽到呻吟在线观看| 欧美主播一区二区三区| 超级砰砰砰97免费观看最新一期| 日韩深夜影院| 久久久久北条麻妃免费看| 亚欧视频在线观看| 国产一区二区三区在线观看免费| 九9re精品视频在线观看re6| 成人在线视频亚洲| 色综合天天综合在线视频| 青青草原播放器| 蜜桃国内精品久久久久软件9| 操91在线视频| 视频一区二区在线| 国产精品国产一区二区三区四区| av成人免费在线| 免费看av软件| 经典三级一区二区| 精品国产精品一区二区夜夜嗨| 成人性生交大片免费看无遮挡aⅴ| 欧美日韩亚洲三区| 国产精品三级美女白浆呻吟| 手机看片1024日韩| 亚洲女同ⅹxx女同tv| 成人一级片网站| 在线一区二区三区视频| 日韩中文字幕在线精品| 蜜臀精品一区二区三区| 99re66热这里只有精品3直播| 91手机视频在线| 看片一区二区| 有码中文亚洲精品| 欧美国产成人精品一区二区三区| 日韩欧美一级| 久久精品国产99国产| 国产精品综合网站| 免费播放片a高清在线观看| 亚洲超丰满肉感bbw| 好吊操视频这里只有精品| 欧美好骚综合网| 国产精品久久视频| av免费观看一区二区| 色老汉一区二区三区| 国产三级视频网站| 亚洲永久免费精品| 久久大香伊蕉在人线观看热2| a'aaa级片在线观看| 欧美zozo另类异族| 清纯粉嫩极品夜夜嗨av| 国产精品中文字幕日韩精品| 中文字幕超清在线免费观看| а天堂中文最新一区二区三区| 最近中文字幕mv在线一区二区三区四区| 亚洲国产精品无码久久久| 久久久综合九色合综国产精品| 无码aⅴ精品一区二区三区浪潮| 九九热hot精品视频在线播放| 久久久久久久网站| 亚洲欧美日韩成人在线| 福利微拍一区二区| www.中文字幕av| 另类小说一区二区三区| 中文字幕欧美日韩一区二区| 国产一区二区三区视频在线| 欧美成人精品一区| 国产18精品乱码免费看| 午夜精品久久久久久久久久 | 国产精品亚洲欧美日韩一区在线| 久久最新资源网| 亚洲成人一级片| 亚洲成人午夜电影| 国产精品无码一区二区三区免费 | 天堂中文av在线| 永久91嫩草亚洲精品人人| 成人午夜电影免费在线观看| 日韩伦理在线一区| 国产午夜精品免费一区二区三区 | 久久成人免费日本黄色| 桥本有菜av在线| 国产成人tv| 国产福利精品视频| 国产黄网站在线观看| 精品黑人一区二区三区久久| 午夜影院免费在线观看| 国产精品乱人伦一区二区| 被黑人猛躁10次高潮视频| 亚洲精品人人| 亚洲日韩国产第一区| 999在线精品| 国产成人亚洲精品| 黄网页在线观看| 亚洲激情视频网站| 中文字幕人妻色偷偷久久| 亚洲一区成人在线| 国产又粗又硬视频| av亚洲精华国产精华| 一级片视频免费观看| 影音先锋久久精品| 亚洲在线视频一区二区| 老汉色老汉首页av亚洲| 国产精品一区久久久| 91色在线看| 久久精品2019中文字幕| 亚洲三级中文字幕| 欧美一区二区三区系列电影| 黄瓜视频在线免费观看| 亚洲久草在线视频| 久久国产柳州莫菁门| 国产高清在线精品| 亚洲欧洲日本精品| 性色一区二区| 国产91沈先生在线播放| 97精品视频| 欧美日韩在线一二三| 精品三级在线观看视频| 成人激情视频免费在线| 在线天堂中文资源最新版| 欧美日韩成人在线视频| 亚乱亚乱亚洲乱妇| 国产亚洲精品成人av久久ww| 日本精品久久久久| 日韩欧美一区在线观看| 91国内精品视频| 在线看欧美视频| 欧美成人性生活| 美女隐私在线观看| 在线电影av不卡网址| 日韩大胆人体| 精品视频在线播放色网色视频| 亚洲av综合色区无码一二三区| 欧美精品九九99久久| 丰满熟女人妻一区二区三| 色综合视频一区二区三区高清| 日本三级免费看| 玉足女爽爽91| 欧美成人精品一区二区免费看片| 中文字幕日韩一区| 四虎影视1304t| 中文字幕av资源一区| 日本二区在线观看| 久久久久久久综合日本| 国产福利短视频| 99久久久精品| 三叶草欧洲码在线| 2020国产精品久久精品美国| 在线天堂www在线国语对白| 99视频热这里只有精品免费| 中国xxxx性xxxx产国| 成人黄色在线看| 国模无码视频一区| 成人av在线播放网站| 日本精品一二三| 成人午夜伦理影院| 特大黑人巨人吊xxxx| 久久综合久久久久88| xxxxx在线观看| 亚洲国产精品高清| 久久人妻无码aⅴ毛片a片app| 中文字幕中文字幕在线一区| 国产精品99久久久久久成人| 亚洲欧美福利一区二区| 欧美爱爱小视频| 五月激情综合网| 在线能看的av| 91黄色免费网站| 国产精品久久久久精| 日韩一区二区在线观看视频 | 精品免费日韩av| 五月天婷婷社区| 亚洲免费一在线| 日韩精品成人av| 欧美乱妇40p| 欧美v在线观看| 日韩欧美电影| 中国老女人av| 亚洲一区二区三区四区五区午夜 | 高清电影在线免费观看| 国a精品视频大全| xxx欧美xxx| 91香蕉电影院| 欧美人妖视频| 亚洲精品日韩在线观看| 午夜精品免费| 久久久久久久激情| 久久电影国产免费久久电影| 国产一级免费片| 国产精品私人自拍| 久久精品视频久久| 欧美日韩在线播放三区| 亚洲国产精品欧美久久| 亚洲欧美精品一区二区| 国产不卡在线| 91av在线国产| 在线观看黄色国产| 日韩美女一区二区三区| 欧洲视频在线免费观看| 久久亚洲综合国产精品99麻豆精品福利 | www.伊人久久| 欧美一区三区四区| 天天干天天草天天射| 久久精品亚洲热| 久久青青视频| 99久久自偷自偷国产精品不卡| 窝窝社区一区二区| 99久久免费观看| 久久激情五月婷婷| 国精产品一区一区三区免费视频| 亚洲免费在线视频| 中文字幕网址在线| 亚洲精品理论电影| 在线播放免费av| 国产欧美亚洲视频| 妖精一区二区三区精品视频| 成人在线国产视频| 久久99国产精品尤物| 蜜桃无码一区二区三区| 午夜欧美大尺度福利影院在线看| 在线观看国产精品视频| 国产午夜精品一区二区三区| av今日在线| 鬼打鬼之黄金道士1992林正英| 色无极亚洲影院| www.日日操| xnxx国产精品| 在线观看免费国产视频| 欧美mv日韩mv亚洲| 国产精品一区二区三区视频网站| 国产精品精品一区二区三区午夜版 | 久久精品www人人爽人人| 色老头久久综合| 免费在线黄色影片| 97涩涩爰在线观看亚洲| 97se亚洲| 老子影院午夜伦不卡大全| 国产高清不卡一区| 亚洲xxxx3d动漫| 7777精品伊人久久久大香线蕉最新版| 高清在线观看av| 国产精品福利在线观看网址| 视频一区中文| 久久午夜夜伦鲁鲁一区二区| 久久久久99精品一区| 亚洲影院在线播放| 亚洲欧美国产精品专区久久| 欲香欲色天天天综合和网| 久久精品magnetxturnbtih| 夜夜精品视频| a级在线观看视频| 欧美日韩国产色| 欧美91精品久久久久国产性生爱| 91国产美女在线观看| 欧美大奶一区二区| a√天堂在线观看| 久久婷婷久久一区二区三区| 国产又爽又黄的视频| 日韩精品免费在线观看| 伊人久久av| 四虎永久国产精品| 久久精品国产一区二区| 男的操女的网站| 欧美xingq一区二区| 成年女人在线看片| 欧美精品一区二区三区在线四季| 老色鬼久久亚洲一区二区| www中文在线| 日韩一区二区三区av| 18aaaa精品欧美大片h| 久久精品日韩| 蜜桃精品视频在线| 麻豆一区产品精品蜜桃的特点| 精品播放一区二区| av日韩电影| 一区二区三区在线观看www| 国产精品18久久久久| www.天天色| 国产一区二区精品丝袜| 9999在线精品视频| 免费超爽大片黄| 国产欧美一区二区精品性色超碰| 国产精品久久久久久在线| 欧美激情按摩在线| 在线观看欧美一区二区| 国产喷白浆一区二区三区| 国产美女三级无套内谢| 97视频免费看| 欧美三级伦理在线| 午夜视频在线免费看| 欧美日韩一二三四五区| 免费观看久久久久| 国产一区在线免费| 裸体在线国模精品偷拍| 日本三级2019| 日韩视频免费看| 女同另类激情重口| 日本77777| 日本韩国一区二区三区| 青春草在线免费视频|

<ul id="wa42o"></ul>

<ul id="wa42o"></ul>

<ul id="wa42o"></ul>