精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

短視頻內(nèi)容理解與生成技術(shù)在美團(tuán)的創(chuàng)新實(shí)踐

原創(chuàng) 精選
人工智能 新聞
針對(duì)視頻數(shù)據(jù),如何通過計(jì)算機(jī)視覺技術(shù)用相關(guān)數(shù)據(jù),為用戶和商家提供更好的服務(wù),是一項(xiàng)重要的研發(fā)課題。本文將為大家分享短視頻內(nèi)容理解與生成技術(shù)在美團(tuán)業(yè)務(wù)場(chǎng)景的落地實(shí)踐。

作者 | 馬彬

針對(duì)視頻數(shù)據(jù),如何通過計(jì)算機(jī)視覺技術(shù)用相關(guān)數(shù)據(jù),為用戶和商家提供更好的服務(wù),是一項(xiàng)重要的研發(fā)課題。本文將為大家分享短視頻內(nèi)容理解與生成技術(shù)在美團(tuán)業(yè)務(wù)場(chǎng)景的落地實(shí)踐。

1. 背景

美團(tuán)圍繞豐富的本地生活服務(wù)電商場(chǎng)景,積累了豐富的視頻數(shù)據(jù)。

上面展示了美團(tuán)業(yè)務(wù)場(chǎng)景下的一個(gè)菜品評(píng)論示例。可以看到,視頻相較于文本和圖像可以提供更加豐富的信息,創(chuàng)意菜“冰與火之歌”中火焰與巧克力和冰淇淋的動(dòng)態(tài)交互,通過短視頻形式進(jìn)行了生動(dòng)的呈現(xiàn),進(jìn)而給商家和用戶提供多元化的內(nèi)容展示和消費(fèi)指引。

視頻行業(yè)發(fā)展

我們能夠快速進(jìn)入了視頻爆炸的時(shí)代,是因?yàn)槎鄠€(gè)技術(shù)領(lǐng)域都取得了顯著的進(jìn)步,包括拍攝采集設(shè)備小型化、視頻編解碼技術(shù)的進(jìn)步、網(wǎng)絡(luò)通信技術(shù)的提升等。近年來,由于視覺AI算法不斷成熟,在視頻場(chǎng)景中被廣泛應(yīng)用。本文將主要圍繞如何通過視覺AI技術(shù)的加持,來提高視頻內(nèi)容創(chuàng)作生產(chǎn)和分發(fā)的效率。美團(tuán)AI——場(chǎng)景驅(qū)動(dòng)技術(shù)

說到美團(tuán),大家首先會(huì)想到點(diǎn)外賣的場(chǎng)景,不過,除了外賣之外,美團(tuán)還有其他200多項(xiàng)業(yè)務(wù),涵蓋了“吃”、“住”、“行”、“玩”等生活服務(wù)場(chǎng)景,以及“美團(tuán)優(yōu)選”“團(tuán)好貨”等零售電商。豐富的業(yè)務(wù)場(chǎng)景帶來了多樣化的數(shù)據(jù)以及多元化的落地應(yīng)用,進(jìn)而驅(qū)動(dòng)底層技術(shù)的創(chuàng)新迭代。同時(shí),底層技術(shù)的沉淀,又可以賦能各業(yè)務(wù)的數(shù)字化、智能化升級(jí),形成互相促進(jìn)的正向循環(huán)。美團(tuán)業(yè)務(wù)場(chǎng)景短視頻

豐富的內(nèi)容和展示形式(C端)本文分享的一些技術(shù)實(shí)踐案例,主要圍繞著“吃”來展開。美團(tuán)在每個(gè)場(chǎng)景站位都有內(nèi)容布局和展示形式,短視頻技術(shù)在美團(tuán)C端也有豐富的應(yīng)用,例如:大家打開大眾點(diǎn)評(píng)App看到的首頁Feed流視頻卡片、沉浸態(tài)視頻、視頻筆記、用戶評(píng)論、搜索結(jié)果頁等。這些視頻內(nèi)容在呈現(xiàn)給用戶之前,都要先經(jīng)過了很多算法模型的理解和處理。

豐富的內(nèi)容和展示形式(B端)而在商家端(B端)的視頻內(nèi)容展示形式包括,景區(qū)介紹——讓消費(fèi)者在線上感受更立體的游玩體驗(yàn);酒店相冊(cè)速覽——將相冊(cè)中的靜態(tài)圖像合成視頻,全面地展示酒店信息,幫助用戶快速了解酒店全貌(其中自動(dòng)生成的技術(shù)會(huì)在下文2.2.2章節(jié)進(jìn)行介紹);

商家品牌廣告——算法可以通過智能剪輯等功能,降低商家編輯創(chuàng)作視頻的門檻;商家視頻相冊(cè)——商家可以自行上傳各類視頻內(nèi)容,算法為視頻打上標(biāo)簽,幫助商家管理視頻;商品視頻/動(dòng)圖——上文提到美團(tuán)的業(yè)務(wù)范圍也包括零售電商,這部分對(duì)于商品信息展示就非常有優(yōu)勢(shì)。舉個(gè)例子,生鮮類商品,如螃蟹、蝦的運(yùn)動(dòng)信息很難通過靜態(tài)圖像呈現(xiàn),而通過動(dòng)圖可為用戶提供更多商品參考信息。短視頻技術(shù)應(yīng)用場(chǎng)景

從應(yīng)用場(chǎng)景來看,短視頻在線上的應(yīng)用主要包括:內(nèi)容運(yùn)營(yíng)管理、內(nèi)容搜索推薦、廣告營(yíng)銷、創(chuàng)意生產(chǎn)。底層的支撐技術(shù),主要可以分為兩類:內(nèi)容理解和內(nèi)容生產(chǎn)。內(nèi)容理解主要回答視頻中什么時(shí)間點(diǎn),出現(xiàn)什么樣的內(nèi)容的問題。內(nèi)容生產(chǎn)通常建立在內(nèi)容理解基礎(chǔ)上,對(duì)視頻素材進(jìn)行加工處理。典型的技術(shù)包括,視頻智能封面、智能剪輯。下面我將分別介紹這兩類技術(shù)在美團(tuán)場(chǎng)景下的實(shí)踐。

2. 短視頻內(nèi)容理解和生成技術(shù)實(shí)踐

2.1 短視頻內(nèi)容理解

2.1.1 視頻標(biāo)簽

視頻內(nèi)容理解的主要目標(biāo)是,概括視頻中出現(xiàn)的重要概念,打開視頻內(nèi)容的“黑盒”,讓機(jī)器知道盒子里有什么,為下游應(yīng)用提供語義信息,以便更好地對(duì)視頻做管理和分發(fā)。根據(jù)結(jié)果的形式,內(nèi)容理解可以分為顯式和隱式兩種。

其中,顯式是指通過視頻分類相關(guān)技術(shù),給視頻打上人可以理解的文本標(biāo)簽。隱式主要指以向量形式表示的嵌入特征,在推薦、搜索等場(chǎng)景下與模型結(jié)合直接面向最終任務(wù)建模。可以粗略地理解為,前者主要面向人,后者主要面向機(jī)器學(xué)習(xí)算法。顯式的視頻內(nèi)容標(biāo)簽在很多場(chǎng)景下是必要的,例如:內(nèi)容運(yùn)營(yíng)場(chǎng)景,運(yùn)營(yíng)人員需要根據(jù)標(biāo)簽,開展供需分析,高價(jià)值內(nèi)容圈選等工作。

上圖中展示的是內(nèi)容理解為視頻打標(biāo)簽的概要流程,這里的每個(gè)標(biāo)簽都是可供人理解的一個(gè)關(guān)鍵詞。通常情況下,為了更好地維護(hù)和使用,大量標(biāo)簽會(huì)根據(jù)彼此之間的邏輯關(guān)系,組織成標(biāo)簽體系。

2.1.2 視頻標(biāo)簽的不同維度與粒度

那么視頻標(biāo)簽的應(yīng)用場(chǎng)景有哪些?它背后的技術(shù)難點(diǎn)是什么?在美團(tuán)場(chǎng)景下比較有代表性的例子——美食探店視頻,內(nèi)容非常豐富。標(biāo)簽體系的設(shè)定尤為關(guān)鍵,打什么樣的標(biāo)簽來描述視頻內(nèi)容比較合適?首先,標(biāo)簽的定義需要產(chǎn)品、運(yùn)營(yíng)、算法多方面的視角共同敲定。在該案例中,共有三層標(biāo)簽,越上層越抽象。

其中,主題標(biāo)簽對(duì)整體視頻內(nèi)容的概括能力較強(qiáng),如美食探店主題;中間層會(huì)進(jìn)一步拆分,描述拍攝場(chǎng)景相關(guān)內(nèi)容,如店內(nèi)、店外環(huán)境;最底層拆分成細(xì)粒度實(shí)體,理解到宮保雞丁還是番茄炒雞蛋的粒度。不同層的標(biāo)簽有不同的應(yīng)用,最上層視頻主題標(biāo)簽可應(yīng)用于高價(jià)值內(nèi)容的篩選及運(yùn)營(yíng)手段。

它的主要難點(diǎn)是抽象程度高,“美食探店”這個(gè)詞概括程度很高,人在看過視頻后可以理解,但從視覺特征建模的角度,需要具備什么特點(diǎn)才能算美食探店,對(duì)模型的學(xué)習(xí)能力提出了較大的挑戰(zhàn)。

2.1.3 基礎(chǔ)表征學(xué)習(xí)

解決方案主要關(guān)注兩方面:一方面是與標(biāo)簽無關(guān)的通用基礎(chǔ)表征提升,另一方面是面向特定標(biāo)簽的分類性能提升。初始模型需要有比較好基礎(chǔ)表征能力,這部分不涉及下游最終任務(wù)(例如:識(shí)別是否是美食探店視頻),而是模型權(quán)重的預(yù)訓(xùn)練。好的基礎(chǔ)表征,對(duì)于下游任務(wù)的性能提升事半功倍。由于視頻標(biāo)簽的標(biāo)注代價(jià)非常昂貴,技術(shù)方案層面需要考慮的是:如何在盡量少用業(yè)務(wù)全監(jiān)督標(biāo)注數(shù)據(jù)的情況下學(xué)習(xí)更好的基礎(chǔ)特征。

首先,在任務(wù)無關(guān)的基礎(chǔ)模型表征層面,我們采用了在美團(tuán)視頻數(shù)據(jù)上的自監(jiān)督預(yù)訓(xùn)練特征,相比在公開數(shù)據(jù)集上的預(yù)訓(xùn)練模型,更加契合業(yè)務(wù)數(shù)據(jù)分布。其次,在語義信息嵌入層面(如上圖所示),存在多源含標(biāo)簽數(shù)據(jù)可以利用。值得一提的是,美團(tuán)業(yè)務(wù)場(chǎng)景下比較有特色的弱標(biāo)注數(shù)據(jù),例如:用戶在餐廳中做點(diǎn)評(píng),圖片和視頻上層抽象標(biāo)簽是美食,評(píng)論文本中大概率會(huì)提到具體在店里吃的菜品名稱,這是可挖掘的優(yōu)質(zhì)監(jiān)督信息,可以通過視覺文本相關(guān)性度量等技術(shù)手段進(jìn)行清洗。這里展示了自動(dòng)挖掘出的標(biāo)簽為“烤肉”的視頻樣本。

視頻樣本

通過使用這部分?jǐn)?shù)據(jù)做預(yù)訓(xùn)練,可以得到一個(gè)初始的Teacher Model,給業(yè)務(wù)場(chǎng)景無標(biāo)注數(shù)據(jù)打上偽標(biāo)簽。這里比較關(guān)鍵的是由于預(yù)測(cè)結(jié)果不完全準(zhǔn)確,需要基于分類置信度等信息做偽標(biāo)簽清洗,隨后拿到增量數(shù)據(jù)與Teacher Model一起做業(yè)務(wù)場(chǎng)景下更好的特征表達(dá),迭代清洗得到Student Model,作為下游任務(wù)的基礎(chǔ)表征模型。在實(shí)踐中,我們發(fā)現(xiàn)數(shù)據(jù)迭代相較于模型結(jié)構(gòu)的改進(jìn)收益更大。

2.1.4 模型迭代

面向具體標(biāo)簽的性能提升主要應(yīng)對(duì)的問題是,如何在基礎(chǔ)表征模型的基礎(chǔ)上,高效迭代目標(biāo)類別的樣本數(shù)據(jù),提升標(biāo)簽分類模型的性能。樣本的迭代分為離線和在線兩部分,以美食探店標(biāo)簽為例,首先需要離線標(biāo)注少量正樣本,微調(diào)基礎(chǔ)表征模型得到初始分類模型。這時(shí)模型的識(shí)別準(zhǔn)確率通常較低,但即便如此,對(duì)樣本的清洗、迭代也很有幫助。設(shè)想如果標(biāo)注員從存量樣本池里漫無目的地篩選,可能看了成百上千個(gè)視頻都很難發(fā)現(xiàn)一個(gè)目標(biāo)類別的樣本,而通過初始模型做預(yù)篩選,可以每看幾個(gè)視頻就能篩出一個(gè)目標(biāo)樣本,對(duì)標(biāo)注效率有顯著的提升。第二步如何持續(xù)迭代更多線上樣本,提升標(biāo)簽分類模型準(zhǔn)確率至關(guān)重要。我們對(duì)于模型線上預(yù)測(cè)的結(jié)果分兩條回流路徑。線上模型預(yù)測(cè)結(jié)果非常置信,或是若干個(gè)模型認(rèn)知一致,可以自動(dòng)回流模型預(yù)測(cè)標(biāo)簽加入模型訓(xùn)練,對(duì)于高置信但錯(cuò)誤的噪聲標(biāo)簽,可以通過模型訓(xùn)練過程中的一些抵抗噪聲的技術(shù),如:置信學(xué)習(xí)進(jìn)行自動(dòng)剔除。更有價(jià)值的是,我們?cè)趯?shí)踐中發(fā)現(xiàn)對(duì)于模型性能提升ROI更高的是人工修正模型非置信數(shù)據(jù),例如三個(gè)模型預(yù)測(cè)結(jié)果差異較大的樣本,篩出后交給人工確認(rèn)。這種主動(dòng)學(xué)習(xí)的方式,可以避免在大量簡(jiǎn)單樣本上浪費(fèi)標(biāo)注人力,針對(duì)性地?cái)U(kuò)充對(duì)模型性能提升更有價(jià)值的標(biāo)注數(shù)據(jù)。

2.1.5 視頻主題標(biāo)簽應(yīng)用——高價(jià)值內(nèi)容篩選聚合

上圖展示了點(diǎn)評(píng)推薦業(yè)務(wù)視覺主題標(biāo)簽的應(yīng)用案例,最具代表性的即為高價(jià)值內(nèi)容的圈選:在點(diǎn)評(píng)App首頁信息流的達(dá)人探店Tab中,運(yùn)營(yíng)同學(xué)通過標(biāo)簽篩選出有「美食探店」標(biāo)簽的視頻進(jìn)行展示。可以讓用戶以沉浸式地體驗(yàn)方式更全面地了解到店內(nèi)的信息,同時(shí)也為商家提供了一個(gè)很好的窗口,起到宣傳引流的作用。

2.1.6 視頻標(biāo)簽的不同維度與粒度

上圖展示了,不同維度標(biāo)簽對(duì)于技術(shù)有不同要求,其中細(xì)粒度實(shí)體理解,需要識(shí)別具體是哪道菜,與上層粗粒度標(biāo)簽的問題不同,需要考慮如何應(yīng)對(duì)技術(shù)挑戰(zhàn)。首先是細(xì)粒度識(shí)別任務(wù),需要對(duì)視覺特征進(jìn)行更精細(xì)的建模;其次,視頻中的菜品理解相較于單張圖像中的菜品識(shí)別更有挑戰(zhàn),需要應(yīng)對(duì)數(shù)據(jù)的跨域問題。

2.1.7 菜品圖像識(shí)別能力向視頻領(lǐng)域的遷移

抽象出關(guān)鍵問題后,我們來分別應(yīng)對(duì)。首先在細(xì)粒度識(shí)別問題上,菜品的視覺相似性度量挑戰(zhàn)在于不同食材的特征及位置關(guān)系沒有標(biāo)準(zhǔn)化的定義,同一道菜不同的師傅很可能做出兩種完全不同的樣子。這就需要模型既能夠聚焦局部細(xì)粒度特征,又能夠融合全局信息進(jìn)行判別。為了解決這個(gè)問題,我們提出了一種堆疊式全局-局部注意力網(wǎng)絡(luò),同時(shí)捕捉形狀紋理線索和局部的食材差異,對(duì)菜品識(shí)別效果有顯著提升,相關(guān)成果發(fā)表在ACM MM國(guó)際會(huì)議上(ISIA Food-500: A Dataset for Large-Scale Food Recognition via Stacked Global-Local Attention Network)。

上圖(右)中展示的是第二部分的挑戰(zhàn)。圖像和視頻幀中的相同物體常常有著不同的外觀表現(xiàn),例如:圖片中的螃蟹常常是煮熟了擺在盤中,而視頻幀中經(jīng)常出現(xiàn)烹飪過程中鮮活的螃蟹,它們?cè)谝曈X層面差別很大。我們主要從數(shù)據(jù)分布的角度去應(yīng)對(duì)這部分跨域差異。

業(yè)務(wù)場(chǎng)景積累了大量有標(biāo)注的美食圖像,這些樣本預(yù)測(cè)結(jié)果的判別性通常較好,但由于數(shù)據(jù)分布差異,視頻幀中的螃蟹則不能被很確信地預(yù)測(cè)。對(duì)此我們希望提升視頻幀場(chǎng)景中預(yù)測(cè)結(jié)果的判別性。一方面,利用核范數(shù)最大化的方法,獲取更好的預(yù)測(cè)分布。另一方面,利用知識(shí)蒸餾的方式,不斷通過強(qiáng)大的模型來指導(dǎo)輕量化網(wǎng)絡(luò)的預(yù)測(cè)。再結(jié)合視頻幀數(shù)據(jù)的半自動(dòng)標(biāo)注,即可在視頻場(chǎng)景下獲得較好的性能。

2.1.8 細(xì)粒度菜品圖像識(shí)別能力

基于以上在美食場(chǎng)景內(nèi)容理解的積累,我們?cè)贗CCV2021上舉辦了Large-Scale Fine-Grained Food Analysis比賽。菜品圖像來自美團(tuán)的實(shí)際業(yè)務(wù)場(chǎng)景,包含1500類中餐菜品,競(jìng)賽數(shù)據(jù)集持續(xù)開放:https://foodai-workshop.meituan.com/foodai2021.html#index,歡迎大家下載使用,共同提升挑戰(zhàn)性場(chǎng)景下的識(shí)別性能。

2.1.9 菜品細(xì)粒度標(biāo)簽應(yīng)用——按搜出封面

在視頻中識(shí)別出細(xì)粒度的菜品名稱有什么應(yīng)用呢?這里再跟大家分享一個(gè)點(diǎn)評(píng)搜索業(yè)務(wù)場(chǎng)景的應(yīng)用——按搜出封面。實(shí)現(xiàn)的效果是根據(jù)用戶輸入的搜索關(guān)鍵詞,為同一套視頻內(nèi)容展示不同的封面。圖中的離線部分展示了視頻片段的切分和優(yōu)選過程,首先通過關(guān)鍵幀提取,基礎(chǔ)質(zhì)量過濾篩選出適合展示的畫面;再通過菜品細(xì)粒度標(biāo)簽識(shí)別理解到在什么時(shí)間點(diǎn)出現(xiàn)什么菜品,作為候選封面素材,存儲(chǔ)在數(shù)據(jù)庫中。線上用戶對(duì)感興趣內(nèi)容進(jìn)行搜索時(shí),根據(jù)視頻的多個(gè)封面候選與用戶查詢?cè)~的相關(guān)性,為用戶展現(xiàn)最契合的封面,提升搜索的體驗(yàn)。

比如,同樣是搜索“火鍋”,左圖是默認(rèn)封面,右圖是“按搜出封面”的結(jié)果。可以看到,左邊的結(jié)果有一些以人物為主體的封面,與用戶搜索火鍋視頻預(yù)期看到的內(nèi)容不符,直觀感覺像是不相關(guān)的Bad Case。而按搜出封面的展示結(jié)果,搜索到的內(nèi)容都是火鍋畫面,體驗(yàn)較好。這也是對(duì)視頻片段理解到細(xì)粒度標(biāo)簽,在美團(tuán)場(chǎng)景下的創(chuàng)新應(yīng)用。

2.1.10 挖掘更為豐富的視頻片段標(biāo)簽

以上都是圍繞美食視頻展開,但美團(tuán)還有很多其他的業(yè)務(wù)場(chǎng)景。如何自動(dòng)挖掘更為豐富的視頻標(biāo)簽,讓標(biāo)簽體系本身能夠自動(dòng)擴(kuò)展,而不是全部依賴人工整理定義,是一個(gè)重要的課題。我們基于點(diǎn)評(píng)豐富的用戶評(píng)論數(shù)據(jù)開展相關(guān)工作。上圖中的例子是用戶的筆記,可以看到內(nèi)容中既包含視頻又包含若干張圖片,還有一大段描述,這幾個(gè)模態(tài)具有關(guān)聯(lián)性,存在共性的概念。通過一些統(tǒng)計(jì)學(xué)習(xí)的方式,在視覺和文本兩個(gè)模態(tài)之間做交叉驗(yàn)證,可以挖掘出視頻片段和標(biāo)簽的對(duì)應(yīng)關(guān)系。

2.1.11 視頻片段語義標(biāo)簽挖掘結(jié)果示例

例如,通過算法自動(dòng)挖掘出視頻片段和標(biāo)簽,左圖展示了標(biāo)簽出現(xiàn)的頻率,呈現(xiàn)出明顯的長(zhǎng)尾分布。但值得注意的是,通過這種方式,算法能夠發(fā)掘到粒度較細(xì)的有意義標(biāo)簽,比如“絲巾畫”。通過這種方式可以在盡量減少人工參與的前提下,發(fā)現(xiàn)美團(tuán)場(chǎng)景更多重要的標(biāo)簽。

2.2 短視頻內(nèi)容生成

下面,我們來講講如何在內(nèi)容理解的基礎(chǔ)上做內(nèi)容生產(chǎn)。內(nèi)容生產(chǎn)是在短視頻AI應(yīng)用場(chǎng)景非常重要的部分,以下分享更多涉及到的是視頻素材的解構(gòu)與理解。

視頻內(nèi)容生產(chǎn)的流程鏈路(如上圖所示),其中內(nèi)容生成環(huán)節(jié)主要是原始視頻上傳到云端后,作為素材,通過算法進(jìn)行剪輯加工,更好地發(fā)揮出內(nèi)容的潛在價(jià)值。比如在廣告場(chǎng)景,通過算法識(shí)別并剪輯出原始視頻中展示商家環(huán)境,菜品效果的精華片段,提升信息的密度與質(zhì)量。另外,視頻內(nèi)容生產(chǎn)根據(jù)應(yīng)用形式可分為三類:

  1. 圖片生成視頻,常見的形式有相冊(cè)速覽視頻自動(dòng)生成;
  2. 視頻生成視頻片段,典型案例是長(zhǎng)視頻精彩片段剪輯,變成更精簡(jiǎn)的短視頻做二次分發(fā);
  3. 視頻像素級(jí)編輯,主要涉及精細(xì)化的畫面特效編輯。

下面,我們就三類應(yīng)用形式展開說明。

2.2.1 圖像生成視頻——餐飲場(chǎng)景 美食動(dòng)圖生成

第一類,圖像生成視頻。該部分要做的更多是針對(duì)圖像素材的理解和加工,使用戶對(duì)技術(shù)細(xì)節(jié)無感的前提下,一鍵端到端生成理想素材。如上圖所示,商家只需要輸入生產(chǎn)素材的圖像相冊(cè),一切交給AI算法:首先算法會(huì)自動(dòng)去除拍攝質(zhì)量較差的,不適合展示的圖片;然后做內(nèi)容識(shí)別,質(zhì)量分析。內(nèi)容識(shí)別包括內(nèi)容標(biāo)簽,質(zhì)量分析包括清晰度、美學(xué)分;由于原始圖像素材的尺寸難以直接適配目標(biāo)展位,需要根據(jù)美學(xué)評(píng)價(jià)模型,對(duì)圖像進(jìn)行智能裁切;最終,疊加Ken-Burns、轉(zhuǎn)場(chǎng)等特效,得到渲染結(jié)果。商家即可獲得一個(gè)編排精美的美食視頻。

2.2.2 圖像生成視頻——酒店場(chǎng)景 相冊(cè)速覽視頻生成

還有酒店場(chǎng)景下相冊(cè)速覽視頻生成的例子,相比動(dòng)圖,需要結(jié)合音頻與轉(zhuǎn)場(chǎng)特效的配合。同時(shí),視頻對(duì)優(yōu)先展示什么樣的內(nèi)容有更高要求,需要結(jié)合業(yè)務(wù)場(chǎng)景的特點(diǎn),根據(jù)設(shè)計(jì)師制定的腳本模板,通過算法自動(dòng)篩選特定類型的圖像填充到模板相應(yīng)位置。

2.2.3 視頻生成視頻片段

第二類,視頻生成視頻片段。主要是將長(zhǎng)視頻切分并優(yōu)選出若干個(gè)更精彩、符合用戶預(yù)期的內(nèi)容作展示。從算法階段劃分為片段生成和片段篩選排序。片段生成部分,通過時(shí)序切分算法,獲取鏡頭片段及關(guān)鍵幀。片段排序部分,比較關(guān)鍵,它決定了視頻優(yōu)先順序。這也是比較困難的部分,它有兩個(gè)維度:

  1. 通用質(zhì)量維度,包含清晰度,美學(xué)分等;
  2. 語義維度,例如:在美食視頻中,菜品成品展示,制作過程等通常是比較精彩的片段。語義維度的理解主要是采用前面介紹的內(nèi)容理解模型來支持。

2.2.3.1 智能封面與精彩片段

 原始封面

算法剪輯視頻(10s)

我們通過視頻生成視頻片段,實(shí)現(xiàn)了兩種應(yīng)用場(chǎng)景。一是智能動(dòng)態(tài)封面,主要基于通用基礎(chǔ)質(zhì)量?jī)?yōu)選出清晰度更高、有動(dòng)態(tài)信息量、無閃爍卡頓的視頻片段作為視頻的封面,相比于默認(rèn)片段的效果更好。

2.2.4 視頻像素級(jí)編輯處理——菜品視頻特效

第三類,視頻像素級(jí)編輯。比如這里展示了一個(gè)基于視頻物體分割(VOS,Video Object Segmentation)技術(shù)的菜品創(chuàng)意特效,背后的關(guān)鍵技術(shù),是美團(tuán)自研的高效語義分割方法,該方法已在CVPR 2021發(fā)表了論文(Rethinking BiSeNet For Real-time Semantic Segmentation),感興趣的同學(xué),可以了解一下。

像素級(jí)編輯處理最重要的技術(shù)之一是語義分割,在應(yīng)用場(chǎng)景中面臨的主要技術(shù)挑戰(zhàn)是既要保證分割模型時(shí)效性,也要保證分辨率,保持高頻細(xì)節(jié)信息。我們對(duì)于經(jīng)典的BiSeNet方法做出了進(jìn)一步改進(jìn),提出了基于細(xì)節(jié)引導(dǎo)的高效語義分割方法。

具體的做法如網(wǎng)絡(luò)結(jié)構(gòu)所示,左邊淺藍(lán)色部分是網(wǎng)絡(luò)的推理框架,沿用了BiSeNet Context分支的設(shè)計(jì),Context分支的主干選用了我們自研的主干STDCNet。與BiSeNet不同的是,我們對(duì)Stage3進(jìn)行一個(gè)細(xì)節(jié)引導(dǎo)的訓(xùn)練,如右邊的淺綠色部分所示,引導(dǎo)Stage3學(xué)習(xí)細(xì)節(jié)特征;淺綠色部分只參與訓(xùn)練,不參與模型推理,因此不會(huì)造成額外的時(shí)間消耗。

首先對(duì)于分割的Ground Truth,我們通過不同步長(zhǎng)的Laplacian卷積,獲取一個(gè)富集圖像邊緣和角點(diǎn)信息的細(xì)節(jié)真值;之后通過細(xì)節(jié)真值和設(shè)計(jì)的細(xì)節(jié)Loss來引導(dǎo)Stage3的淺層特征學(xué)習(xí)細(xì)節(jié)特征。由于圖像的細(xì)節(jié)真值前后背景分布嚴(yán)重不均衡,因此我們采用的是DICE loss和BCE loss聯(lián)合訓(xùn)練的方式;為了驗(yàn)證細(xì)節(jié)引導(dǎo)的有效性,我們做了這個(gè)實(shí)驗(yàn),從特征可視化的結(jié)果中可以看出多尺度獲取的細(xì)節(jié)真值對(duì)網(wǎng)絡(luò)進(jìn)行細(xì)節(jié)引導(dǎo)能獲得最好的結(jié)果,細(xì)節(jié)信息引導(dǎo)對(duì)模型的性能也有所提升。

效果方面,通過對(duì)比可以看出我們的方法對(duì)于分割細(xì)節(jié)的高頻信息保持具有較大的優(yōu)勢(shì)。

3. 總結(jié)展望

以上分享了美團(tuán)在視頻標(biāo)簽、視頻封面與剪輯、視頻細(xì)粒度像素級(jí)編輯技術(shù)領(lǐng)域,通過與業(yè)務(wù)場(chǎng)景的結(jié)合期望為商家和用戶提供更加智能的信息展示和獲取方式。未來,短視頻技術(shù)應(yīng)用方面,在美團(tuán)豐富的業(yè)務(wù)場(chǎng)景包括本地生活服務(wù)、零售電商,都會(huì)發(fā)揮更大的潛在價(jià)值。視頻理解技術(shù)方面,多模態(tài)自監(jiān)督訓(xùn)練,對(duì)于緩解標(biāo)注數(shù)據(jù)依賴,提升模型在復(fù)雜業(yè)務(wù)場(chǎng)景的泛化性能方面非常有價(jià)值,我們也在做一些嘗試和探索。

4. 本文作者

馬彬,美團(tuán)視覺智能部工程師。

責(zé)任編輯:美團(tuán)技術(shù)團(tuán)隊(duì) 來源: 美團(tuán)技術(shù)團(tuán)隊(duì)
相關(guān)推薦

2022-04-15 10:30:03

美團(tuán)技術(shù)實(shí)踐

2022-08-09 09:18:47

優(yōu)化實(shí)踐

2022-03-17 21:42:20

美團(tuán)插件技術(shù)

2013-08-20 13:11:58

技術(shù)美團(tuán)

2022-08-12 12:23:28

神經(jīng)網(wǎng)絡(luò)優(yōu)化

2018-07-13 09:53:27

移動(dòng)應(yīng)用美團(tuán)代碼

2023-11-14 12:07:43

美團(tuán)沙龍

2022-04-29 09:10:00

算法人工智能技術(shù)

2022-03-25 10:47:59

架構(gòu)實(shí)踐美團(tuán)

2016-04-12 17:12:29

機(jī)器學(xué)習(xí)數(shù)據(jù)清洗美團(tuán)

2019-08-23 13:10:39

美團(tuán)點(diǎn)評(píng)Kubernetes集群管理

2012-11-16 13:47:43

Google技術(shù)團(tuán)搜狗

2018-10-29 15:50:23

深度學(xué)習(xí)工程實(shí)踐技術(shù)

2022-03-15 10:20:00

云原生系統(tǒng)實(shí)踐

2017-06-01 10:52:35

互聯(lián)網(wǎng)

2017-05-26 16:42:06

2017-02-20 19:23:13

2022-03-17 12:00:48

異構(gòu)業(yè)務(wù)實(shí)踐

2023-05-19 12:33:24

美團(tuán)技術(shù)

2018-06-01 10:08:00

DBA美團(tuán)SQL
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

日韩国产欧美在线视频| 亚洲+小说+欧美+激情+另类| 亚洲欧美一区二区三区久本道91| 久久久久久一区二区三区 | 中文字幕一二三区| 丁香花在线影院| 久久一夜天堂av一区二区三区| 欧美精品国产精品日韩精品| aaaaaaaa毛片| 韩日毛片在线观看| 中文字幕+乱码+中文字幕一区| 国产成人一区二区| 四虎国产精品成人免费入口| 亚洲精品.com| 亚洲一区二区三区四区在线| 7777奇米亚洲综合久久| 波多野结衣视频网站| 97精品中文字幕| 日韩av中文字幕在线免费观看| 男人添女人下部高潮视频在观看| 无码国产精品96久久久久| 国产日韩免费| 欧美成年人在线观看| 亚洲天堂久久新| 亚洲性视频在线| 欧美日韩国产精选| 欧美视频免费播放| 动漫一区二区| 亚洲精品国产精品乱码不99 | 99精品中文字幕在线不卡 | 亚洲黄色成人久久久| 亚洲av无码国产精品久久不卡| 黑人一区二区| 亚洲国产日韩欧美在线99| 奇米视频888| 亚洲成人激情社区| 亚洲欧洲美洲综合色网| 91成人免费视频| 91片黄在线观看喷潮| 欧美三级视频| 精品国偷自产在线| 色婷婷免费视频| 午夜日韩影院| 欧美性猛交xxxx乱大交3| 国产精品福利视频| 日韩中文字幕高清| 国产精品乱看| 97国产suv精品一区二区62| 欧美黄片一区二区三区| 中文字幕人成人乱码| 精品偷拍各种wc美女嘘嘘| 亚洲美女精品视频| 国产精品2023| 亚洲第一视频网| 涩视频在线观看| 国产精品天堂蜜av在线播放| 欧美在线你懂得| 美女网站视频黄色| 日本一区二区中文字幕| 欧美美女一区二区三区| 亚洲第一成肉网| 成人h动漫精品一区二区器材| 欧美影视一区在线| 欧美黄色性生活| 日韩毛片网站| 日韩欧美美女一区二区三区| 性折磨bdsm欧美激情另类| 一区二区三区亚洲变态调教大结局| 在线观看视频一区二区| 久草综合在线观看| 国产一区影院| 日韩一区二区三区在线观看| www.555国产精品免费| 欧美日韩夜夜| 亚洲欧美成人网| 亚洲综合第一区| 亚洲国产老妈| 97在线观看视频| 久久久久亚洲视频| 国内精品视频一区二区三区八戒| 欧美专区福利在线| 国产午夜福利片| 日日骚欧美日韩| 欧洲日韩成人av| 一级黄色片在线| 国产精品69久久久久水密桃| 精品免费国产| 婷婷视频在线观看| 国产日韩欧美精品电影三级在线| 精品一区2区三区| 成人高清免费观看mv| 国产亚洲一二三区| 免费在线成人av| 精品美女在线观看视频在线观看| 国产欧美在线观看一区| 熟女视频一区二区三区| 538视频在线| 欧洲一区二区av| 又色又爽又黄18网站| 香蕉久久精品日日躁夜夜躁| 日韩一区二区欧美| 国产精品100| 国产综合色在线视频区| 精品国产一区二区三| 日韩黄色影院| 福利二区91精品bt7086| 精品国产鲁一鲁一区二区三区| 成人亚洲综合| 亚洲精品国产精品国自产观看浪潮| 四季av综合网站| 91免费精品| 欧美一级在线亚洲天堂| 亚洲国产精品久久久久爰性色| 高清国产一区二区| 国产福利久久精品| 国产剧情在线| 在线免费视频一区二区| 成人在线电影网站| 欧美88av| 国产欧美精品xxxx另类| 国产在线观看网站| 午夜精品一区二区三区免费视频 | 先锋影音久久| 91香蕉视频在线下载| 色老头视频在线观看| 精品色蜜蜜精品视频在线观看| 欧美精品成人网| 精品成人自拍视频| 欧美激情xxxxx| 国产精品久久影视| 中文字幕精品在线不卡| 欧美日韩亚洲国产成人| 欧美性片在线观看| 亚洲精品一区二区三区不| 精品美女久久久久| 成人成人成人在线视频| 久久这里只有精品8| 91精品视频一区二区| 中文字幕亚洲欧美日韩2019| 国产一级片免费在线观看| 91免费精品国自产拍在线不卡| 亚欧精品在线| 成人1区2区| 中文字幕日韩精品在线| 亚洲欧美日韩一区二区三区四区| 国产一区二区三区综合| 国产一区一区三区| 99精品国产九九国产精品| 久久精品电影网| 国产情侣激情自拍| 亚洲女人小视频在线观看| 手机在线视频一区| 亚洲国产精品久久久天堂| 性欧美xxxx交| 日韩av免费观影| 在线亚洲一区观看| 中文字幕91视频| 久久狠狠亚洲综合| 久久国产精品免费观看| 亚洲精品视频一二三区| 91精品国产高清自在线看超| 性xxxx视频| 一区二区激情视频| 欧美成人三级在线播放| 91精品国产乱码久久久久久久| 26uuu日韩精品一区二区| 国产三级三级在线观看| 久久久不卡影院| 亚洲综合欧美激情| 神马电影久久| 国产精品视频精品| 成人在线观看免费网站| 欧美成人女星排名| 国产一级18片视频| 国产精品美女久久久久久久久 | 久久精品国产第一区二区三区最新章节 | 欧美日韩一区综合| 国产精品高潮久久| 九九热精品视频国产| 一级全黄裸体免费视频| 一区二区三区在线视频播放 | 欧美黄色免费在线观看| 成人av电影免费观看| 99免费视频观看| 亚洲精品一二三区区别| 精品不卡一区二区三区| 福利视频亚洲| 久久久久久久久久国产| 韩日在线视频| 欧美成人在线直播| 久久永久免费视频| 亚洲一区二区三区爽爽爽爽爽| 四虎国产精品免费| 六月丁香综合| 日韩在线观看a| 国产不卡av一区二区| 91高跟黑色丝袜呻吟在线观看| av片在线观看网站| 精品亚洲精品福利线在观看| 91色在线播放| 欧美午夜电影在线| 日本高清www| 国产精品亚洲一区二区三区妖精 | 91久久国产婷婷一区二区| 日韩在线免费电影| 亚洲黄色av女优在线观看 | 91在线观看免费高清完整版在线观看 | 婷婷激情成人| 欧美亚洲视频在线看网址| 蜜桃视频网站在线观看| 日韩精品在线视频| 高h放荡受浪受bl| 欧美乱妇15p| 免费污污视频在线观看| 亚洲成人精品影院| 日韩三级久久久| 国产99精品国产| 黄色小视频免费网站| 久久中文在线| 少妇无码av无码专区在线观看| 亚洲自拍都市欧美小说| 97超级在线观看免费高清完整版电视剧| 牛牛在线精品视频| 久久在精品线影院精品国产| 自拍视频在线网| 欧美一区二区三区成人| 中文字幕a级片| 91黄视频在线| 无码无套少妇毛多18pxxxx| 五月天激情综合| 久久精品视频日本| 欧美国产激情二区三区| 30一40一50老女人毛片| 不卡大黄网站免费看| 中国特级黄色片| 国产福利一区二区三区在线视频| 日韩免费一级视频| 亚洲三级网站| 黄色片网址在线观看| 狠狠入ady亚洲精品经典电影| 欧美精品123| 日韩精品久久久久久久软件91| 国内揄拍国内精品| 678在线观看视频| 91成人精品网站| 在线观看爽视频| 日韩免费中文字幕| 欧美日韩女优| 91精品美女在线| 美女福利一区二区| 国产成人福利网站| 日本一区二区电影| 国产精品丝袜白浆摸在线| 欧美高清xxx| 亚洲精品日韩激情在线电影| 精品欧美视频| 国产精品手机在线| 西瓜成人精品人成网站| 91在线观看欧美日韩| 欧美日韩女优| 亚洲一区亚洲二区| 激情小说一区| 久久亚裔精品欧美| 日本不卡二三区| 经典三级在线视频| 亚洲区一区二| 国产成人无码av在线播放dvd| 亚洲国产导航| 久久人妻精品白浆国产| 免费成人在线视频观看| 日韩av成人网| 国产九色精品成人porny| 四虎精品一区二区| 久久精品综合网| 国产成人自拍网站| 午夜婷婷国产麻豆精品| 天堂网一区二区| 91精品国产手机| 亚洲人视频在线观看| 欲色天天网综合久久| 黄网站视频在线观看| 9.1国产丝袜在线观看| 99久久综合国产精品二区| 亚洲综合中文字幕在线观看| 性欧美xxxx免费岛国不卡电影| 国产精品日韩一区二区三区| 欧美美女在线观看| 丰满人妻一区二区三区53号| 一区二区三区国产在线| av在线免费看片| 久久亚洲综合色| 黄色片在线观看网站| 日本精品视频一区二区| 黄色一级a毛片| 亚洲精品久久久久久久久久久 | 欧美三区四区| 99在线影院| 欧美日一区二区| 国产精品久久久久9999爆乳| 奇米888四色在线精品| 国产精品成人无码专区| 国产精品美女一区二区| 日韩欧美成人一区二区三区| 欧美一区二区三区影视| 99久久精品无免国产免费| 亚洲欧美日韩精品久久亚洲区 | xnxx国产精品| 国产黄在线免费观看| 日韩欧美中文字幕在线观看| www.国产免费| 日韩有码在线观看| 裤袜国产欧美精品一区| 好吊色欧美一区二区三区| 综合天天久久| www.日本一区| 国产视频911| 你懂的国产在线| 亚洲国产精品美女| 欧美xxxx免费虐| 亚洲一区二区三区777| 成人网18免费网站| 日韩手机在线观看视频| 91蜜桃免费观看视频| 国产一二三四在线| 日韩欧美在线观看一区二区三区| 少妇一区二区三区四区| 成人97在线观看视频| 中文字幕成人| 国产精品亚洲天堂| 另类欧美日韩国产在线| 亚洲女同二女同志奶水| 欧美色图免费看| 岛国在线视频免费看| 国产成人一区二区在线| 欧美激情在线精品一区二区三区| 亚洲欧洲一区二区福利| 精品成人免费| 久久久久99人妻一区二区三区| 国产亚洲欧美激情| 四虎影院在线免费播放| 亚洲欧美日韩中文视频| 妞干网免费在线视频| 麻豆精品传媒视频| 丝袜美腿亚洲色图| 免费看的黄色网| 日本一区二区不卡高清更新| 精品美女在线播放| 猫咪在线永久网站| 欧美一级淫片播放口| 婷婷精品在线观看| 成人毛片100部免费看| 国内精品国产成人| 粉嫩av性色av蜜臀av网站| 91精品午夜视频| 亚洲电影视频在线| 翡翠波斯猫1977年美国| 亚洲国产一区二区精品专区| 五月激情婷婷在线| 亚洲男人天堂一区| 亚洲a视频在线| 91chinesevideo永久地址| 精品国产一区探花在线观看 | 国产黑丝在线视频| 一区二区三区在线视频观看58 | av资源亚洲| 午夜精品一区二区三区在线观看| 亚洲国产1区| 91精彩刺激对白露脸偷拍| 欧美午夜精品一区二区蜜桃 | 亚洲四虎影院| 中文字幕一区二区三区最新 | 天堂视频免费看| 一区二区三区精密机械公司| 天堂av中文字幕| 国产精品狠色婷| 91精品成人| 亚洲精品女人久久久| 在线国产亚洲欧美| av网站在线免费| 免费观看成人高| 韩国v欧美v日本v亚洲v| 国产午夜福利一区二区| 在线视频一区二区| 一区二区三区四区视频免费观看| 91制片厂免费观看| 精品亚洲成av人在线观看| 国产无遮挡又黄又爽又色| 亚洲性猛交xxxxwww| 欧美欧美在线| 久草精品在线播放| 亚洲免费大片在线观看| 欧美成人免费| 1区1区3区4区产品乱码芒果精品| 99精品视频在线观看免费播放 | 欧美片第1页| 欧美一区国产一区| 国产成人免费高清| 一区二区三区免费观看视频| 日韩少妇与小伙激情| 青青一区二区|