精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

mPLUG-達(dá)摩院開(kāi)源多模態(tài)對(duì)話大模型技術(shù)與應(yīng)用解析

人工智能
mPLUG-Owl 是阿里巴巴達(dá)摩院 mPLUG 系列的最新工作,延續(xù)了 mPLUG 系列的模塊化訓(xùn)練思想,把 LLM 升級(jí)為一個(gè)多模態(tài)對(duì)話大模型。在 mPLUG 系列工作中,之前的 E2E-VLP 、mPLUG 、mPLUG-2 分別被 ACL2021 、EMNLP2022、ICML2023 錄用,其中 mPLUG 工作在 VQA 榜單首超人類的成績(jī)。

純文本大模型方興未艾,多模態(tài)領(lǐng)域也開(kāi)始涌現(xiàn)出多模態(tài)對(duì)話大模型工作,地表最強(qiáng)的 GPT-4 具備讀圖的多模態(tài)能力,但是遲遲未向公眾開(kāi)放體驗(yàn),于是乎研究社區(qū)開(kāi)始在這個(gè)方向上發(fā)力研究并開(kāi)源。MiniGPT-4 和 LLaVA 問(wèn)世不久,阿里達(dá)摩院便推出mPLUG-Owl ,一個(gè)基于模塊化實(shí)現(xiàn)的多模態(tài)對(duì)話大模型。mPLUG-Owl 是阿里巴巴達(dá)摩院 mPLUG 系列的最新工作,延續(xù)了 mPLUG 系列的模塊化訓(xùn)練思想,把 LLM 升級(jí)為一個(gè)多模態(tài)對(duì)話大模型。在 mPLUG 系列工作中,之前的 E2E-VLP 、mPLUG 、mPLUG-2 分別被 ACL2021 、EMNLP2022、ICML2023 錄用,其中 mPLUG 工作在 VQA 榜單首超人類的成績(jī)。本文將分享mPLUG的工作,即多模態(tài)對(duì)話大模型技術(shù)與應(yīng)用解析。

https://github.com/X-PLUG/mPLUG-Owl。

一、多模態(tài)大模型技術(shù)發(fā)展歷程

首先介紹一下多模態(tài)大模型技術(shù)的發(fā)展歷程。ChatGPT4展現(xiàn)了非常強(qiáng)的多模態(tài)能力。在今年之前多模態(tài)的研究熱點(diǎn)主要圍繞在多模態(tài)預(yù)訓(xùn)練。

圖片

多模態(tài)預(yù)訓(xùn)練大概開(kāi)始于18年前后,是多模態(tài)領(lǐng)域最重要的研究方向之一,并且在實(shí)際業(yè)務(wù)中有著非常廣的應(yīng)用場(chǎng)景。多模態(tài)預(yù)訓(xùn)練最經(jīng)典的四個(gè)任務(wù),比如VQA視覺(jué)問(wèn)答,上傳一張圖片以及一個(gè)問(wèn)題,就可以讓機(jī)器回答出相關(guān)答案;ImageCaption,給一張圖片,可以生成answer;還有跨模態(tài)檢索,以及Visual Grounding。

圖片

剛開(kāi)始的18,19年是基于檢測(cè)特征的兩階段方法,包括UNITER,LXMERT等經(jīng)典方法。2021年,進(jìn)入了端到端的方法,包括CLIP、ViLT等。2022年開(kāi)始嘗試大一統(tǒng)的方法,通過(guò)一個(gè)統(tǒng)一的模型解決圖文、視頻文本這種單模態(tài)的相關(guān)任務(wù),以及Scaling up增加模型size以及預(yù)訓(xùn)練的數(shù)據(jù)量。最近幾個(gè)月最主要的工作就是多模態(tài)對(duì)話大模型。因?yàn)镚PT4并沒(méi)有公開(kāi)其模型和demo,所以最近有很多類GPT4的工作,包括miniGPT4以及mPLUG-Owl的工作。

在多模態(tài)預(yù)訓(xùn)練領(lǐng)域最重要的榜單就是VQA Leaderboard。mPLUG在2021年VQA Challenge排名第一,以81.26的成績(jī)首次超越了人類。現(xiàn)在最高的效果已經(jīng)達(dá)到了86.26,并且是一個(gè)端到端的模型。這些都向我們展示了多模態(tài)預(yù)訓(xùn)練發(fā)展的迅速。無(wú)論是從預(yù)訓(xùn)練的角度還得對(duì)話的角度,都是多模態(tài)研究最重要的方向。

下面介紹一下多模態(tài)預(yù)訓(xùn)練技術(shù)的發(fā)展歷程。

圖片

在18,19年,多模態(tài)預(yù)訓(xùn)練開(kāi)始成為最重要的一個(gè)研究方向的時(shí)候,大家主要是基于目標(biāo)檢測(cè)的視覺(jué)特征抽取,做單/雙流的圖文特征融合,其中代表性工作包括單流UNITER,雙流LXMERT。

進(jìn)入2020年,大家開(kāi)始嘗試端到端的方法,因?yàn)橹暗膬呻A段方法存在效率不高的問(wèn)題,以及領(lǐng)域遷移的問(wèn)題。其中代表性工作基于Resnet的Pixel-BERT、E2E-VLP,以及Transformer的VILT。

2021年,開(kāi)始了數(shù)據(jù)以及模型規(guī)模的Scaling-up,其中代表性的工作包括ALBEF、SimVLM、mPLUG。

2022之后,大家開(kāi)始基于大一統(tǒng)的方法,可以做單/多模態(tài),其中代表性工作包括Coca,F(xiàn)lamingo以及mPLUG-2。

圖片

今年ChatGPT大火,我們通過(guò)GPT4的一些case可以看到,它有著非常強(qiáng)的視覺(jué)內(nèi)容細(xì)粒度理解與推理能力,這已經(jīng)超越了很多之前的方法。比如上圖中左側(cè)的這個(gè)例子,它已經(jīng)能識(shí)別出插口是VGA的,以及手機(jī)是iPhone的,并且能夠給出比較詳細(xì)的結(jié)果。右側(cè)圖的這個(gè)case是對(duì)笑話的理解能力,也是非常細(xì)粒度的。

圖片

GPT4還展示了非常強(qiáng)的視覺(jué)內(nèi)容富文本圖片表格理解與推理能力。

這非常符合自動(dòng)化辦公的要求,documentAI 之前都是用一個(gè)非常復(fù)雜的系統(tǒng)來(lái)做的,既需要做OCR,還需要理解圖片布局,才能做summary,其中的步驟是非常復(fù)雜的。GPT4能用一個(gè)端到端的方法非常詳細(xì)地理解表格中的內(nèi)容,并且具有非常強(qiáng)的文本生成能力。

圖片

上圖左側(cè)是一個(gè)數(shù)學(xué)公式,GPT4能夠理解其中的內(nèi)容,并給出數(shù)學(xué)推導(dǎo)。右側(cè)是一篇論文,GPT4能夠理解得非常詳細(xì)。驚喜點(diǎn)在于這里的文本是比較長(zhǎng)的,并且里面既有圖片又有表格,格式復(fù)雜,而GPT4能夠理解這篇論文講的是什么,要解決的是什么,并給出非常好的summary。這些都展示了GPT4非常強(qiáng)大的富文本圖片理解能力和表格理解能力。

但GPT4并沒(méi)有開(kāi)源demo,現(xiàn)有的demo還是純文本模型,所以從三四月份開(kāi)始相繼發(fā)布了很多類GPT4的模型。

圖片

多模態(tài)對(duì)話大模型主要分成兩類,第一類基于系統(tǒng),將ChatGPT作為一個(gè)中樞,將視覺(jué)信息轉(zhuǎn)換成文本信息,通過(guò)ChatGPT進(jìn)行信息的整理與回復(fù)。其中代表性工作有Visual ChatGPT、MM-REACT以及HuggingGPT。

圖片

第二類模型是端到端的,這種更類似ChatGPT。這類工作主要基于一個(gè)非常強(qiáng)的文本大模型,通過(guò)一個(gè)視覺(jué)backbone來(lái)做文本的對(duì)齊。這種類GPT4的工作希望能夠通過(guò)一個(gè)模型同時(shí)擁有多模態(tài)與文本的能力。代表性工作有MiniGPT-4、LLAVA、Kosmos,以及達(dá)摩院的mPLUG-Owl。

二、多模態(tài)對(duì)話大模型mPLUG技術(shù)與應(yīng)用解析

圖片

mPLUG是一個(gè)模塊化的多模態(tài)模型,圖文的mPLUG以及大一統(tǒng)的mPLUG-2這兩個(gè)工作分別在EMNLP2022和ICML2023發(fā)表。mPLUG系列多模態(tài)預(yù)訓(xùn)練工作,借鑒了人腦的模塊化思想,針對(duì)不同模態(tài)input,不同模態(tài)output,因?yàn)椴煌B(tài)特有屬性針對(duì)不同的功能設(shè)計(jì)不同的模塊,進(jìn)行層次化的預(yù)訓(xùn)練,這樣可以輕量化,可拆拔的靈活應(yīng)用到各種Zero/Few-Shot、Continue Pretrain、下游Finetuning,以及多模態(tài)表征等層次化應(yīng)用場(chǎng)景。所以mPLUG系列工作的主要思想就是層次模塊化、輕量化,這樣我們可以用一個(gè)比較統(tǒng)一的模型應(yīng)用到各種復(fù)雜的場(chǎng)景。

上圖左側(cè)是mPLUG-2的一個(gè)工作,我們針對(duì)不同的模態(tài)拆分成不同的模塊來(lái)做特定的任務(wù),比如Video captioning需要做Video-Encoder和Text-Encoder,Universal Layers用來(lái)做對(duì)齊,VL Fusion用來(lái)做模態(tài)融合然后輸入到Video-Decoder輸出結(jié)果。右側(cè)給出了現(xiàn)有的大一統(tǒng)模型,比如BEiT-3、Coca、Flamingo這些都很難在CV和NLP任務(wù)取得SOTA效果。我們分析其原因都是因?yàn)闆](méi)有這種模塊化、輕量化的概念,所以很難用一個(gè)大一統(tǒng)的模型來(lái)做各種模態(tài)的任務(wù),并且不同模態(tài)之間沒(méi)有做好協(xié)同,不同模態(tài)之間的差距還是很大的。所以我們就提出了mPLUG模塊化多模態(tài)模型。

右下角是mPLUG給出的一個(gè)table,對(duì)于不同的單模態(tài)或多模態(tài)任務(wù)如何組合不同的module。這就是我們之前做的兩個(gè)工作,一個(gè)是圖文mPLUG,一個(gè)是大一統(tǒng)模型mPLUG-2。我們?cè)?0+的任務(wù)上取得了SOTA。這個(gè)工作也發(fā)表在了ICML上。如果大家感興趣,可以去看一下具體的文章。

圖片

接下來(lái)將重點(diǎn)介紹多模態(tài)對(duì)話大模型mPLUG-Owl的工作。這個(gè)工作我們也在github上進(jìn)行了開(kāi)源。最近我們也在第三方上海人工智能實(shí)驗(yàn)室OpenGVLab組織的人工標(biāo)注評(píng)測(cè)多模態(tài)LLM榜單排名第一!與其對(duì)比的是前面提到的一些比較經(jīng)典的模型,比如LLaVA,MiniGPT4,Otter等等。

mPLUG-Owl有非常多的應(yīng)用場(chǎng)景,比如下圖的旅游指南和創(chuàng)意文案。

比如給出一個(gè)富士山的圖片,讓模型給出一個(gè)兩天的行程計(jì)劃。mPLUG-Owl可以給出非常詳細(xì)的旅游指南。右側(cè)的例子是創(chuàng)意文案,給出一張圖片讓模型寫(xiě)一首詩(shī),mPLUG-Owl可以給出比較優(yōu)美的一首詩(shī)。

應(yīng)用場(chǎng)景還包括使用指南和展覽向?qū)А?/span>

圖片

比如給出一個(gè)錘子,問(wèn)模型該如何使用。我們還對(duì)說(shuō)明書(shū),以及非常長(zhǎng)的document進(jìn)行了測(cè)試,mPLUG-Owl都可以給出非常詳細(xì)的描述。右側(cè)這種展覽向?qū)Вo模型一個(gè)圖片,模型可以為我們展示非常詳細(xì)信息,比如圖片的源頭,以及一些發(fā)散性的創(chuàng)作。

下面具體介紹一下mPLUG-Owl的工作。

圖片

mPLUG-Owl是模塊化的結(jié)構(gòu), Visual Encoder我們拿了一個(gè)預(yù)訓(xùn)練好的VIT。文本的大模型包括LLaMA,GPT等。我們也上線了中文的多語(yǔ)言模型。

我們拿兩種模塊化的單模態(tài)的模型加入Visual Abstractor的model,因?yàn)樵诙嗄B(tài)里面端到端的方法存在一個(gè)問(wèn)題,視覺(jué)的長(zhǎng)度比較長(zhǎng),所以我們需要做降序列的操作,將序列長(zhǎng)度降下來(lái),就很容易擬合到純文本的LLaMA、GPT這種結(jié)構(gòu)里面。

我們采用了兩階段的方法,第一階段進(jìn)行預(yù)訓(xùn)練,用海量的圖文pair,主要是為了學(xué)習(xí)視覺(jué)的對(duì)象,把文本和視覺(jué)對(duì)應(yīng)起來(lái),比如人物、地點(diǎn)以及概念,通過(guò)預(yù)訓(xùn)練將它們對(duì)齊。所以在預(yù)訓(xùn)練階段,將視覺(jué)的Encoder、 abstract以及summarize這些模塊放開(kāi),文本模塊freeze住。讓視覺(jué)特征和文本特征更好的對(duì)齊,從而更好地學(xué)習(xí)視覺(jué)的一些概念。第二階段是為了開(kāi)發(fā)視覺(jué)的一些能力,所以我們把視覺(jué)的abstract和Encoder板塊freeze住,文本的部分打開(kāi),加輕量化的LoRA。

圖片

我們也與現(xiàn)有方法進(jìn)行了對(duì)比,像MiniGPT4、Kosmos、LLaVA,大家的工作都是比較類似的,區(qū)別就在于如何做預(yù)訓(xùn)練。與其它方法相比,我們的特點(diǎn)主要在第一階段將視覺(jué)放開(kāi),因?yàn)槲覀冋J(rèn)為視覺(jué)和文本對(duì)齊是非常重要的,需要學(xué)習(xí)這些視覺(jué)的概念;第二階段是要把文本部分放開(kāi),這樣就能開(kāi)發(fā)出文本的SFD能力以及多模態(tài)的SFD的能力。

圖片

之前的工作比如MiniGPT4、LLaVA等,并沒(méi)有做詳細(xì)的性能評(píng)測(cè),只是開(kāi)源了一些demo讓大家來(lái)體驗(yàn)。我們構(gòu)建了一個(gè)多模態(tài)指令評(píng)測(cè)集OwlEval來(lái)評(píng)測(cè)不同的模型,包括OpenFlamingo、BLIP-2、MiniGPT4,LLaVA,以及我們的mPLUG-Owl。

評(píng)分指標(biāo)主要分為四類,進(jìn)行人工評(píng)測(cè)。A:聽(tīng)懂人類的指令,且回答滿意;B:聽(tīng)懂指令,但是回答部分會(huì)存在一些錯(cuò)誤;C:聽(tīng)懂指令,但是回答錯(cuò)誤或者用戶不滿意;D:聽(tīng)不懂指令或者無(wú)效的回答。

我們首先對(duì)知識(shí)問(wèn)答進(jìn)行評(píng)測(cè)。

圖片

對(duì)比的模型有MM-REACT、MiniGPT-4,可以看到mPLUG-Owl給出的回復(fù)非常正確。能夠清楚的理解人類的意圖,并且回答的也是非常正確的。所以我們給出的score是A,MiniGPT-4是B,而MM-REACT的knowledge不太好。

第二個(gè)是多輪對(duì)話的評(píng)測(cè)。

圖片

首先模型要能夠不停的聊,并且能夠理解指代關(guān)系,比如姚明和杜峰的這個(gè)例子,問(wèn)第二個(gè)問(wèn)題的時(shí)候問(wèn)模型左邊是誰(shuí)?更高的是誰(shuí)?這種有指代關(guān)系的問(wèn)題,mPLUG-Owl回復(fù)的都比較好。

圖片

接下來(lái)我們也進(jìn)行了笑話理解的測(cè)試。

MM-REACT很難理解,最終得分是c。GPT-4回答的就非常好,GPT-4的笑話理解和細(xì)粒度理解能力確實(shí)非常強(qiáng)。mPLUG-Owl回答的也算不錯(cuò),至少明白了它的意圖,給出的答案是有一些錯(cuò)誤的,稍微有一些幻覺(jué),但整體來(lái)說(shuō)回答的還是不錯(cuò)的,也展示了mPLUG-Owl非常強(qiáng)的細(xì)粒度理解能力。

我們?cè)谠u(píng)測(cè)的時(shí)候也發(fā)現(xiàn)了mPLUG-Owl的涌現(xiàn)能力,超出了我們的想象。

圖片

我們?cè)陬A(yù)訓(xùn)練的時(shí)候主要是通過(guò)圖文pair,并沒(méi)有加入多圖和OCR的能力,我們進(jìn)行了一些多圖的能力測(cè)試。對(duì)于上圖左側(cè)兩張姚明相關(guān)的圖片,mPLUG-Owl也展示了給出多圖之間關(guān)系的能力。右側(cè)四張圖的漫畫(huà),也進(jìn)一步說(shuō)明了mPLUG-Owl的能力。

還有OCR的能力。

圖片

針對(duì)給出的文章首頁(yè)截圖,mPLUG-Owl能夠很好的理解文章的標(biāo)題和摘要,展現(xiàn)了mPLUG-Owl的OCR的能力。

我們也將其擴(kuò)展到了視頻。我們與優(yōu)酷聯(lián)合發(fā)布了一個(gè)最大的中文數(shù)據(jù)集YouKu-mPLUG,基于此又將其擴(kuò)展到了mPLUG-Owl視頻理解。

圖片

例如上圖左側(cè),模型能夠很好地理解視頻內(nèi)容。右側(cè)是基于視頻進(jìn)行一些創(chuàng)作。并且明白了視頻里面的步驟。這些都展示了模型較強(qiáng)的視頻理解能力。

前面也提到了我們發(fā)布的多語(yǔ)言版本。

圖片

我們希望模型能夠支持更多的中文場(chǎng)景,我們也開(kāi)源了一個(gè)多語(yǔ)言版本,上圖是幾個(gè)case,都展現(xiàn)了mPLUG-Owl的多語(yǔ)言能力。多語(yǔ)言還包含其他語(yǔ)言,比如法語(yǔ)、日語(yǔ)、葡萄牙語(yǔ)等。

圖片

這些都展示了mPLUG-Owl的多語(yǔ)言能力。

剛剛也提到了我們與優(yōu)酷聯(lián)合發(fā)布了一個(gè)業(yè)內(nèi)最大的中文視頻數(shù)據(jù)集YouKu-mPLUG,也是為了推動(dòng)中文社區(qū)的發(fā)展。我們也訓(xùn)練mPLUG-Video中文視頻對(duì)話模型。我們可以基于視頻進(jìn)行多輪的對(duì)話,以及剛剛提到的OCR的能力。以及knowledge的能力都表現(xiàn)的非常好。因?yàn)楝F(xiàn)在中文沒(méi)有海量的視頻數(shù)據(jù)集,如果大家對(duì)我們這個(gè)視頻數(shù)據(jù)集比較感興趣也可以到我們這個(gè)鏈接下進(jìn)行下載。

我們還做了mPLUG-Owl的消融實(shí)驗(yàn)。

圖片

證明了多模態(tài)預(yù)訓(xùn)練和文本的instruction以及多模態(tài)instruction相關(guān)的能力,針對(duì)上圖的六項(xiàng)能力,我們的策略對(duì)模型的提升是比較明顯的,也證明了我們的訓(xùn)練策略和多模態(tài)指令微調(diào)數(shù)據(jù)的有效性。

圖片

剛剛提到了我們與優(yōu)酷聯(lián)合發(fā)布了一個(gè)業(yè)內(nèi)最大的中文視頻數(shù)據(jù)集YouKu-mPLUG,我們也加入了非常多的安全策略,對(duì)數(shù)據(jù)集做了一些過(guò)濾。我們的數(shù)據(jù)集分布比較均勻,大概有45個(gè)類,我們基于數(shù)據(jù)集標(biāo)注了一個(gè)benchmark,包含了分類,檢索等等。都是為了推動(dòng)中文多模態(tài)社區(qū)發(fā)展。因?yàn)橹形亩嗄B(tài)社區(qū)發(fā)展受限的一個(gè)主要原因就是沒(méi)有中文預(yù)訓(xùn)練多模態(tài)數(shù)據(jù)集。第二是沒(méi)有benchmark,無(wú)法做公平的對(duì)比。這也是YouKu-mPLUG的初心。

圖片

上面是我們數(shù)據(jù)的一些case,分布還是比較廣泛的,包括影視,綜藝等等。模型的結(jié)果跟mPLUG-Owl比較類似,只是將一個(gè)文本的模塊擴(kuò)展成視頻的模塊。對(duì)應(yīng)的任務(wù)包括Video Category Prediction以及Video Captioning,基于mPLUG-Owl的結(jié)構(gòu)都取得了不錯(cuò)的效果和明顯的提升。

三、ModelScope實(shí)戰(zhàn)分享

圖片

mPLUG-Owl在ModelScope上開(kāi)源了很多的模型,包括mPLUG-Owl模型以及mPLUG圖文模型、視頻模型等等。大家在ModelScope上搜索模型庫(kù)輸入mPLUG就能查看相關(guān)模型。

圖片

使用也是非常簡(jiǎn)單,將ModelScope安裝之后,直接導(dǎo)入指定好的模型,輸入圖片以及輸入問(wèn)題,就可以得到模型給出的答案。比如我們問(wèn)這個(gè)人的情緒是怎么樣的?模型會(huì)給出“he is angry”。

ModelScope創(chuàng)空間給出了一些demo。

圖片

mPLUG-Owl的兩個(gè)demo包括英文版本和多語(yǔ)言版本也在創(chuàng)空間進(jìn)行了開(kāi)源。點(diǎn)開(kāi)后是一個(gè)聊天的界面,如果大家對(duì)我們的工作感興趣也可以通過(guò)上圖中的鏈接到ModelScope創(chuàng)空間進(jìn)行體驗(yàn)。

圖片

同時(shí),我們的工作也在huggingface和github進(jìn)行了開(kāi)源,左側(cè)是huggingface的使用指南,也歡迎大家進(jìn)行使用體驗(yàn)。

四、mPLUG項(xiàng)目主頁(yè)

圖片

文中提到的mPLUG的工作都已在github進(jìn)行了開(kāi)源,github項(xiàng)目名為X-PLUG,里面包含了mPLUG-2多模態(tài)模塊化大一統(tǒng)模型,以及mPLUG-Owl多模態(tài)對(duì)話大模型。項(xiàng)目主頁(yè)上還包括文中提到的我們與優(yōu)酷聯(lián)合發(fā)布的中文視頻數(shù)據(jù)集YouKu-mPLUG,我們的論文、代碼以及數(shù)據(jù)集的鏈接。歡迎大家star和fork!

如果對(duì)創(chuàng)空間感興趣,可以直接掃描上面的二維碼進(jìn)行體驗(yàn),包括英文和多語(yǔ)言兩個(gè)版本。

整個(gè)X-PLUG體系還包含了很多其它模型,我們也建立了一個(gè)討論區(qū),歡迎大家掃碼加入討論區(qū),或者訪問(wèn)我的知乎鏈接,進(jìn)行交流。

五、問(wèn)答環(huán)節(jié)

Q1:剛剛提到了和優(yōu)酷聯(lián)合發(fā)布的中文視頻數(shù)據(jù)集,能否介紹一下這個(gè)數(shù)據(jù)集可以用到什么場(chǎng)景去解決什么樣的問(wèn)題?

A:YouKu-mPLUG這個(gè)數(shù)據(jù)集的初衷是要補(bǔ)齊中文社區(qū)沒(méi)有中文視頻預(yù)訓(xùn)練多模態(tài)數(shù)據(jù)集的短板。我們現(xiàn)在的應(yīng)用場(chǎng)景更多的是短視頻,比如抖音、快手等等,沒(méi)有這種視頻數(shù)據(jù)集,會(huì)非常影響這種視頻應(yīng)用場(chǎng)景的發(fā)展。并且我們也加入了非常多的安全策略,對(duì)數(shù)據(jù)集做了一些過(guò)濾。

第一是為了推動(dòng)中文多模態(tài)社區(qū)發(fā)展。第二是視頻領(lǐng)域比較經(jīng)典的任務(wù)沒(méi)有benchmark大家不好做公平的對(duì)比。第三是為了推動(dòng)更多的視頻應(yīng)用場(chǎng)景,包括視頻生成和視頻編輯。公開(kāi)這個(gè)數(shù)據(jù)集也是為了讓工業(yè)界和學(xué)術(shù)界來(lái)做更多的應(yīng)用和研究,這也是YouKu-mPLUG的初心。

Q2:多模態(tài)在NLP方面可以怎么使用?用在什么方面?

A:現(xiàn)在的多模態(tài)和NLP是聯(lián)系緊密的,當(dāng)前的多模態(tài)更偏向NLP,因?yàn)槟P偷膐utput是文本。output是視覺(jué)的,比如視頻生成、圖片生成是屬于另外一個(gè)分支。output是文本的跟NLP走的是比較緊密的。區(qū)別只是輸入多了一個(gè)圖片而已,所以NLP的很多技術(shù)也是在多模態(tài)有應(yīng)用的。多模態(tài)預(yù)訓(xùn)練這部分工作應(yīng)該很多都是做NLP出身的,現(xiàn)在的很多應(yīng)用場(chǎng)景,很難是單文本的,包括ChatGPT讓我們經(jīng)驗(yàn)的一個(gè)點(diǎn)也是他是多模態(tài)的。無(wú)論我們輸入圖片還是文本,都能夠非常流暢地進(jìn)行對(duì)話,所以多模態(tài)在NLP的應(yīng)用場(chǎng)景是非常廣的,多模態(tài)可能跟文本唯一不一樣的地方就是需要你完全理解圖片,所以我覺(jué)得這兩個(gè)方向是不分家的。

責(zé)任編輯:姜華 來(lái)源: DataFunTalk
相關(guān)推薦

2023-05-08 10:14:07

模型AI

2023-05-30 10:23:45

模型研究

2024-12-30 00:01:00

多模態(tài)大模型Python

2024-11-11 15:11:23

2024-08-19 13:35:09

2025-09-16 09:35:52

2025-01-08 08:21:16

2023-06-08 11:45:50

模型語(yǔ)言

2023-09-02 12:49:01

2025-02-27 01:00:00

大模型OLMOCRrag

2025-05-20 08:30:00

2023-05-15 12:14:02

ChatGPT語(yǔ)音模型

2025-05-23 09:18:25

2025-08-05 02:25:00

多模態(tài)大語(yǔ)言模型

2024-03-25 12:30:18

AI訓(xùn)練開(kāi)源

2021-06-22 15:56:24

人工智能深度語(yǔ)言開(kāi)源

2024-01-22 13:59:00

模型訓(xùn)練

2024-05-10 06:59:06

2021-01-13 12:39:46

科技趨勢(shì)電子器件量子霸權(quán)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产69久久| 懂色av蜜臀av粉嫩av分享吧最新章节| 国产一区二区在线观| 亚洲欧美日韩成人高清在线一区| 古典武侠综合av第一页| 99热国产在线观看| 日韩免费av| 亚洲国产精品高清久久久| 人妻无码视频一区二区三区| caopen在线视频| 26uuu成人网一区二区三区| 国产精品视频yy9099| 久草视频中文在线| 欧美中文字幕一区二区| 日韩精品中文字幕一区 | 成年人在线观看视频| 国产一区二区影院| 欧美做爰性生交视频| 国产高清视频免费在线观看| 精品自拍偷拍| 91精品视频网| 亚洲视频在线观看一区二区三区| 丝袜美腿av在线| 国产精品乱子久久久久| 国产综合动作在线观看| 国产精品丝袜黑色高跟鞋| 另类av一区二区| 欧美激情精品久久久久久| 在线观看亚洲大片短视频| 美腿丝袜亚洲图片| 欧美一区二区精美| 欧美午夜aaaaaa免费视频| 韩国成人二区| 亚洲一级二级三级| 激情图片qvod| 欧美激情二区| 亚洲国产精品传媒在线观看| 久久涩涩网站| 无码国产精品高潮久久99| 国产成人免费视频一区| 亚洲xxxxx性| 中文字幕日本人妻久久久免费| 国产精品乱看| 午夜精品免费视频| 国产精品99精品| 欧美三区视频| 欧美日韩aaaa| 久热这里有精品| 97久久夜色精品国产| 亚洲香蕉成人av网站在线观看 | 中文字幕欧美人妻精品一区| 男女羞羞在线观看| 精品久久久久久久久久久久| 国产精品69久久久| www在线看| 精品国产福利在线| 欧美精品99久久| 国产美女高潮在线观看| 婷婷国产在线综合| 国产 日韩 亚洲 欧美| 91美女精品| 图片区小说区国产精品视频| 久草热视频在线观看| 美女av在线免费看| 欧美小视频在线| 欧美极品欧美精品欧美图片| 波多视频一区| 欧洲亚洲国产日韩| 99re精彩视频| 日本一区精品视频| 亚洲国产天堂久久综合| 成人免费无码大片a毛片| 亚洲午夜久久| 日韩最新在线视频| 在线免费日韩av| 日韩视频一区| 国产精品a久久久久久| 这里只有精品国产| 国产一区二区三区免费| 国产日韩精品久久| 国产特黄在线| 亚洲男同1069视频| 成人黄色av片| 成人全视频在线观看在线播放高清| 欧美电影一区二区| 精品人妻在线视频| 国产一区二区三区四区五区传媒 | 日本在线视频网址| 欧美日韩在线视频首页| 91制片厂毛片| 国产精品久久久网站| 亚洲欧美国内爽妇网| 中日韩一级黄色片| 免费在线日韩av| 91沈先生作品| 日本亚洲一区| 亚洲视频免费在线| 国产综合免费视频| 日韩最新av| 国产丝袜一区二区三区| 亚洲伦理一区二区三区| 99精品国产99久久久久久福利| 国产精品激情av在线播放| 国产福利第一视频| 久久精品男人天堂av| 亚洲五码在线观看视频| 欧美黄色网页| 精品88久久久久88久久久| 免费看黄色三级| 99av国产精品欲麻豆| 91精品久久久久| 先锋av资源站| 亚洲人一二三区| 激情综合网俺也去| 久久a级毛片毛片免费观看| 日韩中文字幕不卡视频| 黄色av网站免费观看| 国产999精品久久久久久绿帽| 日韩久久不卡| 在线天堂新版最新版在线8| 日韩一级片网站| 日韩福利在线视频| 免费欧美在线| 国产亚洲精品自在久久| 在线观看电影av| 欧美精品日韩一区| avhd101老司机| 蜜桃av综合| 久久免费99精品久久久久久| 黑人另类精品××××性爽| 538prom精品视频线放| 亚洲日本精品视频| 性一交一乱一区二区洋洋av| 国产亚洲精品自在久久| 久久久123| 日韩欧美高清dvd碟片| 久久精品国产亚洲AV成人婷婷| 亚洲免费中文| 久久草视频在线看| 热色播在线视频| 亚洲黄色av女优在线观看 | 欧美午夜片在线免费观看| 99热超碰在线| 国语精品一区| 粉嫩高清一区二区三区精品视频 | 婷婷中文字幕在线观看| 日韩欧美自拍| 成人a在线观看| 久热国产在线| 日韩一区二区三区视频| 久久国产精品二区| 高清国产一区二区三区| www.av91| 国产日韩三级| 538国产精品一区二区在线| 亚洲av片在线观看| 色婷婷国产精品久久包臀| 制服 丝袜 综合 日韩 欧美| 日韩av网站免费在线| 亚洲欧美日韩综合一区| av在线亚洲一区| 色综合91久久精品中文字幕 | 久久女同性恋中文字幕| 欧美丰满熟妇bbbbbb百度| 自拍偷拍欧美一区| 国产精品免费看久久久香蕉| 在线a免费看| 欧美一级理论片| 国产在线观看99| 99精品欧美一区二区三区综合在线| 日日橹狠狠爱欧美超碰| 国产剧情一区| 91在线免费视频| 波多野结衣乳巨码无在线观看| 日韩av网站导航| 五月激情丁香网| 亚洲欧美日韩中文字幕一区二区三区| 人妻精油按摩bd高清中文字幕| 亚洲欧洲一区二区天堂久久| 欧美一区二区三区在线播放| 日韩久久99| 隔壁老王国产在线精品| 九色视频在线观看免费播放| 91精品国产综合久久婷婷香蕉 | 美国黄色片视频| 懂色av一区二区三区免费看| 色综合av综合无码综合网站| 国产精品成人一区二区不卡| 国产欧美一区二区三区另类精品 | 欧美精品久久久久| 丰满少妇在线观看bd| 欧美日韩午夜剧场| 网站永久看片免费| 成人成人成人在线视频| 天天爽人人爽夜夜爽| 激情综合自拍| 亚洲va韩国va欧美va精四季| 99re6热只有精品免费观看| 热re99久久精品国产66热| 国内精品久久久久国产| 亚洲精品久久久久国产| 国产免费的av| 在线观看欧美黄色| 日韩欧美视频在线免费观看| 国产精品久久久久精k8| 午夜不卡久久精品无码免费| 久久97超碰国产精品超碰| heyzo国产| 国产精品av一区二区| 亚洲精品一区二区三区蜜桃久| 69精品国产久热在线观看| 国产精品久久久久久超碰| caoporn-草棚在线视频最| 色偷偷噜噜噜亚洲男人| 免费播放片a高清在线观看| 精品国产乱码久久久久久图片| 性色av一区二区三区四区| 偷拍与自拍一区| 国产中文字幕免费| 亚洲色图清纯唯美| 在线看片中文字幕| 久久久久久麻豆| 日本在线不卡一区二区| 国产一区二区不卡在线| 三级a三级三级三级a十八发禁止| 亚洲中字黄色| 欧美丰满熟妇bbbbbb百度| 一区在线观看| 国产精品视频网站在线观看| 亚洲先锋影音| 伊人精品久久久久7777| 国产亚洲欧美日韩在线观看一区二区 | 国产精品丝袜在线播放| 91久久久久久久| 伦一区二区三区中文字幕v亚洲| 国产成人在线播放| www.com.cn成人| 日韩美女福利视频| 日日夜夜天天综合| 国产a∨精品一区二区三区不卡| 日韩脚交footjobhd| 97香蕉超级碰碰久久免费的优势| 欧美草逼视频| 久久久亚洲精选| 77thz桃花论族在线观看| 久久久亚洲国产天美传媒修理工| 国产盗摄一区二区| 97激碰免费视频| 极品美鲍一区| 国产成人精品久久二区二区91| 校园春色亚洲色图| 国产精品黄页免费高清在线观看| 蜜桃精品在线| 国产一区二区在线免费| 成人国产精品久久| 福利精品视频| 精品一区二区男人吃奶| 久久久久久国产精品一区| 免费成人av| 色综合影院在线观看| 91亚洲国产| 久久观看最新视频| 国产综合精品| 怡红院av亚洲一区二区三区h| 国产人成精品一区二区三| 成人观看免费完整观看| 麻豆精品视频在线观看视频| 亚洲欧美一区二区三区不卡| 国产成人精品影院| 中国黄色a级片| 欧美国产一区二区在线观看| www.99re7| 午夜精品福利一区二区三区av| 亚洲永久精品在线观看| 欧美色综合久久| 不卡视频在线播放| 精品无码久久久久久国产| av片在线免费观看| 久久6免费高清热精品| 美女搞黄视频在线观看| 国产精品欧美风情| 波多野结衣一区二区三区免费视频| 激情久久av| 日韩一级毛片| 国产毛片视频网站| 精品一区二区三区欧美| 日韩成人av影院| 国产婷婷色一区二区三区四区| 欧美三级黄色大片| 欧美日韩一区二区免费在线观看 | 欧美电影免费提供在线观看| 欧美捆绑视频| 久久777国产线看观看精品| 亚洲精品成人图区| 亚洲字幕一区二区| 色综合综合网| 国产一级做a爰片久久毛片男| 久久免费高清| 95视频在线观看| 国产精品国产自产拍高清av王其| 日本少妇bbwbbw精品| 欧美制服丝袜第一页| 精品国自产拍在线观看| 在线视频亚洲欧美| 天堂av在线| 99精彩视频在线观看免费| 精品精品99| 欧美人与动牲交xxxxbbbb| 久久综合影视| 青青草成人免费视频| 一区二区三区在线免费播放| 久久久999久久久| 日韩高清免费观看| 午夜伦理大片视频在线观看| 国产欧美在线播放| 国产毛片一区二区三区| 你懂的av在线| 国产成人精品一区二区三区四区| 久久一级免费视频| 欧美亚洲日本国产| 精品推荐蜜桃传媒| 欧美在线视频网| 国产一区在线电影| 热久久最新网址| 国产乱码精品一品二品| 亚洲av成人精品一区二区三区| 亚洲乱码中文字幕综合| 国产精品羞羞答答在线| 综合国产在线视频| 欧美日韩五码| 天堂va久久久噜噜噜久久va| 亚洲女同在线| 亚洲av成人片色在线观看高潮| 亚洲午夜久久久久久久久电影院| 国产99久久九九精品无码免费| 日韩在线精品视频| 亚洲精品777| 一区二区视频在线观看| 久草在线在线精品观看| 成人黄色短视频| 69堂国产成人免费视频| 福利视频在线| 亚洲最大成人在线| 欧美人成网站| 一本色道久久hezyo无码| 亚洲一区二区三区中文字幕| 男人天堂一区二区| 97在线免费观看视频| 欧美一区二区三区久久| 日本免费黄视频| 久久久久久久久一| 久久影视中文字幕| 中文字幕日韩有码| 99精品美女视频在线观看热舞| 欧洲美女和动交zoz0z| 国产一区二区三区美女| 久久高清无码视频| 日韩高清有码在线| 欧美www.| 日韩视频在线免费播放| 国产麻豆精品久久一二三| 久久精品久久国产| 亚洲加勒比久久88色综合| 午夜激情电影在线播放| 日韩欧美视频一区二区| 精品一区二区av| 国产精品30p| 国产亚洲精品久久久久久牛牛| 国产伊人久久| 大陆极品少妇内射aaaaaa| av在线免费不卡| 欧美成人精品网站| 欧美大片在线影院| 伊人春色之综合网| www.国产视频.com| 亚洲成国产人片在线观看| 你懂的在线视频| 91精品久久久久久久久久| 亚洲午夜黄色| 极品人妻videosss人妻| 欧美一区二区日韩| 日本不卡免费高清视频在线| 亚洲欧美日韩综合一区| 成人美女在线观看| 在线观看亚洲一区二区| 久久久久久久久久久网站| 狠狠综合久久av一区二区蜜桃| 三级黄色片免费看| 欧美性猛xxx| 哥也色在线视频| 日韩高清av电影| 成人午夜电影久久影院| 中文字幕人妻一区二区三区视频 | 丰满岳乱妇一区二区三区| 日韩电影在线观看一区二区| 免费91在线视频| 国产精品自拍区| 亚洲麻豆一区二区三区| 欧美日韩亚洲综合在线| 男人天堂视频在线观看|