精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

實現輸入到輸出「模態自由」, NUS華人團隊開源NExT-GPT,最接近AGI的大一統多模態大模型來了

人工智能 新聞
繼各類輸入端多模態大語言模型之后,新加坡國立大學華人團隊近期開源一種支持任意模態輸入和任意模態輸出的真正「大一統」多模態大模型,火爆 AI 社區。

ChatGPT 的誕生,引爆了 2023 年的基于大語言模型的 AI 浪潮,此后各類開源大語言模型陸續問世,包括 Flan-T5、Vicuna、 LLaMA、Alpaca 等。隨后,社區繼續發力,為模擬這個多模態的世界,研究者們將純語言的大模型擴展到了處理語言之外的多模態大語言模型,諸如支持圖像類的 MiniGPT-4、BLIP-2、Flamingo、InstructBLIP 等,支持視頻類的 Video-LLaMA、PandaGPT 等,以及支持聲音類的 SpeechGPT 等等。

但目前的多模態大語言模型,距離真正人類級別的 AGI,總感覺少了點「內味」。沒錯,人類的認知和溝通必須無縫地在任何信息模態之間進行轉換。作為人類,我們不僅僅可以理解多模態內容,還能夠以多模態的方式靈活輸出信息。

對于現有的大語言模型,一方面,其大多局限于關注于某種單一模態信息的處理,而缺乏真正「任意模態」的理解;另一方面,其都關注于多模態內容在輸入端的理解,而不能以任意多種模態的靈活形式輸出內容。

正當大家都在期待 OpenAI 未來要發布的 GPT-5 是否能實現任意模態大一統功能時,幾天前,來自于新加坡國立大學的 NExT++ 實驗室的華人團隊率先開源了一款「大一統」通用多模態大模型「NExT-GPT」,支持任意模態輸入到任意模態輸出。目前 NExT-GPT 的代碼已經開源,并且上線了 Demo 系統。


  • 項目地址:https://next-gpt.github.io
  • 代碼地址:https://github.com/NExT-GPT/NExT-GPT
  • 論文地址:https://arxiv.org/abs/2309.05519

該實驗室在多模態學習方向的研究有著多年的耕耘,具有深厚的積累,而 NExT-GPT 的取名也雙關了實驗室的名字以及 GPT of Next generation 的寓意。

NExT-GPT 一經發布便受到了 AI 社區的大量關注。有網友表示,NExT-GPT 標識著全能型 LLM 的到來:

圖片

圖片

圖片

也有網友贊嘆,這才是未來的 LLM 大趨勢(大一統任意模態輸入輸出的 LLM):

圖片

接下來,我們來看看 NExT-GPT 可以實現哪些功能:

  • Text → Text + Image + Audio
  • Text + Image → Text + Image + Video + Image
  • Text + Video → Text + Image
  • Text + Video → Text + Audio
  • Text + Audio → Text + Image + Video
  • Text → Text + Image + Audio + Video
  • Text → Text + Image
  • Text + Video → Text + Image + Audio
  • Text → Text + Image + Audio + Video
  • Text → Text + Image

可看到,NExT-GPT 能夠準確理解用戶所輸入的各類組合模態下的內容,并準確靈活地返回用戶所要求的甚至隱含的多模態內容,常見的圖生文、圖生視頻、看圖像 / 聲音 / 視頻說話、圖像 / 聲音 / 視頻問答等問題統統不在話下,統一了跨模態領域的大部分常見任務,做到了真正意義上的任意到任意模態的通用理解能力。

作者在論文中還給出一些定量的實驗結果驗證,感興趣的讀者可以閱讀論文內容。

技術細節

那 NExT-GPT 是如何實現任意模態輸入到任意模態輸出的?原理非常簡單,作者甚至表示在技術層面上「沒有顯著的創新點」:通過有機地連接現有的開源 1) LLM, 2) 多模態編碼器和 3) 各種模態擴散解碼器,便構成了 NExT-GPT 的整體框架,實現任意模態的輸入和輸出,可謂大道至簡。

圖片

NExT-GPT 整體呈現為一個「編碼端 - 推理中樞 - 解碼器」三層架構:

  • 多模編碼階段:利用已開源的編碼器對各種輸入模態進行編碼,然后通過一個投影層將這些特征投影為 LLM 所能夠理解的「類似語言的」表征。作者采用了 MetaAI 的 ImageBind 統一多模態編碼器。
  • 推理中樞階段:利用開源 LLM 作為核心大腦來處理輸入信息,進行語義理解和推理。LLM 可以直接輸出文本,同時其還將輸出一種「模態信號」token,作為傳遞給后層解碼端的指令,通知他們是否輸出相應的模態信息,以及輸出什么內容。作者目前采用了 Vicuna 作為其 LLM。
  • 多模生成階段:利用各類開源的圖像擴散模型、聲音擴散模型以及視頻擴散模型,接收來自 LLM 的特定指令信號,并輸出所對應的模型內容(如果需要生成的指令)。

模型在推理時,給定任意組合模態的用戶輸入,通過模態編碼器編碼后,投影器將其轉換為特征傳遞給 LLM(文本部分的輸入將會直接出入到 LLM)。然后 LLM 將決定所生成內容,一方面直接輸出文本,另一方面輸出模態信號 token。如果 LLM 確定要生成某種模態內容(除語言外),則會輸出對應的模態信號 token,表示該模態被激活。技術示意圖如下:

圖片

文中作者指出,NExT-GPT 可能并不是實現任意模態輸入到任意模態輸出功能的首個工作。目前有兩類前驅工作:

  • 一類是不久前所發布的 CoDi 模型,其整合了各種模態的 diffusion 模型,可以同時處理和生成各種組合的模態內容。然而作者指出,CoDi 由于缺乏 LLMs 作為其核心部件,其僅限于成對(Parallel)內容的輸入和生成,而無法實現復雜的內容推理和決策,根據用戶輸入的指令靈活響應。
  • 另一類工作則試圖將 LLMs 與現有的外部工具結合,以實現近似的「任意多模態」理解和生成,代表性的系統如 Visual-ChatGPT 和 HuggingGPT。但作者指出,由于這類系統在不同模塊之間的信息傳遞完全依賴于 LLM 所生成的文本,其割裂、級聯的架構容易不可避免地引入了噪音,降低不同模塊之間的特征信息傳遞效用。并且其僅利用現有外部工作進行預測,缺乏一種整體的端到端訓練,這對于充分理解用戶的輸入內容和指令是不利的。

而 NExT-GPT 可以良好地解決如上所述的現有工作問題。那么 NExT-GPT 有哪些關鍵點呢?

  • 關鍵點-1:低成本實現復雜推理 + 多模態 in 和多模態 out

如前文所述,不僅要繼承 LLM 所具備的復雜內容理解和推理能力,還需要實現任意模態的輸入和輸出。若考慮從零開始構建整個系統,代價將會巨大(除非是大廠才能承擔成本),也不利于開源和傳播。考慮到現有的大模型已經基本實現了多模態的輸入,為實現全能的大一統多模態能力,因此最關鍵的一點在于高性能的多模態輸出。為此,NExT-GPT 完全基于現有開源的高性能模塊(比如目前性能最強的擴散模型),充分站在巨人的肩膀上,以最低的成本實現大一統多模態大模型的構建目標(實驗室可承擔級別的成本)。

  • 關鍵點-2:高效率端到端訓練和模態對齊學習

妥當的、端到端的系統訓練是 NExT-GPT 區別于現有其他組合型統一大模型系統最重要的一點,也是保證 NExT-GPT 具有優秀性能的前提。另一方面,還需要充分對齊系統中的所有模態的特征表征。為了既保證具有較好的學習成效,又全面降低、控制學習成本,本工作包含了以下的亮點。

首先,NExT-GPT 考慮分別在編碼層 - LLM 之間以及 LLM - 解碼層之間插入投影層(Projection Layers)。在凍結大規模參數的基座「編碼層 - LLM - 解碼層」情況下,僅去訓練參數量極低的投影層部分(以及在指令微調時基于 LoRA 的 LLM 低代價更新),作者實現了僅僅 1% 參數量的訓練代價。

圖片

具體通過 1)以 LLM 為中心的編碼端多模態對齊學習,和 2)局部微調的解碼端指令跟隨增強學習實現。

圖片

另外,對于多模態大模型,為確保其能夠充分忠于用戶指令而響應,進一步的指令調整(IT)是非常有必要的。不同于現有的多模態大模型其輸出端僅涉及到文本,我們的 NExT-GPT 系統,其輸入和輸出端同時覆蓋了各類模態信息。

為此,作者提出了一種模態切換指令微調學習(Modality-switching Instruction Tuning,MosIT),技術內涵如下圖所示。同時,由于現存的多模態指令微調數據集都無法滿足任意多模態 LLM 場景(即 MosIT)的要求,我們因此構建了一套 MosIT 數據集。該數據涵蓋了各種多模態輸入和輸出,提供了必要的復雜性和變異性,幫助提升 NExT-GPT 獲得優越的多模態指令跟隨和相應能力。

圖片

結論和未來展望

總體上,NExT-GPT 系統展示了構建一個通用大一統多模態的 AI 模型的美好景愿和喜人的可能性,這將為 AI 社區中后續的更「人類水平」的人工智能研究提供寶貴的借鑒。

基于 NExT-GPT,后續的研究工作可以考慮以下幾個方面:

1. 模態與任務擴展:受限于現有資源,目前作者所開源的 NExT-GPT 系統僅支持四種模態:語言、圖像、視頻和音頻。作者表示,后續會逐步擴展到更多的模態(例如,網頁、3D 視覺、熱圖、表格和圖表)和任務(例如,對象檢測、分割、定位和跟蹤),以擴大系統的普遍適用性。

2. 考慮更多基座 LLM:目前作者實現了基于 7B 版本的 Vicuna LLM,其表示下一步將整合不同大小的 LLM,以及其他 LLM 類型。

3. 多模態生成策略:目前版本的 NExT-GPT 系統僅考慮了基于擴散模型的純輸出方式的多模態輸出。然而生成模式容易輸出錯誤幻想內容(Hallucination),并且輸出內容的質量往往容易受到擴散模型能力的限制。因此,進一步提升擴散模型的性能很關鍵,這能直接幫助提高多模態內容的輸出質量。另外,實際上可以整合基于檢索的方法來補充基于生成的過程的弊端,從而提升整體系統的輸出可靠性。

4. 降低多模態支持成本:可以考慮進一步降低對更多模態的支持的成本。NExT-GPT 考慮了 ImageBind 來統一多種模態的編碼,從而節省了在編碼端的代價。而對于多模態輸出端,作者簡單地集成了多個不同模態的擴散模型。如何防止隨著模態的增加而動態增加解碼器是后續的重要研究方面。比如可以考慮將一些支持不同模態生成(但具有模態共性)的擴散模型進行復用。

5. MosIT 數據集擴展:目前 NExT-GPT 所使用的 MosIT 數據集規模受限,這也會限制其與用戶的交互表現。后續研究可以進一步提升模態切換指令微調學習策略以及數據集。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-05-10 14:58:06

開源模型

2025-03-13 10:18:42

2025-07-17 10:33:53

2024-08-26 07:40:00

AI訓練

2025-04-16 02:55:00

2025-04-14 09:38:00

2022-11-29 15:15:47

AI模型

2023-07-22 13:17:33

人工智能框架

2025-06-09 09:50:00

VeactReact

2024-04-23 13:38:00

AI數據

2025-03-18 09:29:54

2025-06-13 08:46:00

2015-07-30 12:27:30

重郵華為

2017-12-15 17:14:10

云端

2023-07-17 08:03:03

Shell腳本SQL

2023-04-11 09:43:21

模型AI

2015-05-06 13:52:52

微軟外媒

2014-07-29 13:25:43

WWDC 2014 S

2024-09-27 17:58:26

2025-01-08 08:21:16

點贊
收藏

51CTO技術棧公眾號

午夜视频在线看| 91porny在线| 精品久久亚洲| 亚瑟在线精品视频| 日本成人看片网址| 97精品人妻一区二区三区| 欧美99在线视频观看| 亚洲精品电影久久久| 国产精品视频黄色| 欧洲一区二区三区| 久久久青草青青国产亚洲免观| 国产欧美精品一区二区三区介绍| 久久99久久久| 国产精品免费大片| 欧美成人精品3d动漫h| 999香蕉视频| 在线视频观看国产| 欧美激情在线一区二区| 国产成人亚洲欧美| 亚洲天堂手机在线| 午夜亚洲福利在线老司机| 日韩亚洲精品视频| 亚洲av综合一区二区| 日韩三级不卡| 欧美日韩美女一区二区| 日韩视频第二页| 青青草原国产在线| 亚洲人妖av一区二区| 秋霞在线观看一区二区三区| 亚洲精品久久久久久久久久| 精品一区二区久久久| 国产成人精品午夜| 久久国产精品免费看| 精品成人在线| 欧美高清视频在线观看| 黄色录像免费观看| 区一区二视频| 怡红院精品视频| 短视频在线观看| 国产精品22p| 欧美一二三在线| 成 人 黄 色 小说网站 s色| 日韩欧美一区二区三区在线观看| 午夜视频在线观看一区二区| 成人一级生活片| sm国产在线调教视频| 国产香蕉久久精品综合网| 久久久www免费人成黑人精品| 亚洲AV无码乱码国产精品牛牛 | 久久精品国产亚洲7777| 在线观看日本黄色| 久久亚洲国产| 自拍偷拍亚洲一区| 天天色天天综合| 99久久夜色精品国产亚洲1000部| 夜夜躁日日躁狠狠久久88av| 黄色av免费播放| 欧美一区二区麻豆红桃视频| 亚洲性无码av在线| 久久久精品成人| jlzzjlzz亚洲女人| 中国日韩欧美久久久久久久久| 日韩福利在线视频| 色喇叭免费久久综合网| 日韩视频在线观看免费| 五月婷婷综合激情网| 国产韩国精品一区二区三区| 麻豆成人在线看| 久久久国产精华液| 国产欧美日韩一级| 国产成人精品日本亚洲| 国产又大又黄又爽| 国产精品一二三四| 国产精品一区视频| 日韩精品视频无播放器在线看 | 久青草免费视频| 国产情侣久久| 国产精品久久久久av| 91久久精品国产91性色69 | 色噜噜在线观看| 久久91精品| 精品国产视频在线| 动漫精品一区一码二码三码四码| 美女久久一区| 国产欧美欧洲在线观看| 精品国产无码一区二区| 99视频在线观看一区三区| 日韩精品欧美在线| www.欧美日本韩国| 日韩欧美在线视频免费观看| 欧美丝袜在线观看| www.亚洲一二| 在线看欧美日韩| 久久久久久免费观看| 久久精品1区| 亚洲在线视频观看| 免费在线观看一级毛片| 亚洲欧美自拍偷拍| 免费av网址在线| 涩爱av色老久久精品偷偷鲁| 亚洲人成电影在线| 无码人妻精品一区二区三区夜夜嗨| 夜久久久久久| 成人精品视频在线| 三区在线观看| 一区二区三区在线播放| 黄色三级视频在线| 欧美午夜寂寞| 欧美成人久久久| 波多野结衣在线电影| 粉嫩av一区二区三区| 亚洲国产一区二区精品视频| а√在线中文网新版地址在线| 欧美日韩国产中文| 成年人网站免费在线观看| 综合精品久久| 国产精品美女午夜av| 深夜福利视频在线观看| 亚洲激情av在线| 国产成人美女视频| 国产剧情在线观看一区| 欧美亚洲激情在线| 丰满岳乱妇国产精品一区| 亚洲天堂av一区| 日韩精品你懂的| 国产精品探花在线观看| 91精品国产91久久久久久最新| 国产富婆一级全黄大片| 国产精品二区一区二区aⅴ污介绍| 国产xxxxx在线观看| 成人知道污网站| 久久99亚洲热视| 国产免费叼嘿网站免费| 国产精品久久午夜| 国产一二三区av| 欧美一区三区| 国产精品av电影| 黄网站在线观看| 色婷婷久久久亚洲一区二区三区 | 日韩极品少妇| 国内精品久久久久伊人av| 亚洲av无码国产精品永久一区| 最新中文字幕一区二区三区| 爱豆国产剧免费观看大全剧苏畅| 第一会所亚洲原创| 国产精品网站大全| 日韩av中文| 欧美精品久久久久久久多人混战| 国产极品视频在线观看| 麻豆精品一二三| 亚洲一区精品视频| 999精品视频在线观看| 久久久成人av| 精品国产18久久久久久| 一区二区三区久久| 污污免费在线观看| 国产精品综合| 欧美亚洲精品日韩| 69堂免费精品视频在线播放| 中文字幕亚洲图片| 国产精品乱码一区二区| 一区二区免费看| 黄色免费看视频| 午夜在线精品| 亚洲精品视频一二三| 懂色av色香蕉一区二区蜜桃| 欧美久久久精品| 天堂中文字幕av| 色婷婷国产精品| 五月婷婷欧美激情| 国产精品影音先锋| 国产主播自拍av| 国产一区国产二区国产三区| 国产精品中文字幕在线| 亚洲小说区图片区都市| 亚洲国产成人久久| 激情视频网站在线观看| 国产精品国产三级国产普通话三级| 天天干天天色天天干| 在线播放亚洲| 亚洲v国产v| 91国内精品| 国产成人福利网站| 91高清在线观看视频| 亚洲黄色av网站| 中文字幕在线播放不卡| 一级日本不卡的影视| 欧美激情aaa| 国产精品一区专区| 欧美黄色免费影院| 亚洲国产一成人久久精品| 国产精品三区在线| 国产成人毛片| 国内精品免费午夜毛片| 日韩黄色影院| 亚洲男女性事视频| 国产福利免费视频| 欧美伊人久久久久久久久影院 | 一级毛片视频在线| 亚洲激情在线观看| 国产永久免费视频| 欧美午夜激情小视频| 区一区二区三区中文字幕| 91麻豆精品国产综合久久久 | 成人一区在线看| 91视频免费版污| 狠狠干综合网| 一级二级三级欧美| 最新国产一区| 高清视频在线观看一区| 欧美高清影院| 国产精品2018| 性感女国产在线| 欧美二区乱c黑人| 男人的天堂在线视频免费观看| 日韩精品在线观看网站| 性一交一乱一透一a级| 欧美日韩视频第一区| 欧美激情黑白配| 亚洲国产欧美日韩另类综合| 在线观看美女av| 亚洲国产精品高清| 中文字幕成人动漫| av在线这里只有精品| 日本少妇一级片| 精品一区二区三区香蕉蜜桃 | 精品亚洲a∨| 日韩av黄色在线观看| 成年人黄色大片在线| 色中色综合影院手机版在线观看| 日本a级在线| 中文字幕精品在线| 粉嫩av在线播放| 国产小视频国产精品| 久久久久久久久亚洲精品| 亚洲国产天堂久久综合| 亚洲国产精品无码久久| 欧美草草影院在线视频| 99在线精品视频免费观看软件| 欧美色老头old∨ideo| 日本欧美www| 在线免费不卡视频| 亚洲婷婷久久综合| 欧美图区在线视频| 懂色av蜜臀av粉嫩av喷吹| 欧美在线观看视频一区二区三区| 精品久久久久久久久久久久久久久久| 精品国产精品三级精品av网址| 国产精品7777777| 疯狂欧美牲乱大交777| 91美女免费看| 色八戒一区二区三区| 精品久久久久久久久久久国产字幕| 一本色道久久综合精品竹菊| 中文字幕精品视频在线观看| 欧美视频一区二区三区四区| 一级淫片免费看| 日韩一区二区三区三四区视频在线观看 | 在线观看一区日韩| 波多野结衣mp4| 欧美日韩国产综合视频在线观看 | 国产午夜福利一区二区| 精品国产老师黑色丝袜高跟鞋| 亚洲成人第一网站| 欧美视频在线不卡| jizz中国女人| 欧美精品一区二区蜜臀亚洲| 午夜国产在线视频| 亚洲性无码av在线| 国产视频中文字幕在线观看| 欧美激情精品久久久久久大尺度| 精品极品在线| 国产精品久久久久久av福利| 亚洲综合资源| 国产精品一区免费观看| 欧美色爱综合| 欧美成人精品免费| 天堂av在线一区| 五月天视频在线观看| 成人小视频免费在线观看| 亚洲午夜久久久久久久久红桃| 欧美国产视频在线| 黄页网站免费观看| 日韩欧美主播在线| 国产日产亚洲系列最新| 日韩成人av在线| 天堂а√在线资源在线| 久久久久日韩精品久久久男男 | 欧洲国内综合视频| a级片在线免费看| 亚洲美女www午夜| 4438x成人网全国最大| 欧美一级高清免费| 精品网站999| 欧美一区二区三区四区五区六区| 一区二区三区国产精华| 东京热加勒比无码少妇| 国产成人免费视| www久久久久久久| 亚洲国产精品久久人人爱| 中文字幕一区二区三区四区视频 | 国产+高潮+白浆+无码| 中文久久乱码一区二区| 久草网视频在线观看| 欧美日本一区二区三区| 四虎精品在线| 欧美国产日韩一区二区三区| 欧美123区| 国产自产精品| 国产精品s色| 97超碰成人在线| 久久先锋影音av鲁色资源| 久久久久久久久久久网| 欧美军同video69gay| 你懂的免费在线观看| 久久久亚洲天堂| 久久久久久爱| 亚洲无玛一区| 日韩av在线免费观看不卡| 青青草成人免费视频| 一区二区三区91| 国产偷人妻精品一区二区在线| 亚洲午夜精品久久久久久久久久久久| 白白色在线观看| 91精品黄色| 亚洲欧美在线专区| 亚洲欧美国产日韩综合| 国产亚洲精品超碰| 丁香六月婷婷综合| 日韩经典一区二区三区| 国产精选在线| 精品国产免费久久久久久尖叫| 黄色欧美成人| 国产欧美视频一区| 一区二区成人在线| 国内老熟妇对白hdxxxx| 美女少妇精品视频| 国产精品一区二区三区av | 精品视频在线免费| yjizz视频网站在线播放| 国产成人欧美在线观看| 欧美日韩123| 欧美少妇性生活视频| 欧美激情一区二区三区蜜桃视频| 69av视频在线观看| 最新中文字幕亚洲| 先锋影音网一区二区| 日本黄色播放器| 国产老肥熟一区二区三区| 欧美成人免费看| 亚洲成人精品久久久| 24小时免费看片在线观看| 久久精品美女| 久久婷婷麻豆| 五月激情四射婷婷| 欧美日本韩国一区二区三区视频| 日本精品在线| 91在线看网站| 99热免费精品| 国产人妻大战黑人20p| 欧美色图一区二区三区| 欧洲美女少妇精品| 91九色在线观看| 亚洲乱码久久| 精品无码国产污污污免费网站| 欧美午夜精品免费| av毛片在线免费看| 国产亚洲第一区| 日产欧产美韩系列久久99| 免费观看特级毛片| 欧美大片在线观看一区| 热色播在线视频| 亚洲精品在线视频观看| 国产精品18久久久| 国产美女激情视频| 色妞色视频一区二区三区四区| 日本一区精品视频| 国产特级黄色大片| 国产精品狼人久久影院观看方式| 999久久久久久| 91av国产在线| 午夜精品一区二区三区国产| 97人妻精品一区二区三区免费 | 狠狠综合久久av一区二区蜜桃| 色国产在线视频| 亚洲成人www| 中文日本在线观看| 粉嫩av四季av绯色av第一区| 日韩制服丝袜av| 婷婷色中文字幕| 亚洲小视频在线观看| 香蕉大人久久国产成人av| 麻豆传传媒久久久爱| 夜夜亚洲天天久久| 成人网视频在线观看| 国产精品一区二区免费| 久久精品理论片| 天天操中文字幕| 欧美成人精品在线观看| 精品久久久久久久|