精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

3000多條數據里選出200條效果反而更好,MiniGPT-4被配置相同的模型超越了

人工智能 新聞
今年四月誕生的多模態大型語言模型 MiniGPT-4 不僅能看圖聊天,還能利用手繪草圖建網站,可以說是功能強大。而在預訓練之后的微調階段,該模型使用了 3000 多個數據。確實很少,但上海交通大學清源研究院和里海大學的一個聯合研究團隊認為還可以更少,因為這些數據中大部分質量都不高。他們設計了一個數據選擇器,從中選出了 200 個數據,然后訓練得到了 InstructionGPT-4 模型,其表現竟

在生成細節豐富和精確的圖像描述方面,GPT-4 已經展現出了強大超凡的能力,其標志著一個語言和視覺處理新時代的到來。

因此,類似于 GPT-4 的多模態大型語言模型(MLLM)近來異軍突起,成為了一個炙手可熱的新興研究領域,其研究核心是將強大的 LLM 用作執行多模態任務的認知框架。MLLM 出人意料的卓越表現不僅超越了傳統方法,更使其成為了實現通用人工智能的潛在途徑之一。

為了創造出好用的 MLLM,需要使用大規模的配對的圖像 - 文本數據以及視覺 - 語言微調數據來訓練凍結的 LLM(如 LLaMA 和 Vicuna)與視覺表征(如 CLIP 和 BLIP-2)之間的連接器(如 MiniGPT-4、LLaVA 和 LLaMA-Adapter)。

MLLM 的訓練通常分為兩個階段:預訓練階段和微調階段。預訓練的目的是讓 MLLM 獲得大量知識,而微調則是為了教會模型更好地理解人類意圖并生成準確的響應。

為了增強 MLLM 理解視覺 - 語言和遵循指令的能力,近期出現了一種名為指令微調(instruction tuning)的強大微調技術。該技術有助于將模型與人類偏好對齊,從而讓模型在各種不同的指令下都能生成人類期望的結果。在開發指令微調技術方面,一個頗具建設性的方向是在微調階段引入圖像標注、視覺問答(VQA)和視覺推理數據集。InstructBLIP 和 Otter 等之前的技術的做法是使用一系列視覺 - 語言數據集來進行視覺指令微調,也得到了頗具潛力的結果。

但是,人們已經觀察到:常用的多模態指令微調數據集包含大量低質量實例,即其中的響應是不正確或不相關的。這樣的數據具有誤導性,并會對模型的性能表現造成負面影響。

這一問題促使研究人員開始探究這一可能性:能否使用少量高質量的遵循指令數據來獲得穩健的性能表現?

近期的一些研究得到了鼓舞人心的成果,表明這個方向是有潛力的。比如 Zhou et al. 提出了 LIMA ,這是一個使用人類專家精挑細選出的高質量數據微調得到的語言模型。該研究表明,即使使用數量有限的高質量遵循指令數據,大型語言模型也可以得到讓人滿意的結果。所以,研究人員得出結論:在對齊方面,少即是多(Less is More)。然而,對于如何為微調多模態語言模型選擇合適的高質量數據集,之前還沒有一個清晰的指導方針。

上海交通大學清源研究院和里海大學的一個研究團隊填補了這一空白,提出了一個穩健有效的數據選擇器。這個數據選擇器能夠自動識別并過濾低質量視覺 - 語言數據,從而確保模型訓練所使用的都是最相關和信息最豐富的樣本。

論文地址:https://arxiv.org/abs/2308.12067

研究者表示,這項研究關注的重點是探索少量但優質的指令微調數據對微調多模態大型語言模型的功效。除此之外,這篇論文還引入了幾個專為評估多模態指令數據的質量而設計的新指標。在圖像上執行譜聚類之后,數據選擇器會計算一個加權分數,其組合了 CLIP 分數、GPT 分數、獎勵分數和每個視覺 - 語言數據的答案長度。

通過在用于微調 MiniGPT-4 所用的 3400 個原始數據上使用該選擇器,研究者發現這些數據大部分都有低質量的問題。使用這個數據選擇器,研究者得到了一個小得多的精選數據子集 —— 僅有 200 個數據,只有原始數據集的 6%。然后他們使用 MiniGPT-4 一樣的訓練配置,微調得到了一個新模型:InstructionGPT-4。

研究者表示這是一個激動人心的發現,因為其表明:在視覺 - 語言指令微調中,數據的質量比數量更重要。此外,這種更加強調數據質量的變革提供了一個能提升 MLLM 微調的更有效的新范式。

研究者進行了嚴格的實驗,對已微調 MLLM 的實驗評估集中于七個多樣化且復雜的開放域多模態數據集,包括 Flick-30k、ScienceQA、 VSR 等。他們在不同的多模態任務上比較了使用不同數據集選取方法(使用數據選擇器、對數據集隨機采樣、使用完整數據集)而微調得到的模型的推理性能,結果展現了 InstructionGPT-4 的優越性。

此外還需說明:研究者用于評估的評價者是 GPT-4。具體而言,研究者使用了 prompt 將 GPT-4 變成了評價者,其可以使用 LLaVA-Bench 中的測試集來比較 InstructionGPT-4 和原始 MiniGPT-4 的響應結果。

結果發現,盡管與 MiniGPT-4 所用的原始指令遵循數據相比,InstructionGPT-4 使用的微調數據僅有 6% 那么一點點,但后者在 73% 的情況下給出的響應都相同或更好。

這篇論文的主要貢獻包括: 

  • 通過選擇 200 個(約 6%)高質量的指令遵循數據來訓練 InstructionGPT-4,研究者表明可以為多模態大型語言模型使用更少的指令數據來實現更好的對齊。 
  • 文中提出了一種數據選擇器,其使用了一種可解釋的簡單原則來選取用于微調的高質量多模態指令遵循數據。這種方法力求在數據子集的評估和調整中實現有效性和可移植性。 
  • 研究者通過實驗表明這種簡單技術能夠很好地應對不同任務。相比于原始的 MiniGPT-4,僅使用 6% 已過濾數據微調得到的 InstructionGPT-4 在多種任務上都取得了更優表現。

方法

這項研究的目標是提出一種簡單且可移植的數據選擇器,使其能自動從原始微調數據集中精選出一個子集。為此,研究者定義了一個選取原則,該原則關注的重點是多模態數據集的多樣化和質量。下面將簡單介紹一下。

選取原則

為了有效地訓練 MLLM,選取有用的多模態指令數據是至關重要的。而為了選出最優的指令數據,研究者提出了兩大關鍵原則:多樣性和質量。對于多樣性,研究者采用的方法是對圖像嵌入進行聚類,以將數據分成不同的組別。為了評估質量,研究者采用了一些用于高效評估多模態數據的關鍵指標。

數據選擇器

給定一個視覺 - 語言指令數據集和一個預訓練 MLLM(如 MiniGPT-4 和 LLaVA),數據選擇器的最終目標是識別出一個用于微調的子集并且使得該子集能為預訓練 MLLM 帶來提升。

為了選出這個子集并確保其多樣性,研究者首先是使用一個聚類算法將原始數據集分成多個類別。

為了確保所選出的多模態指令數據的質量,研究者制定了一套用于評估的指標,如下表 1 所示。

表 2 則給出了在計算最終分數時,每個不同分數的權重。

算法 1 展示了數據選擇器的整個工作流程。

實驗

實驗評估中所使用的數據集如下表 3 所示。

基準分數

表 4 比較了 MiniGPT-4 基準模型、使用隨機采樣的數據微調得到的 MiniGPT-4 以及使用數據選擇器微調得到的 InstructionGPT-4 的表現。

圖片

可以觀察到,InstructionGPT-4 的平均表現是最好的。具體來說,InstructionGPT-4 在 ScienceQA 的表現超過基準模型 2.12%,在 OKVQA 和 VCR-OC 上則分別超過基準模型 2.49% 和 4.19%。

此外,InstructionGPT-4 在除 VSR 之外的所有其它任務上都優于用隨機樣本訓練的模型。通過在一系列任務上評估和對比這些模型,可以辨別出它們各自的能力,并確定新提出的數據選擇器的效能 —— 數據選擇器能有效識別高質量數據。

這樣的全面分析表明:明智的數據選擇可以提升模型在各種不同任務上的零樣本性能。

GPT-4 評估

LLM 本身存在固有的位置偏見,對此可參閱機器之心文章《語言模型悄悄偷懶?新研究:上下文太長,模型會略過中間不看》。因此研究者采取了措施來解決這一問題,具體來說就是同時使用兩種排布響應的順序來執行評估,即將 InstructionGPT-4 生成的響應放在 MiniGPT-4 生成的響應之前或之后。為了制定明確的評判標準,他們采用了「贏-平-輸」(Win-Tie-Lose)框架:

1) 贏:InstructionGPT-4 在兩種情況下都贏或贏一次平一次;

2) 平:InstructionGPT-4 與 MiniGPT-4 平局兩次或贏一次輸一次;

3) 輸:InstructionGPT-4 輸兩次或輸一次平一次。

圖 1 展示了這種評估方法的結果。

在 60 個問題上,InstructionGPT-4 贏 29 局,輸 16 局,其余 15 局平局。這足以證明在響應質量上,InstructionGPT-4 明顯優于 MiniGPT-4。

消融研究

表 5 給出了消融實驗的分析結果,從中可以看出聚類算法和各種評估分數的重要性。

圖片

演示

為了深入了解 InstructionGPT-4 在理解視覺輸入和生成合理響應方面的能力,研究者還對 InstructionGPT-4 和 MiniGPT-4 的圖像理解和對話能力進行了對比評估。該分析基于一個顯眼的實例,涉及到對圖像的描述以及進一步的理解,結果見表 6。

InstructionGPT-4 更擅長提供全面的圖像描述和識別圖像中有趣的方面。與 MiniGPT-4 相比,InstructionGPT-4 更有能力識別圖像中存在的文本。在這里,InstructionGPT-4 能夠正確指出圖像中有一個短語:Monday, just Monday.

更多細節請參見原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-10-17 12:47:26

AI數據

2023-09-27 07:39:57

大型語言模型MiniGPT-4

2023-04-24 09:28:53

2025-05-13 02:22:00

2023-04-21 09:49:36

GPTAI

2015-03-03 09:52:02

2012-06-08 09:30:51

Access

2024-05-11 12:34:51

EasyExcelOOM代碼

2020-06-16 16:27:28

戴爾

2024-06-11 09:20:48

2021-04-26 11:43:18

大數據數據分析五一

2024-04-08 10:12:20

GPT4AgentAI

2020-02-06 11:30:08

代碼JavaScript&&

2023-06-18 23:13:27

MySQL服務器客戶端

2023-10-30 09:16:00

模型訓練

2025-05-30 00:00:00

微軟Google顯示器

2019-06-24 11:07:34

數據數據庫存儲

2018-06-21 09:12:01

編程語言Python數據分析

2022-04-06 14:15:10

Python數據
點贊
收藏

51CTO技術棧公眾號

日批视频在线看| 久久精品国产精品亚洲精品色| 激情五月色婷婷| 国产精品欧美日韩一区| 欧美自拍偷拍一区| 国产av第一区| 蜜臀av午夜精品| 老司机精品导航| 久久高清视频免费| 国产精品无码网站| 91成人app| 精品日韩美女的视频高清| 亚洲精品一区二区三区四区五区| 99国产精品欲| 老鸭窝毛片一区二区三区| 日韩一中文字幕| 男人的天堂影院| av免费在线一区| 亚洲一区二区欧美| 亚洲一区二区三区涩| 无码精品人妻一区二区三区影院| 麻豆中文一区二区| 午夜精品久久久久久久99热浪潮 | 久久免费电影| 久久久久久久久久美女| 亚洲在线www| www亚洲视频| 综合久久久久| 一区二区av在线| 国产一级伦理片| 国产精品毛片aⅴ一区二区三区| 懂色av一区二区三区| 永久免费看av| 亚洲搞黄视频| wwwwww.欧美系列| 99一区二区三区| 在线观看日韩一区二区| 久久福利一区| 久久久久久久久久久亚洲| 夫妻性生活毛片| 操欧美老女人| 亚洲欧美色图片| 污污污www精品国产网站| 亚洲网一区二区三区| 欧美美女直播网站| 国产wwwxx| 欧美大片免费观看网址| 午夜精品久久久久久久久| 福利在线小视频| 黄色片免费在线观看| 国产欧美精品一区aⅴ影院| 欧美伦理一区二区| 美国一级片在线免费观看视频 | 亚洲xxxxx| 91九色蝌蚪91por成人| 日韩精品一级二级 | 国产无码精品在线观看| 韩国久久久久| 高清欧美性猛交xxxx| 久久久国产精华液| 欧美黄污视频| 欧美黑人一区二区三区| 国产一级片久久| 欧美午夜久久| 97国产一区二区精品久久呦| 日本熟女一区二区| 国产午夜精品一区二区三区欧美| 欧美在线国产精品| 亚洲黄色免费观看| 日韩**一区毛片| 国产精品一二三在线| 91高潮大合集爽到抽搐| 国产一区二区0| 国产精品污www一区二区三区| 日本美女一级视频| 91丨九色porny丨蝌蚪| 欧美性xxxx69| 色网站免费在线观看| 亚洲精品乱码久久久久久| www.好吊操| 亚洲性受xxx喷奶水| 欧美在线视频不卡| 一二三级黄色片| 亚洲欧洲国产精品一区| 亚洲国产精品嫩草影院久久| 香蕉网在线播放| 欧美日韩xxxx| 成人444kkkk在线观看| 国产精品成人国产乱| 乱人伦精品视频在线观看| 国产专区欧美专区| 手机看片福利在线| 中文字幕久久午夜不卡| 亚洲国产一二三精品无码| 性欧美xxx69hd高清| 欧美日韩亚洲综合一区| 精品伦一区二区三区| 伊人久久大香线蕉无限次| 中文字幕亚洲专区| 国产一级理论片| 男男视频亚洲欧美| 国产精品一区二区在线观看 | 91年精品国产| 亚洲一区不卡在线| 国产一二三在线| 欧美日韩电影一区| 国产精品久久久久久久无码| 色135综合网| 91chinesevideo永久地址| 中文字幕日韩第一页| 国产91精品一区二区麻豆网站 | 一本一道精品欧美中文字幕| 成人免费视频一区二区| 亚洲一区精彩视频| 人在线成免费视频| 日韩一区二区在线观看视频| 欧美黄色一级生活片| 欧美色综合网| 国产有码一区二区| 国产一级网站视频在线| 亚洲国产精品久久一线不卡| 亚洲天堂国产视频| 国产在线日韩精品| 97色在线视频| www.av黄色| 国产精品高潮呻吟| 国产v亚洲v天堂无码久久久| 99re8这里有精品热视频8在线 | 小早川怜子久久精品中文字幕| 欧美精品不卡| 成人日韩av在线| 国产黄色免费在线观看| 欧美三级免费观看| 中文字幕在线视频播放| 欧美精品18| 91欧美精品成人综合在线观看| 黄网在线免费| 欧美午夜美女看片| 性欧美丰满熟妇xxxx性久久久| 国产高清一区| 国产精品久久久久久久一区探花 | 国产一区二区色噜噜| 亚洲丝袜av一区| 日日摸天天添天天添破| av在线不卡观看免费观看| 性高湖久久久久久久久aaaaa| 日韩精品一区二区三区中文在线| 深夜精品寂寞黄网站在线观看| 无码日韩精品一区二区| 久久久亚洲欧洲日产国码αv| 国产在线播放观看| 国产成人精品亚洲线观看| 欧美国产乱视频| 性猛交富婆╳xxx乱大交天津| 一区二区在线观看免费视频播放| 古装做爰无遮挡三级聊斋艳谭| 亚洲mv大片欧洲mv大片| 成人日韩av在线| 97超碰在线公开在线看免费| 日韩亚洲欧美一区| 久草视频在线资源| 成人av在线资源网| 国产女大学生av| 综合亚洲色图| 国产精品久久久久77777| av电影在线观看| 欧美猛男超大videosgay| 26uuu成人网| 粉嫩aⅴ一区二区三区四区| 日本阿v视频在线观看| 欧美电影在线观看免费| 日本久久久久亚洲中字幕| 岛国在线视频免费看| 欧美高清视频一二三区 | 国产最新免费视频| 美女毛片一区二区三区四区| 国产精品第1页| 免费的黄网站在线观看| 欧美一区二区在线免费观看| 香蕉视频一区二区| 久久久不卡网国产精品一区| 国产精品一区二区小说| 欧美伊人久久| 欧美精品二区三区四区免费看视频| 三级成人在线| 久久不射热爱视频精品| 日韩中文字幕免费在线观看| 色999日韩国产欧美一区二区| 成人精品一二三区| 成人免费的视频| 一道本视频在线观看| 欧美日韩国产亚洲一区| 欧美日本亚洲| 成人在线精品| 日本人成精品视频在线| 国产写真视频在线观看| 日韩精品中文字幕视频在线| 国产又粗又猛又爽又黄的| 亚洲一区二区三区四区的| 中国毛片在线观看| 国产一区二区在线免费观看| 亚洲熟妇av一区二区三区漫画| 欧美wwwww| 精品无人区一区二区三区| 久久久加勒比| 国产91对白在线播放| 乱人伦中文视频在线| 精品调教chinesegay| 国产女人高潮的av毛片| 色婷婷av一区二区三区大白胸| 成年人一级黄色片| 久久精品人人做人人爽人人| 国产又黄又嫩又滑又白| 蜜臀av一级做a爰片久久| av在线播放亚洲| 99精品视频精品精品视频| 蜜桃臀一区二区三区| 日韩视频一区二区三区四区| 国产精品女主播| 涩涩视频在线免费看| 欧美第一黄网免费网站| 永久免费av在线| 精品久久久三级丝袜| 国产精品久久免费| 在线视频你懂得一区| 国产性xxxx高清| 亚洲在线一区二区三区| 欧洲美女女同性互添| 国产亚洲午夜高清国产拍精品| 白丝校花扒腿让我c| 麻豆国产欧美一区二区三区| wwwxxx黄色片| 99视频在线精品国自产拍免费观看| 永久免费看av| 91tv官网精品成人亚洲| 亚洲色图自拍| 欧美在线免费看视频| 欧美18视频| 三级精品视频| 久久99精品久久久久久水蜜桃| 国产精品任我爽爆在线播放| 91国产丝袜在线放| 欧美视频二区欧美影视| 亚洲a成v人在线观看| 国产日本亚洲| 成人a级免费视频| 国产精品久一| 亚洲精品欧美一区二区三区| 精品一区二区三区在线观看视频| 成人在线观看视频网站| 国产日韩中文在线中文字幕| 亚洲一区国产精品| 日韩欧洲国产| 成人资源av| 国产ts一区| 久久天天狠狠| 最新国产一区| 日本一区二区视频| 久久国产精品亚洲人一区二区三区| 色99中文字幕| 亚洲草久电影| 一本大道东京热无码aⅴ| 伊人蜜桃色噜噜激情综合| 国产素人在线观看| 另类av一区二区| 亚洲 激情 在线| 加勒比av一区二区| 久草福利在线观看| 成人午夜电影久久影院| 国产网站无遮挡| 国产欧美精品区一区二区三区| 青青青手机在线视频| 亚洲欧美电影院| 免费视频网站www| 欧美日韩国产一区中文午夜| 亚洲欧美一二三区| 在线电影欧美成精品| 精品人妻无码一区二区色欲产成人 | 日韩午夜激情电影| 蜜臀av中文字幕| 亚洲欧洲xxxx| 日本网站在线免费观看视频| 色综合老司机第九色激情| 欧美gv在线| 国产美女久久精品香蕉69| 亚洲国产中文在线| 日本不卡二区| 综合五月婷婷| 每日在线更新av| 精品一区二区三区免费观看| 最新日本中文字幕| 中文无字幕一区二区三区| 久久精品一区二区三| 色呦呦国产精品| 午夜精品久久久久久久99老熟妇 | 国产免费无码一区二区| 2020国产精品| 亚洲av无码一区二区三区在线| 精品日韩中文字幕| 国产精品福利电影| 亚洲欧美日韩在线高清直播| 性欧美高清come| 国产精品电影在线观看| 日韩一二三区| 亚洲精品乱码久久久久久蜜桃91| 欧美日韩久久| 五月婷婷之婷婷| 91麻豆精品一区二区三区| 卡通动漫亚洲综合| 欧美亚州韩日在线看免费版国语版| 亚洲av色香蕉一区二区三区| 一本色道久久综合狠狠躁篇的优点| 波多野结衣在线播放| 国产免费成人av| 美女精品一区最新中文字幕一区二区三区| 热久久最新网址| 青青草国产精品亚洲专区无| 性久久久久久久久久久| 亚洲美女屁股眼交| 亚洲最大成人av| 亚洲欧美国产另类| 成人在线免费观看黄色| 91久久国产精品91久久性色| 经典一区二区| 免费无遮挡无码永久视频| 国产成人午夜片在线观看高清观看| 纪美影视在线观看电视版使用方法| 欧美日韩美女在线| 男人天堂手机在线观看| 欧美日本精品在线| 成人豆花视频| 中文字幕一区二区三区有限公司 | 妺妺窝人体色www在线小说| 国产一区在线观看视频| 免费观看特级毛片| 欧美日韩色一区| 成人全视频高清免费观看| 81精品国产乱码久久久久久| aiai久久| 高清无码视频直接看| 国产精品一区二区不卡| 尤物在线免费视频| 538在线一区二区精品国产| 中文字幕日本在线观看| 国产欧美 在线欧美| 成人一二三区| 九色91popny| 国产精品乱码一区二区三区软件 | 中文字字幕码一二三区| 欧美日韩国产一区在线| 日本啊v在线| 琪琪亚洲精品午夜在线| 教室别恋欧美无删减版| 手机在线免费观看毛片| 国产精品国产三级国产普通话蜜臀 | 欧美第一页浮力影院| 国产精品色婷婷久久58| 一级黄色大毛片| 精品国偷自产在线视频| 精品国产亚洲一区二区三区大结局| 日韩人妻一区二区三区蜜桃视频| 国产一区二区成人久久免费影院| 黄色a级片在线观看| 精品免费日韩av| 成入视频在线观看| 日本一区二区三区免费看| 久久www免费人成看片高清| 暗呦丨小u女国产精品| 精品欧美一区二区久久 | 亚洲国产乱码最新视频| 四虎在线视频| 国产精品高潮呻吟久久av黑人| 日韩在线不卡| 久久久国产精品久久久| 午夜精品成人在线| av资源在线观看免费高清| 91日本视频在线| 亚洲高清av| 午夜时刻免费入口| 日韩一区二区三区电影| 久久久男人天堂| 亚洲精品无人区| 国产精品66部| wwwxxx亚洲| www.久久久久| 国产精品久久久网站| 激情内射人妻1区2区3区| 亚洲精品自拍动漫在线| 青青免费在线视频| 亚洲一区二区三区在线免费观看| 亚洲国产日韩在线| 特级西西人体高清大胆| 精品少妇一区二区三区免费观看 | 神马香蕉久久| 精品999在线| 午夜影院久久久| 自拍视频在线播放| 精品无人乱码一区二区三区的优势| 精一区二区三区| 天堂网中文字幕|