精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

7B模型超越GPT4-V!港科大等發布「圖推理問答」數據集GITQA:視覺圖可提升推理能力

人工智能 新聞
研究人員證實了Visual Graph在圖推理中的作用,以及其可以和文本模態相互增強。

圖神經網絡(GNNs)擅長利用圖的結構信息進行推理,但它們通常需要特定于領域的調優才能達到峰值性能,這阻礙了它們在不同任務之間的泛化性。

相比之下,基于大型語言模型(LLM)的圖推理具有更強的跨任務和泛化能力,但它們在特定任務上的性能往往遜色于專用的圖神經網絡模型。

無論是以圖神經網絡為代表的傳統圖推理還是新興的基于大型語言模型的圖推理,目前圖推理相關工作都忽視了視覺模態的圖信息。

然而,人類會通過視覺特征高效和準確地完成圖任務,例如判斷圖中是否存在環。

因此,探究視覺形態的圖信息在圖推理中的作用具有重要意義。

更具體地,將圖(Graph)繪制為圖片(Image),是否能賦予模型特殊的推理能力呢?這些圖片(稱為視覺圖 Visual Graph)是否能增強現有的基于其他模態的圖推理模型呢?

為了回答這些問題,來自香港科技大學和南方科技大學的研究團隊構建了首個包含視覺圖的推理問答數據集GITQA,并在GPT-4 turbo,GPT-4V等開源模型和Vicuna,LLaVA等閉源模型上進行了廣泛的實驗,證實了Visual Graph在圖推理中的作用,以及其可以和文本模態相互增強。

圖片圖片

論文地址:https://arxiv.org/abs/2402.02130

項目主頁:https://v-graph.github.io/

在GITQA測試基準中,以LLaVA-7B/13B為基礎微調出的多模態模型GITA-7B/13B,展示出了超越GPT-4V的圖推理性能。

GITQA 多模態圖推理問答數據集

研究團隊通過將圖結構繪制為不同風格的視覺圖像,建立了GITQA數據集及其相應的測試基準,GITQA數據集包含超過423K個問答實例,每個實例包含相互對應的圖結構-文本-視覺信息及其相應的問答對。

GITQA數據集包含兩個版本:GITQA-Base和GITQA-Aug,其中GITQA-Base只包含單一風格的視覺圖。

GITQA-Aug則更加豐富,它對視覺圖進行了多種數據增強處理,包括改變布局、點的形狀、邊的寬度和點的風格等,從而提供了更多樣化的視覺圖表現。

圖片圖片

如圖1,GITQA測試基準包含8個具有代表性的圖推理任務:Connectivity(判斷圖中兩點是否聯通)、Cycle(判斷圖中是否有環)、TS(尋找圖的拓撲序)、 SP(尋找圖中兩點間的最短路徑)、 MaxFlow(計算圖中兩點間的最大流)、 BGM(計算二分圖的最大匹配)、 HP(尋找圖中的哈密頓路徑)和GNN(模擬GNN的消息傳遞)。

圖片圖片

每個任務所對應的數據集都被按照圖結構的復雜程度被劃分為不同難度等級的子集(相關統計如表1)。

實驗及結果

實驗一: 基于不同模態圖信息的模型的圖推理能力對比

研究團隊在GITQA-Base數據集上,根據不同的模態圖輸入類型(包括僅文本(T-Only)、僅視覺(V-Only)、以及文本加視覺(V+T)),評估了流行的閉源和開源大型語言模型(如GPT-4 turbo和Vicuna-7B/13B)以及大型多模態語言模型(如GPT-4V和LLaVA-7B/13B)的表現。如圖2所示。

圖片圖片

具體來說,閉源模型GPT-4和GPT-4V執行零樣本推理,而對于開源模型Vicuna和LLaVA,則通過保持主干模型參數不變,僅訓練Projector和LoRA部分進行了微調(特別地,視覺+文本雙模態微調后的LLaVA模型被研究者命名為GITA)。

表2總結了所有八項圖推理任務的測試結果。

圖片圖片

視覺模態 V.S. 文本模態

從表2中可以看到,在Cycle和BGM任務上,視覺模態的表現優于文本模態,而在其他五個任務上則不如文本模態。這揭示了視覺和文本在處理特定類型的圖推理任務上各具優勢。視覺和文本模態的相互增強

對于閉源模型,GPT-4V(V+T)在八個任務的平均準確率上遠高于GPT-4 Turbo(T-only)和GPT-4V(V-only)。

對于開源模型(7B,13B),同樣地,使用雙模態數據訓練出的GITA模型平均表現最佳。這些觀察結果驗證了同時使用視覺和文本信息能夠增強模型的圖推理能力,相比單模態模型可以實現更好的性能。

更具體地說,GITA-7B(V+T)在幾乎所有任務中表現優于LLaVA-7B(V-only)和Vicuna-7B(T-only)。而對于閉源模型,使用雙模態在八個任務中的五個上達到了最高準確率。微調后的LLaVA模型可超越GPT-4V

如表2和圖3所示,GITA-7B和GITA-13B模型,即經過雙模態微調的LLaVA-7B/13B模型,顯示出相較于GPT-4V超過13%的顯著性能提升。這一巨大的進步幅度表明,微調后的GITA模型能夠有效地從GITQA數據集中學習到出色的圖推理能力。

圖片圖片

實驗二:難度等級對圖任務的影響

表3進一步給出了模型在不同難度級別上的測試精度,GNN任務由于對所有模型都太具挑戰被省略)。

在所有難度級別的Cycle和BGM任務中,單獨使用視覺模態的表現優于文本模態,并且與使用兩種模態的表現相當。

然而,對于其他任務,當難度從簡單增加到中等或困難時,只使用視覺模態的模型的性能顯著下降。

圖片圖片

同樣,當難度增加時,只使用文本模態和使用視覺+文本模態的模型在這些任務上也會出現大幅度的性能下降。

對于Connectivity任務,GITA-7B(視覺+文本)和GITA-13B(視覺+文本)在所有三個挑戰級別上都表現出相當的性能。

然而,這種一致的模式在GPT-4V(視覺+文本)中并未觀察到,因為其性能隨著難度級別的增加而下降。

實驗三: 視覺圖的增強策略和風格偏好

研究團隊還探究了特別的數據增強策略在微調模型時的效果。

基于不同的增強策略,研究者將GITQA-Aug數據集劃分為四個增強子集: 布局增強數據集,節點形狀增強數據集,邊的寬度增強數據集,節點風格增強數據集。

圖片圖片

研究者在僅使用視覺圖信息的LLaVA-7B模型上對全部四個增強子集進行了單獨的微調,其推理性能與數據增強前的比較如表4所示。

可以明顯看出,模型在布局增強數據集上對于挑戰性任務的推理能力急劇提升(SP 上升64.8%,HP上升69.63%)。

而其他三種數據增強策略反而導致性能下降。

具體來說,模型在布局增強集上取得了優異的結果,比GITQA-Base集高出11%以上。相比之下,其他增廣集中八個任務的平均結果比基本集低約5%

圖片圖片

這些發現表明基于布局的數據增強為圖推理提供了更有效的視覺視角。進一步,研究者還測試了各個增強策略下,在同組內基于每種風格的Visual Graph推理的性能,如表5所示,展示出模型沒有明顯的風格偏好。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-06-11 14:30:18

2025-04-26 09:25:00

模型推理AI

2025-11-04 08:42:27

2023-05-15 15:38:59

AI模型

2021-12-01 10:05:12

模型人工智能計算

2023-10-11 12:32:53

AI模型

2025-04-11 09:10:00

模型開源AI

2025-09-15 09:43:33

分層推理模型循環網絡推理

2025-04-16 15:28:31

模型AI數據

2025-05-16 09:10:00

2023-11-29 13:52:00

模型訓練

2023-11-03 13:07:00

AI模型

2025-05-19 08:37:00

2017-12-13 10:08:26

大數據圖數據推理數據科學

2023-11-15 14:17:23

微軟語言模型AI 模型

2023-10-13 19:58:33

Mistral7B模型

2024-06-25 12:45:02

2023-12-18 09:39:20

模型AI

2025-06-10 09:07:00

點贊
收藏

51CTO技術棧公眾號

欧美激情一区在线| 激情久久一区| 日韩视频一区在线观看| 国产一区 在线播放| 天堂在线中文字幕| 美腿丝袜亚洲三区| 久久久久国产精品www| 久久久久久久久亚洲| 深夜黄色小视频| 成人影音在线| 国产日韩精品一区二区浪潮av| 成人av.网址在线网站| 日韩免费观看一区二区| 国产精品国内免费一区二区三区| 欧美精品一区二区在线观看| 久久婷婷国产91天堂综合精品| 色www永久免费视频首页在线 | 国产精品一区二区av交换| 欧美性感一区二区三区| 成人免费毛片在线观看| fc2在线中文字幕| 亚洲免费视频二区| 国产永久精品大片wwwapp| 日韩亚洲欧美中文三级| 男女无套免费视频网站动漫| 黑人极品ⅴideos精品欧美棵| 国产亚洲成aⅴ人片在线观看| 91九色蝌蚪成人| 老熟妇一区二区三区啪啪| 在线看片一区| 久热精品视频在线| 日韩中文字幕有码| 日韩电影不卡一区| 日韩无一区二区| 亚洲涩涩在线观看| 国产亚洲精彩久久| 在线观看三级视频欧美| 91精品国产综合久久久久久| 国产人妻互换一区二区| av在线电影观看| 久久婷婷色综合| 国产欧美亚洲日本| 亚洲美女综合网| 国产一区在线不卡| 国产欧美一区二区白浆黑人| 欧美brazzers| 视频一区二区三区在线| 3344国产精品免费看| 国产午夜小视频| 韩国久久久久| 欧美激情在线视频二区| 手机在线免费看毛片| 99视频精品全部免费在线视频| 亚洲一级免费视频| 欧美激情免费观看| www中文在线| 波多野结衣在线播放一区| 亚洲精品综合精品自拍| av无码一区二区三区| 久久久伦理片| 国产丝袜视频一区| 亚洲成人黄色av| 欧美一级淫片| 日韩在线观看免费高清| 老湿机69福利| 欧美日本在线| 国内精品在线一区| 一级片在线观看免费| 视频一区国产视频| 成人免费网站在线看| 国产欧美日韩成人| 激情影院在线观看| www国产亚洲精品久久麻豆| 国产亚洲精品久久飘花| 欧美午夜黄色| 欧美韩国日本不卡| 国产系列第一页| 尤物yw193can在线观看| 亚洲国产精品一区二区www在线| 亚洲熟妇无码一区二区三区导航| 草草视频在线| 色av成人天堂桃色av| 怡红院亚洲色图| 日韩精品三级| 精品视频久久久| 毛片久久久久久| 欧美日韩亚洲一区三区| 97超级碰碰碰久久久| 成人av电影天堂| 一级黄色大片视频| 黄色日韩网站视频| 国产精品久久久久久久小唯西川 | 国产小视频91| 五月天色婷婷丁香| 亚洲精品视频啊美女在线直播| 啪一啪鲁一鲁2019在线视频| 亚洲午夜激情视频| 成人看片黄a免费看在线| 欧美日韩在线一二三| 麻豆网在线观看| 欧美日韩亚洲精品一区二区三区| 国产又黄又猛又粗又爽的视频| 精品黑人一区二区三区观看时间| 欧美第一在线视频| 亚洲美女在线视频| 99热精品免费| 琪琪一区二区三区| 国产亚洲情侣一区二区无| av电影在线观看| 性做久久久久久久久| 久久久久久久久久一区| 蜜桃精品噜噜噜成人av| 久久福利视频导航| 天天干天天插天天射| 北岛玲一区二区三区四区| 一区二区三区欧美成人| 免费毛片b在线观看| 91精品午夜视频| 国产免费无遮挡吸奶头视频| 亚洲特级毛片| 另类小说综合欧美亚洲| 91久久精品国产91性色| 免费在线黄色影片| 亚洲成av人在线观看| av在线网址导航| 性欧美lx╳lx╳| 国内揄拍国内精品少妇国语| a天堂在线观看视频| 国产日产欧美一区二区视频| 久久久久久久久久网| 久久久久毛片免费观看| 中文字幕综合一区| 神马久久久久久久| 91亚洲大成网污www| 久青草视频在线播放| 日本一区影院| 欧美成年人网站| 国产精品国产三级国产aⅴ| 伊人久久精品| 中文字幕一区二区三区在线播放 | 久久99在线观看| 欧美三日本三级少妇三99| www.色在线| 亚洲成人av在线播放| 欧美精品99久久久| 国产精品99久久久久久久vr| 日本成人性视频| 爱情电影网av一区二区| 色噜噜久久综合伊人一本| 中文字幕+乱码+中文| 日本一区二区综合亚洲| caoporn超碰97| 国产一区二区三区91| 成人免费不卡视频| 日本不卡一区二区三区视频| 亚洲黄色中文字幕| 亚洲女人被黑人巨大进入| 日本免费在线观看视频| 国产午夜精品久久久久久久 | 男女性高潮免费网站| 精品一区二区久久久| 亚洲一区二区高清视频| 久久天天久久| 久久香蕉频线观| 国产刺激高潮av| 精品欧美激情精品一区| 中文字幕国产专区| 免费的成人av| 色一情一乱一乱一区91| 成人知道污网站| 欧美一区二区三区免费视| 国产午夜伦鲁鲁| 欧美69xxx| 欧美一级黄色大片| 国产午夜在线播放| 久久久久久99久久久精品网站| 成人在线观看a| 97精品在线| 丁香五月网久久综合| 交100部在线观看| 亚洲性日韩精品一区二区| 在线观看国产精品视频| 一区二区三区欧美在线观看| 亚洲综合自拍网| 美女一区二区久久| 日本大胆人体视频| 久久av超碰| 亚洲一区二区三区香蕉| 蜜桃在线视频| 日韩亚洲精品视频| 内射无码专区久久亚洲| 在线精品在线| 日韩视频亚洲视频| 日本美女一级片| 欧美图区在线视频| 国产性生活网站| 国产亚洲一本大道中文在线| 久久6免费视频| 亚洲中字在线| 国产又粗又大又爽的视频| 欧美精品国产白浆久久久久| 国产精品丝袜高跟| 国产乱码午夜在线视频| 色婷婷综合成人av| 乱色精品无码一区二区国产盗| 一本大道久久a久久综合婷婷| 丝袜美腿小色网| 国产亚洲综合在线| 蜜臀av粉嫩av懂色av| 麻豆精品蜜桃视频网站| 黄色免费福利视频| 欧美99在线视频观看| 在线观看免费一区| 91人人澡人人爽人人精品| 日韩视频一区| 欧美与动交zoz0z| 成人羞羞网站入口免费| 狠狠色伊人亚洲综合网站色| 亚洲一区av| 国产精品美女主播在线观看纯欲| 2018av在线| 欧美另类交人妖| 日本三级视频在线观看| 亚洲欧美一区二区精品久久久| 亚洲乱码在线观看| 欧美福利视频一区| 一级特黄免费视频| 欧美性xxxxxxx| 久久久久香蕉视频| 亚洲精品免费看| 三级全黄做爰视频| 国产精品免费aⅴ片在线观看| 亚洲av无码成人精品国产| 粉嫩欧美一区二区三区高清影视| 午夜久久久久久久久| 黑人巨大精品欧美| 成人国产精品免费观看动漫| 中文字幕第三区| 国产在线乱码一区二区三区| 国产精品一区二区羞羞答答| 久久只有精品| 99999精品视频| 麻豆久久精品| 黄色片视频在线播放| 国产精品免费看| 日韩欧美国产免费| 性高湖久久久久久久久| 男人和女人啪啪网站| 国产精品亚洲欧美| 两根大肉大捧一进一出好爽视频| 黄色成人在线网址| 国精产品一区一区三区视频| 宅男噜噜噜66国产日韩在线观看| 免费高清一区二区三区| 亚洲国产1区| 欧美日韩在线一| 亚洲一区中文字幕永久在线| 一区av在线播放| 黄色一级视频在线观看| 亚洲综合男人的天堂| 国产亚洲精品av| 亚洲不卡av一区二区三区| 日韩精品视频播放| 欧美性生交大片免网| 天天爱天天做天天爽| 欧美色男人天堂| 国产精选久久久| 日韩欧美国产电影| 天天色棕合合合合合合合| 亚洲欧美日韩另类| 亚洲免费视频一区二区三区| 久久夜精品va视频免费观看| 好看的中文字幕在线播放| 欧美亚洲在线视频| 国模私拍国内精品国内av| 亚洲在线第一页| 美女视频亚洲色图| 色综合666| 欧美暴力喷水在线| 久久亚洲综合国产精品99麻豆精品福利 | 手机av免费观看| 欧美日韩精品一区视频| 午夜精品在线播放| 日韩久久午夜影院| av播放在线观看| 欧美精品第一页在线播放| 欧美三级网址| 91亚色免费| 激情五月综合| 国产91porn| 中日韩视频在线观看| 激情五月俺来也| 成人免费看视频| 99精品中文字幕| 精品高清美女精品国产区| 伊人22222| 亚洲国产精品推荐| 伦xxxx在线| 日本亚洲欧美三级| 亚洲精品在线a| 亚洲成色www久久网站| 大片免费在线观看| 狠狠做深爱婷婷久久综合一区| 国产女优在线播放| 亚洲大尺度美女在线| 337p日本欧洲亚洲大胆鲁鲁| 久久青草精品视频免费观看| 成人a在线观看高清电影| 国产欧美丝袜| 亚洲情侣在线| 亚洲欧美激情网| av亚洲精华国产精华精华 | 亚洲成人77777| 一个人www欧美| 色噜噜狠狠狠综合欧洲色8| 国产欧美精品一区二区| 视频国产一区| 欧美日韩在线一| 成人免费视频免费观看| 国精品无码一区二区三区| 欧美亚洲禁片免费| 你懂的视频在线观看| 国内偷自视频区视频综合| 麻豆精品一区| 亚洲欧洲黄色网| 秋霞av一区二区三区| 日韩欧美在线不卡| 丝袜美腿美女被狂躁在线观看| 国产91|九色| 精品综合久久88少妇激情| 91看片淫黄大片91| 久久99国产乱子伦精品免费| b站大片免费直播| 欧美日韩国产麻豆| 国内爆初菊对白视频| 欧美大成色www永久网站婷| 老司机精品视频网| 色女人综合av| 免费xxxx性欧美18vr| 免费一级特黄3大片视频| 色偷偷成人一区二区三区91| 午夜av免费观看| 91av视频导航| 日韩精品亚洲aⅴ在线影院| 黄色片网址在线观看| 成人深夜在线观看| 国产亚洲精品久久777777| 日韩视频免费观看高清在线视频| 国产在线高清视频| 亚洲影院色无极综合| 国内精品美女在线观看| 超碰精品一区二区三区乱码| a在线视频v视频| 精品日产一区2区三区黄免费| 亚洲伦理一区| 国产艳俗歌舞表演hd| 色婷婷av一区| jizz日韩| 亚洲直播在线一区| 国产一区二区中文| 成人在线视频免费播放| 香蕉成人啪国产精品视频综合网| 女人18毛片一区二区三区| 97视频在线看| 国产精品手机在线播放| 九九热免费精品视频| 中文字幕色av一区二区三区| jlzzjlzzjlzz亚洲人| 久久青草福利网站| 国产一区日韩| 五月天婷婷影视| 夜夜嗨av一区二区三区中文字幕| 黑人精品一区二区三区| 青青在线视频一区二区三区| 欧美裸体在线版观看完整版| 99re精彩视频| 亚洲一区二区在线免费观看视频| 国产18精品乱码免费看| 欧美电视剧在线看免费| 日本黄色中文字幕| 最新国产成人av网站网址麻豆| 成人日韩视频| 乱人伦xxxx国语对白| 亚洲国产精品黑人久久久| 国产免费福利视频| 992tv成人免费视频| 国精一区二区| 师生出轨h灌满了1v1| 日本高清成人免费播放| 羞羞视频在线观看不卡| 欧美国产视频在线观看| 久久 天天综合| 亚洲男人的天堂在线视频| 深夜福利亚洲导航| 荡女精品导航| 欧美精品久久久久久久久25p| 亚洲一区二区三区四区在线免费观看 | 久久一二三区| 免费在线观看黄色小视频| 亚洲激情视频网站|