精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ICCV 2025 | ECD:高質量合成圖表數據集,提升開源MLLM圖表理解能力

人工智能 新聞
我們提出 ECD(Effective Chart Dataset)—— 一個規模大、質量高、風格多樣的合成圖表數據集。

本文第一作者楊昱威,來自澳大利亞國立大學,合作者包括章澤宇(澳大利亞國立大學)、侯云鐘(澳大利亞國立大學)、李卓婉(約翰霍普金斯大學)、Gaowen Liu(思科)、Ali Payani(思科)、丁源森(俄亥俄州立大學)以及鄭良(澳大利亞國立大學)。

背景與動機

在科研、新聞報道、數據分析等領域,圖表是信息傳遞的核心載體。要讓多模態大語言模型(MLLMs)真正服務于科學研究,必須具備以下兩個能力:

1. 精準識別與理解圖表元素(如坐標軸、圖例、數據點、標題等);

2. 對圖表數據進行深度推理(如計算差值、比較趨勢、跨子圖推理等);

然而,即便是最先進的開源多模態大語言模型(MLLMs),在高難度科學圖表理解基準測試上準確率依舊徘徊在 30%–50%。盡管合成數據集易于生成,但它們通常存在以下問題:

  • 風格單一:缺乏視覺和內容多樣性;
  • 缺乏真實性:與真實圖表的分布差異較大;
  • 數據模式受限:生成的圖表數據過于簡單,無法模擬復雜場景;

為此,我們提出 ECD(Effective Chart Dataset)—— 一個規模大、質量高、風格多樣的合成圖表數據集。同時,本文還配套設計了一條模塊化數據合成流水線以及高質量評測基準 ECDBench,為開源 MLLM 提供全面的訓練與評測支持。

  • 論文標題:Effective Training Data Synthesis for Improving MLLM Chart Understanding
  • 論文地址:https://arxiv.org/pdf/2508.06492
  • 代碼倉庫:https://github.com/yuweiyang-anu/ECD
  • 項目主頁:https://effective-chart-dataset-synthesis.github.io

數據集亮點

ECD 作為一個全新的高質量合成圖表數據集,具備以下核心優勢:

1. 數據規模與圖表多樣性

  • 數據量:包含 10,000+ 圖表,覆蓋廣泛的學科主題和圖表類型;
  • 多樣性:涵蓋 25 種主題(如經濟學、天文學、醫學等)、29 種圖表類型(如線圖、條形圖、熱力圖等),以及 252 種子圖組合(包括多種復雜布局,如 2 行 3 列、3 行 3 列布局等),是同類合成數據集中覆蓋范圍最廣的。

2. 高質量問答對

數據集包含 300k+ 問答對(包括描述類和推理類問題),所有問答對均由 GPT-4o 自動生成并通過置信度過濾篩選得到。

示例:

描述類問題:“左側子圖的標題是什么?”

答案:“左側子圖的標題是‘不同媒介的消費趨勢’ ”。

推理類問題:“哪個收入來源在本地媒體和國家媒體之間差異最大?”

答案:“數字廣告收入差異最大,差值為 300M。”

3. 數據真實性

  • 最低的 FID(Frechet Inception Distance)得分:ECD 數據集在視覺分布上與真實科學圖表(如 CharXiv 數據集,從 arXiv 文章中圖表搜集得到)的相似度最高;
  • 最高的像素熵:平均像素熵顯著高于其他合成數據集,表明其復雜度更高,信息量更大,推理難度也更高。

方法與創新:模塊化五階段數據合成流水線

為了實現高質量且多樣化的合成圖表數據集 ECD,本文設計了一個五階段模塊化的數據合成流水線,具體如下:

1. 單圖生成  

  • 使用 29 種預定義繪圖函數(如線圖、餅圖、散點圖等),通過獨立數據生成器生成數據表、標題、坐標軸標簽、標記樣式等內容; 
  • 數據生成與繪圖代碼生成分離,提升數據模式的多樣性。數據可以隨機選擇生成遞增、遞減或波動等趨勢。

2. 多子圖組合

  • 條件順序生成,每個子圖的數據生成需要參考前面子圖的數據;
  • 保證多子圖之間的語義一致性,模擬真實科研圖表的布局與信息關聯。

3. 視覺多樣化

  • 添加注釋、陰影、放大視窗(Zoom-in inset)、字體 / 坐標軸樣式的變化;
  • 引入 Seaborn 等繪圖庫,用于提升視覺豐富度;
  • 調整圖表的分辨率與比例,保證其內容可讀性。

4. 圖像質量過濾

  • 基于 GPT-4o 對圖表的視覺清晰度與語義連貫性進行兩方面評分;
  • 僅保留質量高于數據集平均評分的圖表。

5. 問答對生成與過濾

  • 每張圖生成描述類與推理類兩種類型的問答對;
  • 通過 GPT-4o 進行置信度評分,保留置信度最高 QA,剔除低質量樣本。

模型與訓練集對比

  • 在 6 個測試集上評估 4 個開源 MLLM,包括 LLaVA-Next-Llama3-8B、MiniCPM-V2.6、Phi-3-Vision 及 Qwen2.5-VL-7B。 實驗表明,通過 ECD 訓練集微調后,可一致提升 4 個開源 MLLM 的性能表現;
  • 以 LLaVA-Next-Llama3-8B 為基線,對比先前 ChartQA、ChartBench、ReachQA 圖表訓練集 → 在 ECD 訓練集監督微調訓練(SFT)后,在所有測試集上均顯著一致地提升基線性能,其余訓練集上訓練后模型性能存在較大波動(不同測試集上性能有提升 / 有下降)。

數據集可視化對比

ECDBench:高質量圖表理解評測基準

為進一步驗證模型性能,我們基于所提出的 ECD 數據合成流水線與人工核對調整,額外構建了一個高質量的基準測試集 ECDBench,用于對當前多模態視覺語言模型以及采用我們 ECD 訓練集監督微調前后的模型效果進行對比評估,基準統計信息如下:

  • 規模:包含 1,224 張圖表
  • 組成:364 單圖,860 多子圖(涵蓋 2–3 種圖表類型)
  • 平均分辨率:1378×968 px
  • 數據來源:GPT4o 自動生成 + 人工精細修訂
  • QA 配置:每張圖表生成 1 條描述類 + 1 條推理類問答,共計 2,448 對問答

ECDBench 上評估測試結果對比如下

在 ECDBench 上,所有衡量的 MLLMs 中,o4-mini 在所有三個指標上始終表現最佳(推理類問題準確率為 57.03%,描述類問題準確率為 77.45%,平均準確率為 67.24%)。另外,采用 ECD 訓練集微調后的模型(如 LLaVA-Next-Llama3-8B)性能顯著提升,表明 ECD 訓練集的高質量問答對能夠有效幫助提升模型圖表理解能力。

總結與展望

ECD 通過模塊化數據合成流程和高質量 QA 生成機制,保持了與真實科學圖表的高相似度,且顯著提升了數據多樣性與復雜度。ECDBench 則為 MLLM 圖表理解能力提供了全面的評測基準。我們相信,這一工作將為多模態推理、科學 AI 助手以及圖表自動化生成領域提供堅實的數據基礎與技術支持。


責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-01-12 13:38:54

業務購物ToC

2025-07-23 04:00:00

2016-12-20 09:35:52

微軟開源數據集

2025-11-12 08:40:00

數據AI模型

2020-01-09 11:30:40

AI 數據人工智能

2011-05-31 13:43:46

外鏈

2017-07-14 09:54:47

代碼函數程序

2023-08-08 10:06:25

微軟大語言模型

2023-12-03 08:46:20

模型開源

2024-08-26 15:20:45

2021-08-08 14:26:24

SQL數據庫開發

2025-04-14 09:26:00

2025-04-27 09:16:00

模型AI數據

2021-01-20 07:44:15

農業發展科技智慧農業

2023-09-01 14:42:39

數據研究

2012-09-13 10:44:18

Python代碼
點贊
收藏

51CTO技術棧公眾號

国产乱子伦精品| 免费91麻豆精品国产自产在线观看| 日韩国产一级片| 国产区视频在线播放| 久久成人久久鬼色| 97国产精品视频人人做人人爱| 久久只有这里有精品| 亚洲日本中文| 欧美色xxxx| 日韩精品一区二区三区电影| 亚洲欧美日韩免费| 日本欧美一区二区| 久99九色视频在线观看| 99久久久无码国产精品性| 精品一区二区三区亚洲| 色呦呦日韩精品| 欧美 亚洲 视频| eeuss影院www在线观看| 不卡视频免费播放| 亚洲影影院av| 一区二区乱子伦在线播放| 亚洲婷婷免费| 不卡av电影在线观看| 国产肥白大熟妇bbbb视频| 中文字幕一区二区三区中文字幕 | 亚洲天堂一二三| 国产亚洲网站| 久久久噜噜噜久噜久久| www.av成人| 欧美日中文字幕| 亚洲欧洲日本专区| 久久久久麻豆v国产精华液好用吗| 男人亚洲天堂| 欧美性做爰猛烈叫床潮| 欧美黄网站在线观看| 黄页网站在线观看免费| 亚洲色图都市小说| 蜜桃久久精品乱码一区二区 | 成人午夜在线免费| 3d蒂法精品啪啪一区二区免费| 中文字幕乱码人妻二区三区| 久久一区欧美| 国产成人短视频| 麻豆精品久久久久久久99蜜桃| 99精品视频免费观看视频| 色综合久久88| 久久久无码精品亚洲国产| 欧美国产综合| 欧美极品欧美精品欧美视频 | 欧美日韩另类字幕中文| 成人在线国产视频| av电影在线免费| 亚洲成人激情综合网| 国产 日韩 欧美在线| 国产偷倩在线播放| 午夜精品久久久久久久99水蜜桃| 国产高清av在线播放| av毛片午夜不卡高**水| 午夜久久电影网| 丰满少妇久久久| 新版的欧美在线视频| 欧美性xxxx极品hd满灌| 色多多视频在线播放| 国产麻豆一区| 制服丝袜日韩国产| 亚洲一二三四五| 国产一区福利| 亚洲欧美www| 高清国产在线观看| 中文字幕亚洲综合久久五月天色无吗''| 久久综合五月天| 国产五月天婷婷| 另类亚洲自拍| 国产在线a不卡| 精品国产黄色片| 99久久99久久免费精品蜜臀| 日本欧洲国产一区二区| 麻豆tv在线| 亚洲综合av网| 欧美污视频网站| 亚洲国产91视频| 亚洲第一区中文99精品| 免费看91的网站| 欧美日韩三区| 国产精品com| 精品国产av一区二区| 91美女片黄在线观看91美女| 一本一道久久a久久综合精品 | 国产日产精品久久久久久婷婷| 中文字幕在线一区| 亚洲理论电影在线观看| 成人四虎影院| 亚洲国产婷婷香蕉久久久久久| 久久久久久久久久久久| 亚洲欧美综合| 国产精品一区二区久久精品| 黄色av小说在线观看| 日本一区二区成人在线| 日本中文字幕在线视频观看| 久久精品国产福利| 亚洲第一天堂av| 亚洲综合久久av一区二区三区| 激情综合在线| 国产在线观看91精品一区| 神马午夜精品95| 中文字幕一区av| 日韩毛片在线免费看| 亚洲精品一区国产| 中文字幕久热精品视频在线| 久青草视频在线观看| 免费欧美日韩国产三级电影| 国产精品一区二区三区不卡 | 国产精品v日韩精品| 亚洲黄色在线观看视频| 国产精品水嫩水嫩| 黄色a级片免费| 91精品导航| 久久国内精品一国内精品| 久久精品视频1| 波多野洁衣一区| 好吊色视频988gao在线观看| 成人1区2区| 亚洲天堂网在线观看| 香蕉免费毛片视频| 成人小视频在线| 日产精品久久久久久久蜜臀| 少妇精品视频在线观看| 国产一区二区黑人欧美xxxx| 欧美一区二区激情视频| 不卡的av中国片| 欧美高清中文字幕| 亚洲一区二区三区在线免费| 久久人体大胆视频| 91一区二区视频| 国产精品久久久久9999吃药| 国产精品拍拍拍| 欧美日韩国产高清电影| 国产91久久婷婷一区二区| 欧美日韩在线精品一区二区三区激情综| 亚洲国产裸拍裸体视频在线观看乱了 | 成人avav在线| 国产精品久久久久9999爆乳| ccyy激情综合| 久久久久久久久久久人体| 午夜久久久久久久久久| 亚洲柠檬福利资源导航| 国产在线视频三区| 欧美欧美天天天天操| 3d动漫啪啪精品一区二区免费| 黄色av电影在线播放| 制服视频三区第一页精品| 天天爽天天爽天天爽| 黄色资源网久久资源365| 日本丰满大乳奶| 日韩欧洲国产| 国外成人在线视频| 在线观看xxx| 色妹子一区二区| 五月婷婷六月香| 国产精品一区二区在线观看不卡 | 精品视频在线一区二区在线| 中文字幕9999| av中文字幕播放| 亚洲大片精品永久免费| 国产精品边吃奶边做爽| 久久一区亚洲| 亚洲AV无码成人精品一区| 午夜视频一区二区在线观看| 午夜精品三级视频福利| 国内在线精品| 91精品综合久久久久久| 国产亚洲精品码| 久久久久久久久久看片| 日本高清久久久| 亚洲视频碰碰| 日韩理论片在线观看| 国产精品色婷婷在线观看| 97国产精品人人爽人人做| 国产视频网站在线| 欧美一区二区三区白人| 日韩精品手机在线| 日本一区二区成人在线| 亚洲精品久久一区二区三区777| 中文在线不卡| 一区二区三区不卡在线| 操欧美女人视频| 国产精品看片资源| 国产在线xxx| 最新亚洲国产精品| 香蕉视频网站在线| 91 com成人网| 精品久久久久久久久久久久久久久久 | 国产在线一区二| 国产一区高清| 97在线观看视频国产| 黄视频网站在线看| 亚洲男人天堂手机在线| 午夜精品小视频| 欧美亚洲丝袜传媒另类| 精品亚洲永久免费| 国产精品久久99| 亚洲欧美色图视频| 国产成人亚洲精品狼色在线| www.天天射.com| 国产亚洲毛片在线| 青青青在线观看视频| 欧美午夜精彩| 久久亚洲精品欧美| xvideos.蜜桃一区二区| 91精品久久久久久久久久久| 巨茎人妖videos另类| 久久久在线观看| 黄色免费网站在线观看| 国产午夜精品美女视频明星a级| 欧美一区二区黄片| 欧美一区二区视频网站| 成人免费一区二区三区| 欧美日韩国内自拍| 国产一级淫片免费| 亚洲免费在线看| 麻豆一区在线观看| 久久精品人人爽人人爽| 双性尿奴穿贞c带憋尿| av亚洲精华国产精华精| 一级全黄裸体片| 国产精品综合二区| 亚洲一区二区福利视频| 美女视频免费一区| 亚洲视频在线a| 玖玖精品视频| 99免费视频观看| 久久精选视频| 久久久久久久久久久久久久国产| 亚洲精品乱码| 国产精品999视频| 伊人成年综合电影网| 国产尤物av一区二区三区| 一级欧洲+日本+国产| 美国av在线播放| 91成人网在线观看| japanese在线播放| 午夜日韩福利| 欧美视频在线观看视频| 在线日韩中文| 黄色影院一级片| 免费视频一区| 国产精品wwwww| 日韩综合小视频| 中文字幕永久有效| 精品亚洲成a人在线观看| 午夜视频在线观| 国产一本一道久久香蕉| 中文字幕久久久久久久| 成人午夜短视频| 欧美日韩人妻精品一区在线| 91亚洲精品一区二区乱码| 中文字幕av网址| 亚洲国产成人午夜在线一区| 日本二区三区视频| 一区二区三区欧美亚洲| 日韩av综合在线| 日韩欧美在线视频免费观看| 中文字幕在线观看高清| 在线成人av网站| 亚洲精品国产精品乱码不卡| 亚洲激情第一页| 国产女主播在线直播| 久久精品国产清自在天天线 | 亚洲一线二线三线视频| 天天干天天干天天操| 欧亚一区二区三区| 精品国自产在线观看| 日韩精品久久久久久福利| 99免在线观看免费视频高清| 九九久久综合网站| 日韩电影av| 91在线高清视频| 欧美日韩夜夜| 中文字幕日韩一区二区三区| 狠狠久久婷婷| 污污的网站18| 成人精品视频一区二区三区尤物| 欧洲女同同性吃奶| 精品不卡一区二区| 亚洲精选免费视频| 波多野结衣视频网站| 欧美乱妇23p| 无码精品在线观看| 中文字幕日韩欧美| 久久男人天堂| 国产日韩精品电影| 亚洲自拍都市欧美小说| 2025韩国大尺度电影| 亚洲精一区二区三区| 国产又黄又猛的视频| 99精品久久只有精品| chinese全程对白| 欧美午夜影院在线视频| av官网在线观看| 国产一区二区三区毛片| 国产污视频在线播放| 91精品中国老女人| 狠狠色丁香婷婷综合影院| a级免费在线观看| 美女看a上一区| av网站免费在线播放| 夜夜夜精品看看| 亚洲最大成人在线视频| 精品视频在线播放色网色视频| 国产激情在线| 国产精品旅馆在线| 小说区图片区色综合区| 日本中文字幕亚洲| 国产乱码精品一区二区三区五月婷 | 麻豆一区二区三区在线观看| 老牛国产精品一区的观看方式| www.黄色网| 亚洲天天做日日做天天谢日日欢| 国产成人精品777777| 亚洲成年人影院在线| 在线观看中文| 成人有码在线播放| 日韩一级毛片| 毛葺葺老太做受视频| 91麻豆高清视频| 欧美三级午夜理伦| 亚洲黄色www| 懂色av一区| 动漫一区二区在线| 综合视频在线| 亚洲av毛片在线观看| 日韩一区日韩二区| 一本大道伊人av久久综合| 自拍偷拍亚洲区| 精品美女一区| 亚洲毛片aa| 韩国视频一区二区| 91麻豆免费视频网站| 3atv一区二区三区| 日本老太婆做爰视频| 国产精品theporn| 涩视频在线观看| 亚洲成a人片在线观看中文| 囯产精品久久久久久| 久久久亚洲欧洲日产国码aⅴ| 国产一区二区在线视频你懂的| 欧美精品自拍视频| 99久久国产综合精品色伊| 日本一区二区三区精品| 日韩大陆毛片av| 欧美freesex| 日韩免费毛片| 九九热在线视频观看这里只有精品| 萌白酱视频在线| 91精品黄色片免费大全| 2024短剧网剧在线观看| 99国产视频在线| 日韩视频二区| 制服 丝袜 综合 日韩 欧美| 欧美性大战久久久| 国产传媒在线播放| 成人片在线免费看| 国产精品视区| 欧美日韩生活片| 日韩三级视频中文字幕| heyzo高清在线| 欧美日韩免费观看一区| 麻豆视频一区二区| 美女福利视频在线观看| 亚洲福利视频二区| 欧美大片免费高清观看| 亚洲精品永久www嫩草| 国产成人免费在线观看不卡| 在线观看国产亚洲| 一区国产精品视频| 试看120秒一区二区三区| 国产黄色一级网站| 国产精品久99| 香蕉国产在线视频| 国产精品一区久久久| 国产一在线精品一区在线观看| 国产精品久久久免费观看| 欧美日韩高清一区二区不卡 | 欧美女优在线视频| 久久久久xxxx| 天天操天天色综合| 日本在线免费看| 国产一区二区三区高清| 蜜臀久久99精品久久久久宅男| 久久久精品一区二区涩爱| 亚洲偷熟乱区亚洲香蕉av| 伊人精品综合| 国产视频手机在线播放| 亚洲国产美女搞黄色| 91女主播在线观看| 精品视频免费观看| 狠狠久久亚洲欧美| 加勒比在线一区| 97色在线视频观看| 午夜久久黄色|