精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

圖表代碼生成,ChartIR;視頻與文本統一多模態模型

發布于 2025-6-23 06:24
瀏覽
0收藏

Improved Iterative Refinement for Chart-to-Code Generation via Structured Instruction

2025-06-15|SJTU, Shanghai Inno, Lehigh U, BIG AI, BIGAI|??8

??http://arxiv.org/abs/2506.14837v1???
???https://huggingface.co/papers/2506.14837??

研究背景與意義

圖表代碼生成,ChartIR;視頻與文本統一多模態模型-AI.x社區

  1. 問題定義與現狀概述

多模態大語言模型(MLLMs)在視覺理解領域表現卓越,但在圖表到代碼生成任務中仍存在明顯不足。該任務不僅要求模型精準理解高密度、多維度的圖表信息,還需將其準確轉化為結構化且可執行的代碼。直接利用MLLMs進行此類復雜任務常常效果不佳,暴露出視覺理解與代碼翻譯兩大核心挑戰。

  1. 挑戰與目標闡明

當前主流方法存在訓練依賴、單一指標優化、優化過程不平衡等問題,限制了模型在圖表代碼生成上的表現。本文旨在提出一種無訓練、模型無關的迭代細化框架ChartIR,通過結構化指令顯著提升MLLMs的圖表理解與代碼生成能力,實現更高的視覺與結構一致性。

研究方法與創新

圖表代碼生成,ChartIR;視頻與文本統一多模態模型-AI.x社區

圖表代碼生成,ChartIR;視頻與文本統一多模態模型-AI.x社區

  1. 技術框架設計

ChartIR采用兩階段策略:初始代碼生成與迭代細化。初始階段通過多維度的結構化圖表描述,輔助模型理解圖表的文本、顏色、布局和類型等關鍵視覺特征。細化階段則基于生成圖表與參考圖表的差異描述,指導模型逐步修正代碼,提升生成圖表的整體質量。

  1. 創新點詳解
  • 結構化圖表描述機制:區別于傳統單一視覺輸入,ChartIR引入描述與差異兩類指令,將復雜視覺信息轉化為模型易理解的語言表示,顯著增強模型的視覺語義理解能力。
  • 迭代差異驅動的代碼細化:通過多維度差異分析,模型能針對具體視覺和結構缺陷進行精準修正,避免了以往單指標優化帶來的局部最優問題,實現全方位的圖表質量提升。
  • 訓練自由與模型無關性:無需額外訓練即可適配開源與閉源模型(如Qwen2-VL和GPT-4o),保證方法的通用性和實用性。
  1. 理論基礎與優勢ChartIR基于視覺-語言轉換和迭代優化理論,利用中間結構化表示橋接視覺感知與代碼生成的模態鴻溝。相較于現有方法,其多維度描述和綜合差異反饋機制使得模型能更全面地理解和修正圖表細節,提升了代碼生成的準確性和可執行性。

實驗設計與結果分析

圖表代碼生成,ChartIR;視頻與文本統一多模態模型-AI.x社區

圖表代碼生成,ChartIR;視頻與文本統一多模態模型-AI.x社區

  1. 實驗設置

采用Plot2Code和ChartMimic兩個公開基準數據集,分別評測開源模型Qwen2-VL和閉源模型GPT-4o。對比基線包括直接生成(Direct Generation)和最新的迭代多代理方法METAL。評價指標涵蓋GPT-4o主觀打分、文本、布局、類型、顏色等低層次視覺指標,以及PSNR、SSIM等傳統圖像相似性指標。

  1. 結果表現
  • ChartIR在所有指標上均優于基線,GPT-4o模型上GPT-4oScore提升達17%,表明生成圖表在視覺和結構上更接近參考圖。
  • 開源模型Qwen2-VL同樣受益顯著,尤其在傳統圖像質量指標和低層視覺指標上提升明顯,驗證了結構化描述對增強模型視覺理解的有效性。
  • 消融實驗顯示,描述和差異兩大模塊均為性能提升關鍵,缺一不可,且二者協同作用最為顯著。
  1. 多場景適用性實驗涵蓋多種圖表類型和復雜布局,ChartIR在多樣化場景中均展現出穩定且優越的性能,體現出良好的泛化能力和實用價值。

結論與展望

  1. 研究貢獻總結

本文提出的ChartIR框架通過結構化多維描述結合迭代差異細化,有效解決了圖表視覺理解與代碼翻譯的雙重難題,實現了無訓練、模型無關的高質量圖表代碼生成。實驗驗證了其在開源和閉源模型上的廣泛適用性和領先性能。

  1. 局限性分析
  • 計算資源需求較高,尤其在迭代細化階段,盡管查詢次數減少,但整體計算成本仍需優化。
  • 對閉源模型的提升空間有限,因其本身已具備較強的圖表理解能力,結構化指令的增益相對有限。
  1. 未來研究方向
  • 探索更高效的迭代策略和差異描述生成模型,以降低計算開銷。
  • 針對閉源模型,設計更具針對性的結構化指令或輔助模塊,進一步挖掘其潛力。
  • 擴展至更多復雜圖表類型及其他視覺到代碼轉換任務,推動多模態理解與生成技術的發展。

Show-o2: Improved Native Unified Multimodal Models

2025-06-18|NUS, ByteDance, NUS Show Lab|??6

??http://arxiv.org/abs/2506.15564v1???
???https://huggingface.co/papers/2506.15564???
???https://github.com/showlab/Show-o??

研究背景與意義

圖表代碼生成,ChartIR;視頻與文本統一多模態模型-AI.x社區

  1. 研究背景

隨著大型語言模型(LLMs)和大型多模態模型(LMMs)的迅猛發展,統一多模態模型(UMMs)成為整合文本、圖像及視頻理解與生成的關鍵方向。現有研究多聚焦于文本與圖像的融合,尚缺乏對視頻模態的高效統一處理。

  1. 研究意義

本文提出的Show-o2模型,基于3D因果變分自編碼器(VAE)空間,通過空間-時間融合機制構建統一視覺表示,突破了以往模型在多模態融合上的局限,實現了文本、圖像和視頻的原生統一理解與生成,推動多模態模型向更廣泛應用場景邁進。

  1. 挑戰與目標

現有多模態模型往往依賴大規模文本語料,且多模態理解與生成能力分離,難以兼顧高效擴展與性能。Show-o2旨在通過雙路徑融合及兩階段訓練策略,既保留語言知識,又提升視覺生成能力,實現統一、高效且可擴展的多模態模型設計。

研究方法與創新

圖表代碼生成,ChartIR;視頻與文本統一多模態模型-AI.x社區

圖表代碼生成,ChartIR;視頻與文本統一多模態模型-AI.x社區

圖表代碼生成,ChartIR;視頻與文本統一多模態模型-AI.x社區

  1. 統一視覺表示設計

采用3D因果VAE編碼器提取圖像和視頻潛變量,設計雙路徑架構:語義層(Semantic Layers)提取高層語義信息,投影器(Projector)保留低層細節,兩者通過空間-時間融合機制結合,生成統一視覺表示,兼顧多模態理解和生成需求。

  1. 原生統一多模態建模

結合預訓練語言模型,構建包含語言頭和流頭(Flow Head)的雙頭架構。語言頭負責文本的自回歸建模,流頭通過流匹配(Flow Matching)實現圖像和視頻的生成,二者原生集成于單一模型,避免了以往多模型組裝的復雜性。

  1. 兩階段訓練策略
  • 第一階段:針對流頭和視覺融合模塊進行訓練,利用66M圖文對及視頻文本數據,專注視覺生成能力的培養。
  • 第二階段:微調整個模型,結合高質量多模態理解指令和視覺生成數據,確保語言理解與視覺生成能力的協同提升。該策略有效避免了對大規模文本語料的過度依賴,保持語言模型的知識完整性。
  1. 技術優勢與創新點
  • 原生支持文本、圖像和視頻三模態,提升模型的通用性和擴展性。
  • 雙路徑融合機制兼顧語義與細節信息,增強多模態理解與生成效果。
  • 流匹配結合自回歸建模,創新地融合了兩種主流生成范式。
  • 兩階段訓練方案兼顧效率與效果,降低訓練成本,提升大規模模型訓練的可行性。
  1. 對比現有方法

相較于Chameleon、Transfusion和Show-o等模型,Show-o2不僅擴展到了視頻模態,還通過原生統一的模型架構和雙路徑融合機制,顯著提升了多模態任務的性能和生成質量。

實驗設計與結果分析

圖表代碼生成,ChartIR;視頻與文本統一多模態模型-AI.x社區

圖表代碼生成,ChartIR;視頻與文本統一多模態模型-AI.x社區

  1. 實驗設計
  • 數據集:采用66M圖文對、視頻文本對及高質量多模態指令數據,涵蓋豐富場景。
  • 模型規模:測試1.5B和7B參數兩種版本,驗證模型的可擴展性。
  • 評測指標:覆蓋多模態理解(MME、GQA、SEED-Bench等)和視覺生成(GenEval、DPG-Bench、VBench)多個權威基準。
  1. 多模態理解性能

Show-o2在多項理解指標中表現優異,1.5B版本在MME-p和MMU-val等指標領先同參數模型,7B版本超越多款7B及更大參數模型,證明統一視覺表示和融合機制的有效性。

  1. 視覺生成效果

Show-o2在圖像生成任務中,憑借僅66M圖文對訓練數據,達到甚至超越了依賴百億級數據訓練的競品模型。視頻生成方面,Show-o2以2B參數規模實現了對比更大模型的競爭力表現,生成視頻在語義連貫性和視覺質量上均表現優異。

  1. 混合模態生成能力

模型支持交錯文本與圖像的生成,能夠連貫敘述故事,展示了強大的多模態交互能力和生成一致性。

  1. 消融實驗
  • 空間-時間融合機制顯著提升了理解和生成指標。
  • 分類器無關引導(CFG)和推理步數調整對生成質量有積極影響。
  • 兩階段訓練策略對于最終性能提升至關重要。

結論與展望

  1. 總結貢獻

Show-o2提出了一種原生統一的多模態模型架構,通過雙路徑空間-時間融合和結合自回歸與流匹配的生成機制,實現了文本、圖像和視頻的統一理解與生成。兩階段訓練策略有效平衡了語言知識保留與視覺生成能力,模型在多項多模態理解和生成基準上均取得領先成績。

  1. 局限性

當前模型在圖像中文字渲染方面表現不足,存在一定的細節生成缺陷,提示未來需要加強視覺細節的表達能力。

  1. 未來展望
  • 引入更高分辨率視覺編碼與生成技術,提升細節表現。
  • 探索更高效的訓練與推理機制,降低計算資源需求。
  • 擴展更多模態融合,如音頻與三維數據,推動多模態模型向更廣泛應用拓展。
  • 加強模型在跨語言、多文化背景下的泛化能力,提升實用性與公平性。

本文轉載自??AI研究前瞻??,作者:胡耀淇

已于2025-6-23 10:50:16修改
收藏
回復
舉報
回復
相關推薦
国产高潮视频在线观看| 国产欧美中文字幕| 精品人妻一区二区三区日产乱码卜 | 日韩av电影免费观看高清完整版| 日韩中文字幕网| 亚洲香蕉中文网| 456亚洲精品成人影院| 亚洲视频在线一区观看| 精品国产福利| 国产强伦人妻毛片| 母乳一区在线观看| 久久99国产精品自在自在app| 成人影视免费观看| 欧美国产中文高清| 在线观看国产91| 97干在线视频| 欧洲不卡视频| 久久免费视频一区| 波多野结衣久草一区| 中文 欧美 日韩| 一区二区91| 久久成年人免费电影| 免费观看av网站| 日韩第一区第二区| 欧美日韩一级片在线观看| www在线观看免费| а√天堂资源地址在线下载| 91在线码无精品| 亚洲综合中文字幕在线观看| 成年人视频免费| 亚洲欧美日本日韩| 欧美精品在线播放| 婷婷国产成人精品视频| 国产精品一区二区三区av麻| 欧美精品一区二区蜜臀亚洲| 亚洲18在线看污www麻豆| 日韩电影网站| 欧美日韩亚洲网| 丁香六月激情婷婷| 任你弄在线视频免费观看| 1区2区3区国产精品| 色一情一区二区三区四区| 五月婷婷狠狠干| 波多野结衣视频一区| 国产精品麻豆免费版| 精品女同一区二区三区| 狠狠色丁香婷婷综合| 国产精品高清在线观看| 99久久精品国产亚洲| 99av国产精品欲麻豆| 91国内在线视频| 91视频免费网址| 亚洲欧美春色| 日本欧美一二三区| 波多野结衣小视频| 奇米影视在线99精品| 国产精品久久久久一区二区| 日韩xxx视频| 日韩电影免费一区| 国产美女精品免费电影| 一区二区久久精品66国产精品 | 欧美精品少妇| 久久久久国产免费免费| 欧美一级二级三级九九九| 国产区av在线| 国产精品水嫩水嫩| 免费看污污视频| 免费电影网站在线视频观看福利| 亚洲午夜免费福利视频| 日韩欧美国产综合在线| av资源亚洲| 欧美美女一区二区| 波多野吉衣在线视频| 欧美三级自拍| 亚洲图片制服诱惑| 日韩激情小视频| 欧美体内she精视频在线观看| 欧美精品xxx| 在线免费黄色av| 另类综合日韩欧美亚洲| 91精品国产91久久久久青草| 无码h黄肉3d动漫在线观看| 久久亚洲综合色| 一区不卡字幕| 国产精品偷拍| 91国在线观看| 奇米777在线| 三级小说欧洲区亚洲区| 中文字幕不卡在线视频极品| 国精产品一区一区二区三区mba| 午夜亚洲福利| 国产成人精品久久亚洲高清不卡| 在线免费看毛片| 成人av在线播放网址| 深夜福利成人| 日本性爱视频在线观看| 色婷婷激情综合| 在线观看视频在线观看| 一区三区在线欧| 欧美成人久久久| 日本中文字幕在线| 国产经典欧美精品| 欧洲一区二区在线| 羞羞视频在线观看不卡| 91国产成人在线| 国产麻豆剧传媒精品国产| 精品国产一区二区三区噜噜噜| 美女福利精品视频| 免费黄色片视频| 成人午夜激情影院| 在线视频欧美一区| xx欧美xxx| 欧美变态凌虐bdsm| 亚洲国产精品一区二区久久hs| 亚洲在线成人| 99久久精品免费看国产四区| 福利片在线看| 狠狠躁夜夜躁人人爽天天天天97| 日本成人xxx| 国产欧美一区二区三区精品观看 | 五月婷婷视频在线| 国产成a人亚洲| 一区不卡字幕| 欧美国产日韩电影| 亚洲视频欧洲视频| 国产无码精品一区二区| 国产乱人伦偷精品视频免下载| 欧美综合激情| 成人美女大片| 日韩激情视频在线播放| 18精品爽视频在线观看| 捆绑变态av一区二区三区| 欧美日韩系列| 在线看的毛片| 亚洲精品视频在线播放| 日产亚洲一区二区三区| 成人久久久精品乱码一区二区三区 | 懂色av影视一区二区三区| 一二三区视频在线观看| 亚洲欧美在线专区| 91久久久久久国产精品| 人人干在线视频| 欧美日韩高清一区二区不卡| 538精品视频| 日av在线不卡| 亚洲伊人婷婷| av国产精品| 免费av一区二区| 精品人妻av一区二区三区| 亚洲女爱视频在线| 在线观看免费不卡av| 四季av在线一区二区三区 | 国产成人一二片| 久久久久久久91| 乱色精品无码一区二区国产盗| 夜夜嗨av一区二区三区四季av| 黄页网站在线看| 黄色在线一区| 久久99精品国产一区二区三区| 精品极品在线| 国产一区二区日韩| 自拍偷拍第八页| 综合色中文字幕| 99久久久无码国产精品性波多| 欧美午夜一区| 久久国产精品久久| 经典三级一区二区| 日韩在线观看你懂的| 国产露脸国语对白在线| 亚洲影院久久精品| 国产又黄又粗又猛又爽的视频 | 欧美三级欧美成人高清www| 最近中文字幕免费| 久久国产精品第一页| 香蕉视频免费版| 青青草久久爱| 国产免费久久av| 青青青草视频在线| 亚洲欧美999| 91麻豆成人精品国产| 亚洲曰韩产成在线| 熟女高潮一区二区三区| 国内欧美视频一区二区| 国产深夜男女无套内射| 欧美日韩激情| 成人动漫视频在线观看完整版| 蜜桃麻豆av在线| 久久久国产在线视频| 人妻少妇精品无码专区| 欧美日韩精品一区视频| 国产在线观看99| 国产精品拍天天在线| 毛茸茸free性熟hd| 久久成人久久鬼色| 国产免费观看高清视频| 99久久99热这里只有精品| 久久爱av电影| 玖玖精品一区| 国产精品第8页| a级片免费在线观看| www.日韩不卡电影av| 婷婷综合激情网| 91麻豆精品国产综合久久久久久| 欧美 日韩 精品| 亚洲永久精品大片| 99自拍偷拍视频| 99国产麻豆精品| 亚欧精品在线视频| 美女视频黄久久| www日韩视频| 国产日韩综合| 精品人妻人人做人人爽| 久久大综合网| 色涩成人影视在线播放| 欧美三级午夜理伦三级小说| 99re视频在线| 99精品美女视频在线观看热舞| 国产成人精品久久亚洲高清不卡| 18aaaa精品欧美大片h| 欧美成人免费在线视频| h网站在线免费观看| 亚洲老板91色精品久久| 粉嫩小泬无遮挡久久久久久| 欧美一区永久视频免费观看| 中文字幕在线网址| 在线观看中文字幕不卡| 日日摸天天添天天添破| 午夜天堂影视香蕉久久| 久久中文免费视频| 亚洲欧美国产三级| 国产精品免费在线视频| 亚洲国产电影在线观看| 无码人妻aⅴ一区二区三区69岛| 97精品电影院| 中文字幕 日本| 9色porny自拍视频一区二区| 丝袜熟女一区二区三区 | 久久99精品久久久久久秒播放器 | 欧美国产一级片| 一本久道久久综合中文字幕| 欧美一级片免费在线观看| 偷偷要91色婷婷| aaa人片在线| 欧美性猛交xxxx免费看漫画| 国产精品xxxx喷水欧美| 天涯成人国产亚洲精品一区av| 精品无码久久久久久久| 亚洲乱码中文字幕| 99精品久久久久| 亚洲午夜一区二区三区| 一级免费在线观看| 色8久久精品久久久久久蜜| 国产情侣小视频| 欧美日韩一级黄| 99久久精品国产一区二区成人| 日韩一级高清毛片| 色婷婷激情五月| 亚洲精品一区二区网址| 欧美在线观看在线观看| 亚洲日本aⅴ片在线观看香蕉| 国产最新视频在线观看| 2021国产精品久久精品| 91浏览器在线视频| 亚洲污视频在线观看| 蜜臀精品一区二区三区在线观看 | 欧美第一页在线| 青春草视频在线| 欧美在线观看网址综合| 国产精品亚洲d| 国产日产欧美精品| 综合中文字幕| 欧美福利精品| 香蕉视频国产精品| www.99热这里只有精品| 日韩高清一区在线| 亚洲第一天堂久久| www.亚洲国产| 亚洲欧美日韩第一页| 一区二区三区四区亚洲| 亚洲天堂av片| 欧美精品18+| av中文字幕第一页| 日韩精品视频在线观看网址| 五月婷婷丁香花| 久久韩国免费视频| 国产网站在线| 国产在线观看91精品一区| 8x国产一区二区三区精品推荐| 蜜桃视频在线观看成人| 亚洲人metart人体| 欧美韩国日本在线| 国产精品一二三区| 国产免费无遮挡吸奶头视频| 亚洲激情成人在线| 中文字幕乱码人妻二区三区| 精品国产伦一区二区三区观看方式| 色吊丝在线永久观看最新版本| 久久伊人精品一区二区三区| 日韩pacopacomama| 福利精品视频| 91一区二区三区四区| 欧美日韩一道本| 国产精品99久| 亚洲aaa视频| 色综合咪咪久久| 亚洲精品国产片| 日韩一区av在线| 精品成人av| 久久久久久久久久码影片| 中文字幕亚洲精品乱码| 丁香婷婷激情网| av男人天堂一区| www.色小姐com| 欧美电影在线免费观看| 蜜桃视频在线观看视频| 韩国视频理论视频久久| 亚洲精品一区二区三区中文字幕| 一区二区三区四区五区视频| 亚洲一区网站| 少妇激情一区二区三区视频| 亚洲精品视频免费看| 伊人网站在线观看| 亚洲偷欧美偷国内偷| 欧美大胆成人| 久久久久久久久久久久久久一区| 亚洲特级毛片| 精品人妻在线视频| 亚洲另类中文字| 国产绿帽一区二区三区| 日韩视频免费观看| 91成人在线| 四虎一区二区| 日日夜夜免费精品| 亚洲做受高潮无遮挡| 精品欧美一区二区三区| 蜜桃av噜噜一区二区三区麻豆 | 亚洲天堂免费电影| 国产伦精品一区二区三区四区免费| 欧美激情aⅴ一区二区三区| 欧美视频亚洲图片| 亚洲男帅同性gay1069| 国产又粗又猛又爽又黄视频| 久久精品国产视频| 99视频有精品高清视频| 国产免费xxx| 国产91综合网| 日本少妇性高潮| 一卡二卡在线观看| 欧美成人激情在线| 成人免费直播在线| 九色在线视频观看| 久久久久久影视| 中文字幕乱码人妻无码久久| 日韩视频在线一区| 欧美专区视频| 日本xxxxxxxxxx75| 日本亚洲三级在线| 欧美成人全部免费| 国产18精品乱码免费看| 欧美日韩成人在线播放| 91精品国产自产精品男人的天堂 | 欧美三级日韩在线| 日本视频在线| 5g国产欧美日韩视频| 亚洲视频一区| 国产肥白大熟妇bbbb视频| 欧美日韩视频在线一区二区| 成年人网站在线| 九九99玖玖| 奇米影视一区二区三区| 欧美国产日韩在线观看成人| 精品国产一区二区亚洲人成毛片| 国产网站在线| 一区二区av| hitomi一区二区三区精品| 久久久久久久久黄色| 久久久精品久久久久| 精品精品国产毛片在线看| 欧美国产日韩在线播放| 亚洲日本护士毛茸茸| 亚洲精品综合久久| 国产精品99久久久久久久久| 一级欧洲+日本+国产| 国产又爽又黄无码无遮挡在线观看 | 亚洲熟妇无码av在线播放| 久久综合色鬼综合色| 国产一区二区三区中文字幕 | 久热这里只有精品6| 日韩综合视频在线观看| 欧洲亚洲视频| 亚洲天堂av一区二区三区| 精品久久久中文| 91激情在线| 欧美视频一区二区三区…| 日韩中文字幕a| 樱花影视一区二区| 欧美日本网站| 99热99热| 蜜臀av性久久久久蜜臀aⅴ流畅| 久久久久久久国产精品毛片|