精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力 原創

發布于 2025-4-2 07:35
瀏覽
0收藏

公式識別是文檔智能解析中的重要一環,本文筆者將介紹筆者自己的工作,供參考。

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

問題陳述與動機

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

核心問題:當前的數學表達式識別(MER)模型難以處理復雜公式中的層次結構和細粒度細節。

數學公式是邏輯的建筑藍圖——它們在求和符號中嵌套分數,在行文中堆疊矩陣,并分支為條件分段函數。然而,盡管數學公式具有復雜的結構,當前的數學表達式識別(MER)模型甚至難以可靠解析中等復雜度的表達式。試想:當公式的視覺密度增加時,其渲染圖像會擴大以保持清晰度。但問題在于——模型會將所有輸入嚴格調整為224×224像素等固定尺寸。圖1中的負號在原始高分辨率圖像中清晰可辨,但經過壓縮后,它會坍縮成一個與分數線模糊融合的兩像素污點。這種壓縮會引發連鎖故障:下標與基準字符粘連,括號等定界符失去方向感,層級關系消解為視覺噪聲。

數學表達式識別挑戰

復雜公式帶來了三個關鍵挑戰。首先,層次嵌套(如分數內的矩陣)需要精確解析。其次,不同LaTeX代碼可能渲染出相同圖像,導致歧義問題。第三,現有數據集規模小且缺乏結構多樣性。

為應對這些挑戰,我們提出三項貢獻,重新定義數學表達式識別領域:

  1. HDR數據集——MER研究的重大突破。不同于局限于簡單方程的現有數據集,HDR包含超過10億個公式,精心組織為HDR-100M訓練集和覆蓋12個復雜度層級的專項測試集。從基礎分數到嵌套矩陣求和,再到多分支分段函數,該資源完整捕捉了真實科學符號的多樣性。每個公式包含多標簽注釋和替代性語法表示,使模型能夠學習不同LaTeX格式的等價表達。
  2. HDNet架構——帶有顛覆性層次子公式模塊的編解碼架構。其動態裁剪機制可分離求和界限、矩陣括號、分數線等關鍵子組件,在分層融合特征前對每個組件進行最優分辨率處理。
  3. 公平評估協議——針對MER評估體系性缺陷的解決方案。現有指標將有效LaTeX變體誤判為錯誤,混淆語法偏好與真實錯誤。我們的評估協議為數學等價表達式建立等價類標準。

1. HDR數據集

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

首先是HDR數據集。我們在表1中的分析展示了HDR-Test如何系統地按層次級別和線條數對公式進行分類。HDR數據集涵蓋八個類別的公式,其復雜度分別由層次級別和線條數計算得出。

分層如下:

  • 0級:獨立字符

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

  • 1級:字符+位置關系
  • 公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

  • 2級:構造結構

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

  • 3級:多層
  • 公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

首先是HDR數據集。為標準化公式復雜度的表示,我們在此解釋層次級別的含義:

在0級,我們定義原子元素——獨立字符如"a"或數字,它們是構成公式的基礎單元。當這些元素與上標、下標等操作符結合時,復雜度上升至1級。

2級引入結構性復雜度——分數、積分或求和符號。此時空間關系決定了語義。但真正的挑戰出現在更高層級,公式呈現俄羅斯套娃式嵌套結構:例如包裹矩陣的分段函數,這類表達式要求跨多層精確匹配開閉定界符。

通過在復雜度梯度上訓練模型,我們迫使它們掌握LaTeX的結構語法——不僅識別符號,更要理解其嵌套依賴關系。這種層次劃分不僅是理論概念,更是解析真實公式的關鍵。

HDR-1億數據集提供了前所未有的規模和多樣性,涵蓋了從數學到計算機科學領域的arXiv論文中的公式。HDR測試集包含多標簽注釋,以涵蓋有效的LaTeX變體。如圖3所示,HDR在復雜性方面超越了先前的數據集,能夠支持強大的模型訓練和評估。

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

2. HDNet架構

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

Encoder-Decoder: ViT encoder + Transformer decoder

HDNet將視覺Transformer編碼器與Transformer解碼器相結合。其關鍵創新點在于特征融合:將主公式的全局上下文信息與子公式的局部細節信息相融合。損失函數通過參數α來平衡主公式損失和子公式損失。這種雙重關注確保了對公式結構和細節的準確解析。

在訓練過程中,如圖2的左側所示,公式會根據其標簽進行分層解析。每個公式會被拆分、渲染并調整大小成為子公式。主公式也會進行渲染和調整大小。主公式和子公式都會被輸入到編碼器中以提取特征。然后,子公式的特征會通過加權聚合的方式與主公式的特征相融合,以提供額外的視覺細節信息。經過加權的特征會被傳遞到解碼器,以預測主公式的結果。此外,每個子公式的特征會被單獨傳遞到解碼器,以預測子公式的結果。該模型的優化目標包括主公式的損失以及子公式損失的總和。

loss如下:

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

公平評估策略

評估的公平性至關重要。傳統的評估方法局限于字符層面,當數學公式圖像可以用多種有效方式進行解釋時,這些方法往往無法公平地評估模型。由于具有功能等效性的LaTeX命令,預測結果和真實標簽在字符層面可能會有所不同,但作為圖像渲染出來時卻是相同的。例如,一些LaTeX公式在功能上是相同的,但在文本表達上存在差異。

為了克服這一問題,如圖所示,我們提出了一種簡單而高效的評估策略,該策略考慮了功能等效表達式的所有有效解析選項。我們的方法在進行字符層面的評估之前,會用等效表達式來替換標簽和模型預測結果。

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

這種方法能夠涵蓋更廣泛的有效表達式,確保在識別和解析復雜公式時,對模型性能進行更可靠、更公平的評估。通過處理基于LaTeX的公式生成過程中的可變性,我們的策略提高了字符層面評估的準確性和公平性。

評價指標:Edit distance, BLEU, character recall

實驗評測

我們將HDNet與一些基線模型進行了比較,結果見表。HDNet的表現優于所有基線模型,實現了最高的字符召回率(0.968)、最低的平均編輯距離,以及最高的BLEU分數。

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

跨數據集泛化

我們還對現有的公式識別數據集進行了比較,HDNet同樣取得了最佳結果。值得一提的是,HDNet在參數數量方面也具有優勢,如圖4所示,子公式模塊并未增加額外的參數。

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

消融實驗

為了驗證我們的分層子公式模塊,我們進行了四種配置下的消融實驗:不裁剪、隨機裁剪、子公式裁剪,以及子公式和隨機裁剪相結合。

實驗結果總結在表IV中,結果表明“子公式 + 隨機裁剪”的配置取得了最佳性能,公平字符召回率(Fair-CR)得分達到了0.968。然而,僅使用子公式裁剪時,得分降至0.837。這是為什么呢?

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

子公式裁剪在訓練過程中依賴標簽來提取子公式,但在測試階段這些標簽是不可用的。這就導致了訓練階段和測試階段之間的不匹配。通過將子公式裁剪與隨機裁剪相結合(在訓練和測試中都一致應用),我們消除了這種差距,確保了模型的穩健性能。

這個實驗強調了使訓練條件和推理條件保持一致的重要性,尤其是對于像數學表達式識別(MER)這樣對細節敏感的任務來說。

總結與展望

我們的工作解決了數學表達式識別(MER)領域的兩個根本性局限:一是缺乏能夠涵蓋復雜層次結構的數據集,二是現有模型無法解析復雜公式中的細粒度細節。

首先,HDR數據集為MER研究樹立了新的標桿。它擁有一億個訓練樣本,并且有一個涵蓋多個不同學科領域的多標簽測試集。這促使模型去處理嵌套結構、多行公式以及功能等效的解釋。通過納入從簡單字符到深度嵌套矩陣的不同層次,HDR彌合了理論研究與實際應用之間的差距。

其次,HDNet重新定義了模型處理復雜公式的方式。它的分層子公式模塊將表達式分解為高分辨率的子組件,從而實現對細節的精確識別。通過融合主公式及其子公式的特征,HDNet在面對尺度變化和復雜的符號排列時表現出很強的穩健性。雙重損失函數進一步確保了平衡優化,既重視全局結構,又注重局部的準確性。

我們的實驗表明,HDNet優于現有的MER模型,在編輯距離和字符召回率等指標上均取得了最佳性能。至關重要的是,我們引入了一個公平的評估框架,該框架考慮了公式的多種有效解釋,這是對以往嚴格的字符層面比較的一種范式轉變。

展望未來,我們設想HDNet將成為科學文獻分析、教育技術以及多語言公式識別的基礎工具。未來的工作將擴展HDR數據集,使其包含手寫表達式,并針對實時應用對HDNet進行優化。

總之,HDR數據集和HDNet架構解決了數學表達式識別(MER)領域的關鍵缺陷。未來的工作將包括將其擴展到手寫表達式識別以及多語言環境中。


公眾號大模型自然語言處理  作者:余俊暉

原文鏈接:??https://mp.weixin.qq.com/s/jqanDf9Vk_IXJx5XEJkw3w??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2025-4-2 07:35:30修改
收藏
回復
舉報
回復
相關推薦
国产1区2区3区4区| 国产福利精品一区二区三区| 午夜性色福利视频| 久热精品视频| 久久精品99无色码中文字幕| 精品人妻一区二区三| 涩涩视频在线播放| 中文字幕一区二区三区四区不卡 | 正在播放木下凛凛xv99| 欧美一区二区| 亚洲性视频网址| 国产乱国产乱老熟300部视频| 亚洲黄色免费看| 亚洲人成伊人成综合网小说| 欧美高清视频一区| www.久久久久久| 蜜臀精品一区二区三区在线观看| 欧美激情精品久久久久久大尺度| 亚洲av熟女国产一区二区性色| 日本免费精品| 欧美色电影在线| 国产极品尤物在线| caoporn97在线视频| 国产亚洲精品超碰| 国产亚洲情侣一区二区无 | 精品美女一区二区三区| 五月婷婷狠狠操| 免费看男女www网站入口在线| 国产精品国产三级国产普通话99 | 欧美一区二区少妇| 成人性视频网站| 成人啪啪免费看| 久久这里只有精品9| 国产日韩欧美| 久久久综合免费视频| 91插插插插插插| 日韩在线观看电影完整版高清免费悬疑悬疑 | 欧美成人全部免费| 天堂av免费在线| 不卡在线一区二区| 亚洲天堂av网| 亚洲精品一区二区三区影院忠贞| 亚洲精品小区久久久久久| 精品久久久久久久人人人人传媒| 极品人妻一区二区| 午夜精品在线| 欧美tickling网站挠脚心| 国产黄色一区二区三区| 国产精品亚洲四区在线观看| 欧美日韩国产一级二级| 91亚洲精品久久久蜜桃借种| 久久精品xxxxx| 欧美日韩中文字幕精品| 三级在线视频观看| 国产资源一区| 欧美一区三区二区| 青娱乐国产精品视频| 95精品视频| 欧美一级日韩不卡播放免费| 国产探花在线观看视频| 日韩欧美中文字幕在线视频| 日韩亚洲欧美在线观看| 无码av免费精品一区二区三区| 日韩影片在线观看| 亚洲国产黄色片| av网站有哪些| 日韩伦理视频| 久99九色视频在线观看| 国产成人精品av久久| 亚洲日本欧美| 国产成人拍精品视频午夜网站| 天天射天天干天天| 精品在线播放午夜| 国产精品xxx在线观看www| 午夜成人鲁丝片午夜精品| 久久久久免费观看| 中文字幕中文字幕99| 1stkiss在线漫画| 精品久久久久久久久久ntr影视| 国产a级一级片| 福利一区二区免费视频| 欧美一区二区三区喷汁尤物| 日本一级大毛片a一| 亚洲图片久久| 久久偷看各类女兵18女厕嘘嘘 | 国产在线不卡| 国产成人97精品免费看片| 一级欧美一级日韩| 成人av影院在线| 亚欧洲精品在线视频免费观看| 成人短视频在线| 欧美性精品220| 国产亚洲视频一区| 牛牛影视久久网| 日韩在线国产精品| 日本熟伦人妇xxxx| 久久国产福利国产秒拍| 久久国产精品久久| 欧美精品日韩少妇| 婷婷夜色潮精品综合在线| 爱情岛论坛亚洲首页入口章节| 伊色综合久久之综合久久| 亚洲美女av电影| 四虎免费在线视频| 日韩**一区毛片| 国产乱码一区| 老司机在线永久免费观看| 欧美日韩一区二区精品| 国产91在线免费观看| 欧美日韩一区二区三区四区不卡 | 精品国产成人系列| www.涩涩爱| 国产农村妇女精品一区二区| 91亚洲精华国产精华| 欧美18xxxxx| 午夜精品福利在线| 国产一级片中文字幕| 国产va免费精品观看精品视频| 欧美国产在线视频| 夜夜骚av一区二区三区| 久久综合一区二区| 精品国偷自产一区二区三区| 国产午夜久久av| 自拍亚洲一区欧美另类| 在线观看 亚洲| 99久久婷婷国产综合精品电影| 成人免费看片视频在线观看| 在线成人视屏| 亚洲天堂开心观看| 性无码专区无码| 久久综合色天天久久综合图片| 亚洲熟妇无码av在线播放| 日本精品久久| 伊人久久免费视频| 高潮毛片又色又爽免费 | 国语精品中文字幕| 羞羞的视频在线观看| 88在线观看91蜜桃国自产| 91激情视频在线观看| 先锋影音国产一区| 久久久久久国产精品mv| 久久男人av资源站| 亚洲精品国产精品自产a区红杏吧| 强乱中文字幕av一区乱码| 国产一区二区毛片| 国产精品一区在线免费观看| www 久久久| 欧美成人精品一区| 精品久久久中文字幕人妻| 亚洲女性喷水在线观看一区| 中文字幕一区二区在线观看视频| 午夜影院欧美| 亚洲专区在线视频| 女子免费在线观看视频www| 日韩欧美自拍偷拍| 精品午夜福利在线观看| 成人午夜视频免费看| 日本网站免费在线观看| 综合亚洲自拍| 国产精品久久久久不卡| 91激情在线| 日韩一区二区视频| 国产无套内射又大又猛又粗又爽 | 91精品国产乱码久久蜜臀| 亚洲一二三在线观看| 国产精品一区久久久久| 红桃一区二区三区| 精品丝袜久久| 日本视频久久久| 91xxx在线观看| 日韩一本二本av| 国产小视频在线免费观看| 国产日韩欧美不卡在线| 天天色天天综合网| 伊人精品成人久久综合软件| 欧美成人蜜桃| 自拍偷拍亚洲| 国语自产精品视频在线看| 美女欧美视频在线观看免费| 欧美午夜电影一区| 久久精品美女视频| 国产日韩欧美精品一区| 最新av免费在线观看| av成人激情| 一本一道久久a久久精品综合| 综合激情久久| 国产精品入口福利| а√在线中文在线新版| 在线观看欧美成人| 欧美特级特黄aaaaaa在线看| 在线免费精品视频| 久草视频免费在线播放| 国产日韩在线不卡| 国产探花一区二区三区| 老牛国产精品一区的观看方式| 在线免费一区| 免费成人网www| 999在线观看免费大全电视剧| 人人视频精品| 欧美精品成人在线| 在线免费观看黄色网址| 亚洲第一色在线| 一级α片免费看刺激高潮视频| 午夜电影一区二区| 国产精品99久久久久久成人| 久久久久青草大香线综合精品| 日本泡妞xxxx免费视频软件| 蜜臀99久久精品久久久久久软件 | 久久国产人妖系列| 国产极品粉嫩福利姬萌白酱| 亚洲有吗中文字幕| 日韩片电影在线免费观看| 福利片在线一区二区| 国产日韩在线免费| 欧美xnxx| 欧美有码在线视频| av老司机在线观看| 欧美精品在线播放| 黄色一级大片在线免费看产| 亚洲偷熟乱区亚洲香蕉av| 网站黄在线观看| 欧美精品一区二区三区一线天视频 | 3d成人h动漫网站入口| 日本中文字幕第一页| 亚洲国产成人va在线观看天堂| 一级黄色片日本| 国产精品视频九色porn| 免费黄色在线视频| 2021中文字幕一区亚洲| 日韩片在线观看| 99久久婷婷国产| 99久久免费看精品国产一区| 国产999精品久久| 日本一级大毛片a一| 豆国产96在线|亚洲| 亚洲天堂小视频| 国产精品1区2区3区在线观看| 免费网站在线观看黄| 久久国产乱子精品免费女| 免费看污污网站| 青青草国产成人99久久| 中文字幕国产传媒| 蜜桃av一区二区三区电影| 深夜黄色小视频| 久久国内精品自在自线400部| 超碰在线人人爱| 久久国产精品一区二区| 亚洲制服中文字幕| 国产成人自拍网| www男人天堂| 91蜜桃在线免费视频| av网站有哪些| 欧美激情一区二区三区蜜桃视频| av网在线播放| 国产精品入口麻豆原神| 日韩欧美国产成人精品免费| 一区二区三区在线播放| 午夜偷拍福利视频| 狠狠干狠狠久久| 天天爽夜夜爽人人爽| 在线亚洲人成电影网站色www| 中文字幕视频一区二区| 884aa四虎影成人精品一区| 性生活黄色大片| 亚洲精品videossex少妇| 你懂的在线看| 最新中文字幕亚洲| 超碰在线无需免费| 国语自产精品视频在线看抢先版图片 | 制服丝袜第一页在线观看| 成人高清免费观看| 成人午夜剧场视频网站| 国产精品国产三级国产a | www免费在线观看| 国内外成人免费激情在线视频| 在线免费看h| 国产一区二区色| 久久夜色电影| 亚洲精品一品区二品区三品区 | 久久国产乱子伦免费精品| 七七婷婷婷婷精品国产| 在线观看欧美一区二区| 久久青草欧美一区二区三区| 女同久久另类69精品国产| 亚洲丶国产丶欧美一区二区三区| 中文字幕日韩免费| 日韩亚洲欧美高清| 第一页在线观看| 久久男人av资源网站| 国模套图日韩精品一区二区| 91免费人成网站在线观看18| 成人午夜大片| 一区二区免费在线视频| 在线精品亚洲| 午夜啪啪小视频| 26uuu亚洲| 青娱乐av在线| 欧美人妖巨大在线| 天堂91在线| 欧美激情按摩在线| 成人免费在线观看视频| 国产精品视频入口| 99久久久久国产精品| 国模吧无码一区二区三区| 国产黄色成人av| 视频国产一区二区| 色94色欧美sute亚洲13| 黄色成人一级片| 久久成人在线视频| 日本精品另类| 精品日本一区二区三区| 综合一区av| 日本黄大片一区二区三区| 91蜜桃网址入口| 免费在线视频一区二区| 欧美男生操女生| 成人性爱视频在线观看| 欧美做爰性生交视频| 亚洲一区二区电影| 亚洲伊人婷婷| 视频一区二区三区中文字幕| 人妻在线日韩免费视频| 亚洲一区二区三区四区在线观看 | 日本欧美韩国国产| 9色porny| 高清不卡在线观看av| 无码黑人精品一区二区| 精品视频999| av网站在线免费观看| 国产99视频精品免视看7| 亚洲警察之高压线| 熟女性饥渴一区二区三区| av中文字幕不卡| 日本中文字幕网| 亚洲国产成人一区| av成人影院在线| 精品国产乱码久久久久久丨区2区| 影视一区二区| 佐山爱在线视频| 一区二区三区在线播| 亚洲第一天堂影院| 久久99亚洲热视| 中文字幕一区二区三区中文字幕| 欧美黄网在线观看| 国产成人精品网址| 国产精品.www| 亚洲精品午夜精品| 高清成人在线| 亚洲精品国产系列| 韩日欧美一区二区三区| 国产黄色的视频| 日韩免费在线观看| av中文在线资源库| 久久综合精品一区| 日本不卡视频在线观看| 久久av红桃一区二区禁漫| 69久久夜色精品国产69蝌蚪网| 91精品国产91久久久久久青草| 亚洲一区国产精品| 亚洲午夜久久久久久尤物| 91视频啊啊啊| 欧美亚洲丝袜传媒另类| 免费网站黄在线观看| 1卡2卡3卡精品视频| 极品中文字幕一区| 毛片网站免费观看| 欧美卡1卡2卡| 欧美韩日亚洲| 欧美激情论坛| 激情综合网天天干| 久久亚洲国产成人精品性色| 国产视频久久久久| 国产成人福利夜色影视| 狠狠噜天天噜日日噜| 久久综合狠狠综合| 一本一道精品欧美中文字幕| 久久99久久99精品中文字幕| 日本午夜精品| 图片区乱熟图片区亚洲| 亚洲图片欧美视频| 国产中文字幕在线看| 91免费视频网站| 久久三级视频| 国产成人福利片| 天天操天天摸天天爽| 亚洲欧美日韩国产一区二区三区 | 自拍偷拍99| 不卡av在线免费观看| 波多野结衣黄色| 欧美日韩成人网| 欧美精品久久久久久| 超碰人人cao| 欧美亚洲动漫精品| 9999在线视频| 伊人久久大香线蕉av一区| yourporn久久国产精品| 亚洲一区在线观| 欧美一级大片在线观看| 欧美另类综合| 精品伦精品一区二区三区视频密桃|