全國(guó)首批 阿里達(dá)摩院文檔AI通過(guò)信通院權(quán)威評(píng)測(cè)
8月16日,中國(guó)信通院在可信AI峰會(huì)上發(fā)布智能文檔處理首輪評(píng)測(cè)結(jié)果,阿里達(dá)摩院文檔智能平臺(tái)表現(xiàn)優(yōu)異,成為全國(guó)首批獲得“可信AI認(rèn)證”的文檔AI產(chǎn)品。文檔AI能識(shí)別和理解票據(jù)、合同、表格等各種復(fù)雜文檔,是業(yè)界公認(rèn)的高度難技術(shù)之一,阿里達(dá)摩院已構(gòu)建出完整的技術(shù)棧,持續(xù)引領(lǐng)業(yè)界方向。
中國(guó)信通院從2018 年起開(kāi)始建設(shè)“可信AI”評(píng)測(cè)體系,逐漸成為國(guó)內(nèi)人工智能權(quán)威評(píng)測(cè)體系,覆蓋產(chǎn)品服務(wù)能力、應(yīng)用成熟度和可信風(fēng)險(xiǎn)三大類(lèi)。今年中國(guó)信通院首次針對(duì)智能文檔處理(IDP)發(fā)起評(píng)測(cè),通過(guò)百余項(xiàng)關(guān)鍵指標(biāo)進(jìn)行全方位評(píng)估,達(dá)摩院文檔AI在技術(shù)能力、產(chǎn)品能力、應(yīng)用能力三項(xiàng)上均獲得最高的5級(jí)評(píng)價(jià),表現(xiàn)優(yōu)異。 信通院指出,達(dá)摩院文檔AI功能完備,場(chǎng)景豐富,行業(yè)覆蓋廣,且具備較高的準(zhǔn)確率、可接受度總體較高。
據(jù)介紹,文檔AI是OCR(光學(xué)字符識(shí)別)技術(shù)的進(jìn)一步升級(jí)。傳統(tǒng)OCR主要針對(duì)固定版式下的文字識(shí)別,難以應(yīng)對(duì)復(fù)雜情況。文檔AI能夠分析各種隨機(jī)版式,識(shí)別文檔中的層級(jí)和結(jié)構(gòu)關(guān)系,甚至理解復(fù)雜的表格…由于任務(wù)復(fù)雜多樣,文檔AI需要深度融合自然語(yǔ)言處理和計(jì)算機(jī)視覺(jué),一直是業(yè)界公認(rèn)的高難度技術(shù)之一。
阿里達(dá)摩院早在2019年就率先提出基于圖模型的多模態(tài)文檔信息抽取方案,引領(lǐng)業(yè)界發(fā)展方向;目前已構(gòu)建出完整的文檔AI技術(shù)棧,除了文檔核心處理技術(shù)外,還包括底層的電子文檔解析、OCR以及自學(xué)習(xí)平臺(tái)。同時(shí),達(dá)摩院還在探索下一代文檔智能技術(shù),提出了多模態(tài)文檔理解模型Bi-VLDoc,首次通過(guò)不同模態(tài)信號(hào)交叉監(jiān)督、不同模態(tài)強(qiáng)制混合注意力,實(shí)現(xiàn)了視覺(jué)-語(yǔ)言的雙向精準(zhǔn)對(duì)齊,在業(yè)界四個(gè)代表性的文檔理解數(shù)據(jù)集中均取得最佳模型效果(SOTA)。

達(dá)摩院在四個(gè)代表性數(shù)據(jù)集上創(chuàng)造了新SOTA
據(jù)了解,達(dá)摩院文檔AI支持合同、票據(jù)、報(bào)表等各種文檔內(nèi)容的自動(dòng)識(shí)別、提取、分類(lèi)、整合及校驗(yàn),已廣泛應(yīng)用于海關(guān)、法律、醫(yī)療、金融等行業(yè),是企業(yè)數(shù)字化的重要支撐技術(shù)之一。以海關(guān)報(bào)關(guān)業(yè)務(wù)為例,它在上海、寧波等五大港區(qū)落地,讓企業(yè)報(bào)關(guān)人員免去了繁復(fù)的手工錄入。相關(guān)系統(tǒng)運(yùn)行兩年多來(lái),已處理超過(guò)兩百萬(wàn)票報(bào)關(guān)業(yè)務(wù),為報(bào)關(guān)企業(yè)提效3.5倍。此外,達(dá)摩院文檔AI還應(yīng)用于盲文識(shí)別,將盲文翻譯成漢字和數(shù)字,已落地浙江省盲人學(xué)校,助力普惠教育。

AI自動(dòng)生成報(bào)關(guān)單

AI翻譯盲文數(shù)學(xué)試卷
據(jù)介紹,阿里巴巴持續(xù)重點(diǎn)投入文檔AI在內(nèi)的人工智能前沿研究。國(guó)際權(quán)威研究機(jī)構(gòu)Gartner最新的《云AI開(kāi)發(fā)者服務(wù)關(guān)鍵能力報(bào)告》顯示,阿里巴巴在語(yǔ)言AI領(lǐng)域排名全球第二,創(chuàng)下中國(guó)企業(yè)最好成績(jī)。
























