螞蟻集團獲得Spider冠軍,登上兩項NL2SQL權威榜單榜首
日前,螞蟻集團憑借在語義解析領域提出的中間表征語言PQL,超越了Meta、Allen Institute for AI、微軟、達摩院、耶魯大學、上海交通大學等研究機構和科技企業,以78.5分的成績獲得了NL2SQL國際權威榜單Spider的第一名,刷新了該任務的業界記錄。

近年來,運用人工智能技術提高結構化數據利用效率成為了業界研究熱點,NL2SQL(Natural Language to SQL)是一種自動將用戶輸入的自然語言轉成數據庫可操作SQL查詢語句的技術,可以有效提高人機交互效率,實現基于數據庫的自動問答能力,因此在對話系統、商業智能等場景有重要應用價值。
Spider數據集由耶魯大學提出,是業界公認的NL2SQL領域難度最大的大規模跨領域評測榜單,共涵蓋138個不同的領域,包含10181個問題、5693個復雜SQL查詢語句、200個多表數據庫,自2018年提出至今,Spider吸引了眾多國際領先機構參加測評,榜單排名競爭激烈。此次摘下冠軍,顯示出螞蟻集團在NL2SQL技術上的領先性。
在本次評測中,螞蟻集團智能服務團隊聯合螞蟻財富、搜索等螞蟻NLP研究小組共同設計了中間表征語言PQL,這是一種能同時兼容表格與圖譜查詢的中間語言,相比SQL,它能以更簡潔的語法來表征自然語言問題,對問題中存在的關鍵推理路徑進行對齊,并合并查詢圖中存在冗余或同義結構,從而有效提升模型對推理路徑的識別準確性。
近幾年,螞蟻集團在NL2SQL方向上深入多項研究,并結合NL2SQL、對話管理等技術提供結構化表格的多輪對話問答能力,目前這一技術已經在螞蟻財富智能理財助理"支小寶"、客服等多個場景應用,可以將用戶求助自動轉化為背后數據庫查詢,實現復雜問題的理解和回答。例如,當投資者遇到無法快速找到目標基金的問題時,“支小寶”可以通過NL2SQL的技術能力及豐富的金融領域數據,來幫助投資者解決,讓投資者不僅能直接用“所屬板塊、基金經理、漲跌幅、夏普比” 等超過200種條件進行查詢,還可以自由組合條件,實現“所想即所得”的用戶體驗。據了解,目前“支小寶"共累計回復了超過1億次金融問答類理財問題,對該類問題的準確識別率達到了93%。
根據公開信息,去年6月,螞蟻集團智能服務算法團隊和支小寶團隊登上了NL2SQL領域另一權威榜單WikiSQL的榜首。


























