阿里云登頂NL2SQL權威榜單,數據開發分析效率平均提升35%
9月2日消息,NL2SQL(自然語言轉SQL)領域權威榜單Spider 2.0-Snow公布了最新測試結果,阿里云研發的DB-Surfer以59.78%的準確率登頂榜單,這一成績代表了NL2SQL 技術在復雜真實場景中的最高水平。

NL2SQL誕生于上世紀九十年代,旨在打破數據查詢的壁壘,讓非專業用戶通過自然語言的方式訪問和處理數據,例如用戶輸入「查詢某電商平臺數碼產品的日均銷售額」,可幫助用戶自動查詢并將計算結果返回。近兩年大語言模型的成熟大幅提升了NL2SQL系統的準確率,但面向復雜的真實數據分析場景,NL2SQL的任務解決率依舊較低。
作為該領域"最接近真實企業場景"評測集,Spider 2.0基于 632 個真實企業數據庫工作流問題構建,覆蓋金融、醫療、電商等 18 個垂直領域,并全面考察NL2SQL產品的多表關聯、長上下文理解、復雜邏輯推理等能力,也是檢驗NL2SQL產品商業化能力的重要標準。
測試結果顯示,阿里云研發NL2SQL Agent——DB-Surfer以59.78% 的執行準確率斬獲冠軍,超越了國內外多個基于商業大模型的Agent方法,并顯著優于基于固定工作流的 ReFoRCE (37.11%) 和基線智能體方法 Spider-Agent (31.08%)。
據介紹,為滿足超大規模、高復雜度的數據庫查詢任務需求,阿里云DB-Surfer設計了查詢意圖預處理、代碼智能體執行和多源路徑后處理三個模塊,通過“先規劃、后執行”的機制顯著提升了Agent查詢和處理的效率,可以更好地解決數據庫結構復雜、SQL方言多樣、查詢邏輯深度嵌套等難題。
該范式還支持集成多樣化的外部工具,并自主學習海量新知識,可進一步推動NL2SQL技術從單一的查詢生成工具,向更具挑戰性的、能在開放場景下泛化的數據分析助手演進。

DataWorks Copilot - Agent 模式演示
目前,DB-Surfer已深度集成至阿里云大數據開發治理平臺DataWorks的Copilot,并廣泛應用于游戲、在線教育、零售、文化傳媒和金融等領域企業,數據開發分析效率平均提升35%。























