精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

浙大開源“最懂Excel的GPT”!首次將結構化數據作為獨立模態訓練,刷榜提升40百分點

人工智能 新聞
這就是由LeCun高徒、浙江大學博導趙俊博領銜打造的TableGPT2。

大模型理解復雜表格,能力再次飛升了!

不僅能在不規則表格中精準找到相關信息,還能直接進行計算。

比如提問:

如果2022年出口總額的人民幣計價比實際數值少了10%,請計算新的出口總額并與實際數據比較。

普通的大模型要么找不到正確的單元格信息,要么會計算錯誤。

而最新模型給出了正確回答:

實際出口總額為121324327.3663萬元,減少10%后的出口總額為109191894.62967001萬元。

圖片

這就是由LeCun高徒、浙江大學博導趙俊博領銜打造的TableGPT2。

它首次將結構化數據作為獨立模態進行訓練,這意味著大模型將不再依賴長上下文窗口,而是直接理解數據庫、Excel、數倉中的數據,進而搞定SQL、分析、增刪改查等相關任務。

圖片

要知道,結構化數據已是無處不在,從BI(商業智能)到當下爆火的具身智能,大模型想要被更充分精準應用于這些領域,就不能再單純以“文科生”的形式去學習。

圖片

由此趙俊博等人耗時1年帶來了更強大的TableGPT2。

在23個基準測試中,TableGPT2都表現優異,平均性能提高35.20%(7B模型)和49.32%(72B模型)。

目前團隊已將兩個版本的模型、一個Agent工作流以及RealTabBench中的一個子集開源。

關鍵在表格編碼器

在TableGPT2之前,業界幾乎沒有人嘗試將結構化數據作為獨立模態。這主要有兩方面原因——

第一,數據庫中表格的空間關系存在特殊性。比如在圖像視頻上任意交換像素或者詞的token,都會改變數據的本質,這說明兩種模態之間具備空間依賴關系。但是在數據庫的表格中,隨機交換2行或2列數據,表格本身并不會變化。目前我們缺乏工具和手段去應對結構化數據這種特點。

第二,結構化數據存在異質性。比如在CV領域,RGB是很客觀的表達,紅色就是紅色,藍色就是藍色,自然語言也是一樣。但是在結構化數據中,同樣一個表格字段下面的標記,在不同數據庫里的意義可能截然不同。比如都是“1,2,3”,不同圖表中表示的內容可能完全不同。所以這種“異質性”要求大模型對整體的庫、表和字段都有理解,才能給出實際意義。這部分的對齊和傳統LLM對齊不太一樣。

圖片

不過這些問題也不是完全不能解決。

趙俊博介紹,針對表格數據,如果掩碼掉一個“子表”的一些單元格,加上字段、數據庫的信息輔助,是可以才出來掩碼信息的內容。這意味著盡管結構化數據的空間關系比較弱,但是本身還是有分布可以去學習的。

由此,研究團隊提出了TableGPT2工作。

它基于Qwen2.5系列模型,使用超過860億token進行預訓練,給大模型喂入了超過59.38萬張表和236萬高質量的查詢-表-輸出樣本,并創新性加入了一個表格編碼器,專門用于讀取和解釋表格數據。

圖片

模型主要框架包括以下幾個部分:

  • 表格編碼器
  • LLM解碼器
  • 持續預訓練
  • 監督微調
  • Agent工作流

表格編碼器支持輸入整個表格,生成每列的緊湊嵌入。

采用雙維注意力機制,無需位置嵌入,同時進行分層特征提取,確保行和列的關系被有效捕捉。

再使用列對比方法,鼓勵模型學習有意義的、結構感知的語義表示。

具體實現上,通過Q-former樣式適配器對齊嵌入和文本輸入,引入可學習的查詢。

使用特殊標記(如”“和”“)區分表格特征與文本,這樣模型可以同時處理兩種模態。

應用聯合指令微調來增強文本信息、列嵌入和模式單元數據之間的對齊,提高模型對表格數據的理解和解釋能力。

值得一提的是,這個表格編碼器可以單獨使用。作者團隊透露,后續還將發表相關論文。

圖片

LLM解碼器則基于Qwen-2.5模型,用于自然語言生成。

具體訓練部分,預訓練階段首先針對模型的編碼和推理能力進行加強。80%的預訓練數據是有優質注釋的代碼,這和DeepSeek-v2的方法一致,以確保強大的編碼能力。

同時還融入了大量推理數據和特定領域知識(比如金融、制造、生物等),以增強推理能力。

在數據處理層面,采用兩級過濾策略。

文檔層面將數據標記為54個不同類別,token層面利用RHO-1來微調高質量token。

圖片

預訓練部分的數據由86B個token組成。

圖片

進行監督式微調主要是為了提高模型在BI特定任務中的表現。

作者構建了一個包含236萬條樣本的數據集,主要覆蓋多輪對話、復雜推理、工具使用和高度特定的業務查詢場景,包含代碼生成、數據可視化、統計測試和預測建模等表格任務。

通過模糊化字段引用、匿名化字段名等方法增強模型在處理復雜任務時的魯棒性。

最后來看Agent框架。

該框架由運行時prompt、代碼沙箱和agent評估模塊共同增強agent的能力和可靠性。

具體工作流如下。首先通過prompt模塊處理輸入查詢,經過檢索增強處理后將查詢輸入到主模型中。然后TableGPT2與VLM協作,生成工具調用、代碼或其他相關操作。利用智能體的反思能力,觀察中間結果,判斷是否需要迭代。最終得到輸出。

圖片

部分基準下超越GPT-4o

實驗階段,作者將TableGPT2與其他大模型進行性能對比。

對比對象主要分為兩類。

第一類為主流開源大模型,包括DeepSeek-Coder-V2-Lite-16B、YiCoder-9B-Chat、Qwen2.5-Coder-7B-Instruct和Qwen2.5-7B-Instruct。

第二類為針對表格相關任務進行微調或專門開發的模型。包括TableLLMs和CodeLlama-13B。

實驗主要評估模型的6方面任務:表格理解、問答、事實論證、表格到文本、自然語言到SQL、整體評估。

圖片

在不同benchmark上,各個模型表現如下。TableGPT2顯著優于絕大部分其他模型,并在一些基準上超越GPT-4o。

圖片

結果顯示,TableGPT2的7B模型和72B模型的平均準確率分別提高了35.20%和49.32%。

此外,考慮到當下benchmark中針對表格異形問題、匿名問題或者治理較差的情況兼顧不佳,而實際落地中90%以上case都會出現類似情況。

作者還構建了一個新的benchmark—— RealTabBench。它更加關注實際應用中真實出現的問題。

結果顯示在RealTabBench上,TableGPT2表現也是最好。

圖片

另外,TableGPT2不會導致基座模型通用能力下降。

圖片

LeCun高徒“砸鍋賣鐵”開發

該研究來自浙江大學計算機與科學技術學院計算創新研究所。

由助理教授、博士生導師趙俊博領銜。

圖片

趙俊博于2019年獲得紐約大學計算機專業博士學位,師從圖靈獎得主、Meta首席AI科學家、紐約大學教授Yann LeCun。

他曾在Meta(原Facebook)人工智能實驗室(Facebook AI Research)任研究員,期間深度參與了深度學習主流框架PyTorch和向量數據庫Faiss的開發,并曾參與了內部通用對話機器人項目的前沿研究,該工作被視為大模型方向的早期產品化工作之一。

曾于2015年供職于英偉達半年時間,聯合主持開發了全球首個端到端的自動駕駛解決方案,該工作由英偉達創始人Jensen Huang在次年的GTC 大會上做隆重介紹。

截至目前論文總被引數已超過20000次。

圖片

去年,趙俊博主持研發了TableGPT。

這是全球首款對接關系數據庫和數據倉的大模型產品。

圖片

2024年,團隊又繼續“砸鍋賣鐵”,給TableGPT升級了V2版本。

圖片

作為高校團隊,開發一個大模型意味著算力上要砸錢、數據收集工程優化上要出人,這中間有非常多的坑,需要消耗巨大人力財力。

而且TableGPT2的開發還有著諸多難點。

首先在技術上,構建一個在table上單獨模態的編碼器很難弄。它獨有的復雜結構和空間特點,以及字段語義信息對齊等,都有考驗。

其次在數據方面。結構化數據怎么收集、清洗?標簽體系怎么定制?如何把合成數據和人工數據合并?怎么做到成本可控,都是問題。

以及監督微調部分,不光需要輸入輸出樣本對,而且需要收集表,專業領域的數據表還需要專業人士進行標注……

不過為啥還是要做呢?

因為他們看到了大模型理解結構化數據背后更廣闊的應用前景。

趙俊博向量子位介紹,作為高校團隊,他們現在的工作更多是為了“趟路”。

做結構化這件事,我們不會停留在Excel或者數據庫上面,下一步技術發展肯定是往硬件和具身智能領域上走。

靈巧手的觸覺信息,還有具身智能領域的視覺、聽覺等,廣義來說都屬于結構化數據,我們還想往這個方向再往前一步。

與此同時,TableGPT2也會在產業落地上試水,希望能給從業者提供更好用的底座模型。

目前,團隊已經開源了這項工作的多個成果,后續也會發布表格編碼器的相關研究,感興趣的童鞋可以進一步了解~

[1]論文地址:https://arxiv.org/html/2411.02059v1

[2]一個可用agent的git倉庫: https://github.com/tablegpt/tablegpt-agent

[3]模型開源:https://huggingface.co/tablegpt/TableGPT2-7B 

責任編輯:張燕妮 來源: 量子位
相關推薦

2016-08-12 16:20:30

2009-01-08 09:26:53

AMD拆分AMD股份AMD股票

2015-11-25 13:58:40

2021-10-14 18:55:17

百分點科技DeepMatrix

2017-07-12 15:30:59

人工智能知識圖譜深度學習

2023-03-31 09:08:33

百分點數據科學

2016-03-24 15:12:33

2015-12-04 14:49:21

ios9

2017-12-15 14:52:55

百分點

2024-12-06 14:19:50

2018-05-25 18:52:16

百分點,大數據

2018-05-25 18:49:27

百分點,AI,人工智能

2025-03-03 07:39:23

2013-09-03 10:11:37

Windows 8Mac OS X

2015-09-13 09:29:52

百分點

2025-11-17 10:51:05

2023-05-04 08:07:38

微軟Windows

2009-02-12 09:50:55

軟件出口外包增長

2024-11-07 15:30:00

2024-09-24 13:00:00

大語言模型AI
點贊
收藏

51CTO技術棧公眾號

成人av影院在线观看| 国产美女免费看| 蜜桃国内精品久久久久软件9| 午夜久久久影院| 国产经品一区二区| caoporn国产| 久久久久国产精品| 亚洲爱爱爱爱爱| 午夜久久久精品| 免费毛片在线看片免费丝瓜视频| 久久只精品国产| 91精品国产自产在线老师啪 | 国产精品露脸视频| 欧美在线91| 日韩成人中文字幕| 免费精品99久久国产综合精品应用| 超碰在线caoporen| 2023国产精品自拍| 91丨九色丨国产在线| 日韩欧美精品免费| 你懂的免费在线观看视频网站| 日本一不卡视频| 久久夜色精品国产亚洲aⅴ| 国产精品无码在线| 成人97精品毛片免费看| 午夜精品成人在线| 老司机av福利| 国产精品一区在线看| 国产69精品久久99不卡| 国产精品普通话| 久久艹免费视频| 欧美在线二区| 日韩一区二区精品视频| 巨胸大乳www视频免费观看| 日韩成人18| 欧美日韩国产一区二区三区地区| 丰满爆乳一区二区三区| 二区在线播放| 国产精品美女久久久久av爽李琼 | 曰本一区二区三区视频| 日韩免费视频一区| 午夜啪啪小视频| 本网站久久精品| 一本色道综合亚洲| 国产视频一视频二| 波多一区二区| 一区二区三区四区视频精品免费| 亚洲资源在线网| 国产视频网址在线| 久久久久国产免费免费 | 日韩一级免费在线观看| 不卡av免费观看| 亚洲最大的成人av| 在线观看17c| 成人a在线视频免费观看| 国产精品久久久久久久久免费丝袜| 久久精品国产美女| 五十路在线观看| av影院午夜一区| 国产伦精品一区二区三区免费视频| 国产jzjzjz丝袜老师水多| 精品亚洲成a人在线观看 | 在线免费观看国产精品| 亚洲一区网站| 97超碰色婷婷| jizz国产在线观看| 日本不卡123| 国产精品美女久久久久久免费 | 亚洲免费婷婷| 日本精品视频在线| 中文字幕在线观看欧美| 蜜桃视频在线一区| 成人网在线视频| 国产哺乳奶水91在线播放| 国产一区二区不卡| 成人自拍偷拍| 无码国产色欲xxxx视频| 久久午夜羞羞影院免费观看| 欧洲视频一区二区三区| 欧美边添边摸边做边爱免费| 亚洲四区在线观看| 国产精品久久久久9999爆乳| 2021中文字幕在线| 色天使色偷偷av一区二区| 毛片毛片毛片毛片毛片毛片毛片毛片毛片| 国产在线|日韩| 3751色影院一区二区三区| 日本少妇激三级做爰在线| baoyu135国产精品免费| 精品视频在线播放免| 五月婷婷婷婷婷| 欧美日韩国内| 欧美中文字幕第一页| 中文字幕一区二区人妻| 国产白丝网站精品污在线入口| 精品不卡一区二区三区| yiren22综合网成人| 亚洲美女视频一区| 欧美色图另类小说| 国产精品中文| 亚洲欧美国产日韩中文字幕| 午夜黄色福利视频| 日韩视频一区| 91精品久久久久久久久中文字幕| 免费观看黄色一级视频| 欧美国产精品中文字幕| 99热久久这里只有精品| 亚洲第一会所| 欧美成人一区二区三区| 欧美大波大乳巨大乳| 综合视频在线| 国产高清视频一区三区| 亚洲第一成人av| 中文字幕免费不卡在线| 欧美精品自拍视频| 成人激情久久| 国产一区二区三区在线| 日本污视频在线观看| 久久国产精品第一页| 欧美凹凸一区二区三区视频 | 丁香婷婷成人| 最近的2019中文字幕免费一页 | 久久久久久久无码| 亚洲成人av| 国产不卡av在线免费观看| 国产18精品乱码免费看| 亚洲素人一区二区| av网站在线不卡| 日韩影视在线观看| 欧美高清在线视频观看不卡| 羞羞色院91蜜桃| 91丝袜高跟美女视频| 黄黄视频在线观看| 久久91视频| 国产午夜精品一区二区三区 | 亚洲国产精品欧美一二99| 天天操狠狠操夜夜操| 精品国产日韩欧美| 欧美中文在线观看| 青青青手机在线视频观看| 精品视频在线观看| 奇米777在线| 免费精品国产的网站免费观看| 久久视频免费观看| 成人毛片一区二区三区| 99久久精品久久久久久清纯| 久久久久久久久网| 95精品视频| 中文字幕精品www乱入免费视频| 日本韩国欧美中文字幕| 波多野结衣中文字幕一区二区三区| 18视频在线观看娇喘| 日韩欧美专区| 最近2019免费中文字幕视频三| 无码日韩精品一区二区| 91麻豆国产精品久久| 黑人糟蹋人妻hd中文字幕| 欧美久久精品| 欧美伊久线香蕉线新在线| 日本高清视频免费看| 亚洲一本大道在线| 日韩精品人妻中文字幕有码| 激情综合久久| 精品欧美国产| 91精品产国品一二三产区| 亚洲精品美女免费| 你懂的国产在线| 久久新电视剧免费观看| 国产精品无码av无码| 狠狠做六月爱婷婷综合aⅴ| 国产精品极品美女粉嫩高清在线| 国产专区在线播放| 欧美色视频在线观看| 国产免费嫩草影院| 国产一区二区三区免费播放| 粉嫩av一区二区三区天美传媒 | 国产大片精品免费永久看nba| 青青草av免费在线观看| 欧洲视频一区二区| 免费看欧美一级片| 538任你躁精品视频网免费| 韩剧1988免费观看全集| 污视频网站免费观看| 一本大道综合伊人精品热热 | 精品国产一区二区三区久久狼黑人 | 久久久久久久香蕉| 欧美日日夜夜| 国产欧美va欧美va香蕉在线| 亚洲综合影视| 日韩精品免费综合视频在线播放 | 国产亚洲无码精品| 青娱乐精品视频在线| 精品91一区二区三区| 乱中年女人伦av一区二区| 国产精品久久久久久久久免费| 黄视频网站在线| 亚洲第一区第二区| 伊人久久一区二区| 亚洲午夜av在线| 我不卡一区二区| 国产精品99久久久久久久vr| 97国产在线播放| 99精品网站| 精品欧美国产| 国产成年精品| 欧美一区二区.| 久久久久久国产精品免费无遮挡| 亚洲电影av在线| 在线观看黄色国产| 欧美小视频在线| 国产a免费视频| 国产日韩影视精品| 亚洲自拍偷拍精品| 黄页视频在线91| 国产日韩一区二区在线观看| 欧美 日韩 国产 一区| 欧美午夜精品久久久久久蜜| 日韩中文字幕视频网| 国产精品久久久久久久久久久久久久 | 日本不卡一区二区三区在线观看| 国产日韩在线观看视频| 欧美中文字幕视频在线观看| 青春草视频在线| 这里精品视频免费| 亚洲av成人精品日韩在线播放| 欧美顶级少妇做爰| 在线观看亚洲黄色| 欧美日韩在线一区| 国产福利久久久| 亚洲精品少妇30p| 精品一区二区在线观看视频| 国产亚洲精久久久久久| 亚洲国产精品无码久久久久高潮 | 国产精品亚洲美女av网站| 特黄毛片在线观看| 欧美激情综合色| 超碰在线caoporen| 久久精品国产欧美激情| www免费网站在线观看| 亚洲男人的天堂网站| 高清乱码毛片入口| 精品久久一区二区| 国产黄色一区二区| 日韩一区二区三区观看| 国产精品无码天天爽视频| 欧美在线看片a免费观看| 欧美在线观看不卡| 岛国av在线不卡| av资源免费观看| 精品久久久久久电影| 亚洲综合一二三| 亚洲va国产va欧美va观看| 久久国产在线视频| 一区二区三区欧美日| 国产精品老熟女一区二区| 亚洲精选视频在线| 青青操视频在线播放| 一级特黄大欧美久久久| 久久久久无码国产精品| 亚洲一区日韩精品中文字幕| 欧美精品xxxxx| 亚洲国产日日夜夜| 日韩aaaaaa| 欧美日韩在线免费观看| 中文字幕黄色片| 在线观看av不卡| 亚洲视频中文字幕在线观看| 欧美日韩久久久一区| 国产精品爽爽久久| 精品欧美乱码久久久久久1区2区| www.四虎在线观看| 亚洲高清一二三区| 久蕉在线视频| 北条麻妃久久精品| 久久免费电影| 欧美亚洲在线观看| 久久精品资源| 99热99热| 香蕉视频一区| 中文字幕av导航| 亚洲小说欧美另类婷婷| 欧美xxxxx在线视频| 蜜桃视频第一区免费观看| 国产又粗又长又爽又黄的视频| 国产精品1区二区.| 日本一区二区三区网站| 中文字幕在线不卡国产视频| 免看一级a毛片一片成人不卡| 同产精品九九九| 中文字幕一二三四| 亚洲国语精品自产拍在线观看| 国际av在线| 色综合久久88| 三上悠亚亚洲一区| 91夜夜揉人人捏人人添红杏| 高潮按摩久久久久久av免费| 日韩福利视频| 国产精品99一区二区| 日日摸日日碰夜夜爽av| 美女性感视频久久| 精品一区二区三区四区五区六区| 国产无人区一区二区三区| 国产十六处破外女视频| 色天天综合色天天久久| 亚洲精品一区二区三区新线路| 亚洲人成亚洲人成在线观看| av官网在线播放| 日本精品久久电影| 日韩精品一区二区三区中文| 欧美最大成人综合网| 国内久久精品| 视频在线观看免费高清| 99久久er热在这里只有精品66| av资源在线免费观看| 五月综合激情日本mⅴ| 99国产精品久久久久久久成人| 亚洲免费高清视频| 国产网红女主播精品视频| 国产精品一区二区三区成人| 全球av集中精品导航福利| 国产91porn| 麻豆传媒一区二区三区| www.久久av| 午夜视频一区二区| jlzzjlzz亚洲女人18| www.欧美精品一二三区| 亚洲人免费短视频| 久久艳妇乳肉豪妇荡乳av| 午夜天堂精品久久久久| 手机av在线免费| 久久精品亚洲精品国产欧美 | 国产精品美女午夜av| 日韩激情啪啪| 欧美视频在线观看视频| 国产精品 日产精品 欧美精品| 极品蜜桃臀肥臀-x88av| 一本久久精品一区二区| 同心难改在线观看| 欧美激情精品久久久久久免费印度 | 精品日韩免费| 日韩免费毛片视频| 91蜜桃在线观看| 五月婷婷中文字幕| 日韩av在线看| 啊啊啊久久久| 精品999在线观看| 99日韩精品| 国产视频久久久久久| 午夜精品久久一牛影视| 日韩一级在线播放| 97久久精品在线| 亚洲人成网77777色在线播放 | 日本怡春院一区二区| 国产精品免费无码| 欧美性高清videossexo| 1区2区3区在线观看| 国产精品一久久香蕉国产线看观看| 精品亚洲成人| 中文字幕第17页| 亚洲色大成网站www久久九九| 国产片高清在线观看| 九九热这里只有精品免费看| 欧美精品三级在线| 精品少妇在线视频| 26uuu亚洲综合色欧美 | 91精品国产综合久久久蜜臀粉嫩| 麻豆tv入口在线看| 99一区二区| 亚洲在线黄色| 我不卡一区二区| 91精品国产综合久久久蜜臀图片| 欧美四级在线| 精品国产一区二区三区四区vr | 国产精品免费成人| 亚洲国产精品黑人久久久| 国产一区二区网站| 九九精品在线视频| 台湾亚洲精品一区二区tv| 黄色国产小视频| 亚洲欧洲韩国日本视频| 亚洲精品喷潮一区二区三区| 国产91精品不卡视频| 日韩精品一区二区久久| 香蕉视频在线观看黄| 欧美性猛交xxxx免费看| 伊人免费在线| 国产传媒一区二区| 久久在线精品| 日韩成人短视频| 日韩av在线高清| 亚洲欧美综合久久久久久v动漫| 久无码久无码av无码| 久久久国产综合精品女国产盗摄| 亚洲天堂网在线视频| 欧美激情中文字幕在线| 日韩在线理论| 老熟妇精品一区二区三区| 欧美午夜寂寞影院| 9765激情中文在线| 伊人久久av导航|