精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

DB-GPT-Hub:text2sql的微調框架及基準測試套件 原創

發布于 2024-11-28 16:53
瀏覽
0收藏

text2sql任務是將自然語言問題轉換為SQL查詢。使用大模型來進行 sql 生成的方式也越來越常見。根據大模型用于文本到SQL生成的方式,text2sql可以分為兩種場景:零樣本/少樣本提示和微調。

DB-GPT-Hub:text2sql的微調框架及基準測試套件-AI.x社區

盡管少樣本提示的大模型取得了顯著進展,但僅依靠其參數知識和提示來準確處理高度復雜的SQL查詢對于預訓練的大型語言模型來說仍然是一個巨大的挑戰。DB-GPT-Hub側重于微調更大的大型語言模型。

框架設計

DB-GPT 框架下提出了一個端到端大模型 Text2SQL 微調子框架 DB-GPT-Hub。在 DB-GPT 框架下,構架了 Text2SQL 領域下的數據預處理 - 模型微調 - 模型預測 - 模型驗證 - 模型評估的全鏈路工作流程,如下圖所示:

DB-GPT-Hub:text2sql的微調框架及基準測試套件-AI.x社區

DB-GPT-Hub 的架構流程圖

代碼庫設計

  • 數據集構建:將原始文本到SQL數據加工成適合微調LLM的格式(例如,列表1中顯示的TRF),這包括將模式和數據庫描述整合到提示中作為指令,以及在訓練和評估期間增強性能的各種問題表示。此外,我們還將選擇不同的少樣本策略,例如示例選擇和組織,來構建評估數據集(Gao等人,2023)。
  • 訓練:支持使用PEFT策略對開源LLM進行微調。我們支持從小到大的模型規模的大多數公共架構,例如Qwen、Llama、Baichuan和ChatGLM。
  • 預測:支持對開源LLM的微調版本以及閉源LLM進行SQL查詢推理。我們支持少樣本和零樣本方法,以生成特定場景下的SQL。
  • 評估:包含不同的指標(EX、EM、有效效率得分(VES)),以從不同角度評估生成的SQL的性能。

數據集

Spider是一個大規模跨域數據集,包含10,181個自然語言查詢,5,693個獨特的復雜SQL查詢,涵蓋200個數據庫,覆蓋138個領域。該數據集的標準協議將其分為8,659個訓練樣本和2,147個測試樣本,分布在34個數據庫中。SQL查詢分為四個難度級別,即簡單、中等、困難和超難。如下:

簡單:
      Question: What is the number of cars with more than 4 cylinders?
      SQL:SELECT COUNT (*)FROM cars_dataWHERE cylinders > 4

中等:
      Question: For each stadium, how many concerts are there?
      SQL:SELECT T2.name, COUNT (*) FROM concert AS T1 JOIN stadium AS T2ON T1.stadium_id = T2.stadium_idGROUP BY T1.stadium_id

較難:
      Question: Which countries in Europe have at least 3 car manufacturers?
      SQL:SELECT T1.country name FROM countries AS T1 JOIN continents AS T2 ON T1.continent T2.cont_id JOIN car makers AS T3 O N T1.country_id = T3.country WHERE T2.continent = 'Europe' GROUPBY T1.country_name HAVINGCOUNT (*) >= 3

極難:
      Question: What is the average life expectancy in the countries where English is not the official language?
      SQL:SELECT AVG(life_expectancy) FROM country WHERE name NOT IN ( SELECT T1.name FROM country AS T1 JOIN country_language AS T2 ON T1.code = T2.country_code WHERE T2.language = "English" AND T2.is_official = "T")

其他數據集:

  • WikiSQL: 一個大型的語義解析數據集,由80,654個自然語句表述和24,241張表格的sql標注構成。WikiSQL中每一個問句的查詢范圍僅限于同一張表,不包含排序、分組、子查詢等復雜操作。
  • CHASE: 一個跨領域多輪交互text2sql中文數據集,包含5459個多輪問題組成的列表,一共17940個<query, SQL>二元組,涉及280個不同領域的數據庫。
  • BIRD-SQL:數據集是一個英文的大規模跨領域文本到SQL基準測試,特別關注大型數據庫內容。該數據集包含12,751對文本到SQL數據對和95個數據庫,總大小為33.4GB,跨越37個職業領域。BIRD-SQL數據集通過探索三個額外的挑戰,即處理大規模和混亂的數據庫值、外部知識推理和優化SQL執行效率,縮小了文本到SQL研究與實際應用之間的差距。
  • CoSQL:是一個用于構建跨域對話文本到sql系統的語料庫。它是Spider和SParC任務的對話版本。CoSQL由30k+回合和10k+帶注釋的SQL查詢組成,這些查詢來自Wizard-of-Oz的3k個對話集合,查詢了跨越138個領域的200個復雜數據庫。每個對話都模擬了一個真實的DB查詢場景,其中一個工作人員作為用戶探索數據庫,一個SQL專家使用SQL檢索答案,澄清模棱兩可的問題,或者以其他方式通知。

按照NSQL的處理模板,對數據集做簡單處理,共得到約20w條訓練數據

為了充分利用數據庫中的表和字段等相關信息,對 Spider 中的原始數據進行處理,用自然語言表示數據庫包含的表結構以及表結構包含的字段以及相應的主鍵和外鍵等,經過數據預處理后,可以得到如下的數據格式:

{
    "instruction": "concert_singer(數據庫名) contains tables(表) such as stadium, singer, concert, singer_in_concert. Table stadium has columns(列) such as stadium_id, location, name, capacity, highest, lowest, average. stadium_id is the primary key(主鍵). Table singer has columns such as singer_id, name, country, song_name, song_release_year, age, is_male. singer_id is the primary key. Table concert has columns such as concert_id, concert_name, theme, stadium_id, year. concert_id is the primary key. Table singer_in_concert has columns such as concert_id, singer_id. concert_id is the primary key. The year of concert is the foreign key(外鍵)of location of stadium. The stadium_id of singer_in_concert is the foreign key of name of singer. The singer_id of singer_in_concert is the foreign key of concert_name of concert.",
    "input": "How many singers do we have?",
    "response": "select count(*) from singer"
}

{
    "instruction": "concert_singer(數據庫名)包含表(表),例如stadium, singer, concert, singer_in_concert。表體育場有列(列),如stadium_id、位置、名稱、容量、最高、最低、平均。Stadium_id是主鍵(主鍵)。表singer有這樣的列:singer_id、name、country、song_name、song_release_year、age、is_male。Singer_id為主鍵。表concert有如下列:concert_id、concert_name、theme、stadium_id、year。Concert_id是主鍵。表singer_in_concert有如下列:concert_id, singer_id。Concert_id是主鍵。演唱會年份是場館位置的外鍵(外鍵)。singer_in_concert的stadium_id是歌手名的外鍵。singer_in_concert的singer_id是concert的concert_name的外鍵。",
    "input": "我們有多少歌手?",
    "response": "select count(*) from singer"
}

為了更好的利用大語言模型的理解能力,使用了 prompt dict 以優化輸入,如下所示:

SQL_PROMPT_DICT = {
    "prompt_input": (
        "I want you to act as a SQL terminal in front of an example database. "
        "Below is an instruction that describes a task, Write a response that appropriately completes the request.\n\n"
        "###Instruction:\n{instruction}\n\n###Input:\n{input}\n\n###Response: "
    ),
    "prompt_no_input": (
        "I want you to act as a SQL terminal in front of an example database. "
        "Below is an instruction that describes a task, Write a response that appropriately completes the request.\n\n"
        "###Instruction:\n{instruction}\n\n### Response: "
    ),
}

DB-GPT-Hub:text2sql的微調框架及基準測試套件-AI.x社區

Spider數據集上TRP格式的查詢-響應對

指標:

使用兩個常用的指標,精確集匹配準確率(EM)和執行準確率(EX),來評估所有模型的性能。EM衡量預測SQL查詢與其對應真實值之間的匹配SQL關鍵字,而EX比較預測SQL查詢的執行輸出與某些數據庫實例上真實SQL查詢的執行輸出。由于對于給定問題可能存在多個有效的SQL查詢,EX提供了對模型性能更精確的估計。在這兩種指標中,較高的值被認為更好。主要使用EX來評估論文中SQL的準確性。

DB-GPT-Hub:text2sql的微調框架及基準測試套件-AI.x社區

DB-GPT-Hub:text2sql的微調框架及基準測試套件-AI.x社區

LLM

DB-GPT-Hub:text2sql的微調框架及基準測試套件-AI.x社區

支持基座模型

DB-GPT-Hub:text2sql的微調框架及基準測試套件-AI.x社區

微調資源

為了確保公平比較,對所有LLM使用相同的最大上下文長度2048。在評估期間,留下512個token用于響應生成。將參數溫度設置為0,以消除隨機性的影響。

實驗

DB-GPT-Hub:text2sql的微調框架及基準測試套件-AI.x社區

DB-GPT-Hub:text2sql的微調框架及基準測試套件-AI.x社區

參考文獻

  • paper:DB-GPT-Hub: Towards Open Benchmarking Text-to-SQL Empowered by Large Language Models,https://arxiv.org/abs/2406.11434
  • code:https://github.com/eosphoros-ai/DB-GPT-Hub
  • text2sql benchmark:https://github.com/eosphoros-ai/Awesome-Text2SQL


本文轉載自公眾號大模型自然語言處理  作者:余俊暉

原文鏈接:??https://mp.weixin.qq.com/s/Llyb77BSTnyzfOIrBMIPFw??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2024-11-28 18:46:09修改
收藏
回復
舉報
回復
相關推薦
日韩网站免费观看高清| 欧美日韩中国免费专区在线看| 成人黄色午夜影院| 欧美色图一区二区| 日韩美女精品| 欧美日韩免费视频| 丰满少妇大力进入| 国产色在线 com| 国产成人精品综合在线观看| 欧美亚州一区二区三区| 日韩电视剧在线观看免费网站| 亚洲制服欧美久久| 欧美一区二区黄片| 六月丁香综合在线视频| 韩国国内大量揄拍精品视频| 992在线观看| 国产欧美啪啪| 欧美猛男gaygay网站| 男人添女人下部高潮视频在观看| 成人动漫在线播放| 成人禁用看黄a在线| 国产精品久久久久av| 国产无码精品一区二区| 日韩一区二区在线免费| 亚洲精品午夜精品| 特黄特色免费视频| 久久天堂影院| 色哟哟欧美精品| 久久这里只有精品23| 国产在线高清视频| 欧美极品aⅴ影院| 久久精品99久久| 亚洲第一天堂网| 精品一区二区三区在线播放 | 国产一区二区丝袜| 精品欧美一区二区三区免费观看| 婷婷久久一区| 色婷婷**av毛片一区| 波多野结衣办公室33分钟| 国产精品18hdxxxⅹ在线| 91精品国产一区二区三区香蕉| 精品免费国产一区二区| 涩涩视频在线播放| 欧美日韩国产一区二区| 国产婷婷一区二区三区| av福利在线导航| 亚洲综合成人在线视频| www国产无套内射com| 黄色免费在线看| 中文字幕一区二区在线播放| 午夜精品一区二区在线观看的 | 日韩精品一级| 欧美一区二区免费视频| 国产性生活一级片| 成人51免费| 欧美顶级少妇做爰| 亚洲一区二区福利视频| 高清国产一区二区三区四区五区| 欧美日韩国产区一| 美女网站色免费| 欧美极品在线| 日韩欧美国产wwwww| 亚洲综合激情视频| 精品午夜av| 日韩欧美国产一区二区三区 | 大奶在线精品| 亚洲精品v欧美精品v日韩精品| 99久久免费看精品国产一区| 欧美wwwsss9999| 亚洲精品自在久久| 久久成人激情视频| 999国产精品永久免费视频app| www.午夜精品| 久久久久性色av无码一区二区| 国产精品mv在线观看| 国产做受高潮69| 日日摸天天添天天添破| 视频在线观看一区| 成人高清视频观看www| 精品国自产拍在线观看| 99久久精品国产导航| 欧美精品一区二区三区在线四季| av网站无病毒在线| 亚洲精品视频一区| 91成人在线观看喷潮教学| 成人美女视频| 9191国产精品| 97人妻天天摸天天爽天天| 久操国产精品| 日韩在线免费av| 久久精品无码人妻| 久久久久国产精品一区二区 | 国产福利一区视频| 精品国产一区二| 亚洲欧美资源在线| 欧美在线视频第一页| 国产精品女主播一区二区三区| 国产精品色午夜在线观看| wwwav在线播放| 久久久久久久久久久久久久久99 | 超碰caoporn久久| 五月天一区二区| 免费av不卡在线| 小说区图片区色综合区| 欧美成aaa人片在线观看蜜臀| 一级黄色免费网站| 国产精品456| 日韩高清专区| 18aaaa精品欧美大片h| 欧美亚洲国产一区二区三区 | 国产三级小视频| 91色|porny| 一本色道久久88亚洲精品综合| 亚洲精品一区| 日韩欧美色电影| 激情五月激情综合| 亚洲免费影视| 俄罗斯精品一区二区| 福利视频在线看| 福利视频导航一区| av天堂一区二区| 91精品国产福利在线观看麻豆| 国产91|九色| 日本高清视频网站| 一区二区三区欧美在线观看| 高潮一区二区三区| 国产欧美一区| 欧亚精品在线观看| 无码国产精品96久久久久| 亚洲激情在线播放| 天天操精品视频| 欧美xxav| 国产精品欧美日韩久久| 久草在线青青草| 福利一区视频在线观看| 日韩av手机在线播放| 激情婷婷欧美| 超碰国产精品久久国产精品99| 黄色网在线播放| 欧美电影一区二区三区| 婷婷丁香综合网| 琪琪一区二区三区| 亚洲成人自拍视频| 国产福利亚洲| www.欧美三级电影.com| 91精品国自产| 亚洲伦在线观看| 中文字幕55页| 欧美视频一区| 国产成人精品日本亚洲11| jizz一区二区三区| 亚洲国产欧美自拍| 国产精品黄色大片| 久久看人人爽人人| 国产 porn| 91精品久久久久久久蜜月| 成人看片人aa| 污的网站在线观看| 亚洲激情 国产| 国产九色在线播放九色| 国产三级一区二区| 99sesese| 国产精品s色| 国产一区免费观看| 欧美人体一区二区三区| 中文字幕精品—区二区| 国产精品久久无码一三区| 亚洲欧美激情在线| 久久久高清视频| 香蕉久久夜色精品| 亚洲欧美精品在线观看| 色婷婷成人网| 久久久久久久亚洲精品| 亚洲色图欧美视频| 欧美天堂亚洲电影院在线播放| 天天色天天综合| 懂色av一区二区三区免费观看| 黄色网页免费在线观看| 国产91精品对白在线播放| 国产美女久久精品| 蜜臀av在线播放| 亚洲午夜未满十八勿入免费观看全集| 182在线视频| 色呦呦视频在线| 日韩亚洲国产欧美| 欧美美女网站色| 国产伦精品一区二区三区妓女| 另类图片国产| 中文字幕精品—区二区日日骚| 91蝌蚪精品视频| 国产不卡av在线| 在线观看h网| 亚洲男女自偷自拍图片另类| 97成人免费视频| 疯狂做受xxxx高潮欧美日本| 韩国一级黄色录像| 97精品国产97久久久久久久久久久久 | 涩多多在线观看| 国产日韩亚洲| 国产三级中文字幕| 国产精品一区二区av日韩在线| 成人久久久久久久| 天天综合网天天| 欧美日韩国产成人高清视频| 成人jjav| 日韩电影中文 亚洲精品乱码| 国产成人精品一区二三区四区五区| 欧美性xxxx18| 久久婷婷国产麻豆91| 国产精品免费久久久久| 在线观看国产三级| 国产一本一道久久香蕉| 91淫黄看大片| 在线亚洲精品| 日产精品久久久久久久蜜臀| 成人免费在线播放| 久久精品ww人人做人人爽| 午夜免费欧美电影| 国产精品自产拍高潮在线观看| 爱啪啪综合导航| 欧美日韩福利视频| 日韩子在线观看| 在线观看精品国产视频| 欧美男男同志| 日韩国产精品一区| 高h放荡受浪受bl| 欧美一级免费大片| 艳妇乳肉豪妇荡乳av| 欧美优质美女网站| 在线观看污污网站| 色哟哟一区二区三区| 69成人免费视频| 岛国视频午夜一区免费在线观看| 日韩精品一区二区三| 亚洲国产欧美日韩另类综合| 久久久久亚洲天堂| 一个色妞综合视频在线观看| 亚洲色偷偷综合亚洲av伊人| 国产精品久久久久久福利一牛影视 | 久久精品成人欧美大片古装| 精品亚洲成a人片在线观看| 亚洲精品视频在线播放| 亚洲欧美日韩动漫| 亚洲精品久久久久中文字幕二区| 亚洲精品一区二区口爆| 欧美成人a在线| 色窝窝无码一区二区三区成人网站 | 69国产精品成人在线播放| 超免费在线视频| 97av在线视频| 亚洲第一二三四区| 国产精品美女久久| 国产激情久久| 亚洲影视九九影院在线观看| 精品一区二区三区亚洲| 99在线热播| 精品福利网址导航| 久久久7777| 欧美日韩在线播放视频| 亚洲自拍三区| 欧美不卡视频| 男女超爽视频免费播放| 久久电影一区| 亚洲综合欧美激情| 国产乱码字幕精品高清av| 性活交片大全免费看| 91视频.com| 少妇高潮惨叫久久久久| 亚洲天堂久久久久久久| 国产精品99精品| 色狠狠一区二区| 国产精品自产拍| 精品国产伦一区二区三区免费| 深夜视频在线免费| 中文字幕亚洲在线| 成人免费高清观看| 日韩av免费一区| 精品视频成人| 蜜桃999成人看片在线观看| 日韩免费在线| 2019日韩中文字幕mv| 日日夜夜精品视频天天综合网| 亚洲va综合va国产va中文| 福利电影一区二区三区| 日韩丰满少妇无码内射| 亚洲免费在线看| 国产综合精品视频| 日韩一区二区三区四区五区六区| 亚洲欧美丝袜中文综合| 久久精品久久久久| 日韩电影免费看| 91亚洲va在线va天堂va国| 日本成人中文| 永久免费网站视频在线观看| 久久久蜜桃一区二区人| gogo亚洲国模私拍人体| 久久色视频免费观看| 欧美在线视频第一页| 在线免费精品视频| 亚洲黄色精品视频| 少妇精69xxtheporn| 在线能看的av网址| 99精品在线直播| 93在线视频精品免费观看| 人妻内射一区二区在线视频| 国产乱国产乱300精品| 免费看黄色三级| 婷婷开心激情综合| www.四虎在线观看| 日韩一区二区三区国产| 九九热线视频只有这里最精品| 国产高清一区二区三区| 91综合视频| 五月婷婷六月丁香激情| 久久久美女艺术照精彩视频福利播放| 欧美成人aaa片一区国产精品| 欧美日韩在线精品一区二区三区激情 | 麻豆成人在线观看| 蜜臀av一区二区三区有限公司| 亚洲一本大道在线| 国产suv一区二区| 色视频www在线播放国产成人| **在线精品| 麻豆成人在线播放| 亚洲看片免费| 天堂www中文在线资源| 亚洲嫩草精品久久| 一二区在线观看| 在线电影av不卡网址| 日本一区二区三区视频在线| 裸模一区二区三区免费| 亚洲在线黄色| 免费a级黄色片| 欧美午夜影院在线视频| 亚洲人成色777777精品音频| 欧美精品成人在线| 精品资源在线| 亚洲熟妇av日韩熟妇在线| www.66久久| 亚洲日本韩国在线| 亚洲精品久久久久中文字幕二区| 草草在线观看| 久久综合色一本| 免费日韩视频| 久久国产柳州莫菁门| 欧洲另类一二三四区| 91精品专区| 成人网在线免费观看| 一区二区三区四区日韩| 波多野结衣网页| 一级精品视频在线观看宜春院 | 成人美女在线视频| 亚洲精品国产精品乱码| 日韩电影中文字幕| 另类专区亚洲| 色播亚洲婷婷| 国内成+人亚洲+欧美+综合在线| 538精品在线视频| 精品国产污污免费网站入口 | 激情五月深爱五月| 欧美日韩国产一二三| 国产精品刘玥久久一区| 99re国产在线播放| 国产精品美女| 亚洲一区 欧美| 日韩视频国产视频| 国产在线天堂www网在线观看| 欧美国产视频在线观看| 免费精品99久久国产综合精品| 美国黄色片视频| 精品国产百合女同互慰| 这里有精品可以观看| 亚洲午夜精品久久久久久浪潮| 国产精品小仙女| 国产成人无码精品久在线观看 | 日本成人中文字幕在线视频| 日本伦理一区二区三区| 亚洲白虎美女被爆操| 欧美电影网址| 亚洲天堂第一区| 91污片在线观看| 国产精品视频久久久久久| 97精品一区二区视频在线观看| av资源久久| 久草免费资源站| 欧美日韩精品福利| 好看的中文字幕在线播放| 亚洲高清视频在线观看| 成人av电影免费观看| 夜夜躁很很躁日日躁麻豆| 高清欧美一区二区三区| 成人在线国产| 好吊色视频一区二区三区| 欧美日韩精品一区二区三区四区 | 久久久9色精品国产一区二区三区| 亚洲精品乱码久久久久久蜜桃图片| 欧洲人成人精品| 黄色视屏在线免费观看| 国产av第一区| 国产精品美女www爽爽爽|