精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

DATAMIND:構(gòu)建專業(yè)級數(shù)據(jù)分析智能體的可擴(kuò)展方法論

人工智能
浙大與阿里聯(lián)合提出 DATAMIND 框架,僅用 12K 高質(zhì)量軌跡即訓(xùn)練出超越 GPT-5 的開源數(shù)據(jù)分析智能體,系統(tǒng)性解決了數(shù)據(jù)合成、訓(xùn)練策略與執(zhí)行穩(wěn)定性三大挑戰(zhàn)。

大家好,我是肆〇柒。今天來看看來自浙江大學(xué)與阿里巴巴集團(tuán)聯(lián)合研究團(tuán)隊(duì)的最新工作——《Scaling Generalist Data-Analytic Agents》。這項(xiàng)研究不僅提出了名為 DATAMIND 的高質(zhì)量數(shù)據(jù)合成與智能體訓(xùn)練框架,更訓(xùn)練出了在多項(xiàng)基準(zhǔn)上超越 GPT-5 的開源數(shù)據(jù)分析智能體 DATAMIND-14B,為構(gòu)建專業(yè)領(lǐng)域 Agentic AI 提供了一套可復(fù)現(xiàn)、可擴(kuò)展的方法論。

隨著AI進(jìn)入"下半場",面向日益復(fù)雜和特定領(lǐng)域場景的LLM智能體(LLM Agentic)基準(zhǔn)測試正迅速涌現(xiàn)。在這一趨勢中,自動化數(shù)據(jù)分析作為科學(xué)發(fā)現(xiàn)的關(guān)鍵支柱,對實(shí)現(xiàn)"創(chuàng)新AI"愿景至關(guān)重要,展現(xiàn)出提升研究效率和加速科學(xué)發(fā)現(xiàn)的潛力。然而當(dāng)前的數(shù)據(jù)分析智能體過度依賴專有模型的提示工程或多智能體架構(gòu),而開源模型在處理多樣格式、大規(guī)模數(shù)據(jù)文件和真實(shí)世界分析所需的長視野多步推理方面仍面臨嚴(yán)峻挑戰(zhàn)。DATAMIND的出現(xiàn)不僅帶來了一個高性能模型(DATAMIND-14B以71.16%的平均得分超越GPT-5),更提供了一套可擴(kuò)展的數(shù)據(jù)合成和智能體訓(xùn)練配方,為構(gòu)建專業(yè)領(lǐng)域智能體提供了系統(tǒng)化指導(dǎo)。

專業(yè)智能體構(gòu)建的三大核心挑戰(zhàn)與對應(yīng)解決方案

專業(yè)領(lǐng)域智能體的構(gòu)建面臨著一系列固有挑戰(zhàn),這些挑戰(zhàn)在數(shù)據(jù)分析場景中尤為突出。以下將挑戰(zhàn)與DATAMIND的解決方案一一對應(yīng)分析。

挑戰(zhàn)一:數(shù)據(jù)資源不足與DATAMIND的應(yīng)對

訓(xùn)練專業(yè)智能體需要大規(guī)模、高質(zhì)量的任務(wù)集合及其對應(yīng)的解決方案軌跡,但公開可用的數(shù)據(jù)分析基準(zhǔn)測試通常僅提供有限的評估測試集,缺乏逐步軌跡注釋,使得無法從現(xiàn)成資源中組裝有效的訓(xùn)練語料庫。真實(shí)世界的數(shù)據(jù)分析任務(wù)要求處理多樣格式(CSV、Excel、SQLite等)、大規(guī)模數(shù)據(jù)(>1,000行)以及多步驟推理,這使得數(shù)據(jù)合成既必要又困難。

18個細(xì)粒度數(shù)據(jù)分析任務(wù)類別分布

如上圖研究團(tuán)隊(duì)設(shè)計(jì)的18個細(xì)粒度數(shù)據(jù)分析任務(wù)類別呈現(xiàn)明顯的長尾分布特性,相關(guān)性分析(Correlation Analysis)占比最高(14.06%),事實(shí)核查(Fact Checking)占9.34%,而描述性分析(Descriptive Analysis)僅占0.79%。這種不均衡分布反映了真實(shí)數(shù)據(jù)分析場景的特性——用戶更關(guān)注發(fā)現(xiàn)數(shù)據(jù)間的關(guān)系而非簡單描述,為合成查詢提供了真實(shí)分布依據(jù)。

為應(yīng)對這一挑戰(zhàn),DATAMIND從互聯(lián)網(wǎng)和開源社區(qū)收集了3,400個.csv和560個.xlsx文件,并過濾掉無法加載、過小(<20行)或過大(>1,000行)的文件,以及包含異常數(shù)據(jù)類型的文件。對于數(shù)據(jù)庫文件,研究團(tuán)隊(duì)從BIRD和OmniSQL中獲取了1,954個.sqlite文件,構(gòu)建了涵蓋多種格式的多樣化數(shù)據(jù)源。通過細(xì)粒度任務(wù)分類和遞歸易到難任務(wù)組合機(jī)制,系統(tǒng)性地生成多樣化查詢,有效解決了數(shù)據(jù)資源不足的問題。

案例展示:薪資差異分析

讓我們通過一個具體案例來理解DATAMIND的工作流程。想象你是一名人力資源分析師,需要回答:"2020年亞裔男性和黑人男性的年薪中位數(shù)差異是多少?"(What is the difference between the median annual salaries of Asian Men and Black Men in the year 2020?)。這個問題屬于"相關(guān)性分析"類別(第一張圖中占比最高的類別)。

DATAMIND全流程架構(gòu)

上圖清晰展示了DATAMIND如何處理這個具體任務(wù):

1. 數(shù)據(jù)輸入:DATAMIND接收包含歷年薪資數(shù)據(jù)的CSV文件(如上圖所示,包含Year, AsianMen, AsianW, BlackMen等列)

2. 任務(wù)分類:系統(tǒng)識別這是"相關(guān)性分析"任務(wù),并應(yīng)用相應(yīng)的高階工作流

3. 多輪推理:首先加載數(shù)據(jù)并檢查結(jié)構(gòu),然后篩選2020年數(shù)據(jù),計(jì)算中位數(shù)差異

4. 結(jié)果輸出:最終返回類似<answer>The difference is $12,345.</answer>的精確答案

通過這個具體案例,我們可以看到DATAMIND如何將復(fù)雜的多步驟推理過程自動化,而無需用戶編寫任何代碼。在實(shí)際應(yīng)用中,用戶只需提出自然語言問題,DATAMIND就能自動完成從數(shù)據(jù)加載、預(yù)處理到最終結(jié)果生成的全過程。

挑戰(zhàn)二:訓(xùn)練策略不當(dāng)與DATAMIND的應(yīng)對

長視野智能體訓(xùn)練的穩(wěn)定性問題不容忽視。當(dāng)前的智能體訓(xùn)練策略通常遵循SFT-then-RL范式,但在新場景中,如何穩(wěn)定長視野智能體訓(xùn)練以及如何在SFT和RL之間分配訓(xùn)練步驟以實(shí)現(xiàn)最佳性能仍不明確。在多步驟推理過程中,模型可能因外部反饋和多輪次復(fù)合錯誤而經(jīng)歷分布漂移,極易導(dǎo)致軌跡崩潰,從而使強(qiáng)化學(xué)習(xí)訓(xùn)練不穩(wěn)定。

SFT損失對RL訓(xùn)練的影響

實(shí)驗(yàn)數(shù)據(jù)顯示,當(dāng)不施加SFT損失(γ=0)時,答案獎勵幾乎單調(diào)下降;當(dāng)γ提高到0.2時,答案獎勵雖有初始上升但隨后崩潰;而采用動態(tài)γ策略(從0.9退火至0.05)則能實(shí)現(xiàn)穩(wěn)定訓(xùn)練。這表明SFT損失既是RL訓(xùn)練的有效穩(wěn)定器,也可能成為不穩(wěn)定訓(xùn)練的罪魁禍?zhǔn)住?/span>

SFT與RL的動態(tài)平衡:可以將SFT(監(jiān)督微調(diào))比作"老師手把手教學(xué)",而RL(強(qiáng)化學(xué)習(xí))則像"讓學(xué)生獨(dú)立解決問題"。DATAMIND的創(chuàng)新在于動態(tài)調(diào)整這兩種教學(xué)方式的比例——開始時老師指導(dǎo)較多(γ=0.9),隨著學(xué)生能力提升,逐漸放手讓學(xué)生自主探索(γ降至0.05)。正如論文中所述:"訓(xùn)練過程 resembles raising a child。在童年早期,持續(xù)的父母指導(dǎo)(高γ)對防止孩子誤入歧途至關(guān)重要。隨著孩子成長,過度監(jiān)督會抑制孩子自我探索的內(nèi)在動力。"

DATAMIND通過動態(tài)調(diào)整SFT和RL損失的權(quán)重來解決這一問題。研究團(tuán)隊(duì)將γ參數(shù)從峰值0.9通過余弦衰減調(diào)度到谷值0.05,使模型首先從SFT損失中獲取穩(wěn)定監(jiān)督,隨后逐漸減少SFT權(quán)重以鼓勵探索。同時,實(shí)施Void Turns過濾機(jī)制,將無法產(chǎn)生有效代碼片段或答案的智能體循環(huán)定義為"無效輪次",并直接屏蔽這些軌跡對損失的貢獻(xiàn),有效防止了軌跡崩潰。此外,采用DAPO(Decoupled Clip and Dynamic Sampling Policy Optimization)算法,通過每令牌重要性采樣比率和優(yōu)勢函數(shù)平衡探索與利用,確保訓(xùn)練過程的穩(wěn)定性。

挑戰(zhàn)三:代碼執(zhí)行環(huán)境不穩(wěn)定與DATAMIND的應(yīng)對

基于代碼的多輪交互環(huán)境穩(wěn)定性是第三大挑戰(zhàn)。數(shù)據(jù)文件和代碼解釋器涉及復(fù)雜的內(nèi)存管理,而并行智能體rollout和有限內(nèi)存資源下的多輪代碼生成將進(jìn)一步加劇這一問題。

DATAMIND全流程架構(gòu)

上圖清晰展示了DATAMIND如何解決這一挑戰(zhàn)。研究團(tuán)隊(duì)實(shí)施了三大關(guān)鍵創(chuàng)新:

DATAMIND解決環(huán)境穩(wěn)定性的三大創(chuàng)新

1. 異步交互:將模型生成和代碼執(zhí)行解耦,避免同時發(fā)生文件I/O和代碼執(zhí)行高峰

  • 效果:解耦GPU和CPU內(nèi)存需求峰值,防止系統(tǒng)崩潰

2. 塊式代碼維護(hù):僅保留文本代碼塊而非全局變量池

  • 對比:傳統(tǒng)筆記本系統(tǒng)維護(hù)全局變量池(內(nèi)存密集型),而DATAMIND在運(yùn)行時動態(tài)連接代碼片段
  • 優(yōu)勢:實(shí)現(xiàn)相同的全局執(zhí)行效果而無需額外內(nèi)存開銷

3. 安全控制:為每個軌跡設(shè)置隔離環(huán)境

  • 具體措施:嚴(yán)格限制CPU時間和峰值內(nèi)存,過濾不安全函數(shù)調(diào)用
  • 額外功能:自動包安裝機(jī)制,動態(tài)檢查并安裝缺失的Python包

這些措施共同構(gòu)建了一個高效穩(wěn)定的多輪代碼執(zhí)行框架,為長視野推理提供了堅(jiān)實(shí)基礎(chǔ)。

DATAMIND的方法框架

DATAMIND采用系統(tǒng)化方法應(yīng)對上述挑戰(zhàn),其核心在于數(shù)據(jù)合成、訓(xùn)練策略和環(huán)境構(gòu)建三個維度的創(chuàng)新設(shè)計(jì)。

DATAMIND全流程架構(gòu)

上圖清晰展示了這一框架的四個關(guān)鍵組件:細(xì)粒度任務(wù)分類與遞歸任務(wù)組合、知識增強(qiáng)軌跡采樣與過濾、動態(tài)調(diào)整的訓(xùn)練目標(biāo)以及內(nèi)存高效的多輪代碼執(zhí)行框架。

數(shù)據(jù)合成:質(zhì)量優(yōu)先的軌跡構(gòu)建

DATAMIND的數(shù)據(jù)合成流程始于多樣化數(shù)據(jù)文件的收集,隨后通過細(xì)粒度任務(wù)分類和遞歸組合機(jī)制生成高質(zhì)量查詢。研究團(tuán)隊(duì)為每個任務(wù)類別精心設(shè)計(jì)了46個示例查詢作為少樣本演示,確保生成的查詢既多樣又符合任務(wù)特性。通過遞歸易到難任務(wù)組合機(jī)制,將簡單任務(wù)鏈接為多跳分析挑戰(zhàn),通過迭代25次逐步提高難度。

知識增強(qiáng)的軌跡采樣流程包括:為每個問題類別手動設(shè)計(jì)高階工作流k,編碼過程性知識并引導(dǎo)模型在軌跡合成過程中的行為;采樣N=3次獨(dú)立軌跡;使用基于GPT-4o-mini的judge模型驗(yàn)證最終答案是否與推理理由一致;僅保留收斂到相同答案的軌跡。對于不一致的軌跡,將judge模型的思維鏈反饋給智能體進(jìn)行反思修正,這一救援循環(huán)不僅挽救了額外可用數(shù)據(jù),還能豐富思維模式的多樣性。

研究團(tuán)隊(duì)實(shí)施了三層規(guī)則過濾:格式合規(guī)性(確保符合ReAct格式)、長度控制(最終答案<1,024 tokens)和語言完整性(消除亂碼文本或混合自然語言),最終保留11,707條高質(zhì)量軌跡,命名為DATAMIND-12K。值得注意的是,盡管DATAMIND-12K僅含12K軌跡,而TableLLM和Table-R1分別使用20K和2.5M的訓(xùn)練數(shù)據(jù),但DATAMIND系列模型在多個基準(zhǔn)測試上仍取得最佳表現(xiàn)。從Table 1可見,DATAMIND-14B在DABench上達(dá)到80.29%(pass@1),大幅領(lǐng)先Table-R1-14B的45.33%;在TableBench上達(dá)到70.95%,優(yōu)于Table-R1-14B的50.38%。這一結(jié)果有力證明了"高質(zhì)量軌跡比大量低質(zhì)量軌跡更重要"的論點(diǎn)。

訓(xùn)練策略:動態(tài)平衡的SFT-RL范式

DATAMIND在訓(xùn)練策略上突破了傳統(tǒng)SFT-then-RL范式,采用動態(tài)平衡SFT和RL損失的方法。研究團(tuán)隊(duì)將γ參數(shù)從峰值0.9通過余弦衰減調(diào)度到谷值0.05,使模型首先從SFT損失中獲取穩(wěn)定監(jiān)督,隨后逐漸減少SFT權(quán)重以鼓勵探索。

不同γ設(shè)置下的答案獎勵與熵動態(tài)

上圖揭示了SFT損失的雙重角色:當(dāng)γ固定在高位(0.8)時,答案獎勵先短暫上升,隨后逐漸下降,同時策略熵急劇降低,表明模型陷入剛性思維模式;而動態(tài)γ策略能保持策略熵在較高水平,確保模型持續(xù)探索能力。研究團(tuán)隊(duì)將訓(xùn)練過程比喻為"培養(yǎng)孩子":在早期需要大量指導(dǎo)(γ=0.9),隨著模型成熟,逐漸放手(γ=0.05),讓模型通過環(huán)境反饋發(fā)現(xiàn)自身真正能力。

DAPO算法的應(yīng)用進(jìn)一步優(yōu)化了訓(xùn)練過程,其中clip參數(shù)εlow和εhigh分別設(shè)置為0.2和0.28,以平衡探索與利用。獎勵設(shè)計(jì)包含格式獎勵rformat、答案獎勵ranswer和長度獎勵rlength三部分,其中長度獎勵定義為:當(dāng)答案長度l ≤ lmin時為1;當(dāng)lmin < l ≤ lmax時線性衰減至0.5;當(dāng)l > lmax時固定為0.5。研究團(tuán)隊(duì)設(shè)置lmin和lmax分別為256和1024,以防止模型通過幻覺過多令牌來"破解"答案獎勵。此外,使用EMA平滑獎勵值以避免訓(xùn)練過程中的劇烈波動,確保訓(xùn)練穩(wěn)定性。

環(huán)境構(gòu)建:內(nèi)存高效的多輪執(zhí)行框架

DATAMIND的環(huán)境構(gòu)建針對數(shù)據(jù)分析場景的特殊需求進(jìn)行了多項(xiàng)創(chuàng)新,已在"挑戰(zhàn)三"部分詳細(xì)說明,此處不再贅述。關(guān)鍵點(diǎn)在于:異步交互、塊式代碼維護(hù)和安全控制三大創(chuàng)新共同構(gòu)建了一個穩(wěn)定、高效的多輪代碼執(zhí)行框架,為長視野推理提供了堅(jiān)實(shí)基礎(chǔ)。

從DATAMIND學(xué)到的三大核心經(jīng)驗(yàn)

DATAMIND的實(shí)驗(yàn)分析揭示了專業(yè)智能體訓(xùn)練中的三大關(guān)鍵經(jīng)驗(yàn),這些發(fā)現(xiàn)對構(gòu)建其他領(lǐng)域智能體具有重要參考價值。

經(jīng)驗(yàn)一:自一致性過濾比最佳軌跡選擇更重要

自一致性過濾與最佳軌跡選擇分析

在7B模型的SFT階段分析表明,移除自一致性過濾(non-con)導(dǎo)致DABench的pass@1從61.92%降至61.03%,降幅相對較小但顯著。值得注意的是,當(dāng)最終答案一致時,隨機(jī)選擇軌跡的pass@3得分與最佳選擇(con-select)相當(dāng)甚至更高。

更關(guān)鍵的是,包含所有收斂到一致答案的軌跡(不進(jìn)行選擇)能獲得最大的性能提升。這一模式在所有數(shù)據(jù)集上都成立,表明軌跡中嵌入的推理模式和問題解決策略的多樣性對模型推理能力的提升更為有益。這與Guha等人研究發(fā)現(xiàn)一致,盡管我們不能完全排除引入的更大訓(xùn)練量的貢獻(xiàn)。這一經(jīng)驗(yàn)表明,在數(shù)據(jù)合成過程中,確保答案一致性比選擇"最佳"軌跡更重要,而保留多樣化的解決路徑則能進(jìn)一步提升模型能力。

經(jīng)驗(yàn)二:SFT損失的雙重角色與動態(tài)平衡

SFT損失既是RL訓(xùn)練的有效穩(wěn)定器,也可能成為不穩(wěn)定訓(xùn)練的罪魁禍?zhǔn)住?/span>

SFT損失對RL訓(xùn)練的影響

上圖顯示,當(dāng)不施加SFT損失(γ=0)時,答案獎勵幾乎單調(diào)下降,主要由于7B模型有限的多步推理能力難以生成高質(zhì)量軌跡組,以及數(shù)據(jù)結(jié)構(gòu)和代碼語言的異質(zhì)性導(dǎo)致軌跡分布高度不平衡。

提高γ到0.2能在一定程度上緩解問題,答案獎勵雖有初始上升但仍會崩潰。而采用動態(tài)γ策略,模型首先享受強(qiáng)SFT損失的穩(wěn)定監(jiān)督,隨后逐漸減少SFT系數(shù)以鼓勵探索,實(shí)現(xiàn)了整個訓(xùn)練過程的穩(wěn)定。

不同γ設(shè)置下的答案獎勵與熵動態(tài)

上圖進(jìn)一步揭示了固定高γ值會導(dǎo)致策略熵崩潰,使模型陷入專家軌跡中的剛性思維模式,而動態(tài)γ策略能保持策略熵在較高水平。研究團(tuán)隊(duì)將訓(xùn)練過程比喻為"培養(yǎng)孩子":在早期需要大量指導(dǎo)(γ=0.9),隨著模型成熟,逐漸放手(γ=0.05),讓模型通過環(huán)境反饋發(fā)現(xiàn)自身真正能力。這一經(jīng)驗(yàn)強(qiáng)調(diào)了在訓(xùn)練過程中動態(tài)調(diào)整SFT和RL權(quán)重的重要性,避免過早陷入局部最優(yōu)或過晚失去方向。

經(jīng)驗(yàn)三:RL縮小差距但無法逆轉(zhuǎn)順序

冷啟動與RL的性能差距

實(shí)驗(yàn)數(shù)據(jù)顯示,隨著冷啟動訓(xùn)練周期增加,RL帶來的邊際收益遞減。重要的是,盡管RL縮小了性能差距,但post-RL性能仍與基礎(chǔ)模型能力正相關(guān)。這證實(shí)了大部分知識是在監(jiān)督微調(diào)階段習(xí)得的,而強(qiáng)化學(xué)習(xí)主要起到激發(fā)潛在能力的作用,而非強(qiáng)行突破模型固有的能力邊界的觀點(diǎn)。

研究團(tuán)隊(duì)指出:"強(qiáng)化學(xué)習(xí)可以縮小不同基礎(chǔ)模型之間的性能差距,但很難逆轉(zhuǎn)其優(yōu)劣順序" 特別值得注意的是,當(dāng)冷啟動足夠強(qiáng)時,RL帶來的改進(jìn)空間將大幅縮小,這引發(fā)了一個關(guān)鍵問題:是否存在一個性能飽和點(diǎn),使得RL不再有效?如果存在,是什么根本機(jī)制(如策略空間飽和、探索信號減弱或獎勵模型的內(nèi)在限制)導(dǎo)致RL失效?這一經(jīng)驗(yàn)表明,SFT階段獲取的知識是模型能力的基礎(chǔ),而RL主要用于解鎖潛在能力,而非突破模型的固有能力邊界。

為什么我們應(yīng)該關(guān)心DATAMIND?

即使你不是AI專家,DATAMIND的技術(shù)進(jìn)步也將直接影響你的工作和生活:

  • 對非技術(shù)工作者:未來你可能只需用自然語言提問(如"上季度銷售額最高的產(chǎn)品是什么?"),就能獲得專業(yè)級的數(shù)據(jù)分析結(jié)果,無需學(xué)習(xí)復(fù)雜的數(shù)據(jù)工具
  • 對數(shù)據(jù)科學(xué)家:DATAMIND能自動化處理繁瑣的數(shù)據(jù)預(yù)處理和基礎(chǔ)分析,讓你專注于更高價值的洞察發(fā)現(xiàn)
  • 對科研人員:加速科學(xué)發(fā)現(xiàn)過程,如論文中提到的"Scimaster: Towards general-purpose scientific AI agents"研究,將幫助研究人員更快地從數(shù)據(jù)中獲取洞見

專有模型與開源模型性能對比

DATAMIND-14B以71.16%的平均得分顯著優(yōu)于最強(qiáng)專有模型GPT-5(69.44%)和DeepSeek-V3.1(70.58%),而DATAMIND-7B(68.10%)也優(yōu)于所有開源模型。這一結(jié)果直觀證明了DATAMIND方法論的有效性,打破了"專有模型必然優(yōu)于開源模型"的固有認(rèn)知。

從技術(shù)到人文

想象一下,五年前,只有專業(yè)數(shù)據(jù)科學(xué)家才能進(jìn)行復(fù)雜的數(shù)據(jù)分析;今天,DATAMIND這樣的技術(shù)正在將這種能力帶給每一位知識工作者。就像Excel曾經(jīng)讓電子表格分析變得普及一樣,DATAMIND正在讓高級數(shù)據(jù)分析變得觸手可及。

在論文中,研究團(tuán)隊(duì)將訓(xùn)練過程比喻為"培養(yǎng)孩子"——這不僅僅是一個技術(shù)類比,更反映了AI發(fā)展的人文維度。我們不是在創(chuàng)造取代人類的超級智能,而是在培養(yǎng)能與人類協(xié)作的"專業(yè)助手",它們擅長處理繁瑣的技術(shù)細(xì)節(jié),而人類則專注于更高層次的思考和決策。

DATAMIND提供了一套可復(fù)用的專業(yè)智能體構(gòu)建框架,其核心價值不僅在于構(gòu)建了高性能的數(shù)據(jù)分析智能體,更在于提供了一套可擴(kuò)展的數(shù)據(jù)合成和智能體訓(xùn)練配方。研究團(tuán)隊(duì)強(qiáng)調(diào)"質(zhì)量優(yōu)先"的數(shù)據(jù)合成理念對開源社區(qū)的重要價值:盡管DATAMIND-12K僅包含12K軌跡,而TableLLM和OmniSQL分別使用20K和2.5M的訓(xùn)練數(shù)據(jù),但DATAMIND系列模型在多個基準(zhǔn)測試上仍取得最佳表現(xiàn)。

專業(yè)智能體訓(xùn)練如同"教育"過程的深刻啟示值得重視:從指導(dǎo)到放手的漸進(jìn)過程對模型能力發(fā)展至關(guān)重要。研究團(tuán)隊(duì)也坦承當(dāng)前工作的局限性:a) 目前僅包含推理導(dǎo)向的數(shù)據(jù)分析任務(wù),訓(xùn)練、預(yù)測和數(shù)據(jù)可視化任務(wù)被有意排除;b) 受限于計(jì)算資源,實(shí)驗(yàn)骨干模型僅限Qwen家族,模型規(guī)模上限為14B;c) 由于計(jì)算資源限制,尚未全面評估所有RL訓(xùn)練算法,且數(shù)據(jù)稀缺將RL運(yùn)行限制在約350步。

GitHub代碼庫(https://github.com/zjunlp/DataMind)已提供。這些資源和方法論將助力研究者構(gòu)建各自專業(yè)領(lǐng)域的智能體,共同推動"創(chuàng)新AI"愿景的實(shí)現(xiàn),加速科學(xué)研究效率并促進(jìn)科學(xué)發(fā)現(xiàn)。DATAMIND所展示的方法論框架,不僅適用于數(shù)據(jù)分析領(lǐng)域,也為構(gòu)建其他專業(yè)領(lǐng)域的智能體提供了系統(tǒng)化指導(dǎo)。

責(zé)任編輯:龐桂玉 來源: 覺察流
相關(guān)推薦

2015-03-27 09:31:01

2016-09-07 14:41:43

數(shù)據(jù)分析數(shù)據(jù)分析方法論

2016-12-01 19:10:42

大數(shù)據(jù)數(shù)據(jù)分析

2017-06-27 13:50:37

數(shù)據(jù)分析Session

2014-04-21 10:38:36

大數(shù)據(jù)

2013-12-25 09:50:27

華為馬悅企業(yè)業(yè)務(wù)

2020-05-07 11:13:44

NLPAI產(chǎn)品

2023-02-22 08:15:13

壓測模擬計(jì)算

2023-07-26 07:36:07

2022-06-27 08:47:29

BEM修飾符元素

2023-11-20 07:10:48

用戶分析聚類算法

2016-03-25 15:37:18

數(shù)據(jù)治理數(shù)據(jù)分析BI

2016-11-17 10:46:10

2025-04-10 11:47:41

2020-04-02 07:55:07

分析方法論研發(fā)

2021-11-02 18:27:48

數(shù)據(jù)挖掘項(xiàng)目

2024-02-19 00:06:06

數(shù)據(jù)分析系統(tǒng)Doris

2021-05-20 14:18:22

大數(shù)據(jù)數(shù)據(jù)分析工具

2022-06-13 08:00:00

數(shù)據(jù)湖數(shù)據(jù)倉庫大數(shù)據(jù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

电影av一区| 波多野结衣电车痴汉| 日本一区精品视频| 亚洲成国产人片在线观看| 久久99精品久久久久久青青日本| 7799精品视频天天看| 99精品视频在线| 精品国一区二区三区| 已婚少妇美妙人妻系列| av大全在线| 久久久91精品国产一区二区三区| 91久久久久久| 在线观看日本视频| 综合激情婷婷| 亚洲女人天堂视频| 日韩精品xxx| 日韩电影大全网站| 亚洲柠檬福利资源导航| 欧美裸体网站| 成人av手机在线| 欧美a级理论片| 韩国美女主播一区| 99鲁鲁精品一区二区三区| 丝袜连裤袜欧美激情日韩| 7777精品伊人久久久大香线蕉完整版 | 欧美高清在线观看| 337人体粉嫩噜噜噜| 国产精品视屏| 日韩一区二区麻豆国产| 国产又猛又黄的视频| 涩涩视频在线| 亚洲国产日韩在线一区模特| 制服诱惑一区| 超碰国产在线| 国产欧美一区二区三区在线看蜜臀| 国产成人一区二区三区免费看| 亚洲永久精品视频| 久久综合狠狠| 欧美中文字幕在线视频| 日韩三级视频在线| 欧美日韩精品| 久久成年人视频| 国产3级在线观看| 精品欧美久久| 国产亚洲美女久久| 久久精品国产亚洲AV熟女| 狼人精品一区二区三区在线| 欧美成人女星排行榜| 亚洲区 欧美区| 精品国产一区二区三区2021| 6080亚洲精品一区二区| 老司机午夜性大片| 欧美一级做一级爱a做片性| 欧美日韩免费一区二区三区| 我要看一级黄色大片| 成人av集中营| 欧美性受xxxx黑人xyx性爽| 国产日韩成人内射视频| 亚洲男人av| 日韩欧美成人免费视频| 蜜臀av午夜一区二区三区| 成人勉费视频| 欧美三级中文字| 亚洲免费av一区| 97精品资源在线观看| 日韩一区二区三区在线观看| 天天爽夜夜爽视频| 97一区二区国产好的精华液| 日韩av在线天堂网| 91激情视频在线观看| 久久国产精品亚洲人一区二区三区| 国产亚洲a∨片在线观看| 久久一级免费视频| 中文精品久久| 97久久精品人搡人人玩| 国产日产精品一区二区三区| 日韩黄色一级片| 国产精品色悠悠| 国产高清免费av| 成人不卡免费av| 欧洲精品国产| 成人福利片网站| 午夜视频久久久久久| 青青青在线播放| 欧美激情三区| 精品精品国产高清a毛片牛牛| 野花社区视频在线观看| 欧美日韩色图| 欧美国产日本在线| 国产综合精品视频| 经典一区二区三区| 国产伦精品一区二区三区在线 | 国产精品99久久免费| 日韩欧美国产一区二区三区| 国产福利短视频| 久久综合国产| 性色av一区二区三区免费| 69av视频在线观看| 国产成人综合在线播放| 欧美日韩天天操| 高清全集视频免费在线| 欧美日韩综合视频| 97超碰人人看| 欧美一区2区| 久久久亚洲精品视频| 精品国产青草久久久久96| 亚洲第一成人av| 99久久这里有精品| 精品国产sm最大网站免费看| 波多野结衣办公室33分钟| 久久久久久美女精品| 午夜精品久久久久久久白皮肤| 免费又黄又爽又猛大片午夜| 国产一本一道久久香蕉| 欧美另类一区| 黄页网站在线| 欧美日韩一区二区三区四区| 好男人香蕉影院| 欧美丰满日韩| 人九九综合九九宗合| 国产jzjzjz丝袜老师水多| 久久精品欧美日韩| 妞干网在线观看视频| 日韩深夜福利网站| 国产亚洲欧美日韩美女| 日本道在线观看| 国产很黄免费观看久久| 亚洲天堂电影网| 免费成人直播| 亚洲第一精品福利| 青青操国产视频| 久久成人久久爱| 日本在线观看一区二区| 欧美激情护士| 精品国产精品网麻豆系列| 国精产品一区一区二区三区mba| 日韩影院免费视频| 久久av一区二区三区漫画| 日本在线视频www鲁啊鲁| 欧美日韩www| 俄罗斯毛片基地| 爽好久久久欧美精品| 精品综合在线| 天堂√中文最新版在线| 亚洲电影在线看| 九九热这里有精品视频| 国产一区二区剧情av在线| 亚洲人成人77777线观看| 亚洲a∨精品一区二区三区导航| 精品一区二区三区三区| 国产美女激情视频| 91一区二区在线观看| 亚洲熟妇无码一区二区三区| 91综合久久爱com| 久久久欧美精品| 免费观看黄色一级视频| 亚洲国产aⅴ天堂久久| 99久久久无码国产精品性波多| 欧美午夜电影在线观看| 国产一区二区三区四区五区加勒比| 欧美午夜大胆人体| 亚洲国产精品久久久久| 日本午夜精品理论片a级app发布| av在线免费不卡| 黄色片久久久久| 精品一区二区三| 国产日韩欧美影视| 黄视频网站在线| 日韩欧美第一区| 日韩毛片在线播放| 久久在线免费观看| jizz欧美激情18| 外国成人免费视频| 波多野结衣精品久久| 极品在线视频| 亚洲欧美中文日韩在线| 夜夜爽8888| 亚洲欧美另类久久久精品| 亚洲麻豆一区二区三区| 西西人体一区二区| 亚洲午夜在线观看| 亚洲精品在线播放| 欧美孕妇性xx| 天天影视久久综合| 日韩精品一区在线观看| 中文字幕视频网| 国产精品美女久久久久aⅴ国产馆 国产精品美女久久久久av爽李琼 国产精品美女久久久久高潮 | www.4hu95.com四虎| 国产一区二区三区久久久| 欧美视频在线第一页| 亚洲高清极品| 91九色单男在线观看| 深夜成人在线| 久久久精品久久久久| 人妻一区二区三区免费| 在线观看日韩一区| 久久久www成人免费毛片| 91麻豆福利精品推荐| 久久久久久久久久一区二区| 亚洲黄色视屏| 中文字幕欧美日韩一区二区| 久久精品福利| 成人国产亚洲精品a区天堂华泰| h片在线观看| 色偷偷亚洲男人天堂| 五月激情六月婷婷| 欧美乱妇20p| 日韩不卡在线播放| 亚洲一区二区三区四区五区中文| 欧美人与性囗牲恔配| 成人免费观看av| 午夜剧场在线免费观看| 国产精品婷婷| 免费网站在线观看视频| 日韩系列欧美系列| 欧美日韩综合网| 国产精品久久久久av蜜臀| 国产欧美日韩精品在线观看| 九色porny丨首页入口在线| www国产精品视频| 午夜视频免费看| 日韩三级免费观看| 一级特黄色大片| 一本色道久久综合狠狠躁的推荐| 久久久久黄色片| 最新不卡av在线| 天堂在线中文视频| 久久综合九色综合97婷婷女人| 欧美国产在线一区| 捆绑调教美女网站视频一区| 妓院一钑片免看黄大片| 亚洲欧美网站| aa在线观看视频| 国产综合自拍| 国产精品视频网站在线观看| 91精品国产乱码久久久久久 | 国产吃瓜黑料一区二区| 精品一区二区三区免费播放| 国内自拍视频一区| 久久久xxx| 国产免费成人在线| 午夜在线视频观看日韩17c| 缅甸午夜性猛交xxxx| 亚洲毛片一区| 欧美精品卡一卡二| 国精品一区二区| 女人被男人躁得好爽免费视频 | 久久精品一偷一偷国产| 91官网在线| 日韩中文字幕免费看| 欧美成年黄网站色视频| 日韩一区二区三区国产| 黄色网址免费在线观看| 久久久精品国产一区二区| 国产激情视频在线| 欧美老少配视频| 污污的视频在线观看| 欧美极品少妇xxxxⅹ免费视频| 牛牛电影国产一区二区| 久久免费在线观看| 碰碰在线视频| 日本精品久久久久影院| 国产成人免费9x9x人网站视频| 国产精品 欧美在线| 91精品店在线| 91久久久久久久久久久久久| 欧美a在线观看| 国产精品二区三区| 日韩欧美影院| 日韩理论片在线观看| 久久精品久久久| 成人网站免费观看入口| 性欧美暴力猛交另类hd| 成人性生交免费看| 国产成人在线视频网站| 给我免费观看片在线电影的| 久久久蜜臀国产一区二区| 中文字幕第69页| 亚洲精品国产一区二区精华液 | 视频免费一区| 欧美激情精品久久久久久免费印度 | 伊人久久影院| 欧美日韩精品一区| 久久亚洲成人| 国产爆乳无码一区二区麻豆| 久久裸体视频| 女人高潮一级片| www.视频一区| jizzjizz日本少妇| 亚洲成人在线网站| 久久久999久久久| 91精品国产品国语在线不卡| 手机看片福利永久| 尤物tv国产一区| 日本孕妇大胆孕交无码| 国产91色在线播放| 亚洲精品影片| 亚洲韩国在线| 一本色道精品久久一区二区三区| 日韩精品你懂的| 成人av电影免费观看| 欧美aaa级片| 亚洲国产裸拍裸体视频在线观看乱了| 免费又黄又爽又猛大片午夜| 欧美va亚洲va| 免费黄色在线观看| 欧美最猛性xxxxx(亚洲精品)| 成人污污视频| 日韩三级在线播放| 国产综合激情| 91看片破解版| 久久精品男人天堂av| 亚洲国产综合久久| 欧美一区二区三区日韩| 国产乱理伦片a级在线观看| 久久久久久69| 91视频亚洲| 亚洲精品成人a8198a| 校园激情久久| 国产麻豆剧传媒精品国产av| 亚洲精品ww久久久久久p站| 精人妻无码一区二区三区| 亚洲国产精品成人av| av大片在线| 成人av番号网| 成人影院在线| 污污视频网站免费观看| 91原创在线视频| 日本在线视频免费观看| 欧美本精品男人aⅴ天堂| 久草资源在线观看| 国产精品自拍小视频| 欧美精品一区二区久久| 黑鬼大战白妞高潮喷白浆| 91最新地址在线播放| 日本在线视频免费观看| 欧美不卡在线视频| 日韩专区av| av色综合网| 欧美日韩1区| 免费黄视频在线观看| 亚洲老妇xxxxxx| 国产精品自偷自拍| 日韩资源在线观看| 啪啪av大全导航福利综合导航| 午夜一区二区三视频在线观看| 毛片一区二区| 亚洲精品成人无码| 欧美在线视频全部完| 懂色一区二区三区| 国产精品人成电影在线观看| 色综合五月天| 亚洲黄色片免费| 亚洲激情六月丁香| 精品人妻一区二区三区麻豆91| 欧美精品一二区| 精品一区二区三区视频在线播放 | 91麻豆桃色免费看| 一区二区三区四区日韩| 性高潮久久久久久| 午夜不卡av在线| 四虎精品成人免费网站| 欧洲精品毛片网站| jlzzjlzz亚洲女人| 国产精品探花在线播放| 亚洲一级二级三级| 免费一级毛片在线观看| 国产精品成av人在线视午夜片| 日韩午夜电影网| 中国老熟女重囗味hdxx| 亚洲成人av资源| 国产青青草在线| 91精品在线一区| 9色国产精品| 亚洲成人黄色av| 欧美精品亚洲二区| 成全电影大全在线观看| 欧美不卡在线一区二区三区| 美女脱光内衣内裤视频久久网站 | 国偷自产av一区二区三区麻豆| 婷婷开心久久网| eeuss影院在线播放| 亚洲一区二区三区视频| 99在线精品视频在线观看| 亚洲一区视频在线播放| 欧美一区二区三区免费观看视频| 爱看av在线入口| 亚洲免费在线精品一区| 成人午夜伦理影院| 中文字幕在线视频第一页| 欧美另类高清videos| 国产99久久久国产精品成人免费 | 亚洲第一精品在线观看| 中文字幕日韩欧美| 98视频精品全部国产| 国产一线二线三线在线观看| 亚洲一区二区三区四区在线观看| 丁香在线视频| 国内一区在线| 精品一区二区日韩|