精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

還在為AI數據發愁?張文濤和鄂維南院士團隊推出Data-centric AI系統

人工智能 新聞
張文濤和鄂維南院士團隊提出了以數據為中心的 AI 系統 DataFlow。

1. 基本介紹

近年來,大模型發展主要由大型科技公司主導,其領先的核心在于規模龐大且高質量的數據資源。然而,這些公司通常并不公開其原始數據及數據處理工具,使得學術界在大模型訓練數據的構建與優化方面難以追趕,受制甚深。

盡管近年來開源了大量數據集,學術界在大模型數據準備方面仍面臨諸多挑戰。目前,大模型訓練數據的清洗與構建仍主要依賴各個研究團隊 “閉門造車”,缺乏系統化、高效的工具支持。現有的數據處理工具如 Hadoop 和 Spark 等,支持的操作算子大多偏向傳統方法,尚未有效集成基于最新大語言模型(LLMs)的智能算子,對于構建先進大模型的訓練數據支持有限。 

為此,張文濤和鄂維南院士團隊提出了以數據為中心的 AI 系統 DataFlow。它系統實現了 100 余個基于規則、本地大模型或大模型 API 的數據治理算子(Operators),并在此基礎上構建 8 條預設數據處理流水線(Pipeline),包括:大規模嘈雜數據(如 PDF 文檔、純文本、低質量問答數據、爬蟲數據等)的清洗、擴增與評估;帶有思維鏈的強推理數據合成;RAG 數據提取與合成等等主流數據治理需求。該系統可供用戶靈活組織現有算子,開發新算子,修改現有流水線,組裝定制化流水線,以滿足多樣的數據治理任務。

圖片

目前 DataFlow 全面支持文本模態的數據治理,可供大語言模型(LLM)的預訓練(Pre-training)、有監督微調(Supervised Finetuning)、強化學習微調(Reinforcement Finetuning )使用。經過治理的數據可以有效提升大語言模型在通用領域的推理能力和檢索能力,與醫療、金融、法律等特定領域的性能。此外,多模態版本的 DataFlow 正在如火如荼開發中,會在不久的將來與大家見面。

  • 官方文檔:https://opendcai.github.io/DataFlow-Doc
  • Github 官方倉庫:https://github.com/OpenDCAI/DataFlow

2.設計理念

圖片

DataFlow 框架的數據處理邏輯主要分為算子層 (operator) 和流水線層 (pipeline)。其次,DataFlow 通過數據管理類(storage)實現讀寫管理,大模型后端類(LLMServing)支持算子調用大模型,進而實現對數據的復雜過濾、擴增和評分。此外,我們還設計了 Agent for DataFlow 模塊。使用大模型 Agent 實現多種智能數據治理功能:(1) 根據用戶描述自動編排算子構成新 Pipeline (2) 根據用戶描述自動編寫新算子 (3) Agent 自動解決數據分析任務。

2.1 框架設計

  • 數據管理:DataFlow 現階段主要支持大模型文本數據處理,為提高易用性,DataFlow 內核使用 pandas 的 DataFrame 數據表作為載體實現讀寫數據。
  • 大模型后端:目前 DataFlow 支持兩種后端,包括:

    (1)使用 vLLM 或 SGLang 作為本地推理后端,在本地 GPU 部署大模型作為推理服務。支持算子決策。

    (2)使用 request 方式向大模型服務商的 API(如 ChatGPT,Deepseek)發起請求,并支持多進程并發請求。

2.2 功能設計

  • DataFlow 算子是基本數據處理單元,通常基于規則、深度學習模型或大語言模型(LLM)實現處理邏輯。
  • DataFlow Pipeline 是對多個 DataFlow 算子的有序編排,旨在完成一個完整的數據處理任務。DataFlow 目前提供了 8 條完整流水線以供參考,用戶可以自定義修改。
  • DataFlow Agent 是一個基于多智能體協同的自動化任務處理系統,覆蓋 “任務拆解 → 工具注冊 → 調度執行 → 結果驗證 → 報告生成” 完整流程,致力于復雜任務的智能化管理與執行。

2.3 DataFlow 具體示例:

  • 評估算子示例:我們主要通過 “通用評估算子” 和 “專有評估算子” 進行評估。以通用算子為例,主要包含文本結構、多樣性和復雜性、安全性、流暢性和可理解性、教育價值、內容準確性和有效性等維度。

詳見官方文檔 https://opendcai.github.io/DataFlow-Doc/zh/guide/f50mqhmb/

  • 數據處理流水線示例:我們提供多條推薦使用的數據處理流水線,數據處理及評估結果如下。

  (1)通用文本數據處理流水線

圖片

主要由去重、改寫和過濾算子等組建,能夠實現刪除冗余字符、提取有效信息的處理效果。

詳見官方文檔 https://opendcai.github.io/DataFlow-Doc/zh/guide/textpipeline/

如下圖實驗結果顯示,清洗后的數據在多個評估維度都有提升。

圖片

(2)強推理數據合成流水線

圖片

主要包括以下三方面算子,能夠支持數據合成及多維度數據評估。

1. 問題處理:過濾非數學問題、合成新問題、驗證問題正確性、進行難度評分和類別分類。

2. 答案生成與處理:根據問題的標準答案或模型生成的答案進行處理,包括格式過濾、長度過濾和正確性驗證等。

3. 數據去重:對生成的問答數據進行去重,確保數據集的質量。

詳見官方文檔 https://opendcai.github.io/DataFlow-Doc/zh/guide/reasoningpipeline/

如下圖實驗結果顯示,合成數據在多個評估維度都有提升。

圖片

(3)Text2SQL 數據合成流水線

圖片

主要由以下幾個步驟組成:

1. 數據過濾:篩選無效 SQL 和問題描述不一致的數據;

2. 難度分類:基于 SQL 語法復雜度和執行通過率劃分難度等級;

3. Schema 處理:提取和格式化數據庫 Schema 信息;

4. 知識生成:構建自然語言問題到 SQL 查詢所需的額外知識;

5. 問題優化:標準化問題表述;

6. 提示詞生成:構建用于訓練的高質量問答數據。

詳見官方文檔 https://opendcai.github.io/DataFlow-Doc/zh/guide/text2sqlpipeline/

如下圖實驗結果顯示,處理后數據在多個評估維度上都有提升。

圖片

(4)Agentic RAG 數據處理流程

圖片

主要由以下算子構成:

1. 片段遴選:選取過濾有意義文本;

2. 構造問答對:基于現有片段中的信息,構建問答對。該問答對需要原文本支持;

3. 問題質量評估:對問答對和原文本的質量進行評估與分類,便于構建 RAG 知識庫;

4. 問題橫向合并:可以合并多個問答對的內容,提高問題復雜性與跨度;

5. 問題縱向合并:將多個問題合并為需要多次檢索的問答對。

詳見官方文檔 https://opendcai.github.io/DataFlow-Doc/zh/guide/agenticrag_pipeline/

如下圖實驗結果顯示,合成數據訓練模型在多個評估維度都有提升。

圖片

(5)Agent 自動數據處理流程

Agent 主要由以下六個模塊組成,可以添加算子并且編排已有算子,以實現自動的數據處理流水線。

1. Planning Agent:任務分解,定義任務鏈;

2. Task Dispatcher:分配任務;

3. Execution Agent:生成工具,處理任務;

4. Tool Register:注冊工具;

5. Evaluation Agent:調試與驗證;

6. Analysis Agent:總結并生成報告。

詳見官方文檔 https://opendcai.github.io/DataFlow-Doc/zh/guide/agent/agent_for_data/

效果如下:

3. 使用方式

3.1 基于代碼使用

代碼倉庫

  • 目前 DataFlow 已經部署在 PyPi,可以通過 pip install open-DataFlow 輕松一鍵安裝。
  • DataFlow 借鑒了 PyTorch 的風格的算子組織與調用方式,算子聲明通過__init__函數實現,算子運行通過 run 函數實現。接口簡明清晰,易于上手。

圖片

Github 官方倉庫:https://github.com/OpenDCAI/DataFlow

使用文檔

我們還提供了詳細的教程文檔,也歡迎開源社區提出有趣的見解,一起豐富完善文檔內容,讓 DataFlow 更加新手友好,利于上手。

圖片

官方文檔:https://opendcai.github.io/DataFlow-Doc

3.2 基于前端使用

無代碼拖拽式 Pipeline 搭建:滿足需要針對業務場景個性化定制 / 微調 pipeline 的需求。

圖片

一鍵調用數據準備 Pipeline:提供已跑通的行業 / 特定場景的最佳實踐模版。

圖片

Agent 自動化 Pipeline 設計:通過多輪對話理解并分析客戶需求,給出合理的數據過濾、數據合成、pipeline 調整等建議,確認后可一鍵配置。

圖片

目開源

  • 官方文檔:https://opendcai.github.io/DataFlow-Doc
  • Github 官方倉庫:https://github.com/OpenDCAI/DataFlow
責任編輯:張燕妮 來源: 機器之心
相關推薦

2022-08-27 12:13:05

人工智能MLOps

2022-10-26 08:16:58

jar包依賴關系Maven

2024-03-04 11:19:25

AI人工智能倪光南

2015-12-29 13:53:14

BeeCloud云計算支付

2024-07-09 18:36:12

2018-03-09 06:17:00

WiFi網絡無線

2020-12-16 09:18:38

數據科學數據大數據

2023-10-12 08:59:52

Docker AI生成式 AI

2023-10-12 15:32:36

2025-09-19 09:34:37

2024-07-09 13:52:34

2019-10-09 16:49:57

AI在線教育人工智能

2018-11-11 11:16:38

AI天貓比價

2018-11-12 00:19:32

2023-05-06 09:34:15

MetaAI

2023-06-19 09:01:17

2023-08-02 10:45:43

點贊
收藏

51CTO技術棧公眾號

av在线免费观看网站| 国产区在线观看视频| 激情综合五月| 亚洲国产美国国产综合一区二区| 国产高清精品一区二区三区| 五月天婷婷久久| 欧美电影三区| 亚洲国产成人久久| 黑森林福利视频导航| 美女羞羞视频在线观看| 不卡的看片网站| 国产精品视频播放| 免费人成在线观看| 国内精品伊人久久久| 日韩一区二区在线观看| 国产白丝袜美女久久久久| 999在线视频| 99精品视频在线免费观看| 国产精品视频99| 色婷婷av国产精品| 亚洲国产一区二区三区在线播放| 亚洲精品久久久久中文字幕欢迎你| 视频二区在线播放| 麻豆免费在线| 亚洲精品一二三区| 日本在线免费观看一区| 亚洲h视频在线观看| 日韩不卡一区二区| 国外成人性视频| 欧美另类videoxo高潮| 国产精品三级| 亚洲国产日韩精品在线| 国产乱叫456| 中文另类视频| 色呦呦国产精品| 成人免费在线网| av网站在线免费看推荐| 国产日本一区二区| 精品国产免费一区二区三区 | 欧美午夜精品久久久久久超碰| 真实国产乱子伦对白视频| 欧美激情办公室videoshd| 久久久精品日韩欧美| 国产精品久久精品国产| av中文字幕播放| 国产一区二区三区在线观看免费视频 | 久久99国产精品| 亚洲av综合色区无码一二三区 | 欧美日韩一区二区在线观看视频| 色综合av综合无码综合网站| а√在线中文网新版地址在线| 亚洲精选免费视频| 日本在线视频www色| 免费在线观看黄色| 国产精品久线观看视频| 四虎影院一区二区三区 | 后进极品白嫩翘臀在线视频| 国产成人精品免费在线| 91九色在线免费视频| 国产欧美一级片| 国产成人免费在线观看不卡| 99久久精品久久久久久ai换脸| 99国产揄拍国产精品| 国内精品不卡在线| 666精品在线| 亚洲第一天堂在线观看| 成人短视频下载| 国产亚洲一区二区三区在线播放| 天堂网在线播放| 2024国产精品视频| 欧美日韩在线一区二区三区| 国产女人在线观看| 亚洲欧洲日本在线| av动漫在线免费观看| 国产原创av在线| 欧美在线91| 欧美成人精品xxx| 欧美日韩国产精品一区二区三区| 午夜精品婷婷| 性色av一区二区咪爱| 日韩免费不卡视频| 国产九九精品| 中文字幕五月天| 亚洲美女尤物影院| 欧美日韩在线免费观看| 丰满爆乳一区二区三区| 欧美男女交配| 51午夜精品国产| 亚洲精品成人无码毛片| 国偷自产av一区二区三区| 日韩精品久久久久久久玫瑰园| 久久久精品人妻无码专区| 欧美日韩有码| 欧美激情视频在线观看| 亚洲黄色三级视频| 日韩va欧美va亚洲va久久| 成人黄色免费网站在线观看| 丰满岳乱妇国产精品一区| 久久亚洲精精品中文字幕早川悠里| 午夜精品区一区二区三| 性欧美高清come| 色狠狠色狠狠综合| 一级片免费在线观看视频| 开心激情综合| 精品激情国产视频| 精品成人免费视频| 六月丁香婷婷色狠狠久久| 官网99热精品| 男人天堂手机在线| 欧美日韩国产中文精品字幕自在自线 | 欧美另类综合| 国产成人精品日本亚洲| 亚洲第一色视频| 国产精品萝li| 成人综合视频在线| 国产高清亚洲| 一本色道久久综合亚洲精品小说 | 91精品国产乱| 无码人妻aⅴ一区二区三区69岛| 欧美国产激情| 国产精品免费一区豆花| 天天舔天天干天天操| 综合av第一页| 在线观看岛国av| 中文字幕观看av| 亚洲精品三区| 亚洲久久久久久久久久久| 青花影视在线观看免费高清| 亚洲欧美日韩视频二区| 99国产在线观看| 一级毛片视频在线| 色综合久久99| av鲁丝一区鲁丝二区鲁丝三区| 中文字幕亚洲综合久久五月天色无吗''| 日韩免费观看网站| 午夜福利视频一区二区| 一个色在线综合| 天天久久综合网| 久久精品高清| 国产伦精品一区二区三区精品视频| 日韩专区一区二区| 五月激情六月综合| 国产大尺度视频| 欧美日本国产| 99在线视频播放| www在线免费观看视频| 欧美手机在线视频| 国产精品20p| 日韩黄色在线观看| 日本一区二区在线视频观看| 欧美大片免费| 中国人与牲禽动交精品| 无码人妻久久一区二区三区| 久久综合久久鬼色| 777米奇影视第四色| 偷拍一区二区| 国产精品爱久久久久久久| 可以在线观看的av| 色国产精品一区在线观看| 色欲av无码一区二区三区| 亚洲欧美日韩在线观看a三区| 好吊妞www.84com只有这里才有精品| 国模私拍视频在线播放| 精品国产免费久久| 天海翼一区二区| 久久久久久久久99精品| 欧美黄色性生活| 婷婷综合亚洲| 国产91精品一区二区绿帽| 爱福利在线视频| 亚洲另类激情图| 亚洲天堂中文在线| 亚洲精品久久久蜜桃| 成人在线视频免费播放| 美女视频一区免费观看| 亚洲国产一区二区在线 | 国产精品免费电影| 国产鲁鲁视频在线观看特色| 精品国产三级电影在线观看| 日韩在线播放中文字幕| 中日韩av电影| av天堂一区二区| 久久久久久婷| 日本丰满少妇黄大片在线观看| 99久久免费精品国产72精品九九| 欧美性受xxxx白人性爽| 1024免费在线视频| 亚洲第一精品福利| 久久久久精彩视频| 夜夜嗨av一区二区三区| 毛片网站免费观看| 国内外成人在线| 久久久久久久午夜| 国产高清一区| 精品亚洲一区二区三区四区五区高| 无码小电影在线观看网站免费 | 日韩激情久久| 亚洲一级大片| 国产狼人综合免费视频| 岛国av在线播放| 久久精品国产精品亚洲| 性xxxx视频| 日韩午夜激情av| 这里只有精品国产| 精品动漫一区二区| 国产黄色小视频网站| 久久久久综合网| 国产乱码精品一区二三赶尸艳谈| 五月天欧美精品| 国产小视频你懂的| 99久久精品99国产精品| av亚洲天堂网| 性欧美videos高清hd4k| 亚洲丁香婷深爱综合| 影音先锋黄色网址| 欧美午夜精品久久久久久人妖| 国内偷拍精品视频| 中文字幕乱码日本亚洲一区二区| 国产精品第5页| 国产精品久久久久久久免费软件 | 日韩一二三四| 日韩欧美一区在线| 中文字幕在线一| 一本久久综合亚洲鲁鲁五月天| 欧美激情一区二区视频| 国产精品久久久久久户外露出| 久操视频免费看| 99久久99久久精品免费观看| 少妇献身老头系列| 狠狠色综合日日| 国产成人美女视频| 免费看欧美女人艹b| 欧在线一二三四区| 宅男噜噜噜66一区二区| 日本久久久网站| 你懂的视频一区二区| 日本福利视频导航| 久久人体视频| 亚洲国产一区二区三区在线| 第一会所亚洲原创| 日本一区二区三区免费观看| 蜜桃成人av| 日本亚洲自拍| 波多野结衣在线播放一区| 欧美中日韩一区二区三区| 综合亚洲色图| 美女被啪啪一区二区| 全球av集中精品导航福利| 国产伦精品一区二区三区视频黑人 | 欧美激情自拍| 污污污污污污www网站免费| 亚洲澳门在线| 老司机激情视频| 在线成人欧美| 日本www在线播放| 久久精品人人做人人爽电影蜜月| 欧美性大战久久久久xxx | 全球成人中文在线| 伊人久久精品一区二区三区| 日本精品久久久久影院| 日本一道高清亚洲日美韩| 国产欧美久久久久久| 四虎精品一区二区免费| 亚洲在线免费视频| 成人香蕉社区| 免费影院在线观看一区| 加勒比久久综合| 中文字幕一区二区三区有限公司| 亚洲午夜精品一区 二区 三区| wwwwww欧美| 免费在线亚洲| av中文字幕网址| 成人午夜私人影院| 日韩在线免费观看av| 国产女同互慰高潮91漫画| 四虎影院中文字幕| 午夜国产不卡在线观看视频| av片免费观看| 日韩西西人体444www| 五月婷婷综合久久| 日韩亚洲精品电影| 国产黄色大片在线观看| 日本午夜精品理论片a级appf发布| 福利一区二区免费视频| 97超碰在线播放| 伊人久久大香线蕉综合网站 | 欧美日韩国产乱码电影| 精品久久久无码中文字幕| 日韩成人在线电影网| 69视频在线观看| 久久免费精品日本久久中文字幕| 欧美freesex| 3d动漫精品啪啪一区二区三区免费| 免费看久久久| 国产高清免费在线| 国产欧美短视频| 国产在线观看中文字幕| 97久久超碰国产精品| 国产又色又爽又高潮免费| 亚洲电影第三页| 中文字幕+乱码+中文| 亚洲精品一区二区三区蜜桃下载 | 国产毛片在线看| 久久久久久久久久久人体| 福利一区视频| 久久婷婷开心| 欧美日韩免费| 国产精品区在线| 久久久久亚洲综合| 国产一级一片免费播放放a| 欧美日韩亚洲综合在线 欧美亚洲特黄一级 | 欧美黄色aaa| 欧美在线视频不卡| 熟妇高潮一区二区高潮| 久久天天躁狠狠躁夜夜躁| 成人欧美magnet| 国产欧美亚洲日本| 亚洲中无吗在线| 天天综合网日韩| 久久久五月婷婷| 97人人澡人人爽人人模亚洲 | 日本在线一二三| 欧美激情手机在线视频| 国产999精品在线观看| 青青草国产精品| 免播放器亚洲| 一起草在线视频| 亚洲福利一区二区| 国产高清免费在线观看| y97精品国产97久久久久久| 成人自拍av| 日本一区视频在线观看| 99香蕉国产精品偷在线观看| 久久久久久久穴| 夜夜精品视频一区二区| av免费观看网址| 久久久精品久久久| 婷婷久久免费视频| 亚洲精品在线免费看| 日本欧美加勒比视频| 国产三级av在线播放| 日韩欧美国产高清91| 四虎在线视频免费观看| 久久免费精品视频| 高清一区二区三区| 男人插女人视频在线观看| 国产成人av福利| 久久精品国产亚洲AV无码麻豆| 精品日韩在线观看| 99在线视频影院| 精品高清视频| 久久国产日本精品| 51妺嘿嘿午夜福利| 在线观看视频一区二区欧美日韩| 国产精品久久久久久久龚玥菲| 国产成+人+综合+亚洲欧洲| 禁断一区二区三区在线| 激情五月婷婷久久| 国产精品美女一区二区三区| 国产又爽又黄又嫩又猛又粗| 不卡中文字幕av| jizz国产精品| 激情综合在线观看| 国产午夜精品久久久久久免费视 | 久久久国产精品网站| 一区二区三区视频在线播放| 国产真实乱偷精品视频免| 69av.com| 亚洲美女精品成人在线视频| 99蜜月精品久久91| 国产树林野战在线播放| 成人福利视频在线| 免费av中文字幕| 久久色在线播放| 欧美电影免费网站| 免费激情视频在线观看| 日韩一区欧美小说| 欧美 日韩 国产 成人 在线| 人体精品一二三区| 99久久99久久精品国产片果冰| 国产精品二区视频| 精品日本高清在线播放| av在线天堂| 国产精品美女久久久久av福利| 性感少妇一区| 亚洲一级生活片| 国产视频精品在线| 97久久中文字幕| 欧美在线观看成人| 国产精品久久久久aaaa樱花| 欧美性受xxxx狂喷水| 国产精品日韩久久久久| 欧美涩涩网站| 免费黄色片网站| 亚洲电影免费观看高清完整版在线 | 精品久久久久久无码人妻| 91成人在线观看喷潮| 午夜激情在线| 亚洲午夜精品久久久久久浪潮| 不卡av在线网|