精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM數(shù)學(xué)性能暴漲168%,微軟14人團(tuán)隊力作!合成數(shù)據(jù)2.0秘訣曝光,智能體生成教學(xué)

人工智能 新聞
合成數(shù)據(jù)2.0秘訣曝光了!來自微軟的研究人員們提出了智能體框架AgentInstruct,能夠自動創(chuàng)建大量、多樣化的合成數(shù)據(jù)。經(jīng)過合成數(shù)據(jù)微調(diào)后的模型Orca-3,在多項基準(zhǔn)上刷新了SOTA。

全世界高質(zhì)量數(shù)據(jù)幾乎枯竭。

AI科學(xué)家們?yōu)榱私鉀Q這一難題,可謂是絞盡腦汁。

目前來看,合成數(shù)據(jù)或許就是大模型的未來,也成為業(yè)界公認(rèn)的解決之法。

就連英偉達(dá)科學(xué)家Jim Fan曾發(fā)文表示,合成數(shù)據(jù)將提供下一萬億個高質(zhì)量的訓(xùn)練token。

圖片

但是,用合成數(shù)據(jù),并非完全對LLM訓(xùn)練有幫助。

前段時間,Nature封面研究顯示,合成數(shù)據(jù)迭代9次后,會讓大模型崩潰。而且,類似的研究比比皆是。

那么,我們該怎么辦呢?

最近,微軟團(tuán)隊提出了可擴(kuò)展的智能體框架——AgentInstruct,可自動創(chuàng)建大量多樣化、高質(zhì)量的合成數(shù)據(jù)。

它最大的優(yōu)勢在于,僅只用原始數(shù)據(jù)源,就能創(chuàng)建完整的提示和回應(yīng)。

圖片

論文地址:https://arxiv.org/pdf/2407.03502

對此,研究人員使用AgentInstruct,創(chuàng)建了2500萬對「后訓(xùn)練」數(shù)據(jù)集,涵蓋了多種使用技能,如文本編輯、創(chuàng)意寫作、工具使用、編碼、閱讀理解等。

然后,他們利用這些數(shù)據(jù)對Mistral-7b進(jìn)行后訓(xùn)練,得到了Orca-3模型。

與原始的Mistral-7b-Instruct相比,Orca-3在多個基準(zhǔn)測試中,都顯示出顯著的性能提升。

圖片

而在數(shù)學(xué)方面上的表現(xiàn),性能直接暴漲168%。

圖片

當(dāng)「合成數(shù)據(jù)」遇上智能體

過去一年,我們見證了智能體的興起。

智能體可以生成高質(zhì)量的數(shù)據(jù),通過反思和迭代,其能力反超了底層基礎(chǔ)大模型。

在這個過程中,智能體可以回顧解決方案,自我批評,并改進(jìn)解決方案。它們甚至可以利用工具,如搜索API、計算器、代碼解釋,來擴(kuò)展大模型的能力。

此外,多智能體還可以帶來更多的優(yōu)勢,比如模擬場景,同時生成新的提示和響應(yīng)。

它們還可以實現(xiàn)數(shù)據(jù)生成工作流的自動化,減少或消除某些任務(wù)對人工干預(yù)的需求。

論文中,作者提出了「生成式教學(xué)」的概念。

這是說,使用合成數(shù)據(jù)進(jìn)行后訓(xùn)練,特別是通過強(qiáng)大的模型創(chuàng)建數(shù)據(jù),來教另一個模型新技能或行為。

AgentInstruct是生成式教學(xué)的一個智能體解決方案。

總而言之,AgentInstruct可以創(chuàng)建:

- 高質(zhì)量數(shù)據(jù):使用強(qiáng)大的模型如GPT-4,結(jié)合搜索和代碼解釋器等工具。

- 多樣化數(shù)據(jù):AgentInstruct同時生成提示和回應(yīng)。它使用多智能體(配備強(qiáng)大的LLM、工具和反思流程)和一個包含100多個子類別的分類法,來創(chuàng)建多樣化和高質(zhì)量的提示和回應(yīng)。

- 大量數(shù)據(jù):AgentInstruct可以自主運行,并可以應(yīng)用驗證和數(shù)據(jù)過濾的流程。它不需要種子提示,而是使用原始文檔作為種子。

圖片

生成式教學(xué):AgentInstruct

我們?nèi)绾蝿?chuàng)建海量數(shù)據(jù)?如何保證生成的數(shù)據(jù)具有多樣性?如何生成復(fù)雜或微妙的數(shù)據(jù)?

為此,研究人員概述了解決這些挑戰(zhàn)的結(jié)構(gòu)化方法:

圖片

具體來說,AgentInstruct定義了三種不同的自動化生成流程:

內(nèi)容轉(zhuǎn)換流程:將原始種子轉(zhuǎn)換為中間表示,簡化了針對特定目標(biāo)創(chuàng)建指令的過程。

種子指令生成流程:由多個智能體組成,以內(nèi)容轉(zhuǎn)換流程的轉(zhuǎn)換后種子為輸入,生成一組多樣化的指令。

指令改進(jìn)流程:以種子指令流程的指令為輸入,迭代地提升其復(fù)雜性和質(zhì)量。

圖片

接下來,研究人員為為17種不同的技能實現(xiàn)了這些流程,每種技能都有多個子類別。

這些技能包括閱讀理解、問答、編碼、檢索增強(qiáng)生成、創(chuàng)意寫作、工具/API使用和網(wǎng)絡(luò)控制。

完整列表,如下表1中所示。

圖片

接下來,研究人員通過以下三種技能的案例研究,來解釋這些工作流是如何運作的。

圖片

圖片

圖片

實驗結(jié)果

正如開頭所述,研究人員使用2580萬對指令,微調(diào)Mistral-7b-v0.1模型,然后得到Orca-3。

那么經(jīng)過使用AgentInstruct數(shù)據(jù)訓(xùn)練Orca-3,性能究竟如何?

AgentInstruct的目標(biāo)是合成一個大型且多樣化的數(shù)據(jù)集,其中包含不同難度級別的數(shù)據(jù)。

在這個數(shù)據(jù)集上,像Orca-2.5、Mistral-Instruct-7b和ChatGPT這樣的基準(zhǔn)模型得分遠(yuǎn)低于10分,顯示出它們相對于GPT-4(被指定為基準(zhǔn),得分為10)的劣勢。

圖4中描繪的性能比較展示了基準(zhǔn)模型與Orca-3之間的對比分析。

這個圖顯示了在AgentInstruct數(shù)據(jù)的支持下,后訓(xùn)練過程中各種能力的顯著提升。

圖片

表2概括了所有評估維度的平均得分。

平均而言,包括每輪訓(xùn)練輪后的Orca-3,AgentInstruct數(shù)據(jù)的引入使性能相比Orca 2.5基準(zhǔn)提高了33.94%,相比Mistral-Instruct-7B提高了14.92%。

圖片

刷新多項基準(zhǔn)SOTA

表3中給出了每個基準(zhǔn)的所有基線的結(jié)果。

比如,在AGIEval提升40%,在MMLU上提升19%,在GSM8K上提升54%,在BBH上提升38%,在AlpacaEval上提升45%。

此外,它在性能上持續(xù)超過其他模型,如LLAMA-8B-instruct和GPT-3.5-turbo。

圖片

就閱讀理解任務(wù)來說,對于LLM至關(guān)重要。對于小模型來說,也更為重要。

通過使用AgentInstruct進(jìn)行針對性訓(xùn)練,可以觀察到Mistral的閱讀理解能力有了實質(zhì)性的提升(見表4)——相比Orca 2.5提高了18%,相對于Mistral-Instruct-7b提高了21%。

此外,通過利用這種數(shù)據(jù)驅(qū)動的方法,研究人員將一個7B參數(shù)的模型在LSATs的閱讀理解部分的表現(xiàn),提升到了與GPT-4相匹配的水平。

圖片

再拿數(shù)學(xué)來說,通過AgentInstruct,成功提升了Mistral在從小學(xué)到大學(xué)水平的各種難度數(shù)學(xué)問題上的熟練程度,如下表5所示。

在各種流行的數(shù)學(xué)基準(zhǔn)測試上,改進(jìn)幅度從44%-168%不等。

應(yīng)當(dāng)強(qiáng)調(diào)的是,生成式教學(xué)的目標(biāo)是教授一種技能,而不是生成數(shù)據(jù)來滿足特定的基準(zhǔn)測試。AgentInstruct在生成式教學(xué)方面的有效性通過在各種數(shù)學(xué)數(shù)據(jù)集上的顯著改進(jìn)得到了證明。

圖片

表6顯示了,Orca-3-7B模型和FoFo基準(zhǔn)上,其他開源和閉源基準(zhǔn)的性能。

圖片

另外,通過 AgentInstruct 方法,成功地將模型幻覺減少31.34%,同時達(dá)到了與GPT-4(教師)相當(dāng)?shù)馁|(zhì)量水平。

圖片

表8顯示了使用/不使用RAG的MIRAGE上所有模型的結(jié)果。

圖片

總之,AgentInstruct生成教學(xué)方法,為模型后訓(xùn)練生成大量多樣化和高質(zhì)量數(shù)據(jù)的挑戰(zhàn),提供了一個有前途的解決方案。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2023-02-23 07:46:48

學(xué)習(xí)模型數(shù)據(jù)倉庫

2025-03-03 09:00:00

2024-12-02 10:15:00

LLM模型

2025-07-31 02:00:55

AI智能體短視頻

2022-06-20 11:28:20

人工智能數(shù)據(jù)生成器

2024-04-18 08:38:15

LLM數(shù)據(jù)訓(xùn)練模型

2013-05-30 09:15:16

微軟團(tuán)隊成功秘訣微軟

2025-06-25 08:53:00

模型AI強(qiáng)化學(xué)習(xí)

2024-12-23 09:38:00

2025-11-06 01:44:00

2022-06-13 15:28:42

人工智能機(jī)器學(xué)習(xí)數(shù)據(jù)

2024-02-02 17:04:35

UCLALLMGPT-4

2024-10-14 09:25:00

2025-04-08 00:40:00

谷歌合成數(shù)據(jù)大模型

2022-08-11 08:00:00

機(jī)器學(xué)習(xí)合成數(shù)據(jù)深度學(xué)習(xí)

2024-09-27 12:20:18

2022-04-17 23:13:02

人工智能元宇宙數(shù)據(jù)

2025-06-04 03:00:00

人工智能AI智能訓(xùn)練

2023-08-01 14:59:35

人工智能合成數(shù)據(jù)

2025-02-07 13:26:13

點贊
收藏

51CTO技術(shù)棧公眾號

日韩女优人人人人射在线视频| 在线区一区二视频| 精品一区二区三区日本| 综合网在线观看| 色综合久久网| 亚洲第一中文字幕在线观看| 欧美aⅴ在线观看| 麻豆电影在线播放| 国产成人在线观看免费网站| 日本精品视频网站| 欧美成人免费观看视频| 久久爱www成人| 日韩一区二区在线看片| 丰满少妇被猛烈进入高清播放| 男人影院在线观看| 91啪九色porn原创视频在线观看| 国产精品亚洲网站| 日韩av在线播| 99精品在线观看| 亚洲精品久久久久久久久久久久| 婷婷激情5月天| 亚洲性色av| 亚洲欧美日韩国产成人精品影院| 欧美不卡1区2区3区| 国产乱码精品一区二三区蜜臂| 亚洲欧美春色| 欧美激情在线观看| 欧美88888| 亚洲资源网你懂的| 精品国产成人系列| 九九久久久久久| 亚洲国产成人二区| 亚洲第一av色| 国产爆乳无码一区二区麻豆| 五月香视频在线观看| 久久久久久久免费视频了| 国产一区免费在线| 亚洲国产成人一区二区| 国内精品久久久久影院一蜜桃| 国产成人黄色av| 久久久久女人精品毛片九一 | 亚洲高清资源综合久久精品| 水中色av综合| 国产精品主播直播| 成人久久精品视频| 亚洲最新av网站| 麻豆国产91在线播放| 国产成人亚洲综合青青| 国产一级免费视频| 亚洲尤物在线| 欧美专区第一页| 日韩毛片一区二区三区| 国产欧美一级| 欧美最猛黑人xxxx黑人猛叫黄| 欧美福利视频一区二区| 99国产精品私拍| 97精品一区二区视频在线观看| 日本熟妇毛耸耸xxxxxx| 亚洲第一毛片| 欧美做受高潮电影o| av大片免费观看| 久久久久国产精品一区三寸 | 亚洲色成人www永久网站| 毛片一区二区| 国产精品激情av在线播放| 亚洲精品国产无码| 麻豆国产精品一区二区三区 | 999视频精品| 久久视频免费在线播放| 日韩在线中文字幕视频| 欧美日韩亚洲一区三区| 2018中文字幕一区二区三区| 黄色片视频免费| 另类人妖一区二区av| 91精品综合久久久久久五月天| 国产丝袜视频在线观看| 国产成人午夜精品5599| 国内精品视频免费| 黄色视屏网站在线免费观看| 国产精品毛片久久久久久| 米仓穗香在线观看| av在线不卡免费| 色嗨嗨av一区二区三区| 91丨九色丨蝌蚪| 国产精品毛片视频| 国产亚洲精品一区二区| 一区二区三区四区五区| 亚洲三级电影在线观看| 国产精品夫妻激情| 精品人妻无码一区二区色欲产成人 | 国产精品久久久久久久久| 国产精品久久婷婷| 成人av网站免费观看| 日韩高清在线播放| 香蕉成人app免费看片| 欧美片第1页综合| 欧美日韩爱爱视频| 日韩视频在线观看一区| 精一区二区三区| 精品无人区一区二区三区| 9色在线视频网站| 亚洲高清免费一级二级三级| 久久久国产欧美| 99精品在免费线中文字幕网站一区| 国产偷国产偷亚洲清高网站| 中文字幕手机在线观看| 美女爽到呻吟久久久久| 国产精华一区| 伊人免费在线| 欧美午夜精品伦理| 三上悠亚 电影| 成人短片线上看| 国内精品久久久久伊人av| 亚洲天堂视频网| 91丨九色丨蝌蚪丨老版| 大荫蒂性生交片| 国产精品黄色片| 亚洲欧美日韩一区二区三区在线| a级黄色片免费看| 美腿丝袜亚洲色图| 欧美高清性xxxxhd| 成人影音在线| 91精品国产乱码久久蜜臀| 亚洲国产无码精品| 亚洲视频碰碰| 成人高清在线观看| 黄色动漫在线观看| 欧美日韩你懂的| 熟女俱乐部一区二区| 亚洲精品美女91| 亚洲综合第一页| 麻豆视频在线| 在线不卡中文字幕| 黄色一级片一级片| 日本麻豆一区二区三区视频| 久久综合九色欧美狠狠| 僵尸再翻生在线观看免费国语| 日韩午夜精品视频| 黄视频网站免费看| 精品一区中文字幕| 一区二区三区四区不卡| 久久福利在线| 最新国产成人av网站网址麻豆| 中文字幕在线天堂| 久久精品欧美一区二区三区麻豆| 亚洲国产精品久久久久婷蜜芽| 538任你躁精品视频网免费| 久热精品视频在线观看一区| 国产又粗又猛又爽又黄视频 | 国产成人免费在线视频| 中文字幕免费高| www.久久久.com| 久久综合88中文色鬼| 国产精品视频第一页| 1000精品久久久久久久久| wwwwwxxxx日本| 国产精品不卡| 114国产精品久久免费观看| 3d玉蒲团在线观看| 精品国产乱码久久| 日韩免费视频一区二区视频在线观看| www.亚洲国产| 北条麻妃在线观看| 不卡在线一区| 91久久精品视频| 性欧美video高清bbw| 精品粉嫩aⅴ一区二区三区四区| 国产精品99精品| 337p粉嫩大胆色噜噜噜噜亚洲| 成人性做爰aaa片免费看不忠| av一区二区高清| 91精品国产综合久久男男| 国产黄大片在线观看画质优化| 欧美一区二区精品久久911| 久久婷婷国产麻豆91| 99久久99久久精品免费观看| 欧美精品第三页| 久久综合成人| 国产美女精品在线观看| www.成人爱| xxxxx成人.com| 黄色福利在线观看| 在线中文字幕一区| 天天鲁一鲁摸一摸爽一爽| 国产99精品国产| 亚洲乱码中文字幕久久孕妇黑人| jiujiure精品视频播放| 91免费版黄色| 欧美黑人巨大xxxxx| 久久久av网站| 日韩欧美在线观看一区二区| 欧美另类z0zxhd电影| 日本熟妇成熟毛茸茸| 国产精品久久久久久久久免费樱桃 | 男人舔女人下面高潮视频| 色综合天天爱| 精品视频一区在线| 国产精品2区| 日本中文字幕不卡免费| 久久久久久国产精品免费无遮挡| 亚洲国产精品va在线| 在线观看黄色国产| 午夜精品一区在线观看| www.com.av| 久久亚洲精精品中文字幕早川悠里| 国内av一区二区| 久久综合导航| 日本手机在线视频| 国产精品国产一区| 欧美精品久久久| 国产色噜噜噜91在线精品| 国产日韩视频在线观看| 福利视频久久| 国产欧美精品一二三| 日本高清不卡一区二区三区视频 | 日韩精品分区| 一区二区三区美女xx视频| 男人天堂av网| 欧美一级国产精品| 一级特黄特色的免费大片视频| 欧美日韩国产一区在线| 青娱乐在线视频免费观看| 亚洲国产精品av| 久久亚洲AV成人无码国产野外| 国产精品一区一区| www.污污视频| 六月丁香婷婷久久| 精品少妇无遮挡毛片| 国产精品美女| 欧美牲交a欧美牲交| 国精品一区二区| 一级黄色片播放| 91精品一区国产高清在线gif | 国产精品久久波多野结衣| 亚洲欧洲一二区| 国产美女精品视频免费观看| 日韩不卡免费高清视频| 全球成人中文在线| 欧洲一区精品| 18性欧美xxxⅹ性满足| 91www在线| 91国产中文字幕| www.超碰在线| 97视频在线观看视频免费视频 | 男女性杂交内射妇女bbwxz| 国产麻豆精品theporn| 999久久久精品视频| 极品少妇xxxx精品少妇偷拍| 亚洲一二三av| 国产精品亚洲一区二区三区在线| 成人高清在线观看视频| 国产一区二区三区在线观看免费| 久久精品国产99久久99久久久| 国产乱一区二区| 成人啪啪18免费游戏链接| 国产成人精品一区二| 日本中文字幕有码| 成人黄页在线观看| 星空大象在线观看免费播放| 99热精品国产| 最近中文字幕免费| 国产精品乱码一区二区三区软件 | 中文字幕影片免费在线观看| 97精品视频在线观看自产线路二| 国产又黄又粗又猛又爽的视频| 久久亚洲精精品中文字幕早川悠里| www.99热| 综合色天天鬼久久鬼色| 久久黄色小视频| 狠狠躁天天躁日日躁欧美| 91视频久久久| 欧美电影影音先锋| 日本成人动漫在线观看| 亚洲人成网在线播放| 日本在线www| 欧美精品久久久久久久| 在线精品亚洲欧美日韩国产| 国产精品国内视频| 国产一区二区av在线| 国产一区二区在线网站| 欧美理论视频| 日本五级黄色片| 美日韩精品视频| 免费黄频在线观看| 91麻豆产精品久久久久久 | 欧美一区二区三区少妇| 日韩中文字幕免费看| 国产探花视频在线观看| 国产成人在线一区二区| 精品一区二区三区亚洲| 久久久水蜜桃| 一级毛片免费高清中文字幕久久网| 国产美女网站在线观看| 另类小说综合欧美亚洲| 日韩www视频| 国产精品久久久久精k8| 成人免费区一区二区三区| 欧美精品在线观看播放| 成人午夜福利视频| 日韩在线欧美在线| 91精品论坛| 国产乱码精品一区二区三区不卡| 欧美精品色图| 日本十八禁视频无遮挡| 久久爱另类一区二区小说| 老司机福利av| 亚洲国产婷婷综合在线精品| 中文字幕日本人妻久久久免费| 亚洲激情视频在线观看| 操你啦视频在线| 国产精品久久久久久久久男| 日韩深夜影院| 精品人妻人人做人人爽| 麻豆精品一二三| 免费黄色片网站| 欧美日韩国产精品专区| www.亚洲天堂.com| 日韩在线观看免费av| 国产精品亚洲一区二区三区在线观看 | 精品欧美在线观看| 中文字幕在线亚洲| 国产超碰精品| 欧美久久综合性欧美| 在线不卡欧美| 最新日本中文字幕| 亚洲综合清纯丝袜自拍| 99热精品在线播放| 日韩天堂在线视频| 成人午夜sm精品久久久久久久| 欧美日韩一区二区三区在线视频 | 欧美捆绑视频| 2019av中文字幕| 亚洲色图美女| 欧美日韩激情视频在线观看| 成人黄色国产精品网站大全在线免费观看 | 亚洲巨乳在线观看| 久久九九国产| 久久美女免费视频| 色婷婷香蕉在线一区二区| 天堂中文网在线| 韩国三级电影久久久久久| 国产精品1luya在线播放| www.日本在线视频| 成人av一区二区三区| 日韩高清精品免费观看| 亚洲第一区中文99精品| √最新版天堂资源网在线| 国产精品久久精品视| 亚洲国产一区二区精品专区| 国产污在线观看| 五月天国产精品| 黄色av网站在线看| 国产成人亚洲综合青青| 日本女优一区| www.51色.com| 亚洲国产中文字幕| 五月婷婷六月色| 国产精品h片在线播放| 日韩综合网站| 日韩久久久久久久久久久| 一区二区三区欧美久久| 蜜臀av中文字幕| 日本韩国欧美精品大片卡二| 啪啪亚洲精品| 亚洲午夜精品一区| 一二三区精品视频| 五月激情丁香婷婷| 国产精品pans私拍| 久久久久久久久久久妇女 | 国产亚洲视频系列| 亚洲熟妇av乱码在线观看| 久久亚洲影音av资源网| 国内精品国产成人国产三级粉色| 国产亚洲欧美在线视频| 亚洲国产精品精华液2区45| 国产免费黄色大片| 午夜免费日韩视频| 欧美日韩一二| 伦伦影院午夜理论片| 精品毛片网大全| 不卡在线视频| 99九九电视剧免费观看| 久久aⅴ乱码一区二区三区| 欧洲性xxxx| 欧美精品一区视频| 日韩美女在线看免费观看| 亚洲天堂第一区| 26uuu精品一区二区| 国产精品伦理一区| 91精品国产高清久久久久久91| 不卡中文字幕| 又黄又爽的网站| 欧美日韩久久久久久| 国产高清自产拍av在线| 亚州欧美一区三区三区在线| 白白色 亚洲乱淫| 一区二区三区免费在线视频| 18久久久久久| 午夜欧美理论片| 成人在线手机视频|