精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

編碼碾壓ChatGPT!UIUC清華聯(lián)手發(fā)布7B參數(shù)Magicoder,代碼數(shù)據(jù)權(quán)重全開源

人工智能 新聞
全新代碼大模型Magicoder,不到7B參數(shù),就能在代碼生成領(lǐng)域與頂級代碼模型不相上下。

開源「代碼大模型」來了!

UIUC清華團(tuán)隊的研究人員發(fā)布了Magicoder,不到7B參數(shù),就能在代碼生成領(lǐng)域與頂級代碼模型不相上下。

值得一提的是,Magicoder的代碼、權(quán)重和數(shù)據(jù),毫無保留完全開源。

論文地址:https://arxiv.org/abs/2312.02120

Magicoder依靠的OSS-INSTRUCT的方法,是通過對現(xiàn)有頂級代碼模型(例如ChatGPT)的提示,加上網(wǎng)絡(luò)上的種子代碼片段,來生成的代碼。

這可真是取之于大模型,用之于大模型;就有網(wǎng)友轉(zhuǎn)發(fā)說道:通過這些結(jié)果,看到了提高用于LLMs的合成數(shù)據(jù)的潛力也是一個非常有趣的領(lǐng)域。

話不多說,那就讓我們來具體了解一下Magicoder的來歷吧!

代碼生成的發(fā)展史

代碼生成(Code Generation),也叫程序合成(Program Synthesis),近幾十年來,一直都是學(xué)術(shù)界的一塊「硬骨頭」,在此領(lǐng)域進(jìn)行過的許多嘗試,例如基于抽象的合成和基于示例的編程,都沒有取得很好的效果。

直到最近,使用在代碼上訓(xùn)練的大型語言模型取得了顯著的突破,被廣泛應(yīng)用于輔助實際軟件開發(fā)。

最初,諸如GPT-3.5 Turbo和GPT-4之類的閉源模型主導(dǎo)了各種代碼生成基準(zhǔn)和排行榜。

為了推動開源LLM在代碼生成領(lǐng)域的應(yīng)用,SELF-INSTRUCT方法被開發(fā)出來,通過使用強(qiáng)大的LLM生成合成的編碼指令,并利用這些指令對較弱的學(xué)生模型進(jìn)行微調(diào),以從強(qiáng)大的教師模型中提取知識。

然而,SELF-INSTRUCT在提高LLM的指令遵循能力時,仍然依賴于狹窄范圍的預(yù)定義任務(wù)或啟發(fā)式方法。

為了解決這一問題,UIUC和清華的研究人員提出了Magicoder,其中采用的OSS-INSTRUCT方法,旨在減輕LLM固有的偏見,通過直接學(xué)習(xí)開源代碼釋放其創(chuàng)造高質(zhì)量和創(chuàng)意編碼指令的潛力。

OSS-INSTRUCT通過從開源中搜集的隨機(jī)代碼片段獲得靈感,自動生成新的編碼問題。借助于不同的種子代碼片段,OSS-INSTRUCT能夠直接產(chǎn)生多樣、真實和可控的編碼指令數(shù)據(jù)。

如下圖所示,在這個例子中,LLM從兩個不同函數(shù)的不完整代碼片段中獲取靈感,成功地將它們關(guān)聯(lián)起來,并構(gòu)建出一個現(xiàn)實的機(jī)器學(xué)習(xí)問題。

由于OSS-INSTRUCT與現(xiàn)有的數(shù)據(jù)生成方法是正交的,OSS-INSTRUCT可以被同時結(jié)合使用,進(jìn)一步推動模型在編碼任務(wù)中的能力。

為什么OSS-INSTRUCT如此神奇?

OSS-INSTRUCT的工作方式是通過對LLM(例如ChatGPT)進(jìn)行提示,然后根據(jù)從互聯(lián)網(wǎng)搜集的一些種子代碼片段(例如來自GitHub)生成編程問題及其解決方案。

一方面,種子片段提供了生成的可控性;

另一方面,OSS-INSTRUCT加強(qiáng)了LLM創(chuàng)建編程問題的多樣化,更符合真實的編程場景。

我們可以從以下幾個指標(biāo)中一探究竟:

1. 類別平衡

如下圖所示,通過計算OSS-INSTRUCT中每個樣本的嵌入與這10個類別之間的余弦相似性,可以看出其在不同類別之間表現(xiàn)出了多樣性和平衡。

2. 長度分布

下圖展示生成問題和解決方案的長度分布,良好的平衡性讓OSS-INSTRUCT更貼合實際應(yīng)用場景。

3. 與HumanEval的相似性計算

下圖展示了與HumanEval樣本的余弦相似性。

可以看出,OSS--INSTRUCT在所有研究的數(shù)據(jù)生成技術(shù)中表現(xiàn)出最低的平均相似度,這說明OSS--INSTRUCT生成的數(shù)據(jù)是最富有多樣性的。

但是,既然OSS-INSTRUCT獲取到的種子片段來自于開源代碼,為什么不直接在這些開源代碼上進(jìn)行微調(diào)呢?

為了回答這個問題,研究人員遵循CodeSearchNet,使用基礎(chǔ)的CODELLAMA-PYTHON-7B對配對數(shù)據(jù)進(jìn)行了2個時期的微調(diào),遵循相同訓(xùn)練設(shè)置。

對比結(jié)果如下表,在75,000個配對注釋-函數(shù)數(shù)據(jù)上,微調(diào)甚至使基礎(chǔ)模型惡化,而OSS-INSTRUCT有助于引入實質(zhì)性的提升。

研究人員推測,這種惡化可能是由這些配對數(shù)據(jù)固有的大量噪聲和不一致性導(dǎo)致的。

這進(jìn)一步表明,數(shù)據(jù)的真實性對于代碼指令調(diào)整至關(guān)重要,而非格式。

該結(jié)果還凸顯了OSS-INSTRUCT的優(yōu)越性,可以將這些松散相關(guān)的代碼片段轉(zhuǎn)化為語義一致的指令調(diào)整數(shù)據(jù)。

Magicoder表現(xiàn)評估

研究團(tuán)隊首先構(gòu)建了使用OSS-INSTRUCT進(jìn)行訓(xùn)練的Magicoder系列,同時進(jìn)一步組合使用OSS-INSTRUCT和Evol--INSTRUCT構(gòu)建了MagicoderS系列,并在兩個系列上都進(jìn)行了測試。

代碼生成基準(zhǔn)使用的是HumanEval和MBPP,這是目前兩個最廣泛使用的基準(zhǔn)。這些基準(zhǔn)中的每個任務(wù)都包括一個任務(wù)描述(例如docstring)作為提示,然后讓LLMs生成相應(yīng)的代碼。其正確性由少量測試用例進(jìn)行檢查。

為了更嚴(yán)格的評估,研究人員還使用了由EvalPlus框架支持的HumanEval+和MBPP+以獲取更多的測試。

值得注意的是,MagicoderS-CL和MagicoderS-DS在HumanEval+上的表現(xiàn)都優(yōu)于只有7B參數(shù)的ChatGPT。

讓我們具體看下Magicoder的表現(xiàn):

1. Python語言

我們首先可以觀察到Magicoder-CL相在HumanEval和HumanEval+上相對于CODELLAMA-PYTHON-34B有了實質(zhì)性的改進(jìn)。

MagicoderS-CL在HumanEval+上優(yōu)于ChatGPT和所有其他開源模型。

此外,盡管在HumanEval上得分略低于WizardCoder-CL-34B和ChatGPT,但在更嚴(yán)格的HumanEval+數(shù)據(jù)集上超過了它們,這表明MagicoderS-CL可能生成更穩(wěn)健的代碼。

2. 其他編程語言

在除了Python之外的語言對比中,Magicoder-CL在所有研究過的編程語言中都大幅超過了基礎(chǔ)的CODELLAMA-PYTHON-7B。

此外,MagicoderS-CL在所有編程語言上都進(jìn)一步改進(jìn)了Magicoder-CL,僅使用7B參數(shù)就實現(xiàn)了與WizardCoder-CL-34B相當(dāng)?shù)男阅堋?/span>

值得注意的是,Magicoder-CL僅使用非常有限的多語言數(shù)據(jù)進(jìn)行訓(xùn)練,但仍然優(yōu)于其他具有相似甚至更大規(guī)模的LLMs。這意味著LLMs可以從數(shù)據(jù)中學(xué)習(xí)超出其格式的知識。

3. 數(shù)據(jù)科學(xué)庫

最后,針對7個熱門Python數(shù)據(jù)科學(xué)庫的1,000個獨特的數(shù)據(jù)科學(xué)編碼問題(DS-1000 dataset),研究人員也進(jìn)行了單元測試,旨在評估LLMs在實際用例中的表現(xiàn)。

從表中可以看出,Magicoder-CL-7B已經(jīng)在所有評估的基線中表現(xiàn)出色,包括最先進(jìn)的WizardCoder-SC-15B,改善了8.3個百分點。

雖然Magicoder還不夠完美,但作者認(rèn)為,通過公開分享所有的數(shù)據(jù)和代碼細(xì)節(jié),會有越來越多的先進(jìn)代碼模型出現(xiàn)。

讓我們也拭目以待。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2024-07-22 09:00:00

2024-03-18 07:01:42

2025-03-20 08:34:14

2024-07-22 07:10:00

小模型機(jī)器學(xué)習(xí)蘋果

2025-02-10 14:30:00

模型數(shù)據(jù)開源

2024-12-03 15:51:45

2025-04-14 09:27:00

2024-02-22 10:09:00

開源模型

2024-06-03 10:43:34

2025-04-02 09:00:00

模型開源AI

2025-06-23 09:01:00

2025-01-06 07:40:00

2024-05-15 09:17:30

模型AI

2025-10-15 14:10:47

AI模型開源

2023-12-14 13:00:00

AI訓(xùn)練

2023-12-17 13:07:11

訓(xùn)練數(shù)據(jù)

2025-03-27 09:40:59

2023-10-13 19:58:33

Mistral7B模型

2024-01-29 09:40:00

AI訓(xùn)練

2024-02-04 07:20:00

AI模型
點贊
收藏

51CTO技術(shù)棧公眾號

日韩美女一区二区三区在线观看| 高清免费电影在线观看| 国产精品入口66mio| 日韩黄色高清视频| 日韩一级片播放| 午夜在线视频观看| 日韩激情视频在线观看| 中文字幕少妇一区二区三区| www.五月天色| 欧美xxxx黑人又粗又长| 久久一区二区视频| 国产精品爽爽爽| 成人免费毛片东京热| 亚洲v天堂v手机在线| 欧美日韩五月天| 日韩国产成人无码av毛片| 天堂资源最新在线| 久久精品国产成人一区二区三区 | 久久久噜噜噜久久中文字幕色伊伊| 成人免费观看男女羞羞视频| 欧美精品中文字幕一区| 稀缺小u女呦精品呦| 亚洲精华液一区二区三区| 国产色产综合色产在线视频| 91久久极品少妇xxxxⅹ软件 | 天堂在线中文字幕| 日韩成人午夜精品| 正在播放欧美一区| 成人一区二区三区仙踪林| 芒果视频成人app| 亚洲黄网站在线观看| 欧美大香线蕉线伊人久久| 国产精品视频一二区| 99精品免费| 久久精品电影一区二区| 中文字幕丰满乱子伦无码专区| 亚洲ww精品| 91国偷自产一区二区开放时间| 一区二区三区四区欧美日韩| 偷拍精品一区二区三区| 国产中文字幕精品| 国产精品久久久久久久久久久新郎 | 欧美aaaaaa| 天天爽夜夜爽夜夜爽精品视频| 一区二区三视频| 可以在线观看的av网站| 大尺度一区二区| 91精品久久久久久久久久另类| 可以在线观看av的网站| 欧美不卡高清| www.国产精品一二区| av在线网站观看| 北条麻妃一区二区三区在线观看 | 国产 日韩 欧美 在线| 91不卡在线观看| 色婷婷**av毛片一区| 男人天堂av电影| 一区二区网站| 欧美久久久久中文字幕| 欧美伦理视频在线观看| 国偷自产一区二区免费视频| 亚洲国产精品影院| 992tv快乐视频| 国产高清一区二区三区视频| 中文字幕在线不卡| 亚洲精品中文综合第一页| 国产小视频福利在线| 久久久久久久久久久久久夜| 久久综合一区| 精品999视频| 国产亚洲一区字幕| 日韩欧美激情一区二区| 五月天婷婷在线观看| 91亚洲精品乱码久久久久久蜜桃| 国产一区免费观看| 好吊色一区二区三区| 国产精品自产自拍| av蓝导航精品导航| 国产精品国产av| 国产一区不卡视频| 91精品久久香蕉国产线看观看| 中文字幕在线观看高清| 蜜桃视频第一区免费观看| 国产欧美日韩精品在线观看 | 欧美成人激情| 欧美成人免费一级人片100| 永久免费看黄网站| 亚洲国产一区二区精品专区| 2019av中文字幕| 日韩精品久久久久久免费| 日韩影院精彩在线| 国产在线播放91| av 一区二区三区| 粉嫩av一区二区三区粉嫩| 国产免费一区二区三区| 男人天堂网在线观看| 日本一区二区不卡视频| 丰满人妻一区二区三区53号| 午夜影院在线播放| 91精品国产一区二区三区| www.四虎在线| 日韩av有码| 国内精品久久影院| 伊人色综合久久久| www.亚洲免费av| 一级做a爰片久久| 正在播放日韩精品| 欧美一区二区人人喊爽| 精品少妇人妻一区二区黑料社区| 天天插综合网| 日韩av成人在线| 精品国产999久久久免费| 2019国产精品| 欧美精品久久久久久久久久久| 欧美性片在线观看| 精品处破学生在线二十三| 免费看的黄色录像| 一区二区91| 97免费资源站| 最新国产在线观看| 欧美视频不卡中文| 图片区偷拍区小说区| 99久久夜色精品国产亚洲狼| 国产成人拍精品视频午夜网站| 亚洲成人久久精品| 亚洲欧洲av色图| 99视频精品免费| 亚洲精品蜜桃乱晃| 久久久久久久久久久成人| 97超碰人人模人人人爽人人爱| 久久久久亚洲综合| 大j8黑人w巨大888a片| 日本一区二区三区播放| 色偷偷偷亚洲综合网另类| 精产国品一区二区| 成人a免费在线看| 日本a在线天堂| 精品一区91| 久久精品最新地址| 国产精品国产三级国产普通话对白 | 国产一区日韩欧美| 97人摸人人澡人人人超一碰| 国产在线高潮| 欧美精品一二三| 中文字幕91视频| 日本亚洲最大的色成网站www| 久久精品国产一区二区三区日韩| 超碰97国产精品人人cao| 精品少妇一区二区三区视频免付费| 日韩在线观看免| 精品综合久久久久久8888| 中文字幕人成一区| 成人51免费| 欧美日韩福利电影| 好男人在线视频www| 亚洲午夜精品久久久久久久久| 伊人成人免费视频| 一区二区电影| 97超碰人人看人人 | 日韩片欧美片| 成人黄色在线播放| 色呦呦在线资源| 精品国产成人在线影院| 国产在线一区视频| 26uuu另类欧美| 欧美激情精品久久久久久小说| 九色精品91| 国产美女久久久| 50度灰在线| 精品国产电影一区二区| 特级毛片www| 国产无人区一区二区三区| 在线观看国产中文字幕| 小处雏高清一区二区三区| 97超碰人人模人人爽人人看| 波多野结衣中文字幕久久| 亚洲激情免费观看| 亚洲男人天堂网址| 亚洲欧洲韩国日本视频| 一级黄色片毛片| 国产九九精品| 正在播放亚洲| 国产精品三p一区二区| 国产91九色视频| 麻豆传媒视频在线观看| 精品99999| 国产美女www| 亚洲图片一区二区| 日韩欧美黄色网址| 国产丶欧美丶日本不卡视频| www.com毛片| 五月精品视频| 欧美成人一区二区在线| 亚洲高清国产拍精品26u| 性视频1819p久久| 日本美女在线中文版| 亚洲成av人片在线观看香蕉| 中文字幕自拍偷拍| 婷婷国产在线综合| 亚洲二区在线播放| 久久综合中文字幕| 91精品人妻一区二区三区蜜桃2 | 色综合天天爱| 精品国产乱码久久久久久丨区2区 精品国产乱码久久久久久蜜柚 | 国产精品妹子av| 久久性爱视频网站| 久久99日本精品| www黄色av| 欧美日韩日本国产亚洲在线 | 狠狠躁狠狠躁视频专区| 最新欧美人z0oozo0| 久久99欧美| 四虎在线精品| 欧美大片在线看免费观看| 欧美日本韩国一区二区| 91精品欧美综合在线观看最新| 爱爱视频免费在线观看| 久久精品一区二区三区四区| xxxx国产视频| 手机精品视频在线观看| 欧美 日韩 国产 高清| 97视频热人人精品免费| 精品国产_亚洲人成在线| 五月天色综合| 国产精品久久久久久久天堂 | 欧美一级片免费在线| 青青草原国产在线| 在线成人一区二区| 欧美一区二区三区激情| 欧美精品久久一区二区三区| 亚洲免费视频二区| 亚洲成人一二三| 91人妻一区二区三区蜜臀| 国产精品欧美久久久久无广告| 少妇一级淫片免费放播放| 国精品**一区二区三区在线蜜桃| 少妇高清精品毛片在线视频| 性欧美精品高清| www插插插无码免费视频网站| 日韩精品永久网址| 国产精品一区在线播放| 91精品导航| 999热视频| 久久不卡日韩美女| 国产日韩在线观看av| 伊人久久国产| 69av视频在线播放| 欧美高清另类hdvideosexjaⅴ | www.8ⅹ8ⅹ羞羞漫画在线看| 久久精品青青大伊人av| 男女啪啪在线观看| 中文字幕亚洲在线| 国产九九在线| 亚洲人成人99网站| 国产系列在线观看| 亚洲欧美一区二区三区久久| 免费av网站观看| 欧美一级视频精品观看| 91丨porny丨在线中文 | 五月天中文字幕| 欧美性色黄大片手机版| 日韩人妻精品中文字幕| 欧美视频中文字幕在线| 成人a v视频| 日本黄色一区二区| 国产女主播喷水视频在线观看 | 欧美××××黑人××性爽| 91高清免费视频| 91精品店在线| 国产日韩综合一区二区性色av| 新片速递亚洲合集欧美合集| 91av视频在线| 三上悠亚一区二区| 国产精品免费一区二区三区都可以 | 精品伊人久久久| 国产精品美女久久久久av福利| 思热99re视热频这里只精品| 欧美激情论坛| 欧美日韩性在线观看| 欧日韩一区二区三区| 外国成人激情视频| 国产又粗又长又爽视频| 亚洲精品极品| 亚洲性图一区二区| 国产精品1区二区.| 最新在线黄色网址| 国产精品久久免费看| 18岁成人毛片| 精品久久久久久久大神国产| 激情四射综合网| 欧美亚洲综合在线| 国产女人18毛片水18精| 精品国产91久久久久久久妲己| 欧美成人免费| 久久久www成人免费精品张筱雨| 日韩三级免费| 国产精品免费一区二区三区都可以| 2019中文亚洲字幕| 国产欧美日韩亚洲| 曰本一区二区三区视频| 免费成人深夜夜行网站视频| 亚洲国产午夜| 欧美三级午夜理伦三级富婆| www.66久久| 国产又粗又猛又爽又黄的视频四季 | 三级一区在线视频先锋| 99日在线视频| 暴力调教一区二区三区| 手机在线中文字幕| 粉嫩av一区二区三区免费野| 91黄色在线视频| 亚洲国模精品一区| 秋霞午夜在线观看| 18性欧美xxxⅹ性满足| 久久久成人av毛片免费观看| 国产精品久久国产三级国电话系列 | 国产精品永久免费| 粉嫩久久久久久久极品| 亚洲精品成人a8198a| 国产深夜精品| 中文字幕1区2区| 国产精品麻豆99久久久久久| 亚洲久久在线观看| 日韩精品一区二区三区视频| 成人av一区| 另类美女黄大片| 久久亚洲资源中文字| 欧美极品日韩| 午夜精品久久久久99热蜜桃导演| 一区二区免费av| 久久久国产一区二区三区四区小说| 免费看特级毛片| 精品视频1区2区| 午夜国产在线观看| 欧美成人在线网站| 免费精品一区| 伊人久久青草| 日产国产欧美视频一区精品| 亚洲精品视频久久久| 无码av免费一区二区三区试看| 国产精品无码专区av免费播放| 日韩亚洲在线观看| 精品三区视频| 欧美少妇一区| 视频一区中文字幕| www.超碰97| 天天操天天综合网| 三级国产在线观看| 午夜精品福利电影| 国产人与zoxxxx另类91| 麻豆一区二区三区在线观看| 久久精品国产久精国产爱| 欧洲av一区二区三区| 欧美性xxxxx极品少妇| 精品久久av| 人妖精品videosex性欧美| 蜜桃精品噜噜噜成人av| 欧美性久久久久| 久久毛片高清国产| 国产九色91回来了| 最新亚洲国产精品| 成人免费在线观看视频| 美乳视频一区二区| 制服诱惑一区二区| 亚洲久久久久久| 黑人精品xxx一区| 你懂的视频在线| 91wwwcom在线观看| 国产影视精品一区二区三区| 日韩免费高清在线| 欧美国产精品专区| 中文字幕免费高清在线观看| 日韩在线国产精品| 日韩在线成人| 男女私大尺度视频| 26uuu亚洲婷婷狠狠天堂| 中文字幕在线观看第二页| 色妞欧美日韩在线| 看亚洲a级一级毛片| 精品少妇人妻av免费久久洗澡| 99国产精品久久久久久久久久| www.久久久久久久| 久久精彩免费视频| 成人直播在线观看| 天天操天天干天天玩| www激情久久| 在线视频1卡二卡三卡| 国产69精品久久久久9| 亚洲裸色大胆大尺寸艺术写真| 国产极品美女高潮无套久久久| 国产精品看片你懂得| 午夜老司机福利| 4438全国亚洲精品在线观看视频| 第九色区aⅴ天堂久久香| 捷克做爰xxxⅹ性视频| 亚洲激情综合网| 国产玉足榨精视频在线观看| 国产免费久久av| 性欧美暴力猛交另类hd| 午夜剧场免费在线观看|