精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AutoCoder:性能超越GPT-4o的模型,居然只有33B,還是開源!

發布于 2024-5-28 10:36
瀏覽
0收藏

比GPT4還要厲害的開源模型

AutoCoder:性能超越GPT-4o的模型,居然只有33B,還是開源!-AI.x社區圖片

今天這篇論文介紹了一個最新的大語言模型 AutoCoder,一個只有33B的大語言模型。AutoCoder-33B在HumanEval基準測試中Pass@1的達到90.9%,領先于當前所有頂級的代碼生成大型語言模型。在HumanEval+上,它的Pass@1為78%,僅次于GPT-4 Turbo和CodeQwen1.5-Chat。

模型下載地址:https://huggingface.co/Bin12345/AutoCoder

AutoCoder:性能超越GPT-4o的模型,居然只有33B,還是開源!-AI.x社區圖片

其中,盡管AutoCoder-S只有6.7B參數,它在HumanEval和HumanEval+上的Pass@1比率依然達到了78.7%和72%。在MBPP和MBPP+基準測試中,它的性能分別為79.4%和69.8%,在MBPP+的測試中,其表現在70B參數級別內僅次于DeepSeek-Coder-instruct (33B)。

為了測試AutoCoder在多種程序語言上的表現,作者采用MultiPL-E基準測試AutoCoder。實驗結果顯示,AutoCoder在Java、C++和Rust語言上的Pass@1成績分別為61.4%、68.9%和60.8%,表現卓越。在其他三種語言上,它的表現也僅次于CodeQwen1.5-Chat等少數模型,彰顯了AutoCoder在多語言代碼生成上的強勁實力。

AutoCoder:性能超越GPT-4o的模型,居然只有33B,還是開源!-AI.x社區圖片

為什么AutoCoder這么強?

AutoCoder之所以能強國GPT-4o的原因,是因為作者采用了 AIEV-INSTRUCT方法來構建高質量的代碼指令集數據。

AIEV-INSTRUCT通過智能體(Agent)交互模擬程序員編碼和執行單元測試的過程,并通過執行驗證確保數據的準確性。AIEV-INSTRUCT包含教學階段和自學階段,減少了在數據注釋過程中對成本高昂的閉源模型的依賴。

AutoCoder:性能超越GPT-4o的模型,居然只有33B,還是開源!-AI.x社區圖片

上圖展示了AIEV-INSTRUCT的整體架構,分為兩個階段:教學階段和自我學習階段。

  • ? 在教學階段,模型主要通過吸收教師模型的知識來學習;
  • ? 而在自我學習階段,它則獨立進行學習。

在教學階段,作者收集了開源代碼片段,并引入GPT-4 Turbo作為教師模型,以補充和修正這些代碼。整個流程包含四個關鍵步驟:

  • ? 在初始化階段(I),配置了必要的組件,GPT-4 Turbo扮演著提問者和程序員的雙重角色,確保生成的數據多樣化,從而形成一個更加均衡的概率分布,避免對話模板的單一化。對話消息以空列表的形式初始化,用于在整個過程中存儲數據。最終,這個列表將包含多輪對話,并將整個對話作為單一數據項加入到我們的最終數據集中。此外,還需要設置一個Docker容器,作為我們的代碼解釋器,負責安裝必要的外部包并執行需要驗證的代碼。
  • ? 在提出問題階段(II),首先利用GPT-4 Turbo執行OSS-Instruct ,構建問題描述和具體解決方案,包括基于開源代碼片段的代碼片段。不同的是,要求GPT-4 Turbo提供一些單元測試,以進一步確保數據集中代碼的準確性。前一步驟中初始化的對話消息將依次添加問題描述(?)、解決方案和單元測試(?)。
  • ? 在執行反饋階段(III),通過多輪執行反饋來檢驗生成的代碼,提升數據集的質量。首先,將第二步生成的代碼片段輸入代碼解釋器。如果執行出錯,對話消息將添加詳細的錯誤輸出(Stderr)(?)。同時,這些錯誤信息將提供給提問者,他將基于錯誤輸出生成自然語言描述,該描述也將添加到對話消息中(?)。然后,自然語言描述和錯誤輸出作為新問題提交給程序員,程序員將繼續修改代碼。對話消息將添加新生成的代碼(?),并重復這一過程。
  • ? 在終止階段(IV),同樣使用代碼解釋器運行程序員生成的代碼。如果程序運行成功,輸出結果(Stdout)將添加到對話消息中(?),完成單個數據項的分析。每分析2000個數據項后,將新數據按1:9的比例劃分為測試集和訓練集。訓練集用于訓練學生模型(AutoCoder)。訓練完成后,使用測試集來評估教師模型和學生模型。評估完成后,將比較兩個模型的首次通過率(Pass@1)。如果教師模型表現更佳,我將繼續教學階段;如果學生模型表現更佳,將轉向自我學習階段。自我學習階段與教學階段的主要區別在于,自我學習階段中,用學生模型取代了原始的教師模型,學生模型自己擔任提問者和程序員的角色,獨立完成整個執行反饋過程。

AutoCoder:性能超越GPT-4o的模型,居然只有33B,還是開源!-AI.x社區圖片

作者將AutoCoder-AIEV-Instruct數據集與幾個現有的大型代碼指令數據集進行了對比,對比結果如上圖。AutoCoder-AIEV-Instruct數據集包含169K個數據樣本,累計達到241K輪對話。其中,150K輪對話數據來源于多輪對話樣本。該數據集不僅包含主要功能,還涵蓋了后續的包安裝、代碼執行錯誤或結果,以及多樣化的錯誤分析。與Magicoder-Evol-Instruct和Magicoder-OSSInstruct原始數據集相比,新增的單元測試進一步提高了代碼相關任務的準確性。此外,與Code-Feedback 相比,AutoCoder-AIEV-Instruct包含了更豐富的執行反饋結果,減少了代碼塊拼接所需的多輪對話,從而增強了上下文的連貫性。

訓練過程

AutoCoder模型的基礎模型是Deepseek-Coder的兩個基礎版本,即6.7B和33B,作者在這兩個模型的基礎上進行了細致的微調,借助AutoCoder-AIEV-Instruct數據集,成功打造出了AutoCoder 33B和AutoCoder-S 6.7B。

為了賦予AutoCoder代碼解釋器的能力,利用transformer庫中的AutoTokenizer工具包,為模型引入了四個特殊標記。硬件配置上,使用了10個節點,配備了總計40塊80GB的A100 GPU,這些GPU部署在一個基于SLURM的集群中。GPU間的通信由NVIDIA的集體通信庫(NCCL)負責。在訓練參數的設置上,使用了deepspeed庫中的ZeRO-Stage 3特性,以實現模型參數的分割,每個GPU的批次大小設為8,梯度累積步數為4,學習率設為5e-5,參數類型選用了bf16。序列的最大長度被設定為5120,而訓練的總周期則為2。整個訓練過程中,采取了全面的參數調優策。

demo演示方法

git clone https://github.com/bin123apple/AutoCoder

conda create -n AutoCoder pythnotallow=3.11
conda activate AutoCoder
pip install -r requirements.txt


cd /Web_demo
pip install -r requirements.txt

python chatbot.py

AutoCoder:性能超越GPT-4o的模型,居然只有33B,還是開源!-AI.x社區

本文轉載自??大語言模型論文跟蹤??,作者: HuggingAGI ????

收藏
回復
舉報
回復
相關推薦
国产精品美女久久| 欧美日韩国产一区| 国产综合精品一区二区三区| 欧美日韩在线观看免费| 久久中文字幕一区二区| 亚洲男同性视频| 99国产在线| 香蕉视频一区二区| 视频福利一区| 欧美性极品少妇| 一区二区三区四区免费视频| av手机免费看| 一本色道精品久久一区二区三区| 日韩精品一区二区三区蜜臀 | 国产美女免费看| 影音先锋成人在线电影| 精品国产免费久久| 福利视频一二区| 浮生影视网在线观看免费| 美女精品自拍一二三四| 欧美成人免费大片| 欧美 变态 另类 人妖| 成人免费视频观看| 亚洲影院理伦片| 欧美精品一区二区三区在线看午夜| 性高潮视频在线观看| 欧美日韩国产免费观看| 国产丝袜一区视频在线观看| 天堂在线一区二区三区| brazzers在线观看| 国产精品网站在线播放| 国产伦精品一区二区三区照片| 无码人妻丰满熟妇区bbbbxxxx| 亚洲香蕉av| 亚洲欧美www| 一级全黄裸体片| 黄色成人在线视频| 亚洲黄色性网站| 色一情一区二区三区四区 | 91精品麻豆日日躁夜夜躁| 少妇高潮喷水在线观看| 欧美黄色激情| 久久无码av三级| 666精品在线| 一级片在线免费播放| 欧美日韩日本国产亚洲在线| 一本大道亚洲视频| 在线黄色免费网站| 国产精品一区二区三区四区在线观看 | 国产高清久久| 国产亚洲精品一区二区| 国产白袜脚足j棉袜在线观看| 久久69成人| 色88888久久久久久影院野外| 深夜福利成人| 免费成人av电影| 99re这里只有精品首页| 国产精品久久久久久久天堂第1集| 亚洲无码精品在线播放| 爽好久久久欧美精品| 97婷婷涩涩精品一区| 看片网站在线观看| 亚洲精品极品少妇16p| 一区二区三区无码高清视频| 双性尿奴穿贞c带憋尿| 国产精品视屏| 亚洲电影av在线| 国内自拍偷拍视频| 日韩一级淫片| 日韩欧美三级在线| 精品无码av一区二区三区不卡| 日韩电影精品| 欧美天堂一区二区三区| 亚洲高清不卡在线| 国产高清在线不卡| 国产午夜精品久久久久| 午夜宅男久久久| 91tv亚洲精品香蕉国产一区7ujn| 国产精品999久久久| 国自产拍偷拍福利精品免费一 | 日本高清不卡的在线| 亚洲精品77777| 一本久道综合久久精品| 国产91精品久久久久| 国产又黄又爽又色| 久久午夜电影| 国产日韩欧美电影在线观看| 国产精品污视频| 国产乱人伦偷精品视频不卡| 亚洲最大的av网站| 亚洲精品国产精| gogo大胆日本视频一区| 麻豆成人小视频| av资源在线观看免费高清| 国产精品丝袜黑色高跟| 97超碰人人爱| eeuss鲁一区二区三区| 日韩欧美一区二区三区| 一本色道久久亚洲综合精品蜜桃| 激情久久一区二区| 91精品国产综合久久香蕉的特点| 亚欧美一区二区三区| 澳门成人av| 亚洲国产精品久久久| 国产美女喷水视频| 91九色精品| 性欧美在线看片a免费观看| 国产一级大片在线观看| 亚洲一区国产| 国产欧美日韩中文| 亚洲精品久久久狠狠狠爱| 91亚洲大成网污www| 欧美日韩综合另类| 精品国产丝袜高跟鞋| 亚洲成av人片| 特级丰满少妇一级| 伊人久久大香线蕉av超碰| 日韩精品在线观看一区二区| 久久午夜精品视频| 精久久久久久| 国产精品日韩欧美大师| 亚洲第一页视频| 久久免费看少妇高潮| 特色特色大片在线| 日本午夜大片a在线观看| 欧美日韩1234| 中文字幕狠狠干| 91精品国产乱码久久久久久久| 欧美国产日韩一区二区三区| 婷婷激情五月综合| 成人精品在线视频观看| 亚洲精品国产精品国自产| 91av久久| 欧美一区二区视频在线观看| 亚洲精品国产精品国自产网站| 欧美日韩a区| 国产乱人伦真实精品视频| 老牛影视av牛牛影视av| 亚洲视频 欧洲视频| 欧美黄色免费影院| 激情小说亚洲色图| 欧美床上激情在线观看| 中文资源在线播放| 97精品国产露脸对白| 日本xxxxx18| 精品69视频一区二区三区| 亚洲激情在线视频| 久久国产精品波多野结衣| 久久精品国产网站| 日韩精品欧美一区二区三区| 蜜桃传媒在线观看免费进入| 在线播放一区二区三区| 欧美aaa级片| 日韩精品一级中文字幕精品视频免费观看| 国产精品国产精品国产专区蜜臀ah| a√资源在线| 色噜噜狠狠成人中文综合| 91成人在线观看喷潮蘑菇| 欧美电影三区| 日本免费在线精品| 亚洲 国产 欧美 日韩| 亚洲综合一二三区| 精品人妻一区二区乱码| 91久久夜色精品国产按摩| 国产精品久久久久av免费| 猫咪在线永久网站| 色婷婷综合久久久中文一区二区| 精品国产乱码久久久久夜深人妻| 亚洲女同另类| 亚洲一区二区三区sesese| 黄色网址免费在线观看| 777xxx欧美| 亚洲不卡在线播放| 国产一区二三区| 黄色录像特级片| 成人性生交大片免费看中文视频| 51精品国产黑色丝袜高跟鞋| 国产高清在线| 日韩亚洲国产中文字幕欧美| 男人的天堂一区二区| 日本一区二区三区国色天香| 欧美熟妇另类久久久久久多毛| 亚洲激情av| 亚洲精品国产精品国自产| jizzjizzjizz欧美| 日本国产一区二区三区| 黄色动漫在线| 亚洲欧美日韩天堂一区二区| 国产欧美日韩综合精品一区二区三区| 亚洲高清免费视频| 一二三四国产精品| caoporen国产精品视频| 五月天av在线播放| 99日韩精品| 中文字幕第50页| 伊人成综合网yiren22| 亚洲一区二区三区xxx视频| 丁香六月综合| 欧美性猛xxx| 国产精品h视频| 天堂网av在线播放| 91国产精品成人| 欧美人妻精品一区二区三区| 91欧美激情一区二区三区成人| 亚洲午夜激情影院| 午夜综合激情| 草草视频在线免费观看| 日韩精品免费一区二区在线观看| 国产在线一区二| 9999在线精品视频| 8x拔播拔播x8国产精品| av中文字幕在线观看| 国产亚洲精品美女| 在线观看xxx| 日韩免费看网站| 亚洲无码久久久久| 一本色道久久综合亚洲91| 青青草手机在线视频| 中文字幕一区二区三| 波多野吉衣中文字幕| 成人丝袜视频网| 国产欧美一区二| 蜜臀久久久久久久| wwwxxx黄色片| 国产欧美激情| 国产深夜男女无套内射| 欧美视频福利| 麻豆传媒网站在线观看| 天天天综合网| 中文字幕在线观看一区二区三区| 国产不卡av一区二区| 麻豆传媒一区二区| 天天做夜夜做人人爱精品 | 精品人妻伦一二三区久久| 欧美三级电影精品| 波多野结衣不卡| 91久久香蕉国产日韩欧美9色| 日韩经典在线观看| 亚洲国产精品自拍| 中文字幕一区二区三区手机版 | 欧美亚洲另类色图| 亚洲激情不卡| 欧美变态另类刺激| 亚洲一区图片| 久久国产色av免费观看| 日精品一区二区三区| 国产成人久久婷婷精品流白浆| 亚洲成人中文| 国产精品无码av在线播放| 国产精品资源| 欧美丰满熟妇xxxxx| 人禽交欧美网站| 污污网站在线观看视频| 久久电影网电视剧免费观看| 亚洲自拍第三页| 国产成人精品免费| 高清中文字幕mv的电影| 成人h版在线观看| 插吧插吧综合网| 国产精品午夜在线观看| 疯狂试爱三2浴室激情视频| 亚洲精品免费电影| 国产午夜福利片| 岛国av一区二区三区| 香蕉污视频在线观看| 欧美色偷偷大香| 国产wwwwwww| 日韩电影免费观看中文字幕| 黄色大片在线看| 久久国产一区二区三区| 欧美日韩色网| 欧美怡春院一区二区三区| 你懂得影院夜精品a| 国产日本欧美一区二区三区| 日韩av综合| 久久精品国产一区二区三区不卡| 视频一区中文| 神马午夜伦理影院| 国产欧美在线| caoporm在线视频| 成人午夜免费电影| 亚洲AV无码成人精品区明星换面| 亚洲欧洲美洲综合色网| 国产大片aaa| 欧美日韩国产精品成人| 亚洲第一精品网站| 亚洲三级av在线| 操你啦视频在线| 69影院欧美专区视频| 欧美亚洲黄色| 国产一区二区免费电影| 成人亚洲一区| 日本人体一区二区| 另类专区欧美蜜桃臀第一页| 久久免费精品国产| 国产精品污www在线观看| 日韩精品人妻中文字幕| 欧美日韩中文字幕一区| 色wwwwww| 麻豆乱码国产一区二区三区| 日本不卡1234视频| 97在线中文字幕| 欧美电影《轻佻寡妇》| 日韩免费毛片视频| 成人av网在线| 国产精品免费人成网站酒店| 色偷偷成人一区二区三区91| 亚洲精品综合网| 中文综合在线观看| 在线能看的av网址| 高清视频一区二区三区| 日韩久久久久| 超碰影院在线观看| 不卡电影免费在线播放一区| 欧美肥妇bbwbbw| 欧美视频在线观看一区| 天堂v视频永久在线播放| 欧美久久久精品| 日本在线一区二区| 先锋影音日韩| 亚欧成人精品| 免费黄色三级网站| 夜夜爽夜夜爽精品视频| 国产精品久久久久久在线| 国产一区二区三区久久精品| 日本在线影院| 激情五月综合色婷婷一区二区| 午夜欧美视频| 亚洲日本黄色片| 国产精品视频观看| 日韩黄色片网站| 亚洲天堂av综合网| 91av亚洲| 久久综合婷婷综合| 99综合在线| 亚洲最大免费视频| 亚洲一二三四在线观看| 精品人妻无码一区二区三区蜜桃一 | 亚洲777理论| 亚洲乱码精品久久久久.. | 性感美女一区二区在线观看| 精品国产乱码久久久久久蜜柚 | 国产女女做受ⅹxx高潮| 96av麻豆蜜桃一区二区| www.国产com| 国产一区二区三区高清在线观看 | 成人免费91在线看| 欧美日韩国产探花| 污污免费在线观看| 天天影视色香欲综合网老头| 少妇人妻精品一区二区三区| 97国产在线视频| 午夜精品福利影院| 国产激情在线观看视频| 中文在线一区二区| 国产视频aaa| 欧美疯狂性受xxxxx另类| 999精品视频在这里| 欧美二区在线视频| 久久久影视传媒| 亚洲无码精品在线播放| 久久成人在线视频| 给我免费播放日韩视频| 免费成人在线视频网站| 国产女同互慰高潮91漫画| 亚洲天堂网在线观看视频| 欧美精品做受xxx性少妇| 欧美顶级毛片在线播放| 国产精品第12页| 国产精品区一区二区三| a在线观看免费| 91精品国产高清久久久久久91| 久久91成人| 依人在线免费视频| 洋洋成人永久网站入口| 青草久久伊人| 成人欧美在线视频| 一本色道久久| 波多野结衣欲乱| 欧美精品一区二区三区在线| 精品无人乱码一区二区三区 | 欧美日韩成人一区二区三区| 美女网站在线免费欧美精品| 久久久久久久久久久久国产| 亚洲精品一区二区网址| 色综合视频一区二区三区44| 热久久最新网址| 国产午夜精品久久久久久免费视| 91tv国产成人福利| 韩国日本不卡在线| 日韩电影免费网站| 国产人妻黑人一区二区三区| 91成人国产精品| 日本大片在线播放| 色视频一区二区三区| 粉嫩aⅴ一区二区三区四区| 日日夜夜狠狠操| 久久久久久久久久久av| 97精品在线| 免费污网站在线观看|