精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

150億參數、一次通過率超60%,華為代碼能力超GPT3.5的大模型來了

人工智能 新聞
這次,華為代碼生成大模型盤古 Coder2 采用了一種類似于 RLHF(基于人類反饋的強化學習)的框架,相較前代實現了更高的一次生成通過率。

隨著大模型成為 AI 開發新范式,將大語言模型集成至編程領域、完成代碼生成與補全任務成為重要趨勢之一。業界出現了一些引人矚目的代碼大模型,比如 OpenAI 的 CodeX、谷歌 DeepMind 的 AlphaCode、HuggingFace 的 StarCoder 等等。

在國內,去年 7 月底,華為諾亞方舟實驗室語音語義實驗室聯合華為云 PaaS 技術創新實驗室推出了其代碼大模型 PanGu-Coder。與 Codex 和 AlphaCode 相比,該模型在代碼生成的一次通過率(PASS@1)指標上大幅超越同等參數規模的模型,甚至優于規模更大的模型。除了英文外,PanGu-Coder 在中文上表現出色。

圖片

PanGu-Coder 模型大小和配置。

根據對 PanGu-Coder 的相關內測表現,它不僅熟悉常見算法,而且能熟練地使用各種 API,求解高等數學問題也不在話下。

一年過去了,PanGu-Coder2 終于來了,論文已在 arXiv 上提交。此次華為云、中國科學院和北京大學的研究者聯合帶來了更強大的代碼生成大模型。

圖片

論文地址:https://arxiv.org/pdf/2307.14936.pdf

為了增強預訓練代碼大模型的生成性能,各種各樣的方法被提出并應用,比如監督微調、指令調整、增強學習(RL)等。在本文中,針對現有基于 RL 方法所存在的問題并進一步挖掘代碼大模型的潛力,研究者提出了一種全新的 RRTF 框架,它的全稱為 Rank Responses to align Test&Teacher Feedback,成功地在代碼大模型上應用自然語言 LLM 對齊技術

就其思路而言,RRTF 框架有別于以往的 CodeRL 和 RLTF,而是遵循了 RLHF(基于人類反饋的強化學習)的思路,使用排序響應(代替獎勵模型的絕對值)作為反饋,實現了更簡單和高效的訓練方法。

研究者將 RRTF 應用于開源的 StarCoder 15B 上,并推出了一個在所有已發布代碼大模型中實現最佳性能的 PanGu-Coder2。該模型在 OpenAI HumanEval 基準上實現了 62.20% 的 pass@1 指標,相較 PanGu-Coder 3 億參數版本的 17.07% 有了顯著提升

圖片

不僅如此,在 CoderEval 和 LeetCode 基準上的廣泛評估結果表明,PanGu-Coder2 超越了以往所有的代碼大模型

方法概覽

RRTF 框架

研究者們提出了一個更簡單但是功能強大的框架 RRTF,它將幾種前沿技術無縫結合,包括指令調優、Evol-Instruct 方法以及強化學習。本次方法的核心理念是:利用測試信號和人類偏好共同作為反饋,對響應進行排序,從而引導模型生成更高質量的代碼。

因此,受最近大型自然語言模型與指令微調取得的進展啟發,研究者提出了這一新的訓練范式,即 RRTF 框架。框架概覽如下圖所示。

圖 1:RRTF 框架概覽

RRTF 包括以下三個步驟:采樣、排序和訓練。

  • 采樣階段:通過 Evol-Instruct 生成的 prompt 對響應性進行采樣。
  • 排序階段:根據單元測試和啟發式偏好對不同來源的響應進行排序。
  • 訓練階段:使用 prompt 三元組和被選用 / 被拒絕響應的相應分數來訓練代碼大模型。

模型架構

基于具有 Multi-Query-AttentionShazeer 的 decoder-only Transformer,研究者訓練出一個 15B 參數的 PanGu-Coder2。同時利用 FlashAttention 來減少計算量和內存占用。因此,該模型的最大長度可以擴展到 8192。下表 1 顯示了該模型的詳細超參數。

圖片

訓練語料庫

由于手動收集高質量語料庫耗時耗力,研究者遵循 Evol-Instruct 技術來構建其訓練語料庫。具體來講,他們基于 Alpaca 20K 數據集,并迭代進化該數據集中的編程問題,從而獲得新的編程問題。prompt 如下圖 2 所示。

圖片

針對這些問題,研究者從不同模型中采樣了答案。總的來說,他們收集了一個包含 100K 個有答案編程問題的原始語料庫,并把它稱為指令和解答方案對(instruction and solution pairs)。然后利用一些手動定義的規則在原始語料庫上進行數據預處理,將其規模縮小至 68K。

更重要的,為了防止數據泄露,研究者花大力氣調查了其 68K 數據集與 HumanEval 基準之間的潛在重疊。經過細致的調查,他們確信其實驗中無數據泄露,進一步驗證了 PanGu-Coder2 的有效性。

實現細節

研究者選擇 StarCoder 15B 作為基礎模型,并以 512 的全局批大小對其進行 6 epoch 訓練。圖 3 展示了單個訓練樣本的格式。除了在 prompt 中添加一對三引號外,研究者只使用從響應中提取的代碼片段進行訓練。

圖片

實驗及評估

研究團隊進行了一系列的實驗來評估 PanGu-Coder2 的性能。

性能

該研究將 PanGu-Coder2 與現有的代碼大模型在 Python 代碼生成方面進行了性能比較。下表 2 顯示了在 HumanEval 基準上的比較結果。

在所有閉源模型中,PanGu-Coder2 排名第二。與 PaLM-Coder 和 LaMDA 等大模型相比,PanGu-Coder2 雖然規模較小,但性能卻更好。值得注意的是,PanGu-Coder2 的表現優于 OpenAI 的 GPT-3.5,但與 GPT-4 仍有差距。

圖片

表 3 展示了貪婪解碼的比較結果。在所有基準測試中,PanGuCoder2 都取得了最好的成績。值得注意的是,PanGu-Coder2 不僅在 HumanEval 上超過了 WizardCoder 和 StarCoder,而且在 CoderEval 和 LeetCode 上也超過了這兩個模型。

圖片

表 2 和表 3 的實驗結果可以得出以下結論:

  • 在開源模型中,PanGu-Coder2 在 HumanEval 上以 61.64% pass@1 達到了 SOTA。
  • 盡管 PanGu-Coder2 的規模較小,但其性能卻優于 PaLM-Coder 和 LaMDA 等更大規模的模型。
  • PanGu-Coder2 是實驗中唯一同時在 HumanEval、CoderEval 和 LeetCode 上都達到最佳性能的模型。

如下圖 4 所示,整體準確率隨著數據集大小的增加而增加:

圖片

在訓練計算量方面,無論數據集大小如何,準確率可能會在訓練開始時急劇下降或持平。大約 2 個 epoch 后,訓練曲線變得更加穩定,準確率隨著損失的減少而持續上升。3 個 epoch 后,準確率達到最佳,而 4 個 epoch 后,準確率變得更加穩定,顯示出收斂的跡象。這表明,PanGu-Coder2 模型大約需要 3-4 個 epoch 才能完全捕捉到數據集中的知識,而之后的訓練步驟對提高模型能力的幫助可能微乎其微。

用例研究

為了對模型進行實證研究并分析未來的工作方向,該研究比較和分析了三個模型的成功和失敗案例:基礎模型 StarCoder、指令調整模型 WizardCoder 和 PanGu-Coder2 模型。下圖 5 顯示了三種模型在貪婪解碼(greedy decoding)和核采樣(nucleus sampling)方面的異同:

圖片

圖 5 還表明 PanGu-Coder2 和 WizardCoder 可以互補:雖然 PanGu-Coder2 解決了大部分問題,并且其中一些問題是 WizardCoder 無法解決的,但也有一些問題只能通過 WizardCoder 解決。此外,還有一些問題即使采樣 200 次,這三個模型也都無法解決。

該研究選擇 StarCoder、WizardCoder 和 PanGu-Coder2 生成的幾個具有代表性的示例代碼作為案例進行研究,以對 PanGu-Coder2 的優缺點進行評估。

如下圖 6 所示,PanGu-Coder2 能夠熟練地理解編程問題的邏輯,而 WizardCoder 和 StarCoder 在這方面有所欠缺。這一觀察結果表明,PanGu-Coder2 通過該研究提出的排名反饋,有效地在編程問題陳述和代碼解決方案之間建立了細致的映射。

圖片

如下圖 7 所示,在某些情況下,PanGu-Coder2 和 StarCoder 的性能差于 WizardCoder,WizardCoder 可能受益于使用大量豐富注釋代碼指令進行訓練。在某種程度上,這一觀察表明,引入注釋數據可能會在訓練過程中產生積極效果。

圖片

此外,下圖 8 給出了一個復雜的編程挑戰,StarCoder、WizardCoder 和 PanGu-Coder2 都給出了錯誤的代碼解決方案。這一觀察結果表明,目前代碼大模型在處理復雜編程要求方面仍達不到人類的熟練程度,還有一些改進的空間。

圖片

推理優化

GPU 內存消耗和推理速度是模型實際部署和使用的關鍵因素,因此該研究使用 CTranslate2 和 GPTQ 兩種量化技術來進行實驗,研究模型推理的優化策略。下表 4 展示了使用不同量化技術優化的模型的 GPU 內存消耗、推理速度和 HumanEval 性能。

圖片


責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-09-01 21:12:13

GPT3.5模型微調

2023-08-27 14:08:17

開源代碼Meta大模型

2024-02-04 12:22:47

AI數據

2024-03-28 11:15:36

開源AI

2023-02-16 13:48:56

模型論文

2023-09-18 16:24:33

數據研究

2023-08-23 13:27:00

SQLCoder開源開發

2024-02-06 17:55:10

2023-01-04 12:49:28

GPT-3.5

2012-05-08 09:47:08

Google PlayAndroid應用程序

2023-09-25 07:31:19

算力AI框架

2023-06-27 09:14:52

微軟LLM AI 模型

2015-11-02 10:55:29

Android專利微軟

2023-03-10 13:56:42

ChatGPT

2023-04-23 10:28:01

2017-02-28 11:13:36

華為

2023-03-17 21:59:37

2023-06-21 13:37:41

模型研究

2024-04-14 19:53:44

2024-07-08 08:38:00

模型推理
點贊
收藏

51CTO技術棧公眾號

三级影片在线观看欧美日韩一区二区 | 99欧美视频| 欧美精品自拍偷拍| 丁香色欲久久久久久综合网| 黄色三级网站在线观看| 亚洲经典自拍| 在线日韩av观看| 中文字幕一区二区三区人妻在线视频 | 天天射天天综合网| 亚洲第一福利网站| 99视频在线视频| 里番在线播放| 国产免费观看久久| 99国精产品一二二线| 国产伦精品一区二区三区视频我| 999久久久91| 日韩成人在线播放| 成人在线短视频| 欧美va视频| 精品国产乱码久久久久久天美 | 亚洲二区免费| 日韩一区av在线| 日本黄色片在线播放| 国产精品一区免费在线| 91国产免费观看| 老太脱裤子让老头玩xxxxx| 日本视频在线播放| 久久久五月婷婷| 成人18视频| 亚洲性生活大片| 夜夜爽av福利精品导航| 欧美另类69精品久久久久9999| 国产精品无码久久久久一区二区| 亚洲图色一区二区三区| 欧美乱熟臀69xxxxxx| 粉嫩虎白女毛片人体| а√天堂资源官网在线资源| 一区二区三区四区五区视频在线观看| 日本一区二区不卡高清更新| 无码国产精品96久久久久| 国产一区二区精品久久| 国产美女扒开尿口久久久| 国产精品第一页在线观看| 亚洲最新av| 色偷偷亚洲男人天堂| 中字幕一区二区三区乱码| 亚洲国产网址| 亚洲精品视频在线播放| 老熟妇精品一区二区三区| 盗摄系列偷拍视频精品tp| 欧美一区二区三区视频| 亚洲一区二区福利视频| 深夜日韩欧美| 欧美高清激情brazzers| 亚洲图色中文字幕| 国产精品亚洲欧美日韩一区在线| 欧美日韩第一区日日骚| 亚洲国产高清av| 日韩在线激情| 7777精品伊人久久久大香线蕉完整版| 国产91色在线观看| 成人51免费| 欧美一级片在线| 国偷自产av一区二区三区麻豆| 视频一区视频二区欧美| 日韩精品一区二区三区三区免费| 免费观看一区二区三区| 中文字幕日韩在线| 亚洲第一网中文字幕| 国产十八熟妇av成人一区| 日韩美女国产精品| 亚洲人成网站777色婷婷| 黄网站在线免费看| 亚洲伊人网站| 人九九综合九九宗合| 天堂中文字幕在线观看| 日韩精品亚洲专区| 国产免费一区二区三区香蕉精| 91久久精品无码一区二区| 国产乱码精品一区二区三| 电影亚洲一区| 亚洲成人综合视频| 日本欧美黄色片| 深夜成人福利| 欧美日韩视频在线观看一区二区三区| 欧美美女一级片| 91亚洲无吗| 亚洲女人天堂成人av在线| 在线观看亚洲大片短视频| 羞羞色午夜精品一区二区三区| 色综合久久精品亚洲国产 | 午夜欧洲一区| 亚洲性视频网站| 久久精品亚洲a| 欧美日韩精选| 国产成人极品视频| 国产人妻精品一区二区三| 成人av电影在线观看| 色视频一区二区三区| 成人免费高清| 色婷婷综合中文久久一本| 日本高清一区二区视频| 欧美激情久久久久久久久久久| 中文字幕日韩有码| 日韩av电影网| 久久99精品一区二区三区三区| 国产麻豆日韩| 久久精品视频观看| 欧美日韩一区二区三区在线免费观看| 性生活免费在线观看| 精品素人av| 久热精品视频在线观看一区| 日韩不卡视频在线| 国产精品一区二区无线| 日韩中文不卡| 天堂√中文最新版在线| 日韩一区二区三区在线| 黄色三级生活片| 国产精品日韩精品欧美精品| 亚洲v日韩v综合v精品v| 国产福利片在线| 黑人与娇小精品av专区| 美女被爆操网站| 五月激情综合| 国产精品狼人色视频一区| 亚洲av成人精品日韩在线播放| 亚洲精品v日韩精品| 国产色视频在线播放| 欧美女王vk| 97国产精品免费视频| 国产高清在线免费| 成人免费一区二区三区在线观看| 欧美综合在线观看视频| 伊人久久大香线蕉| 97av在线视频| 免费av网站在线播放| 亚洲精品福利视频网站| 欧洲在线免费视频| 国产国产精品| 成人免费在线视频网址| 1769在线观看| 欧美日韩视频在线观看一区二区三区 | 久久国产精品久久久久久| 最近中文字幕免费在线观看| 久久久精品日韩欧美| www.中文字幕在线| 久久精品色综合| 91精品国产色综合| 婷婷在线免费视频| 香蕉影视欧美成人| 野外性满足hd| 久久久久久婷| 三区精品视频| 免费成人毛片| 久久久精品视频成人| 国产黄a三级三级看三级| 亚洲男同1069视频| 国产精品无码自拍| 国产精品毛片在线| 欧洲亚洲一区| 色噜噜成人av在线| 萌白酱国产一区二区| www.激情五月.com| 亚洲v精品v日韩v欧美v专区| 国产伦精品一区二区三区精品| 亚洲一级电影| 免费av一区二区三区| 久久久人成影片一区二区三区在哪下载 | 国产精品 欧美在线| 成人影院免费观看| 9191久久久久久久久久久| 全程偷拍露脸中年夫妇| 成人app下载| 最近免费中文字幕中文高清百度| 日韩在线中文| av在线不卡观看| 天堂在线中文网官网| 亚洲一二在线观看| 国产福利小视频| 欧美日韩国产中文精品字幕自在自线 | 久久9999免费视频| 午夜精品99久久免费| 免费一级毛片在线观看| 8v天堂国产在线一区二区| 免费一级片视频| 久久在线免费观看| 久久久福利影院| 国产亚洲高清视频| 艳色歌舞团一区二区三区| 国产精品一线| 国产精品伦子伦免费视频| 四虎影视国产在线视频| 国产亚洲欧洲高清| 亚洲精品国产片| 欧美伊人久久大香线蕉综合69| 欧美日韩在线国产| 国产日韩av一区二区| 性生交大片免费看l| 久久尤物视频| 成人性生活视频免费看| 日韩欧美在线中字| 免费看污久久久| 日韩精品一区二区三区中文| 国产精品久久久久9999| 91黄页在线观看| 久久久av一区| 国产二区在线播放| 亚洲精品456在线播放狼人| 中文在线最新版天堂| 精品久久久中文| 久久久www成人免费毛片| 日本一区二区动态图| 国产又黄又粗又猛又爽的视频| 麻豆精品一区二区综合av| 国产视频一视频二| 国产精品99一区二区| 国产精品激情av在线播放| www免费网站在线观看| 日韩网站在线看片你懂的| 天天操天天操天天操天天| 91丝袜国产在线播放| av在线网站免费观看| 久久精品人人| 日韩免费在线观看av| 中文字幕伦av一区二区邻居| 亚洲综合小说区| 日韩三区免费| 51视频国产精品一区二区| 欧美日韩色网| 精品国内产的精品视频在线观看| 五月天婷婷社区| 欧美日本一区二区| 中文人妻熟女乱又乱精品| 精品久久久国产| 久久亚洲精品大全| 亚洲在线视频网站| 日本黄色录像视频| 中文字幕高清一区| 精品人妻无码一区二区三区| 91免费国产视频网站| 天天躁日日躁狠狠躁免费麻豆| 狠狠色丁香久久婷婷综| 日本成人中文字幕在线| 宅男噜噜噜66国产日韩在线观看| 成人高清dvd| 99精品视频在线| 天堂v在线视频| 日韩久久精品网| 手机成人在线| 日韩在线视屏| 日韩欧美视频一区二区三区四区| 亚洲区小说区| 久热这里只精品99re8久| 人体久久天天| 久久99精品久久久久久久久久 | 影音先锋久久精品| 无码人妻精品一区二区蜜桃百度| 999久久久免费精品国产| 欧美日韩亚洲国产成人| 91精品国产福利在线观看麻豆| 亚洲巨乳在线观看| 欧美r级电影| www.18av.com| 亚洲性感美女99在线| 野外做受又硬又粗又大视频√| 亚洲黄色精品| 欧美精品99久久| 亚洲在线免费| 超碰在线公开97| 久久99国产精品麻豆| 国产永久免费网站| 国产一二三精品| 天天躁日日躁狠狠躁av麻豆男男| 99精品桃花视频在线观看| 西西大胆午夜视频| 国产精品免费免费| 老熟妻内射精品一区| 亚洲一二三区不卡| 亚洲av无码精品一区二区| 一本一道久久a久久精品| av资源免费观看| 欧洲国内综合视频| 国产又粗又猛又黄又爽无遮挡| 精品999在线播放| 天堂资源中文在线| 在线观看精品国产视频| 中文字幕中文字幕在线中高清免费版| 欧美国产一区二区三区| 18aaaa精品欧美大片h| 国产精品久久久久久久久久久不卡| 国产精品亚洲成在人线| 亚洲在线视频观看| 成人资源在线播放| 亚洲一区二区三区免费观看| 欧美三级免费| www.日日操| 成人网在线播放| 性欧美一区二区| 亚洲精品综合在线| 91麻豆精品在线| 日韩欧美www| 国产免费视频在线| 午夜精品福利视频| 日韩成人综合网| 精品久久久久久一区二区里番| 97精品在线| 久久久久狠狠高潮亚洲精品| 韩国欧美国产1区| 久久国产柳州莫菁门| 亚洲精品老司机| 无码人妻丰满熟妇区五十路| 欧美精品一区二区久久久| 99中文字幕一区| 538国产精品视频一区二区| 欧美日韩黄色| 色阁综合av| 亚洲久久一区| 欧美日韩国产美女| 无码精品在线观看| 久久久久久69| 日韩美女在线| 欧美1o一11sex性hdhd| 亚洲视频日本| 欧美又黄又嫩大片a级| 2021中文字幕一区亚洲| 日本熟女一区二区| 91精品国产色综合久久| 国产香蕉视频在线看| 欧美一级在线播放| 亚洲无线观看| 五月天在线免费视频| 久久精品国产亚洲aⅴ| www在线观看免费视频| 亚洲成人激情自拍| 亚洲第一色网站| 久久久成人精品视频| 成人精品一区二区三区电影| 清纯唯美一区二区三区| 亚洲精品孕妇| 亚洲精品鲁一鲁一区二区三区| 亚洲欧美国产毛片在线| 一本到在线视频| 国产亚洲精品成人av久久ww| 另类专区亚洲| 欧美日韩亚洲在线 | 日韩av一区二区在线观看| segui88久久综合| 2022国产精品| 亚洲h色精品| 佐山爱在线视频| 亚洲精品国产一区二区三区四区在线| 无码任你躁久久久久久久| 日韩精品电影网| 九色porny自拍视频在线播放 | 欧美电影在线观看免费| www.射射射| 99精品一区二区| 亚洲天堂五月天| 有码中文亚洲精品| 日本成人片在线| 亚洲国产日韩欧美| 日韩精品亚洲一区二区三区免费| 人妻视频一区二区| 欧美中文字幕亚洲一区二区va在线| 91av资源在线| 成人性教育视频在线观看| 亚洲国产精品日韩专区av有中文| 最好看的中文字幕| 亚洲国产精品麻豆| 国精产品一品二品国精品69xx| 2019最新中文字幕| 美女亚洲一区| 国产三级精品三级在线| 一区二区不卡在线视频 午夜欧美不卡在| aaa一区二区三区| 91国内在线视频| 国产va免费精品观看精品视频| 欧美成人xxxxx| 国产精品国产精品国产专区不蜜| 97国产成人无码精品久久久| 国语自产偷拍精品视频偷| 五月综合久久| 天天插天天操天天射| 亚洲综合在线五月| 亚洲 国产 欧美 日韩| 亚州成人av在线| 欧美电影三区| 欧美午夜精品一区二区| 欧美性猛交一区二区三区精品| 蜜芽在线免费观看| 国产精品综合久久久久久| 免费成人小视频| 欧美日韩大片在线观看| 亚洲欧美中文日韩v在线观看| 97成人超碰| 天堂8在线天堂资源bt| 国产精品色眯眯| 欧美一区二区三区激情| 日本高清视频一区| 国产一区二区中文|