精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

流量工程將代碼生成的準確率提高一倍:由19%提高至44%

譯文
人工智能
代碼生成是人工智能中一項越來越重要的能力。它指訓練機器學習模型,基于對所需程序功能的自然語言描述自動生成計算機代碼,并有許多潛在的應用,從將軟件規格轉換成實用代碼、自動化后端開發到協助人類程序員,不一而足。

一篇新論文的作者提出了一種“強化”代碼生成的方法。

代碼生成是人工智能中一項越來越重要的能力。它指訓練機器學習模型,基于對所需程序功能的自然語言描述自動生成計算機代碼,并有許多潛在的應用,從將軟件規格轉換成實用代碼、自動化后端開發到協助人類程序員,不一而足。

然而,與翻譯或總結等相關語言任務相比,生成高質量代碼對AI系統依然具有挑戰性。代碼必須精確匹配目標編程語言的語法,優雅地處理極端情況和意外輸入,并準確地處理問題描述中指定的許多小細節。就連在其他領域無害的小錯誤也可能完全破壞程序的功能,導致編譯或運行失敗。

最近,CodiumAI的研究人員提出了一種名為AlphaCodium的新方法,可大幅提高GPT-4等大語言模型的代碼生成能力。他們的主要觀點是,僅僅調整提示的措辭對于復雜的編碼問題具有固有的局限性。相反,他們設計了一個多階段流程,專注于對照測試用例迭代地生成、運行和調試代碼,從而使模型能夠從經驗中學習。

提示工程的局限性

在自然語言任務中,提示工程指仔細調整提示的措辭和結構,以指導模型生成所需的輸出。比如說,在輸入文本之前添加短語“寫簡明的摘要:”可以從模型中得到針對性更強的摘要。

提示工程已被證明在做文本生成引導大語言模型行為方面非常有效。然而針對編碼問題,研究人員發現,就連廣泛的及時調整也只能獲得極小的效益。原因發人深省。生成高質量的代碼需要:

  • 精確匹配目標編程語言的語法
  • 優雅地處理極端情況和意外輸入
  • 解決問題陳述中描述的所有小細節和需求
  • 為所有的有效輸入確保代碼正確編譯和運行

這些結構性需求遠遠超出了文本生成的范疇。將它們硬編碼到提示中對于復雜的問題是行不通的。單單提示本身缺乏模型學習這些的編碼技巧和細微差別所需要的具體反饋。

AlphaCodium迭代流程

為了應對這些挑戰,研究人員設計了一個針對代碼生成問題結構的迭代流程。關鍵的創新在于針對測試用例利用所生成代碼的執行,以提供直接的學習信號。

AlphaCodium的流程有兩個主要階段:

預處理

  • 模型將問題描述釋義為項目符號,以提取關鍵細節。
  • 解釋每個示例輸入/輸出背后的預期邏輯。
  • 提供兩三個自然語言解決方案。
  • 為代碼覆蓋生成額外的不同測試用例。

代碼迭代

  • 模型生成初始代碼解決方案。
  • 針對公共測試用例重復運行該代碼,修復出現的錯誤。
  • 對模型生成的測試用例執行同樣的事情。
  • 額外的測試用例被添加到不斷增大的“測試錨”(test anchor)套件中,以防止回歸。

通過增量推理問題、開發解決方案假設、擴展測試覆蓋,以及反復生成和調試代碼,模型通過經驗來學習——這正是高質量代碼生成所需的技能。

圖1. 具有結構化輸出的提示示例(生成可能的解決方案階段)

研究人員發現,與端到端模型相比,將流程設計為具有清晰接口和目標的模塊可以獲得更好的結果。每個階段首先專注于更簡單的子任務,以積累知識,并發掘為下游階段提供依據的洞察力。像測試生成這樣的上游階段不需要完整的解決方案,只需要基本的推理。

實驗結果

研究人員依據CodeContests衡量基準對AlphaCodium進行了評估,該衡量基準包含來自競爭性編程比賽的數百個編碼問題。

圖2. 問題描述和反思——一個典型的CodeContests問題的例子,基于人工智能對問題進行自我反思。雖然最初的描述冗長而復雜,但適當的自我反思可以使問題更清晰、更連貫,從而改進代碼解決方案

針對GPT-4模型,與經過大量優化的單個提示相比,AlphaCodium將驗證集上的代碼生成準確率從19%提高到了44%。面對不同的模型大小和測試集,這個好處依然適用,與單獨的提示工程相比收效顯著。

AlphaCodium的性能也顯著優于之前發布的方法,比如AlphaCode和CodeChain,同時使用更少的計算資源。比如說,它通過避免不必要的蠻力生成,其準確性可以媲美AlphaCode,而模型查詢少10000倍。

這些結果證明了圍繞任務結構整體設計AI系統的價值,而不是將其視為通用文本生成器。通過合并迭代代碼運行和調試,AlphaCodium更好地將訓練過程與生成健壯實用代碼的最終目標結合起來。

更廣泛的影響

雖然針對競爭性編程問題進行了演示,但AlphaCodium中使用的概念為AI推進代碼生成提供了更廣泛的適用經驗:

  • 單單提示工程對于處理復雜的代碼任務具有局限性。具體解決問題的經驗至關重要。
  • 基于測試的開發規范可以為模型訓練提供依據。測試提供了明確的適應度函數。
  • 迭代代碼調試將模型改進的重點放在實際發生的錯誤上。
  • 測試覆蓋擴展突出了提示中不可見的泛化性差距。
  • 具有雙重驗證的軟決策減少了脆弱性和偏差。

AlphaCodium為基于軟件工程最佳實踐的代碼生成提供了一種大有前途的新范式。關于泛化性和計算開銷仍然存在有待商榷的研究問題。但這里展示的原則(從經驗中學習、測試驅動開發、模塊化推理和迭代式調試)似乎為提高AI的編碼能力提供了堅實的基礎。

論文鏈接:https://arxiv.org/pdf/2401.08500.pdf

代碼庫:https://github.com/Codium-ai/AlphaCodium

原文標題:"Flow engineering" doubles code generation accuracy (19% vs 44%),作者:Mike Young

鏈接:https://notes.aimodels.fyi/flow-engineering-intensifies-for-code-generation/

責任編輯:姜華 來源: 51CTO
相關推薦

2009-09-16 10:05:06

GoogleChrome 3.0瀏覽器

2022-06-24 08:20:56

requests爬蟲Python

2017-09-28 09:40:36

圖像分類準確率

2012-07-04 09:30:49

程序員開發效率

2023-04-10 14:22:26

PCIe6.0PCIe

2012-07-04 08:48:59

程序員

2023-06-27 09:48:40

谷歌AML AI 工具

2022-11-21 10:18:24

AI谷歌

2023-06-28 13:49:12

AI人工智能

2020-05-12 10:43:30

谷歌算法人工智能

2011-02-22 09:29:33

無線網絡無線網速

2020-10-12 11:01:53

AWSSageMaker德比軟件

2020-09-14 14:10:04

開發技能代碼

2016-01-27 13:37:53

機器學習數據模型算法

2019-04-02 11:36:11

AI

2024-04-02 10:13:25

在線小工具開發

2020-12-24 19:29:08

PCIntel芯片

2019-05-10 14:28:27

MySQL技巧數據庫

2020-04-22 09:04:27

Linux命令行搜索工具

2009-06-15 08:47:33

微軟Windows 7操作系統
點贊
收藏

51CTO技術棧公眾號

大陆成人av片| 国产二区精品| 欧美私人免费视频| 超碰成人在线免费观看| 理论片中文字幕| 久久九九免费| 欧美大片第1页| 国产精品高清无码在线观看| 色综合一区二区日本韩国亚洲| 一区二区三区中文字幕| 农村寡妇一区二区三区| 91在线公开视频| 亚洲手机在线| 日韩中文字幕欧美| 粉嫩av懂色av蜜臀av分享| 国内自拍亚洲| 日韩欧美国产激情| 超碰人人爱人人| 99视频在线观看地址| 成人永久免费视频| 成人av番号网| 精品久久久久久久久久久久久久久久| 亚洲深深色噜噜狠狠爱网站| 亚洲色图综合久久| 中文字幕精品久久久| 婷婷久久综合九色综合99蜜桃| 欧美视频国产精品| 99热这里只有精品免费| 日本免费在线视频| 久久久欧美精品sm网站| 国产尤物91| 国产黄色片网站| 久久精品国产一区二区三区免费看| 性色av一区二区三区红粉影视| 国产美女福利视频| 欧美色婷婷久久99精品红桃| 日韩久久免费电影| 久久久无码人妻精品无码| 四虎影视成人精品国库在线观看| 色94色欧美sute亚洲线路一久 | 懂色av成人一区二区三区| 日韩成人av影视| 热99在线视频| 国产精品999在线观看| 欧美特黄视频| 欧美肥臀大乳一区二区免费视频| 性欧美疯狂猛交69hd| 成人精品视频| 中文字幕亚洲国产| 国产综合精品久久久久成人av| 校花撩起jk露出白色内裤国产精品 | 亚洲av人无码激艳猛片服务器| 亚洲综合三区| 人妖精品videosex性欧美| 中文字幕在线观看免费视频| 亚洲黄网站黄| 午夜免费久久久久| 国产精品视频一区在线观看| 亚洲在线免费| 国产99视频精品免视看7| 亚洲 欧美 日韩 在线| 欧美亚洲专区| 国产精品99久久99久久久二8| 无码人妻精品一区二区三区蜜桃91 | 欧美日韩中文不卡| 国产精品麻豆成人av电影艾秋| 欧美视频在线一区| 亚洲综合婷婷久久| 精品久久亚洲| 精品99一区二区| 青青草视频播放| 国产欧美日韩| 久久精品成人动漫| 欧美黄色一级网站| 精品成人无码久久久久久| 性国产高清在线观看| 亚洲一区二区精品久久av| 日韩av高清在线看片| 原纱央莉成人av片| 欧美私模裸体表演在线观看| av中文字幕网址| 免费观看亚洲天堂| 亚洲精品国产欧美| 亚洲精品成人av久久| 亚洲精品成人| 97免费中文视频在线观看| 国产专区第一页| 蜜臀久久99精品久久久画质超高清| 国产日韩欧美在线观看| www.黄色av| 26uuu久久天堂性欧美| 欧美一区观看| 国产秀色在线www免费观看| 亚洲午夜视频在线观看| 欧美激情国产精品日韩| 久久麻豆视频| 亚洲黄色av女优在线观看| 日本美女xxx| 亚洲视频日本| 国产日本欧美一区| 天堂在线视频网站| 中文字幕一区三区| heyzo国产| japansex久久高清精品| 国产午夜精品久久久 | 欧美美乳视频| 欧美成人sm免费视频| 国内自拍视频在线播放| 国产乱码精品一区二区三区av| 久久手机视频| 影音先锋男人资源在线| 欧美亚洲国产一卡| 亚州av综合色区无码一区| 99成人超碰| 日韩免费观看网站| 蜜臀久久99精品久久久| 中文字幕日本乱码精品影院| 成人一级片网站| eeuss鲁片一区二区三区| 色噜噜国产精品视频一区二区| 国产精品999在线观看| 国产福利视频一区二区三区| 亚洲不卡中文字幕| 丁香花视频在线观看| 在线播放视频一区| 久久午夜福利电影| 亚洲乱码久久| 成人欧美一区二区| h片在线免费| 欧美男男青年gay1069videost| 国产精品一级黄片| 欧美三级乱码| 国产精品久久久久久影视| 欧美女同网站| 精品成人国产在线观看男人呻吟| 潘金莲一级淫片aaaaa| 天天综合一区| 国产精品专区h在线观看| 欧美美女搞黄| 欧美午夜性色大片在线观看| 东京热av一区| 在线播放不卡| 国产高清一区二区三区| 羞羞的视频在线观看| 日韩一区二区三区精品视频| 国产传媒免费在线观看| 久久精品国产99国产精品| 性欧美.com| 成人精品国产| 中文字幕九色91在线| 波多野结衣激情视频| 国产网红主播福利一区二区| 久久久久久久久久久免费视频| 日韩手机在线| 国产91精品久久久| 神马电影在线观看| 日韩欧美国产视频| 扒开jk护士狂揉免费| 日韩和欧美一区二区三区| 欧美精品久久| 成人黄色视屏网站| 色偷偷888欧美精品久久久| 91福利在线观看视频| 国产精品久久久久三级| 国产成人美女视频| 午夜国产精品视频| 豆国产97在线| 欧美激情网站| 国产一区二区三区免费视频| 中文字幕人成人乱码亚洲电影| 中文字幕av不卡| 亚洲精品永久视频| 韩国久久久久| 久久综合久久久| 秋霞国产精品| 欧美成人第一页| 日本免费一区视频| 欧美视频中文在线看| 欧美三级视频网站| 国产一区二区精品久久91| 日韩a级黄色片| 亚洲三级网页| 国产欧美欧洲在线观看| 男女视频在线| 亚洲欧美三级在线| 国产精品爽爽久久久久久| 亚洲图片有声小说| a级片在线观看| 国内久久婷婷综合| 国产精品无码人妻一区二区在线| 精品福利久久久| 亚洲一区中文字幕在线观看| 国产精品蜜芽在线观看| 在线观看日韩视频| www.综合色| 91国偷自产一区二区使用方法| 性爱在线免费视频| 99久久精品国产一区| 在线观看国产一级片| 亚洲精品乱码| 午夜精品美女久久久久av福利| 日本一区影院| 国产成人中文字幕| 人人超在线公开视频| 一个色综合导航| 国 产 黄 色 大 片| 在线观看亚洲精品视频| 欧美日韩中文视频| 国产精品不卡一区二区三区| yy1111111| 国产一区二区不卡在线| 日韩毛片在线免费看| 中文乱码免费一区二区三区下载| 日本不卡免费新一二三区| www.久久东京| 成人在线中文字幕| 欧美粗大gay| 性欧美xxxx视频在线观看| av网站大全在线| 这里只有精品久久| 欧美捆绑视频| 日韩福利在线播放| 国产黄色av网站| 欧美日本一区二区| 老熟妇仑乱一区二区av| 亚洲狠狠爱一区二区三区| 久久嫩草捆绑紧缚| 国产日本欧美一区二区| 国产精品九九九九九| 国产成人免费视频精品含羞草妖精| 日本黄大片一区二区三区| 视频一区免费在线观看| 奇米精品一区二区三区| 亚洲夜间福利| 美女扒开大腿让男人桶 | 黄色一级片在线看| 你懂的国产精品| 中文字幕久久一区| 久久精品国产www456c0m| 欧美视频观看一区| 久久精品色播| 精品国产一区二区三区四区精华 | 日本电影一区二区三区| 国产精品网在线观看| 国产精品视频免费一区二区三区| 久久免费福利| 亚洲一区二区三区在线视频| 国产精品一区二区美女视频免费看| 国产免费一区视频观看免费| 成人a在线观看高清电影| 国产精品大片wwwwww| 国产一区一一区高清不卡| 国产精品久久久久久久久免费 | 狠狠色噜噜狠狠狠狠色吗综合| 成人动漫视频| 国产伦精品一区二区三区视频免费| 亚洲成av人片在线观看www| 亚洲综合小说区| 成人春色在线观看免费网站| 好看的日韩精品| 免费久久久久久久久| 欧洲av一区| 日韩黄色大片| 午夜探花在线观看| 中文乱码免费一区二区三区下载| 天天做天天躁天天躁| 亚洲精品韩国| 少妇人妻互换不带套| 免费人成精品欧美精品| 免费av不卡在线| 福利电影一区二区| 日b视频在线观看| 国产亚洲精品中文字幕| 日本在线观看网址| 亚洲一区二区偷拍精品| www.国产com| 欧美日韩美女一区二区| 超碰在线人人干| 亚洲毛片一区二区| 丝袜美腿美女被狂躁在线观看| 伦理中文字幕亚洲| 悠悠资源网亚洲青| 国产男女猛烈无遮挡91| 97视频一区| 亚洲v日韩v欧美v综合| 国产精品多人| 成年人视频在线免费| 精品一区二区影视| 国产二级一片内射视频播放| 日本一区二区三区高清不卡| 青青草精品在线视频| 欧美日韩中文字幕在线| 国产又粗又猛又黄| 亚洲国产欧美一区| 色视频在线免费观看| 91精品国产91久久久久久久久| 国产精品久久久久久久久免费高清| av一区二区三区四区电影| 久久不见久久见中文字幕免费 | 欧美另类z0zx974| 一区二区三区四区高清精品免费观看| 亚洲天堂一区在线观看| 91麻豆精品国产| 国产中文在线观看| 久久久久久久久久av| 国模私拍国内精品国内av| 精品欧美国产| 亚洲一区色图| 91色国产在线| 91亚洲精华国产精华精华液| 国产人妻精品一区二区三区不卡| 欧美午夜激情小视频| www.久久成人| 上原亚衣av一区二区三区| 樱花草涩涩www在线播放| 俄罗斯精品一区二区三区| 久久精品播放| 久久精品免费网站| av男人天堂一区| 九九视频免费看| 欧美精品在线观看播放| 韩国中文字幕2020精品| 2019中文字幕在线观看| 视频精品国内| 四虎永久免费网站| 韩国精品久久久| 欧美一区二区三区粗大| 色哟哟国产精品| 少妇精品视频一区二区| 久久精品在线播放| 国产情侣一区二区三区| 色女人综合av| 手机精品视频在线观看| 三级黄色片网站| 亚洲国产精品一区二区www| www日本视频| 久久综合久久八八| 伊人久久大香| 亚洲一区二区精品在线观看| 日韩电影在线看| jizz中文字幕| 在线观看精品一区| 美女做暖暖视频免费在线观看全部网址91| 高清一区二区三区日本久| 成人另类视频| 免费av手机在线观看| 不卡在线观看av| 日韩手机在线观看| 亚洲精品黄网在线观看| 日韩脚交footjobhd| 久久综合给合久久狠狠色| 久久欧美肥婆一二区| 老牛影视av老牛影视av| 日韩欧美综合在线视频| 精品无人乱码| 国产精品免费小视频| 欧美电影一二区| 波多野结衣在线免费观看| 亚洲免费在线视频| 亚洲精品久久久蜜桃动漫| 久久久久亚洲精品| 色老板在线视频一区二区| 97在线免费公开视频| 国产视频在线观看一区二区三区| 精品一区二三区| 精品国偷自产在线视频99| 麻豆国产一区| 97超碰人人澡| wwwwww.欧美系列| 亚洲视屏在线观看| 久久精品国产久精国产一老狼| 欧美中文高清| 国产av麻豆mag剧集| 国产亚洲精品aa| 国产又粗又长又黄| 久久久爽爽爽美女图片| 国产成人精品999在线观看| 亚洲欧美视频二区| 亚洲尤物视频在线| 九九在线视频| 成人有码在线视频| 亚洲精品1234| 日本成人免费在线观看| 精品国产乱码久久久久久影片| 欧美a级在线观看| 一区二区三区|亚洲午夜| 成人激情视频网站| 波多野结衣小视频| 欧美成人精品一区二区三区| 少妇高潮一区二区三区| 狠狠躁狠狠躁视频专区| 亚洲成av人片在线| jizz在线观看| 丁香婷婷久久久综合精品国产| 玖玖国产精品视频| 青青草激情视频| 在线成人激情黄色| 高清日韩中文字幕| jizzzz日本| 色呦呦国产精品|