精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

IBM開源了5億行代碼數(shù)據(jù)集,里面最多的編程語言卻不是Python

新聞 人工智能
近日,IBM 研究院發(fā)布了一個名為 CodeNet 的數(shù)據(jù)集,該數(shù)據(jù)集包含 1400 萬個代碼樣本,用于訓(xùn)練面向編程任務(wù)的機(jī)器學(xué)習(xí)模型。

谷歌服務(wù)包含 20 億行代碼,一輛汽車的系統(tǒng)包含 1 億行代碼——寫代碼、debug 這么大的工作量不交給 AI 來做能行?

讓 AI 自動生成代碼,是很多開發(fā)者的夢想,近些年來,有關(guān)這一方面的研究屢見不鮮。但要想訓(xùn)練一個好用的 AI,最重要的工作或許就是找到優(yōu)質(zhì)數(shù)據(jù)。

近日,IBM 研究院發(fā)布了一個名為 CodeNet 的數(shù)據(jù)集,該數(shù)據(jù)集包含 1400 萬個代碼樣本,用于訓(xùn)練面向編程任務(wù)的機(jī)器學(xué)習(xí)模型。該數(shù)據(jù)集的主要特點(diǎn)包括:

  • 迄今為止最大的編碼數(shù)據(jù)集,其中包含 4000 個問題,1400 萬個代碼樣本,50 + 種編程語言;
  • 該數(shù)據(jù)集添加了注釋,包括問題描述、內(nèi)存 / 時間限制、語言、代碼通過 / error 等。

IBM 希望 CodeNet 仿效大型圖像數(shù)據(jù)集 ImageNet,并成為教軟件理解軟件開發(fā)藍(lán)圖的領(lǐng)先數(shù)據(jù)集。IBM 希望 CodeNet 可以用于訓(xùn)練具有如下功能的開發(fā)工具:

  • 從一種編程語言轉(zhuǎn)換到另一種編程語言;
  • 代碼推薦與補(bǔ)全;
  • 代碼優(yōu)化;
  • 搜索應(yīng)用程序和庫來源以查找所需例程;
  • 將一種語言轉(zhuǎn)換成另一種語言;
  • 識別錯誤 / 正確的實(shí)現(xiàn)機(jī)制。

利用深度學(xué)習(xí)進(jìn)行自動化編程

近年來,機(jī)器學(xué)習(xí)領(lǐng)域取得了令人矚目的進(jìn)步,AI 讓多種工作任務(wù)實(shí)現(xiàn)了自動化,包括編程。但是 AI 在軟件開發(fā)中的滲透卻遇到了極大的困難。

人們在編程時通常會使用大量的有意識和潛意識思維機(jī)制發(fā)現(xiàn)新的問題并探索不同的解決方案。相比之下,大多數(shù)機(jī)器學(xué)習(xí)算法都需要定義明確的問題和大量帶有注釋的數(shù)據(jù)才能夠開發(fā)出解決相同編程問題的模型。

為了解決這一難題,研究者與開發(fā)者們已經(jīng)做出了很多努力,包括創(chuàng)建數(shù)據(jù)集和基準(zhǔn),以開發(fā)和評估「用于編程的 AI」系統(tǒng)。但是,鑒于軟件開發(fā)的創(chuàng)造性和開放性,很難為編程創(chuàng)建完美的數(shù)據(jù)集。

IBM 的研究人員試圖創(chuàng)建一個多用途的數(shù)據(jù)集,可用于訓(xùn)練各種任務(wù)的機(jī)器學(xué)習(xí)模型。CodeNet 的創(chuàng)建者將其描述為「非常大規(guī)模,多樣且高質(zhì)量的數(shù)據(jù)集,能夠加快使用 AI 編程的步伐」。該數(shù)據(jù)集包含 1400 萬個代碼樣本,共有用 55 種編程語言編寫的 5 億行代碼,其中 C++ 是樣本中使用最多的語言,Python 位居第二。這些代碼樣本是從提交給在線編程平臺 AIZU 和 AtCoder 上的近 4,000 項(xiàng)挑戰(zhàn)的提交中獲得的,代碼樣本包括這些挑戰(zhàn)的正確答案和錯誤答案。

CodeNet 項(xiàng)目地址:https://github.com/IBM/Project_CodeNet

CodeNet 的主要特點(diǎn)之一是代碼樣本中添加了注釋。數(shù)據(jù)集中包含的每個編程挑戰(zhàn)都有一個文本說明以及 CPU 時間和內(nèi)存限制。每個代碼提交都包含十幾條信息,包括語言,提交日期,內(nèi)存占用大小,執(zhí)行時間,接受和 error 類型。為了確保該數(shù)據(jù)集在編程語言,接受和 error 類型等多個維度上保持平衡,IBM 的研究人員付出了巨大的努力。

機(jī)器學(xué)習(xí)編程任務(wù)

CodeNet 并不是訓(xùn)練機(jī)器學(xué)習(xí)模型來執(zhí)行編程任務(wù)的唯一數(shù)據(jù)集。相比于其他數(shù)據(jù)集,CodeNet 具有以下特點(diǎn):首先是數(shù)據(jù)集的規(guī)模,包括樣本數(shù)量和語言的多樣性;但更重要的是編碼樣本附帶的元數(shù)據(jù)。CodeNet 中添加的豐富注釋使其能夠適用于多種任務(wù),不再只是用于特定編程任務(wù)。

使用 CodeNet 開發(fā)用于編程任務(wù)的機(jī)器學(xué)習(xí)模型包括以下方式:

  • CodeNet 可以用來進(jìn)行語言翻譯任務(wù)。由于數(shù)據(jù)集中包含的每個編程挑戰(zhàn)都包含不同編程語言的提交,因此數(shù)據(jù)科學(xué)家們可以用它來創(chuàng)建機(jī)器學(xué)習(xí)模型,將代碼從一種語言轉(zhuǎn)換成另一種語言。對于希望將舊代碼移植成新語言、使新一代程序員能夠訪問并使用新型開發(fā)工具進(jìn)行維護(hù)的人們而言,這可能很方便;
  • CodeNet 還可以用來開發(fā)完成代碼推薦任務(wù)的機(jī)器學(xué)習(xí)模型開發(fā)。推薦工具既可以像完成當(dāng)前代碼行的自動完成樣式模型一樣簡單,也可以是編寫完整函數(shù)或代碼塊的更復(fù)雜系統(tǒng)。

由于 CodeNet 擁有大量關(guān)于內(nèi)存和執(zhí)行時間指標(biāo)的元數(shù)據(jù),數(shù)據(jù)科學(xué)家也可以使用它來開發(fā)代碼優(yōu)化系統(tǒng)。或者,可以使用 error 類型的元數(shù)據(jù)來訓(xùn)練機(jī)器學(xué)習(xí)系統(tǒng),以標(biāo)記源代碼中的潛在缺陷。

CodeNet 更高級的用例是代碼生成。CodeNet 是一個豐富的問題文本描述庫,并包含對應(yīng)的源代碼。已經(jīng)有開發(fā)人員使用高級語言模型(如 GPT-3)從自然語言描述生成代碼,CodeNet 或許能夠幫助微調(diào)這些語言模型,使其在代碼生成中更加一致。

IBM 的研究人員已經(jīng)對 CodeNet 進(jìn)行了一些實(shí)驗(yàn),這些實(shí)驗(yàn)包括代碼分類、代碼相似性評估和代碼補(bǔ)全。使用的深度學(xué)習(xí)體系架構(gòu)包括簡單的多層感知器、卷積神經(jīng)網(wǎng)絡(luò)、圖神經(jīng)網(wǎng)絡(luò)、Transformer。

IBM 和 MIT-IBM Watson AI 實(shí)驗(yàn)室團(tuán)隊(duì)聯(lián)合開發(fā)了該數(shù)據(jù)集,研究中的實(shí)驗(yàn)結(jié)果顯示大多數(shù)任務(wù)都能獲得90%以上的準(zhǔn)確率。

論文地址:https://github.com/IBM/Project_CodeNet/blob/main/ProjectCodeNet.pdf

建立高效的機(jī)器學(xué)習(xí)系統(tǒng),需付出巨大努力

IBM 的工程師們進(jìn)行了大量的工作來管理 CodeNet 數(shù)據(jù)集并開發(fā)其輔助工具。

首先,研究團(tuán)隊(duì)需要從 AIZU 和 AtCoder 收集代碼樣本。二者中只有一個平臺有應(yīng)用程序接口(API),可以很容易地獲取代碼,而另一個平臺沒有易于訪問的接口,研究團(tuán)隊(duì)需要開發(fā)新工具,從平臺的網(wǎng)頁上抓取數(shù)據(jù),并將其分解成表格格式。然后研究者們需要手動將兩個數(shù)據(jù)集合并到一個統(tǒng)一的模式中。

接下來,研究團(tuán)隊(duì)需要開發(fā)用于識別和刪除重復(fù)代碼和樣本(包含大量無效代碼,運(yùn)行時未執(zhí)行的源代碼)的工具,以清除無用數(shù)據(jù)。

此外,該研究團(tuán)隊(duì)還開發(fā)了預(yù)處理工具,使得在 CodeNet 語料庫上訓(xùn)練機(jī)器學(xué)習(xí)模型變得更容易,包括用于不同編程語言的 tokenizer、分析樹(parse tree)和用于圖神經(jīng)網(wǎng)絡(luò)的圖表征生成器。

所有這些都提醒我們,要創(chuàng)建高效的機(jī)器學(xué)習(xí)系統(tǒng),需要付出巨大的努力。人工智能要取代程序員還有很長的路要走。

 【責(zé)任編輯:張燕妮 TEL:(010)68476606】

 

 

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2021-05-21 10:46:55

AI 代碼人工智能

2023-03-26 19:38:09

2015-07-16 17:23:27

2018-05-08 10:28:53

Oracle云轉(zhuǎn)型Adobe

2021-12-29 21:36:12

微信支付寶移動支付

2020-07-17 10:09:44

程序員技術(shù)開發(fā)

2024-12-19 07:50:00

2013-04-11 09:37:51

編程語言

2023-07-18 18:10:04

2022-03-09 07:29:55

AI開源C語言

2011-09-23 09:47:48

編程

2009-04-27 12:42:54

技術(shù)周刊收購Oracle

2021-11-02 15:49:46

低代碼編程Power Fx微軟

2013-08-23 11:06:34

編程語言

2018-11-25 20:29:24

編程語言PythonJava

2022-05-26 07:53:33

Python代碼編程語言

2021-05-14 13:05:20

AI 數(shù)據(jù)人工智能

2021-03-04 08:41:02

微軟Powr Fx低代碼

2020-12-08 06:20:00

Python自動化工具開源

2020-02-05 17:09:28

編程語言代碼Ruby
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

亚洲摸摸操操av| 国产盗摄一区二区三区| 一本大道亚洲视频| 在线视频日韩欧美| 国产后进白嫩翘臀在线观看视频| 99re热这里只有精品视频| 国产精品777| 卡通动漫亚洲综合| 日韩超碰人人爽人人做人人添| 欧美自拍丝袜亚洲| 人人妻人人澡人人爽欧美一区双 | 日韩一区二区视频| 欧美一级在线看| 精品国产丝袜高跟鞋| 91香蕉视频黄| 成人蜜桃视频| 一级日韩一级欧美| 免费一级欧美片在线播放| 久久五月天综合| 白白色免费视频| 国产厕拍一区| 欧美一区二视频| 男人女人黄一级| 国产精品yjizz视频网| 亚洲欧美日本在线| 午夜精品美女久久久久av福利| 成人乱码一区二区三区| 麻豆91精品91久久久的内涵| 2019av中文字幕| 久久久久久久久久久97| 欧美岛国激情| 国产一区二区三区在线观看网站| 精品1卡二卡三卡四卡老狼| www一区二区三区| 欧美色网站导航| 欧在线一二三四区| 九色porny丨首页入口在线| 亚洲精品视频免费观看| 午夜精品区一区二区三| 国产精品天堂| 国产亚洲视频系列| 蜜桃传媒视频第一区入口在线看| 后入内射欧美99二区视频| 国产一区二区三区四区五区入口| 国产精品久久久久久久av大片| 欧美一区二区三区四| 亚洲成人资源| 97高清免费视频| 日韩精品视频免费看| 狠狠干综合网| 欧美精品成人91久久久久久久| 小早川怜子一区二区的演员表| 清纯唯美日韩| 伊人青青综合网站| 国产黄色录像视频| 色爱综合网欧美| 色视频www在线播放国产成人| jizz中文字幕| 久久精品国产99久久| 国产亚洲视频在线观看| gv天堂gv无码男同在线观看 | 国产爆乳无码一区二区麻豆| av片在线观看永久免费| 亚洲精品久久久蜜桃| 国产一区二区片| 国产激情在线播放| 色拍拍在线精品视频8848| 日韩中文字幕免费在线| 日本精品在线中文字幕| 欧美人与禽zozo性伦| 欧美一级免费在线| 久久黄色影视| 一区二区三区黄色| 男女做暖暖视频| 一区二区亚洲精品| 粗暴蹂躏中文一区二区三区| 久久久91视频| 亚洲男人影院| 国产在线一区二区三区| www日本高清视频| 99国产精品久| 一区二区不卡在线观看| 污污网站在线看| 欧美日韩性视频在线| 五月婷婷激情久久| 136导航精品福利| 精品在线欧美视频| 91香蕉视频在线播放| 亚洲国产专区校园欧美| 国产精品99久久久久久www| 国产一区二区三区在线观看| 成人国产精品免费观看动漫| 日韩欧美99| 成人在线免费看片| 福利视频导航一区| 超碰人人草人人| 久久午夜影院| 爱福利视频一区| 麻豆久久久久久久久久| 国模大尺度一区二区三区| 国产欧美日韩伦理| 午夜免费播放观看在线视频| 亚洲第一久久影院| 岛国毛片在线播放| 丝袜连裤袜欧美激情日韩| www.日本久久久久com.| 日本道在线观看| 国产一区91精品张津瑜| 欧美日韩一区二区三| 羞羞视频在线免费国产| 欧美曰成人黄网| 精品视频站长推荐| 亚洲成av人片乱码色午夜| 日韩av第一页| 日本人妻丰满熟妇久久久久久| 国产精品网站一区| 99爱视频在线| 都市激情久久| 久久综合电影一区| 中文字幕一级片| 99精品久久免费看蜜臀剧情介绍 | 国产欧美日韩一级| 91黄在线观看| 日韩精品成人av| 色视频一区二区| 女同毛片一区二区三区| 欧美91精品| 成人黄色生活片| av在线第一页| 色综合久久久久久久久久久| 男男做爰猛烈叫床爽爽小说 | 色综合久久精品亚洲国产| 中文字幕一区二区人妻痴汉电车| 91久色porny| 男女激情无遮挡| 91精品啪在线观看国产爱臀| 插插插亚洲综合网| 国产精品久久久久久久成人午夜| 国产日本欧美一区二区| 国内外成人激情视频| 欧美日韩麻豆| 91精品国产免费久久久久久 | 伊人成人开心激情综合网| 国产在线观看黄色| 92国产精品观看| 亚洲中文字幕无码av永久| 91欧美极品| 色综合天天综合网国产成人网| 国产精品久久久久久免费| 国产精品视频在线看| 宅男噜噜噜66国产免费观看| 国产精品嫩草影院在线看| 日韩美女在线观看| 国产小视频免费在线观看| 色综合久久综合中文综合网| 久久中文字幕人妻| 午夜影院日韩| 日韩av在线电影观看| 都市激情综合| 正在播放欧美一区| 国产美女精品视频国产| 一区二区三区四区在线播放| 国产精品成人无码专区| 午夜在线a亚洲v天堂网2018| 日韩性感在线| 91麻豆精品国产91久久久更新资源速度超快| 日韩在线观看免费全集电视剧网站| 一本到在线视频| 一区二区三区毛片| 无码一区二区精品| 日韩成人免费在线| 中文字幕日韩一区二区三区| 最新国产精品精品视频| 欧美自拍视频在线| 在线观看的av| 欧美成人在线直播| 亚洲天堂一区在线观看| 中文字幕乱码日本亚洲一区二区| 天天影视色综合| 亚洲国产精品一区| 日韩欧美一区二区三区久久婷婷| 日韩在线你懂得| 欧美激情在线一区| 你懂得网站在线| 7878成人国产在线观看| 免费日韩一级片| 国产精品久久久久久久久快鸭| 在线成人精品视频| 日韩不卡一二三区| 超碰人人爱人人| 国产欧美亚洲精品a| 成人在线播放av| 中文在线免费视频| 久久亚洲精品成人| 欧美日本网站| 日韩欧美激情在线| 国产情侣呻吟对白高潮| 亚洲一区二区三区四区在线免费观看 | 成人看片网页| 欧美国产日本在线| 在线观看h片| 亚洲乱码av中文一区二区| 91 中文字幕| 一本到高清视频免费精品| 粉嫩av性色av蜜臀av网站| 国产校园另类小说区| av电影中文字幕| 日韩成人免费电影| 国产真人做爰毛片视频直播| 天天做天天爱综合| 欧美日本国产精品| 成人直播在线观看| 国产日韩中文在线| 91精品影视| 97人洗澡人人免费公开视频碰碰碰| 黄色在线观看网站| 这里只有精品在线观看| 日本a一级在线免费播放| 日韩欧美亚洲国产精品字幕久久久 | 日本精品视频一区二区| 久久久久香蕉视频| 亚洲欧洲另类国产综合| 婷婷色一区二区三区| 97久久人人超碰| 熟女人妻一区二区三区免费看| 精品午夜久久福利影院| 一区二区三区韩国| 久久亚洲欧洲| 成人一级片网站| 西西裸体人体做爰大胆久久久| 欧美黑人在线观看| 欧美人成在线| 欧美a级黄色大片| 亚洲a在线视频| 久久视频免费在线| 小处雏高清一区二区三区| 亚洲国产欧洲综合997久久| 精品日韩毛片| 亚洲国产精品一区在线观看不卡 | 91麻豆精品国产91久久久更新资源速度超快| 欧洲日本亚洲国产区| 欧美一级鲁丝片| 69**夜色精品国产69乱| 国产在线精彩视频| 91超碰caoporn97人人| 999av小视频在线| 久久久久久久亚洲精品| 国产在线观看www| 91精品国产高清自在线| 在线免费av资源| 国产精品 欧美在线| 成人免费网站www网站高清| 国产精品99一区| 亚洲男人在线| 91探花福利精品国产自产在线| 秋霞午夜一区二区三区视频| www 成人av com| 美女一区二区在线观看| 久热国产精品视频一区二区三区| 蜜臀av免费一区二区三区| 欧美亚洲免费高清在线观看 | 日日鲁鲁鲁夜夜爽爽狠狠视频97| 麻豆亚洲精品| 三上悠亚av一区二区三区| 久久99热99| www.美色吧.com| 久久理论电影网| 少妇一级黄色片| 亚洲日本在线天堂| 免费一级特黄特色大片| 狠狠躁夜夜躁人人爽超碰91| 国产精品免费无遮挡无码永久视频| 欧美性色黄大片| 国产三级精品在线观看| 精品国产91九色蝌蚪| 久久久久久久久亚洲精品| 在线激情影院一区| 日本三级韩国三级欧美三级| 26uuu久久噜噜噜噜| 久久亚洲精品人成综合网| 91偷拍精品一区二区三区| 蜜桃成人av| 亚洲爆乳无码精品aaa片蜜桃| 国产精品丝袜xxxxxxx| 向日葵污视频在线观看| 国产99久久久国产精品潘金网站| aa片在线观看视频在线播放| 国产精品乱码一区二区三区软件| 精品少妇一二三区| 欧洲日韩一区二区三区| 丰满人妻妇伦又伦精品国产| 一区二区三区无码高清视频| 丰满的护士2在线观看高清| 国产精品免费一区豆花| 国产精品对白| 正义之心1992免费观看全集完整版| 亚洲啪啪91| 永久免费黄色片| 国产欧美一区二区精品仙草咪 | 色综合色狠狠综合色| 精品毛片在线观看| 亚洲天堂影视av| 国产又色又爽又黄刺激在线视频| 国产精品视频久| 欧美大胆a级| 女人床在线观看| 热久久国产精品| 中文字幕丰满孑伦无码专区| 亚洲美女少妇撒尿| 最新中文字幕第一页| 精品亚洲一区二区三区在线播放| 中文字幕有码在线观看| 国产精品久久久久久久美男| 日本一道高清一区二区三区| 国产精品久久久久久久久电影网| 另类中文字幕网| a天堂中文字幕| 红桃av永久久久| 欧美熟妇交换久久久久久分类| 久久韩剧网电视剧| 成人做爰视频www| 欧美精品在线一区| 99视频一区| 女性生殖扒开酷刑vk| 亚洲精品va在线观看| 亚洲视频在线免费播放| 国产亚洲精品激情久久| 在线看的毛片| 久久综合久久久| 亚洲作爱视频| 日韩成人av一区二区| 亚洲香肠在线观看| 亚洲免费一级片| 欧美激情精品久久久久久免费印度 | 欧美亚洲尤物久久| 国产中文字幕在线观看| 欧美最猛性xxxxx免费| 青青草原在线亚洲| www一区二区www免费| 91亚洲精华国产精华精华液| 香蕉免费毛片视频| 日韩国产欧美区| 亚洲黄色网址| 日本不卡免费新一二三区| 麻豆91精品| 成人一级片免费看| 欧美日韩精品专区| 国产激情在线| 97中文在线| 黄色成人91| 人妻无码一区二区三区| 日韩欧美精品在线观看| 男人久久精品| 国产精品高潮粉嫩av| 久久高清免费| 亚洲国产欧美91| 亚洲国产成人av网| 无码精品在线观看| 国产成人福利网站| 99久久国产综合精品成人影院| 中文国产在线观看| 亚洲国产成人91porn| 涩涩视频在线观看免费| 欧洲成人在线观看| 天天色天天射综合网| 好吊操视频这里只有精品| 五月天婷婷综合| avtt亚洲| 成人免费在线一区二区三区| 亚洲伦伦在线| 91资源在线播放| 欧美一区二区三区思思人| 91丝袜在线| 四虎一区二区| 国产精品白丝av| 日本一区二区免费电影| 日韩在线欧美在线| 超碰地址久久| 国产xxxxx视频| 亚洲精品视频一区二区| 手机福利小视频在线播放| 成人免费黄色网| 99综合视频| 亚洲国产123| 亚洲美女在线观看| 日韩一区二区三区色| 成人综合视频在线| 亚洲色欲色欲www在线观看| 污污的视频网站在线观看| 国产精品免费观看在线| 尤物在线精品| 网站永久看片免费| 日韩成人中文字幕在线观看| 色成人综合网| 久草资源站在线观看| 自拍偷拍国产精品| 国产永久av在线| 国产精品swag| 韩国精品在线观看| 天天综合久久综合|