精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

僅用5M數據超過 OpenAI?快手最新 Code Embedding 模型 OASIS(綠洲)發布 原創

發布于 2024-12-2 09:45
瀏覽
0收藏

出品 | 51CTO技術棧(微信號:blog51cto)

最近,快手Kwaipilot 團隊正式宣布開源 OASIS(Optimized Augmentation Strategy for Improved code Search)Code Embedding模型。快手 Kwaipilot 團隊在代碼表征領域實現了突破性進展,僅僅使用 5M Tokens數據大幅領先 OpenAI,在多個 Code Search benchmark 中顯著超越現有最佳水平。

1.什么是代碼表征?

隨著代碼庫規模的持續擴大,開發者越來越依賴高效的代碼檢索系統來提升開發效率。傳統的關鍵詞匹配方法已經無法滿足現代軟件開發的需求。代碼表征(Code Embedding)技術通過將代碼片段轉化為向量表示,使機器能夠深入理解代碼語義,從而實現更智能的代碼檢索。Code Embedding模型在代碼檢索、倉庫級代碼問答,代碼補全等場景中發揮不可或缺的作用。

僅用5M數據超過 OpenAI?快手最新 Code Embedding 模型 OASIS(綠洲)發布-AI.x社區圖 1. 代碼表征搜索[1]


2.OASIS用了哪些黑科技?

OASIS 的訓練只使用了 5M Tokens的數據,遠低于 SOTA 模型的訓練樣本數,通過結合程序分析技術與創新設計的損失函數,以極低的成本就在多個測試集上超越了現有的 SOTA 模型。

具體來說,OASIS 模型采用了多項創新技術:

  • 倉庫級程序分析:傳統方法僅關注單個代碼片段,缺少代碼的上下文信息,結合南方科技大學Arise實驗室技術,OASIS 引入了倉庫級別的程序分析技術。通過分析函數調用關系和依賴結構,模型能夠更好地理解代碼在更大上下文中的語義,相比于孤立地使用函數的 docstring,程序分析技術可以引入額外的上下文信息構建高質量樣本對。
  • OASIS-instruct 數據合成算法:我們開發的專有數據增強策略能夠自動生成高質量的訓練樣本。這些樣本包含代碼和自然語言的對應關系,使模型能夠學習到更細膩的語義差異。
  • 融合式損失函數:創新性地將多目標優化策略應用于模型訓練,確保模型在保持傳統Code Embedding模型能力的情況下,既能準確區分相似樣本,又能識別細微的語義差異,在優化目標的角度添加了新的訓練維度。

3.OASIS到底有多強?

僅用5M數據超過 OpenAI?快手最新 Code Embedding 模型 OASIS(綠洲)發布-AI.x社區

在權威的代碼檢索基準測試中,OASIS 展現出了令人矚目的性能:

OASIS在訓練過程中并不包含測試集提供的訓練集的情況下,在 CSN、CoSQA、AdvTest 等主流評測集上,性能優越。平均檢索準確率優于現有所有同尺寸的Code Embedding模型,具體來說,以5M數據訓練在三個不同的代碼檢索數據集全面超越OpenAI-Ada-002,在模型尺寸僅為三分之一的情況下在平均檢索成功率超越CodeFuse-CGE-Small,多個數據集領先明顯。

CodeSearchNet (CSN)數據集

該數據集包含超過200萬個代碼-文檔對,涵蓋Python、Java、JavaScript等六種主流編程語言。數據主要來源于函數級別的代碼及其對應的文檔字符串(docstring),使用自然語言的docstring作為查詢(query)。

CoSQA 數據集

CoSQA數據集是一個包含20,000+對自然語言查詢和代碼的標注數據集,每個數據對都至少由3名人類標注者進行標注。CoSQA數據集中的查詢來源于真實的網絡搜索,反映了開發者在日常工作中遇到的具體需求,而代碼片段則從不同的數據集中精心篩選,以確保多樣性和質量。

AdvTest 數據集

AdvTest數據集專門用于測試代碼搜索任務的難度。它通過規范化函數名和變量名來增加挑戰性,并從原始數據中過濾出高質量的樣本。該數據集包含近2萬的測試樣本,旨在評估模型在代碼理解和搜索方面的性能。

OASIS模型僅使用了5M的訓練數據,以1.3B的參數量在CSN,CoSQA,AdvTest數據集了超過SOTA模型,性能表現遠超OpenAI-Embedding-Ada-002。

4.OASIS有哪些應用場景呢?

OASIS 的應用場景廣泛:

在智能代碼檢索方面,OASIS能準確理解開發者的查詢意圖,從海量代碼庫中精準定位最佳實踐代碼片段。當開發者輸入具體需求描述時,模型能從海量代碼庫中精準定位最佳實踐代碼片段,并優先推薦與當前項目技術棧相匹配的示例。

僅用5M數據超過 OpenAI?快手最新 Code Embedding 模型 OASIS(綠洲)發布-AI.x社區圖 2. IDE代碼檢索

在代碼推薦領域,OASIS突破了傳統代碼補全工具的局限。基于對代碼語義的深度理解,模型能預測開發者的編碼意圖,主動推薦API調用序列和完整的功能實現方案,提升Kwaipilot代碼補全在私域代碼方言中的補全質量。

在智能CR場景,OASIS能夠精確識別功能相似但實現細節不同的代碼片段。這一能力在Code Review 功能中作用顯著,可以幫助模型識別代碼中的可能錯誤。

僅用5M數據超過 OpenAI?快手最新 Code Embedding 模型 OASIS(綠洲)發布-AI.x社區圖 3. Kwaipilot代碼審查

在代碼語義理解方面,模型應用于Kwaipilot RepoChat功能,模型能夠自動提取遺留系統或第三方庫中的關鍵程序邏輯,生成準確的功能描述和調用關系圖譜,幫助開發者快速熟悉上手倉庫,顯著降低團隊的代碼理解成本。

5.開源與未來展望

為推動代碼智能領域的發展,我們決定將 OASIS 完整開源。開發者可以直接通過 Hugging Face 使用模型,也可以基于我們的代碼進行進一步的改進和定制。

Huggingface 地址:https://huggingface.co/Kwaipilot/OASIS-code-1.3B

未來,Kwaipilot 團隊將持續投入代碼智能領域的研究,計劃:

  • 發布性能更強的Code Embedding模型
  • 開源詳細的技術報告和研究成果
  • 拓展模型在更多場景下的應用

OASIS 不僅是一個代碼表征模型,更是 Kwaipilot 團隊對代碼智能未來的探索。我們期待與開發者社區一起,繼續推動這項技術的發展,為軟件開發效率的提升貢獻力量。

讓我們一起,在代碼智能的綠洲中開啟新的篇章。

Reference

[1] Gu X, Zhang H, Kim S. Deep code search[C]//Proceedings of the 40th International Conference on Software Engineering. 2018: 933-944.

本文轉載自??51CTO技術棧??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2024-12-2 09:46:33修改
收藏
回復
舉報
回復
相關推薦
欧美日韩国产页| 成人h动漫精品| 久久久精品网站| www.四虎精品| 你懂得影院夜精品a| 成人欧美一区二区三区| 精品国产一区二区三区麻豆小说| www.国产一区二区| 亚洲成人免费| 亚洲欧美日韩精品久久| 狠狠躁狠狠躁视频专区| 国产大片aaa| 伊人成综合网yiren22| 亚洲自拍偷拍图区| 日本不卡在线播放| 狠狠躁日日躁夜夜躁av| 奇米色一区二区三区四区| 欧美黑人极品猛少妇色xxxxx| 蜜桃精品一区二区| 亚洲国产视频二区| 色94色欧美sute亚洲线路二| 999久久欧美人妻一区二区| 阿v免费在线观看| 成人福利电影精品一区二区在线观看| 国产精品丝袜高跟| 青青草免费观看视频| 欧美激情日韩| 久久精品视频在线播放| 国产手机在线观看| 欧美精品中文字幕亚洲专区| 91麻豆精品国产91久久久| 噼里啪啦国语在线观看免费版高清版| ririsao久久精品一区| 中文字幕在线不卡一区| 日韩videos| 日韩偷拍自拍| 一区二区91| 色中色综合影院手机版在线观看| 91禁男男在线观看| 国产精品三级| 亚洲欧美成人一区二区在线电影| 亚洲精品久久一区二区三区777 | 免费成人高清在线视频theav| 日韩午夜在线影院| 九色91porny| 精品国产18久久久久久二百| 国产精品国产精品国产专区不片 | 男人天堂手机在线观看| 国内成人免费视频| 国产日产久久高清欧美一区| 亚洲精品久久久久久久蜜桃| 久久精品123| 欧美在线免费看| 日韩精品在线免费视频| 国产欧美在线| 欧美性视频网站| 五月婷婷色丁香| 香蕉亚洲视频| 国产成人在线一区二区| www.黄色在线| 精品午夜久久| 日韩欧美电影在线| www.久久com| 视频在线观看免费影院欧美meiju 视频一区中文字幕精品 | 亚洲天堂资源| 色国产综合视频| av丝袜天堂网| 日韩一区二区三区四区五区| 日韩一区在线播放| 中文字幕一区综合| 制服丝袜在线播放| 亚洲国产日日夜夜| 国产一区二区在线视频播放| 伊人久久国产| 欧美日韩亚洲不卡| 亚洲精品乱码久久久久久9色| 日本一区二区乱| 亚洲第一精品夜夜躁人人躁| 欧美精品成人网| 韩日精品一区| 欧美大片在线观看一区二区| 捆绑裸体绳奴bdsm亚洲| 性欧美xxxx免费岛国不卡电影| 亚洲欧美国产一本综合首页| 国产成人在线网址| 欧美日韩第一区| 青青草国产精品一区二区| 夜夜嗨av禁果av粉嫩avhd| 国内欧美视频一区二区| 99一区二区三区| 天堂在线中文资源| 国产精品美女久久久久aⅴ | 黄色网在线免费观看| 亚洲一区视频在线| 欧美日韩精品免费观看| 丰满少妇在线观看bd| 久久久精品黄色| 精品欧美日韩| 日本三级视频在线播放| 亚洲国产欧美在线| 三级视频中文字幕| 丁香一区二区| 欧美一区二区三区精品| 私密视频在线观看| 婷婷中文字幕一区| 欧美亚洲另类激情另类| 国产口爆吞精一区二区| 久久日韩精品一区二区五区| 国产精品免费一区二区三区四区 | 久久久无码精品亚洲日韩按摩| 亚洲高清在线播放| 国产传媒在线| 欧美一区二区精品在线| 亚洲国产av一区| 精品福利电影| 欧美放荡办公室videos4k| 亚洲欧美偷拍一区| 丁香网亚洲国际| 中文字幕日韩精品久久| 伊人色综合一区二区三区影院视频| 欧美一级国产精品| 中文字幕在线观看二区| 久久av在线| 国产美女精品在线观看| 蜜桃视频在线观看免费视频网站www | 欧美一级搡bbbb搡bbbb| 美国美女黄色片| 久久av最新网址| 国内精品久久久久久久果冻传媒| 蜜桃视频在线观看www社区| 色狠狠一区二区| 黄色短视频在线观看| 狠狠爱综合网| 美女久久久久久久久久久| 亚洲影院在线播放| 99久久久免费精品国产一区二区| 91成人在线视频观看| 欧美日韩免费电影| 中文字幕av一区| 中文字幕在线播| 久久久久久久免费视频了| 乱妇乱女熟妇熟女网站| 奇米影视777在线欧美电影观看| 色与欲影视天天看综合网| 国产免费无遮挡| 亚洲乱码精品一二三四区日韩在线 | 国产在线高清视频| 欧美日韩一级视频| 亚洲ⅴ国产v天堂a无码二区| 日韩精品亚洲一区二区三区免费| 精品在线不卡| 成人性生活视频| 亚洲欧美中文字幕在线一区| 国产中年熟女高潮大集合| 亚洲激情社区| 久久久水蜜桃| 欧美18—19sex性hd| 亚洲欧美一区二区三区四区| 免费的毛片视频| 国产午夜精品久久| 黄色三级视频在线| 欧美国产一级| 亚洲精品免费网站| 免费在线国产视频| 日本高清免费不卡视频| 久久亚洲AV无码专区成人国产| 日韩福利视频导航| 亚洲精品视频一二三| 亚洲人体在线| 欧美黑人一级爽快片淫片高清| 亚洲av无码乱码国产麻豆| 亚洲图片欧美综合| 三上悠亚ssⅰn939无码播放| 日韩精品1区2区3区| 一区二区不卡在线观看| 日韩免费一级| 欧美一级片一区| 98在线视频| 日韩欧美国产三级| 激情视频网站在线观看| 国产精品视频一二| 中国男女全黄大片| 久久成人免费| 黄色网址在线免费看| 国产精品qvod| 国产精品偷伦一区二区| 在线午夜影院| 亚洲男女性事视频| 99riav国产| 欧美性生交xxxxx久久久| gv天堂gv无码男同在线观看| 国产精品综合二区| 亚洲精品在线免费| 99ri日韩精品视频| 国产精品精品国产| 视频在线这里都是精品| 欧美性猛片xxxx免费看久爱| 天天干中文字幕| 久久久久久久久久久久久女国产乱 | 欧美aaaaaaa| 亚洲欧美中文字幕| 刘亦菲毛片一区二区三区| 欧洲av一区二区嗯嗯嗯啊| 欧美成人免费观看视频| 国产三级欧美三级| 亚洲香蕉中文网| 久久久久av| 久久综合给合久久狠狠色| 国产成人视屏| 国产精品久久网| 美女高潮在线观看| 久久久久www| 岛国在线视频| 精品一区二区三区四区| 超碰在线观看99| 中文字幕一区二区三| 久久精品国产亚洲AV熟女| 成人午夜电影网站| 日本黄色一级网站| 日本不卡123| 日本精品久久久久中文字幕| 亚洲激情一区| 日本五级黄色片| 欧美自拍一区| 成人午夜电影免费在线观看| 青草综合视频| 国产精品男人爽免费视频1| 国精一区二区三区| 欧美疯狂xxxx大交乱88av| 日本激情视频在线观看| 伊人精品在线观看| 激情小视频在线| 欧美乱妇15p| 激情五月婷婷小说| 综合久久久久久| 蜜桃av免费观看| 国产欧美日韩精品a在线观看| 一级特级黄色片| av不卡免费在线观看| 亚洲日本久久久| 成人性色生活片| 制服丝袜在线第一页| 北条麻妃国产九九精品视频| 老女人性生活视频| 国产成人午夜视频| 免费黄色av网址| 成人国产亚洲欧美成人综合网 | 欧美wwwxxxx| av在线app| 美女av一区二区三区| 一二三四区在线观看| 欧美国产日韩一区二区三区| 青草在线视频在线观看| 欧美激情二区三区| av在线不卡免费| 97国产精品视频人人做人人爱| tube8在线hd| 日本亚洲精品在线观看| 精品无人乱码一区二区三区 | 亚洲人精品午夜射精日韩 | 性色av一区二区三区免费| 咪咪网在线视频| 国产精品第一区| 电影中文字幕一区二区| 高清视频一区二区三区| 欧美天堂影院| 亚洲欧洲一二三| 午夜精品av| 九色在线视频观看| 日本午夜精品一区二区三区电影| 欧美一级xxxx| 成人免费av资源| 久久只有这里有精品| 亚洲特级片在线| 国产无套粉嫩白浆内谢| 一本大道久久a久久综合| 亚洲在线免费观看视频| 欧美成人一级视频| 你懂的在线视频| 久久黄色av网站| 999福利在线视频| 国产精品日韩在线一区| 国产成人视屏| 欧美日韩大片一区二区三区| 亚洲澳门在线| 亚洲欧洲日产国码无码久久99| 日本午夜一本久久久综合| 91福利视频免费观看| 久久综合狠狠综合久久激情 | 欧美疯狂party性派对| 国产av人人夜夜澡人人爽麻豆 | 日韩免费在线观看视频| 综合久草视频| 欧美日韩精品免费在线观看视频| 99久久亚洲精品蜜臀| 一区二区传媒有限公司| 久久99久久久欧美国产| 中文字幕一区二区久久人妻网站| 中文字幕精品在线不卡| 天天操天天射天天爽| 欧美视频在线一区| 少妇荡乳情欲办公室456视频| 中文字幕av一区中文字幕天堂| 国产后进白嫩翘臀在线观看视频| 国产精品久久久久久久美男| 久久精品国产亚洲blacked| 在线观看欧美亚洲| 美女91精品| 精品国产免费久久久久久婷婷| 日本一区二区三区四区在线视频| 国产精品视频免费在线| av黄色在线看| 在线不卡的av| 国产精品四虎| 午夜剧场成人观在线视频免费观看| 国产精品久久久久久妇女| 国产日韩欧美一区二区三区四区| 成人高清电影网站| 成人性生活视频免费看| 免费观看成人av| 少妇毛片一区二区三区| 亚洲午夜精品17c| 国产又粗又大又爽| 中文字幕精品av| 欧美大胆性生话| 精品无码久久久久国产| 亚洲网站视频| 久久久久久无码精品人妻一区二区| 国产精品毛片久久久久久久| 天堂网视频在线| 亚洲美女性生活视频| 老色鬼在线视频| 国产一区精品视频| 在线观看日韩av电影| 久久无码专区国产精品s| 综合激情成人伊人| 97精品久久人人爽人人爽| 日韩在线中文字幕| 色8久久久久| 亚洲综合激情五月| 久久精品国产精品亚洲精品| 精品人妻中文无码av在线 | 日韩精品成人免费观看视频| 日韩黄色在线免费观看| 涩涩视频在线免费看| 久久大片网站| 性久久久久久| 粉嫩av蜜桃av蜜臀av| 色诱视频网站一区| 国产福利小视频在线观看| 国产精品高清在线| 欧美日韩性在线观看| 亚洲黄色小视频在线观看| 国产精品视频一区二区三区不卡| 一二三四区视频| 久久躁日日躁aaaaxxxx| 亚洲国产高清在线观看| 成年人网站国产| 99久久精品99国产精品| av图片在线观看| 中文字幕亚洲专区| 精品亚洲二区| 男人添女人下面高潮视频| 久久蜜桃av一区精品变态类天堂| 色老头在线视频| 久久精品国产久精国产思思| 午夜视频一区二区在线观看| 国产欧美日韩小视频| 久久久久久久网| 91精东传媒理伦片在线观看| 欧美精品免费在线| 极品束缚调教一区二区网站| 丰满人妻中伦妇伦精品app| 国产视频亚洲色图| 99久久国产免费| 91高清视频在线免费观看| 欧美色爱综合| 欧美熟妇精品一区二区| 日韩欧美中文免费| 五月婷婷在线观看| 国产区一区二区三区| 国产一级久久| 亚洲一区电影在线观看| 精品国产不卡一区二区三区| 欧美动物xxx| 在线观看三级网站| 91浏览器在线视频| 国产精品毛片一区视频播 | 久久三级毛片| 久久99久久久久久| 中文字幕av一区 二区| www.精品久久| 国产精品旅馆在线| 激情综合自拍| 黄色香蕉视频在线观看| 亚洲精品一区二区三区不| 日韩精品一区二区三区中文字幕| 青青青免费在线| 亚洲丝袜自拍清纯另类| 你懂得网站在线|