精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

再見,Devin!基于GPT-4o,最強「AI工程師」Genie誕生

人工智能 新聞
AI編碼的桂冠又易主了,Genie超越Devin,成為了地表最強的「AI軟件工程師」,Genie不是一個編程助手,而是一個能夠自主思考的「同事」,與你并肩作戰。

不知道你還是否記得首個「AI程序員」Devin,由10枚IOI金牌在手的創業團隊Cognition AI開發,今年3月上線。

它由GPT-4提供后端支持,能以文本形式接收自然語言指令,并自主編寫代碼。

剛剛上線時,雖然效果沒法達到取代程序員,但依舊給人留下了深刻印象。

如今,5個月過去,「狂飆」的GenAI領域已然大不相同。不僅GPT-4迎來了下一代模型GPT-4o,新發布的Claude 3.5 Sonnet、Codestral等模型都在編碼方面性能優秀。

Devin的直接挑戰者,是初創公司Cosine開發的自主AI工程師Genie。

Cosine發布的報告顯示,在SWE-Bench中,Genie的得分為30.08%,輕松超越了分數為13.8%的Devin。

圖片

Cosine聯合創始人兼CEO Alistair Pullen表示:「(Genie)模型的能力不是一個基準測試分數能概括的:它從一開始就被訓練成像人類軟件工程師(SWE)一樣思考和行動。」

圖片

我很高興與大家分享,我們打造出了世界上最強的AI軟件工程師,在SWE-Bench上取得了30.08%的成績,領先于亞馬遜和Cognition。

由于CEO聲稱Genie可以像人類軟件工程師一樣思考和行動,網友調侃道,「你的意思是它不能和女人說話,如果你打電話給它,它就會出汗?」

圖片

Genie是什么?它能做什么?

和Devin類似,Genie也可以在人類工程師的指導下自主完成各種編碼任務,包括bug修復、功能構建、代碼重構,以及通過全面測試進行代碼驗證。

除了自主運行,Genie也可以與用戶協作。

目前Genie還處在內測階段,可以在官網注冊信息后申請試用。

圖片

博客地址:https://cosine.sh/blog/state-of-the-art

Cosine聲稱Genie可以模擬人類工程師的認知過程。

Pullen在博文中解釋說,「我的構想很簡單:讓它觀察人類工程師如何完成工作,并模仿這一過程。」

Genie生成的代碼存儲在用戶的GitHub repo中,這意味著Cosine不會保留副本,也不會有任何隨之而來的安全風險。

此外,Cosine的軟件平臺已經與Slack和系統通知集成,它可以像人類同事那樣,利用系統通知來提醒用戶、提出問題或標記問題。

「Genie還可以向用戶提出澄清性問題,并對其生成的Pull Request(拉取請求)的評論/意見做出回應」。

Pullen表示,「我們正試圖讓Genie表現得像同事一樣,因此讓該模型使用同事的渠道是最合理的。」

圖片

與OpenAI合作,用上最新GPT-4o

與許多依賴基礎模型并輔以少量工具的模型不同,Genie是通過一個專有流程開發出來的,其中包括訓練和微調來自OpenAI的模型。

Genie剛開始研發時,只能基于上下文窗口相對較小的模型進行微調,其范圍在16-32k token。

團隊在早期探索中發現,即使用超過1 億token的大型數據集,加上設計架構的優點和各種壓縮/分塊方法,也依舊受限于模型在特定時刻能表達的信息容量。唯一的方法是使用上下文窗口更大的模型。

幸運的是,不久之后他們就獲得了OpenAI長上下文模型的訪問權限,這成為了Genie能力的突破口。

Pullen向VentureBeat透露,「Genie(目前)是一個非通用的GPT-4o變體,OpenAI允許我們訪問并使用他們的模型進行訓練,作為實驗計劃的一部分。」

「該模型表現良好,我們也因此與OpenAI的微調團隊和工程領導層分享了我們的心得。這對我們來說是一個真正的轉折點,因為它說服了他們為我們的新技術投入資源和關注。」

雖然Cosine沒有說明具體型號,但OpenAI最近剛剛宣布了GPT-4o長輸出上下文模型的有限可用性,輸出長度可達64k token,相比最初的4k足足增加了16倍。

訓練數據是關鍵

Pullen在技術報告中寫道,在最近的訓練運行中,Genie接受了數十億token數據的訓練,選擇這些數據的組合是為了讓模型盡可能勝任當前用戶最關心的語言。

Genie的技術報告中列出了訓練數據包含的15種語言,Java、JS、C、C++、C#、Rust、Python等熱門語言,以及常用的Scala、Kotlin、Swift、PHP等也都全部涵蓋。

其中,JavaScript、Python、TypeScript和TSX是數據集中占比最多的語言,其余的占比均為3%。

圖片

Cosine的博文表示,團隊花了近一年的時間整理數據集,包括來自真實工程師的大量軟件開發活動。

獲取并有效利用這些數據是極其困難的,因為從本質上講,這些數據是不存在的。

他們的數據管道從追蹤軟件工程師的開發軌跡開始,收集pull request、commits、來自OSS存儲庫的issue(MIT許可)等數據。

之后在管道中運行這些數據,以取證方式導出推理過程,重建出人類是如何得到最終結論的。

圖片

數據集中各種任務類型的占比

這個專有數據集是第一版模型訓練的基礎,剩下的工作由自我對弈和自我改進完成。

Genie的自主性循環由四個主要過程組成:計劃、檢索、代碼編寫和代碼運行。這些本身并不新穎,但由于 Genie被訓練成像人類一樣執行任務,因此有了更大程度的改進。

「數據標注的影響不容低估,從有能力的軟件工程師那里獲得高質量的數據非常困難,但結果是值得的,因為它讓我們深入了解了開發人員不易被發現的解決問題的思考方式。」

該數據集不僅體現了完美的信息脈絡和漸進式知識發現,還捕捉到了人類工程師逐步決策的過程。

Pullen斷言,「通過使用這個數據集實際訓練我們的模型,而不是簡單地提示基礎模型(這是其他人正在做的事情),我們發現我們不再只是隨機生成代碼,而是像人類一樣處理問題。」

基準評估結果

模型開發過程中,團隊主要使用了兩個基準進行評估——SWE-Bench 和 HumanEval。

前者涵蓋的問題比較全面,包括分解問題、找到相關代碼、對代碼進行分類并實現可行解決方案;后者更專注于編寫代碼,沒有檢索方面的內容,并且對問題理解的強調較少。

然而,官方博客中僅披露了SWE-Bench分數,Genie取得30.08%的成績,SWE-Lite中為50.67%的分數。

其中,Genie在SWE-Bench的表現非常亮眼:這是迄今為止的最高分數,相比第二名的19.27%有超過10%的增幅。

圖片

此外,團隊還單獨測試了模型的信息檢索能力,特別是檢索所需代碼文件的正確部分的能力。

這是AI工程師的核心組件之一——如果模型不能可靠且熟練地找到正確的代碼進行編輯,那么編輯代碼的能力也無法得到充分發揮。

假設模型每次都能找到正確代碼,可以查看模型為完成任務查找了多少行代碼,以及實際找到的代碼行數,來簡單地衡量檢索能力。

測試中,Genie成功檢索到了142,338行中所需的91,475行代碼,得分為64.27%。這里顯然還有很大的改進空間,而且相較于分解問題能力,檢索能力是關注較少的一個方面。

背靠YC,華人牛津碩士帶隊

Cosine是通過硅谷著名的Y Combinator創業加速器成立的。

該公司是一個人類推理實驗室,專注于研究和整理人類執行任務的方式,旨在教會人工智能模仿、擅長并擴展這些任務。

2022年,Alistair Pullen、Sam Stenner和Yang Li聯合創立了Cosine,將其定位為人類推理實驗室。

他們希望從軟件工程領域開始,研究和整理人類執行任務的方式,從而教會AI模仿、擅長并擴展這些任務,推動智能的發展。

Cosine已從Uphonest和SOMA Capital募集到250萬美元種子資金,Lakestar、Focal等公司也參與了投資。

Cosine擁有一支規模不大但技術精湛的團隊,已經在人工智能領域取得了長足的進步,Genie只是一個開始。

Pullen在公告博文中表示,「我們真心相信,我們能夠為任何工作和行業重現人類推理。」

「軟件工程只是一個最直觀的起點,我們迫不及待地想向大家展示我們正在研究的其他一切。」

值得一提的是,在創始人團隊中,有一位華人面孔,Yang Li。

圖片

Li畢業于牛津大學社會學系,在2021年被評為福布斯30位30歲以下精英之一。

圖片

在創辦Cosine之前,他有過6段工作/創業經歷,其中包括美團摩拜單車業務的商務總監。

圖片

可以看到,在2022年以前,Yang Li以一年一跳的頻率不斷在產業界探索新機會。

現在,Yang Li推特的簡介上是這樣描述自己的:經歷了1 次IPO、2次收購和3家獨角獸。

1次IPO指的就是,將摩拜單車月活躍用戶數增長至2.2 億,直至550億美元的IPO。

Genie的未來

Pullen在給VentureBeat的郵件中透露了Genie可能采用的價格模式。早期階段,產品定價將分為兩個類型:

一是面向個人和小型團隊。與現有人工智能工具相比,價格具有競爭力,大約在20美元左右。這一級別的產品在功能和使用上會有一些限制。

二是面向企業。具有更多的功能,使用幾乎不受限制,并且能夠創建一個完美的人工智能同事、代碼專家。這一級別的價格將更高。

「我們一直在追逐一個夢想,那就是制造出一種能夠真正自動執行端到端編程任務、無需干預且高度可靠的人工同事。Genie正是實現這一夢想的第一步」,Pullen在Cosine的博客文章中寫道。

Genie的推出對軟件開發團隊具有深遠影響,尤其是那些希望提高生產率、減少日常工作時間的團隊。

憑借自主處理復雜編程挑戰的能力,Genie有可能改變工程資源的分配方式,讓團隊專注于更具戰略性的計劃。

Pullen寫道,「工程資源不再是制約因素的想法,對我來說是一個巨大的驅動力,尤其是在創辦公司之后。」

人工智能同事可以跳入一個未知的代碼庫,在比人類快數倍的時間內解決未知問題,其價值不言而喻,并將對世界產生巨大影響。

Cosine為Genie的未來發展制定了雄心勃勃的計劃。

「我們正在加速推進,通過Genie革新技術團隊。我們的主要目標是平衡實際產品與前沿研究。」

- 完善數據集以增強Genie的能力。通過拓寬數據并引入新功能,Genie將精通更多編程語言和最新框架,精準地滿足開發者的工作需求。

- 擴展其模型組合。包括用于簡單任務的小型模型和能夠處理更復雜挑戰的大型模型。利用獨特的數據集,將使Cosine能夠將任何最先進的基礎模型轉換為Genie模型。

- 將工作擴展到開源社區。比如,對一個領先的開源模型進行上下文擴展,并使用龐大的數據集進行預訓練。

- 使用特定代碼庫微調Genie。這是一項企業功能,能夠使Genie對大型、遺留代碼庫有完美的理解,即使這些代碼是用不太流行或專有的語言編寫的。

Pullen表示,隨著公司不斷完善Genie,將不斷向客戶發布更新,優化與這個人工同事的互動并收集有價值的反饋。

Li在推特中暢想,Cosine旨在將人類的推理能力編碼化,未來不再有過采樣,也不再有copilot。

圖片

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-08-14 09:13:28

2024-05-21 12:23:17

2024-06-05 08:29:35

2024-05-14 11:29:15

2024-11-28 15:51:19

GPT-4o微軟

2024-05-24 14:04:04

2025-01-06 13:15:02

2024-09-06 13:00:29

2025-04-08 02:26:00

2024-05-14 19:16:52

ChatGPTGPT-4oOpenAI

2025-04-15 08:01:12

2024-08-13 15:38:30

2025-08-07 14:05:40

OpenAI大模型開源

2024-06-27 12:45:30

2024-05-17 09:35:55

GPT-4o模型OpenAI

2025-07-23 09:32:02

2025-03-31 08:44:00

GPT-4o模型技術

2025-08-11 08:42:00

GPT-5AI模型

2025-05-26 09:05:00

2024-06-21 09:51:17

點贊
收藏

51CTO技術棧公眾號

97超碰国产精品| 成人天堂yy6080亚洲高清| 国产精品综合一区二区| 午夜精品视频在线| 高清国产在线观看| 中文字幕久久精品一区二区 | 精品国产污污免费网站入口| 国产亚洲综合视频| 岛国中文字幕在线| 久久一二三国产| 114国产精品久久免费观看| 国产黄色免费观看| 国内揄拍国内精品久久| 中文字幕欧美专区| 亚洲狠狠婷婷综合久久久久图片| 日韩成人一区| 色综合一个色综合| 无码人妻少妇伦在线电影| 爱爱爱免费视频在线观看| 丁香亚洲综合激情啪啪综合| 国产精品久久久久久婷婷天堂| 欧美毛片在线观看| 久久五月天小说| 亚洲欧美色图片| 亚洲精品第二页| www欧美在线观看| 欧美丝袜自拍制服另类| jizzjizz国产精品喷水| 欧洲一区二区三区| 中文字幕佐山爱一区二区免费| 日韩av高清| 亚洲欧美一区二区三| 国产成人8x视频一区二区| 国产剧情日韩欧美| 国产主播第一页| 裸体素人女欧美日韩| 97久久国产精品| 国产精品a成v人在线播放| 亚洲一区在线| 久久视频在线直播| 亚洲人做受高潮| 日韩在线精品| 日韩中文第一页| 亚洲一级理论片| 成人免费电影网址| 这里只有精品在线观看| 男女男精品视频网站| 欧美精品一二| 一色桃子一区二区| 国产视频不卡在线| 日韩欧美伦理| www国产精品视频| 黄色精品视频在线观看| 99精品视频在线观看免费播放| 中文字幕日韩视频| 亚洲一级二级片| 影视一区二区| 欧美大荫蒂xxx| 国语对白一区二区| 夜夜嗨av一区二区三区网站四季av| 欧美激情18p| 日韩精品视频播放| 国产麻豆综合| 国产精品国产自产拍高清av水多| 中文字幕xxxx| 精品在线免费视频| 91网站在线免费观看| 亚洲精品久久久久久久久久| 成人av网址在线观看| 久久精品丝袜高跟鞋| 黄色片视频在线观看| 欧美国产日韩一二三区| 中文字幕制服丝袜在线| 三级福利片在线观看| 午夜精品久久久久| 爆乳熟妇一区二区三区霸乳| 午夜精品久久久久久毛片| 欧美一区二区三区在线电影| 中文字幕人妻一区二区三区| 免费看成人吃奶视频在线| 日韩最新av在线| 麻豆亚洲av熟女国产一区二| 亚洲专区一区| 国产欧美日韩综合精品| 精品国产va久久久久久久| 99精品久久只有精品| 日韩欧美亚洲日产国产| 成人午夜在线影视| 欧美色视频日本高清在线观看| 天天影视综合色| 国产精品日本一区二区三区在线| 亚洲精品在线一区二区| 亚洲一二三精品| 国产精品mv在线观看| 国产成人综合亚洲| 亚洲AV无码国产精品午夜字幕 | 国产三级伦理在线| 91高清视频在线| 影音先锋资源av| 日韩精品永久网址| 91av在线不卡| 国产精品无码专区av免费播放| 成人avav影音| 潘金莲一级淫片aaaaaa播放1| 亚洲天堂免费电影| 欧美一级日韩免费不卡| 欧美成人国产精品一区二区| 欧美在线不卡| 国产精品久久久久久久久久久新郎| 国产手机视频在线| 国产日韩欧美高清在线| 国产www免费| 国产精品毛片无码| 在线丨暗呦小u女国产精品| 国产精品免费av一区二区| 国产一区二区三区蝌蚪| 日韩av电影免费在线观看| zzzwww在线看片免费| 91麻豆精品国产无毒不卡在线观看 | 黑人巨大精品| 亚洲国产美女久久久久| 欧美精品乱码视频一二专区| 九九视频精品免费| 日韩影院一区| 成人影院大全| 亚洲精品在线不卡| 国产成人在线观看网站| 成人免费视频网站在线观看| 99精品视频网站| 欧美a视频在线| 国产一级揄自揄精品视频| 婷婷激情五月网| www.在线成人| 欧美成人高潮一二区在线看| 日本精品一区二区三区在线观看视频| 亚洲最大在线视频| 无码人妻黑人中文字幕| 久久久久久久一区| 99蜜桃臀久久久欧美精品网站| 麻豆一区一区三区四区| 97在线视频精品| 午夜性色福利视频| 富二代精品短视频| 人妻丰满熟妇av无码久久洗澡 | 国产亚洲欧美日韩在线观看一区二区 | 妞干网免费在线视频| 精品国产3级a| 日韩美女一级片| www.久久精品| 精品免费国产一区二区| 国产亚洲精品美女久久久久久久久久| 国产成人精品一区二区在线| 国产色a在线| 欧美日韩视频在线一区二区| 老司机福利在线观看| 久久精品噜噜噜成人av农村| 亚洲视频欧美在线| 国产免费av国片精品草莓男男| 超碰精品一区二区三区乱码| av手机免费看| 午夜精品福利视频网站| 国产美女喷水视频| 日本中文字幕一区| 致1999电视剧免费观看策驰影院| 国产一区二区三区| 久久久久久久999精品视频| 天堂在线观看av| 日本高清不卡视频| 女性裸体视频网站| 从欧美一区二区三区| 久久精品国产精品亚洲色婷婷| 西野翔中文久久精品字幕| 国产精品夫妻激情| yellow91字幕网在线| 亚洲国产日韩精品在线| 成人黄色片在线观看| 亚洲日本成人在线观看| 男人网站在线观看| 日韩黄色在线观看| 国产激情片在线观看| 日本妇女一区| 91精品国产综合久久久久久久久| 少女频道在线观看免费播放电视剧| 亚洲精品成人久久| 一级特黄aaa大片| 亚洲高清久久久| youjizz亚洲女人| 国产成人日日夜夜| 玩弄japan白嫩少妇hd| 亚洲一区 二区 三区| 欧美xxxx黑人又粗又长密月 | 精品免费视频123区| 99久久er| 91精品国产91久久久久久| 中文字幕在线免费| 亚洲福利精品在线| 国产原创中文av| 色综合咪咪久久| 九九免费精品视频| 国产精品三级av| 国产熟妇搡bbbb搡bbbb| 国产一本一道久久香蕉| 亚洲最大综合网| 国产精品综合| 亚洲精品无码国产| 女人天堂亚洲aⅴ在线观看| 日本午夜精品电影| 欧美日韩另类图片| 91视频婷婷| 青青国产精品| 国产精品高潮呻吟久久av野狼| 成全电影大全在线观看| 久久在线精品视频| 免费黄网站在线| 亚洲日韩欧美视频| 无码国产精品一区二区免费16| 欧美一区二区三区视频在线| 伊人免费在线观看高清版| 黑人精品xxx一区| 91porn在线视频| 综合久久给合久久狠狠狠97色| 白白色免费视频| 久久一日本道色综合| 精品中文字幕在线播放| 国产69精品久久久久777| 天天色天天综合网| 久久黄色级2电影| 91蝌蚪视频在线观看| 久久高清免费观看| 中国丰满人妻videoshd| 99国产精品自拍| 激情伊人五月天| 亚洲精品韩国| 两根大肉大捧一进一出好爽视频| 亚洲电影在线| 亚洲国产精品无码观看久久| 影音国产精品| 日本中文字幕网址| 99精品久久| 日日摸日日碰夜夜爽av| 亚洲中午字幕| 国产精品天天av精麻传媒| 每日更新成人在线视频| 日韩视频在线免费看| 日韩和欧美一区二区三区| 国产精品第12页| 日韩av中文在线观看| 国产wwwxx| 紧缚奴在线一区二区三区| 国产传媒免费观看| 国产精品一区二区三区四区 | 国产欧美日韩中文久久| 亚洲一区视频在线播放| 中文字幕av不卡| av在线免费播放网址| 日韩理论片一区二区| 欧美色图亚洲天堂| 精品国产户外野外| 91在线视频免费播放| 欧美色网一区二区| 国产片在线播放| 精品日本一线二线三线不卡| 天天爱天天干天天操| 亚洲欧洲成视频免费观看| 国产视频福利在线| 欧美成人黄色小视频| 9999在线视频| 国产精品久久久久99| 精品一区二区三区中文字幕| 国产一区二区免费电影| 九色精品91| 黑人巨茎大战欧美白妇| 亚洲欧美日韩综合国产aⅴ| 99sesese| 成人综合在线网站| 欧洲美熟女乱又伦| 亚洲精品写真福利| 亚洲另类在线观看| 欧美精品乱人伦久久久久久| 免费观看a视频| 亚洲香蕉av在线一区二区三区| 成人短视频在线观看| 欧美一区二区三区艳史| 欧美综合社区国产| 九九九九九精品| 日韩欧美高清在线播放| 欧美成人三级在线视频| 精品写真视频在线观看| 午夜男人的天堂| 亚洲三级理论片| 日本高清不卡码| 91精品国产一区二区| 青青草视频在线免费观看| 久久亚洲影音av资源网| 精品国产免费人成网站| 99影视tv| 久久精品国产大片免费观看| 91成人在线观看喷潮教学| 精品一区二区三区在线观看国产 | 最新热久久免费视频| 中国一级免费毛片| 欧美日韩中文字幕精品| 色婷婷在线视频| 久久伊人色综合| 成人影院在线免费观看| 国产综合动作在线观看| 中文在线播放一区二区| 一区二区三区 欧美| av电影一区二区| 久久久久久久国产精品毛片| 欧美天堂一区二区三区| 免费在线国产| 久久久久日韩精品久久久男男| 日本午夜免费一区二区| 日韩成人av网站| 亚洲欧美日韩综合国产aⅴ| 亚洲国产精品第一页| 亚洲特黄一级片| 国产三级理论片| 伊人久久久久久久久久| 男人的天堂免费在线视频| 国产嫩草一区二区三区在线观看 | 91av俱乐部| 97精品久久久午夜一区二区三区 | 蜜臀av在线| 99久久国产免费免费| 88国产精品视频一区二区三区| 无码少妇一区二区三区芒果| 北条麻妃国产九九精品视频| 久久久久成人网站| 欧美一区二区三区免费大片| 91亚洲欧美| 国产九九精品视频| 99re6这里只有精品| 国产三级三级看三级| 中文字幕va一区二区三区| 男人天堂视频网| 亚洲一区av在线播放| 日韩在线观看不卡| 欧洲久久久久久| 美女视频黄 久久| 亚洲人与黑人屁股眼交| 在线播放一区二区三区| av网站大全在线| 成人综合av网| 亚洲精品一二| 91成人破解版| 欧美亚洲动漫制服丝袜| 欧美精品电影| 97超级在线观看免费高清完整版电视剧| 亚洲成人一区| 久草视频福利在线| 一本色道久久综合狠狠躁的推荐| 国产在线观看精品一区| 国产精品女视频| 天天操夜夜操国产精品| 波多野结衣中文字幕在线播放| 亚洲一区二区三区视频在线 | 伊人青青综合网站| 日本欧美在线| 韩日视频在线观看| 久久看人人爽人人| 亚洲视频一区在线播放| 毛片精品免费在线观看| 成人高潮a毛片免费观看网站| 无码中文字幕色专区| 国产日产精品一区| 国产毛片一区二区三区va在线| 久久99视频精品| 天堂俺去俺来也www久久婷婷 | 色屁屁影院www国产高清麻豆| 亚洲天堂av在线免费| 高清一区二区三区av| 亚洲 欧美 综合 另类 中字| 国产亚洲精品精华液| 国产欧美一级片| 欧美综合在线第二页| 国产韩日影视精品| 色综合久久五月| 欧美日韩国产一区二区三区地区| 99在线播放| 欧美日韩在线精品| 国产麻豆精品95视频| 成人毛片18女人毛片| 久久精品人人做人人爽| 欧美电影免费网站| 不卡中文字幕在线观看| 精品久久久久久中文字幕| 97人人在线| 精品伦理一区二区三区| 国产主播一区二区| 丰满人妻老熟妇伦人精品| 久久精品国产成人精品| 五月激激激综合网色播| 又色又爽又黄视频| 在线亚洲欧美专区二区| av影院在线免费观看| 午夜啪啪免费视频| 国产午夜精品久久| 三级网站在线看|