精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

世界首個AI程序員Devin視頻竟造假?博主逐幀解析,Devin代碼任務(wù)完成很糟糕

人工智能 新聞
全球首個AI程序員Devin被爆視頻造假?YouTube博主近日揭露了背后明星初創(chuàng)公司Cognition的謊言,通過逐幀分析發(fā)現(xiàn),Devin并不能獨立完成Upwork工作。

全網(wǎng)爆火的世界首個AI程序員Devin,如今被爆出視頻竟是作假?

最近,一位有35年軟件工程師經(jīng)驗的YouTube博主去逐幀復(fù)現(xiàn)了,Devin完成Upwork任務(wù)的宣傳視頻。

卻意外發(fā)現(xiàn),AI并不能像人類工程師一樣完成任務(wù),而且非常糟糕。

圖片

他將25分鐘「揭穿Devin的謊言」視頻公開后,一時間引爆全網(wǎng)并在HN、Reddit等社交平臺上掀起軒然大波。

圖片

更有意思的是,博主自己復(fù)制了Devin嘗試做的任務(wù),花費了大約36分鐘。

然而,Devin用了至少6個小時,甚至可能超過一天。

圖片

有網(wǎng)友表示,「正如博主詳細解釋的那樣,盡管其試圖在演示中暗示,Devin并不能獨立完成Upwork的工作。它正在創(chuàng)建混亂、過于復(fù)雜的代碼」。

圖片

也有人認為,Devin從誕生之初,就更多的是營銷和炒作,而不是現(xiàn)實。

圖片

說來,Devin視頻真的是作假了嗎?

逐幀分析,揭穿Devin的謊言

Devin發(fā)布之初,背后初創(chuàng)公司Cognition AI更新的官方博文中,通過七個視頻介紹了這一AI的「魔力」。

其中,一個視頻是,讓Devin自主完成了全球最大的綜合類自由職業(yè)平臺Upwork的一項任務(wù)。

當時,網(wǎng)友看后驚訝地表示,沒想到AI智能體都可以做副業(yè)了。

Cognition的開發(fā)者You挑選了一項「用計算機視覺模型做推理」的工作,具體要求是:

- 我希望利用該資源庫中的模型進行推斷。(https://github.com/mahdi65/roadDamageDetection2020)

- 您的交付成果將是關(guān)于如何在AWS的EC2實例中進行操作的詳細說明。

- 請?zhí)峁┠瓿蛇@項工作的評估報告。我不會回復(fù)沒有評估的報告。

圖片

如下是Devin在官方視頻中,完成任務(wù)的表現(xiàn)。

接下來,一起看下YouTube博主如何逐幀分析,Devin在真正實操中的能力。

博主稱,我們首先看到Devin并不是能做Upwork上的任何工作,而是在這項任務(wù)中,研究者精心挑選了「road damage」任務(wù)。

當然,這并非說Devin就是欺騙性的,而是代表其在別的任務(wù)中的表現(xiàn),一定要比這個差。

圖片

然后,在實際對話中,開發(fā)者You向Devin提出的要求如下,「我想用這個儲存庫中的模型進行推理,請弄清楚」。

值得注意的是,客戶的要求是「你需要在亞馬遜EC2實例中提交這一操作的詳細說明」,與開發(fā)者提出要求顯然不同。

圖片

然而,根據(jù)Devin的視頻末尾,實際上它并沒有按照客戶要求完成工作。

在博主看來,完成這項任務(wù)之前,你需要明確怎樣開始這項工作。

這就需要向客戶詢問:

- 實例的大小,類型

- 是更傾向于一個運行更快但成本更高的實例,還是一個更經(jīng)濟但運行較慢的實例?

- 這個系統(tǒng)需要持續(xù)在線嗎?

......

如何處理自己需要進行推理分析的資料/圖片?你將怎樣把這些上傳到服務(wù)器?

比如,可以建立一個網(wǎng)頁界面來處理,也可以通過SSH上傳,或者放在S3 bucket里。那輸出結(jié)果的訪問方式又是怎樣的呢?

這些都是你必須了解的問題。

總而言之,博主稱,這也是我之前視頻里提到的,軟件開發(fā)者的工作中最難的、最關(guān)鍵的、最耗時的一部分:

主要是與客戶、領(lǐng)導(dǎo)及其他利益相關(guān)者的溝通。

這些都是 AI 目前無法完成的任務(wù),而這些恰恰是我們所做的非常重要的事情。

Devin實際上做了什么?

如下是視頻中的一個截圖,提到了一個Repo。

這是一個名為 requirements.txt 的文件,它規(guī)定了代碼的依賴庫版本。

不過,這個代碼庫最初依賴的一些庫是四年前的版本,而現(xiàn)在其中一些庫已經(jīng)不再提供下載,所以不得不進行修改。

再此,視頻中提到了Devin更新了代碼。博主表示,「Devin能夠做到這一點確實令人贊嘆」。

與客戶的要求相比,他們基本上希望建立自己的推理能力。

Devin被告知只使用樣例數(shù)據(jù)就可以,因此這正是博主復(fù)現(xiàn)Devin操作時所做的。

Devin很早就遇到了一個錯誤,這是一個命令行錯誤:

在頂部,遇到了與打開圖像、文件未找到、無此文件或目錄相關(guān)的錯誤。

這個錯誤出現(xiàn)在一個名為visualize_detections.py的代碼文件中。博主稱自己并沒有遇到這一問題,是因為在代碼庫中不存在名為visualize_detections.py的文件。

回到命令行,如果放大窗口的其他部分,便會看到,Devin將一些內(nèi)容寫入一個名為inspect_results.py的文件中,接著運行Python執(zhí)行這個文件,結(jié)果出現(xiàn)了語法錯誤。

在Python文件中使用/n是不行,而且echo命令也不該這么使用。這整個過程都是錯誤的毫無意義。

Devin在創(chuàng)建這些含錯誤的文件后,又進行了修正。視頻中提到,Devin實際上是在進行打印行調(diào)試。這是一個很常見的做法,很多人都會用到。

評論里說,「Devin正在添加代碼,追蹤數(shù)據(jù)流直至徹底理解」。

博主對此懷疑道,我不相信Devin真的能理解任何事物。

放大觀察這一部分,可以看到一個奇特的循環(huán)。它正在讀取一個文件,并把數(shù)據(jù)讀入一個緩沖區(qū)。這是update_image_ids.py文件。

再次說明,這個文件在客戶要求使用的代碼倉庫中不存在。

實際上,博主在GitHub上搜索了所有可能的位置,只有2處存在帶有這個名稱的文件。

屏幕上顯示三個的原因是,其中一個是另一個的分支版本,它們與Devin正在使用的文件完全不同。

但問題在于Devin此處正在調(diào)試一個自己創(chuàng)建的文件,而這個文件完全不在項目代碼倉庫中,非常不妥。

其實,Devin并不是在修正自己在網(wǎng)上發(fā)現(xiàn)的代碼,也不是在處理客戶指定的問題代碼,而是在修正自己生成的錯誤代碼。

更糟糕的是,這樣做并無必要。這是那個代碼庫中的readme文件。

該庫中有一個名為infer.py的文件,正如視頻中Devin所做的那樣。

readme文件說明了其功能及使用方法。在右側(cè),甚至還有一個小按鈕,可以復(fù)制整條命令,粘貼至命令行窗口,然后按下回車。

博主認為開發(fā)這個「檢測道路損壞」的代碼倉庫的人已經(jīng)盡可能地簡化了使用說明,但Devin似乎還是沒能理解。

因此,Devin不得不自己創(chuàng)建了一個混亂的項目。

正如Devin正在發(fā)現(xiàn)的,復(fù)雜,難以處理,很容易出現(xiàn)小錯誤,這樣的代碼很難調(diào)試。

半小時復(fù)現(xiàn),AI卻用了6小時

接下來,博主計劃自己去復(fù)現(xiàn)Devin嘗試做的任務(wù)。

他表示,自己用了大約36分的時間,完成所做的事。

下一張幻燈片中,實際上有一個需要修復(fù)的錯誤,在名為dataset.py的文件第33行。

問題是torch模塊缺少一個名為underscore six的屬性。

博主在谷歌上搜索了這個問題,找到了GitHub上的一個相關(guān)評論。

他按照該評論中的建議修改了代碼行,這樣確實解決了問題。

「解決這個問題總共花了我大約一分鐘七秒的時間,只需這么短的時間我就修正了錯誤。這只是一個快速的谷歌搜索而已」。

以下是博主所做的修改的具體內(nèi)容,這是最初狀態(tài)和最后狀態(tài)之間的差異。

這是requirements.txt文件的一處修改,最開始使用的是torch 1.4.0版本,博主使用了最新版本的torch 2.2.2。

然后在右邊,這是Devin視頻中的最后一屏,左邊是我的視頻,也就是最后的輸出。

它們兩個大同小異。博主的框是黃色的,Devin是紅色的。

根據(jù)Devin官方視頻中時間,從最初2024年3月9日3:25pm開始,一直到9:41pm完成,中間經(jīng)歷了6個小時。

圖片

最后再看下,Devin完成工作的效果及其評價。

為了復(fù)制Devin的結(jié)果,博主只需要在云實例上設(shè)置合適硬件的環(huán)境,并實際運行兩個帶有正確路徑的命令。

這些東西看起來就像Devin做了很多工作,完成了很多任務(wù)。

然而,只要你設(shè)置好環(huán)境,實際上你只需要運行2個命令。些代碼修正全都無關(guān)緊要,因為它們都是 Devin 自生成的代碼。

在視頻的最后,研究者You表示Devin做得好。而實際上,Devin完成的任務(wù)對于AI來說的確很酷。

AI程序員,全網(wǎng)沸騰

3月初,還記得Devin發(fā)布時,全網(wǎng)都在瘋轉(zhuǎn)這個AI。

在SWE-bench基準測試中,它的表現(xiàn)遠遠超過Claude 2、Llama、GPT-4等選手,取得了13.86%的驚人成績!

它不僅能自主學(xué)習(xí)不熟悉的技術(shù),端到端地構(gòu)建和部署應(yīng)用程序,自己改bug,甚至還能訓(xùn)練和微調(diào)自己的AI模型!

網(wǎng)友紛紛恐慌,Devin會偷走我們的工作嗎?難道程序員真的不存在了?!

圖片

甚至,背后十人初創(chuàng)團隊的勵志故事也被人挖了出來。

核心創(chuàng)始人首席執(zhí)行官Scott Wu,以及弟弟Neal Wu等人共攬收十枚IOI金牌。

圖片

也就不到一個月的時間,各種AI程序員相繼誕生。

比如,普林斯頓團隊提出的SWE-agent,可以在真實的GitHub倉庫里修bug,還有OpenDevin,Devika開源項目。

圖片

不過,關(guān)于AI程序員能否解決真實問題的能力,卻是還應(yīng)該持有保留態(tài)度。

因為,即便是借助了GPT-4 Turbo的能力,AI也并非是萬能的。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2024-03-18 09:26:15

微軟AI

2024-03-19 09:29:32

AI程序員

2024-04-07 00:00:02

AI程序員開發(fā)

2024-12-04 13:25:46

2024-03-18 06:55:51

DevinAI程序員人工智能

2024-04-03 12:18:45

AI訓(xùn)練

2025-01-24 12:49:55

AI開發(fā)工具視頻

2017-11-14 21:30:15

2018-12-29 14:45:34

RESTfulGoogleUser

2012-07-10 11:31:37

OpenFlowSDN

2015-08-31 10:14:30

程序員處理代碼糟糕代碼

2015-09-01 11:20:58

程序員糟糕代碼

2015-08-19 08:51:38

程序員面試糟糕

2024-06-03 12:03:56

2012-08-29 15:49:50

2024-03-18 09:15:31

2025-07-21 09:03:00

模型AI訓(xùn)練

2013-06-14 11:16:14

2021-11-01 22:39:14

程序員專業(yè)技術(shù)

2024-03-21 14:16:28

AGI人工智能馬斯克
點贊
收藏

51CTO技術(shù)棧公眾號

精品人妻一区二区三区香蕉| 欧美一区二区综合| 三级影片在线看| eeuss鲁片一区二区三区| 亚洲成人tv网| 亚洲精品国产一区| 99久久精品免费看国产交换| 国产一区清纯| 亚洲欧美日韩国产中文| 手机版av在线| 草草在线观看| 国产精品国产自产拍在线| 69174成人网| 岛国av中文字幕| 久久久久免费av| 日韩精品一二三四区| 无尽裸体动漫2d在线观看| 1区2区3区在线| 综合在线观看色| 九色综合婷婷综合| 国产视频手机在线| 久久最新视频| 久久久久久久久久久人体| 超碰97av在线| 亚洲免费专区| 精品人在线二区三区| 国产一二三区av| 日本黄色免费在线| 一区二区理论电影在线观看| 日韩欧美第二区在线观看| 欧美 日韩 人妻 高清 中文| 久久精品国产一区二区| 97国产suv精品一区二区62| www成人啪啪18软件| 欧美大胆视频| 欧美一区二区在线观看| 自慰无码一区二区三区| 欧美a免费在线| 91美女视频网站| 亚洲bt天天射| 国产精品国产精品国产| 残酷重口调教一区二区| 欧美成人a∨高清免费观看| 久热免费在线观看| www555久久| 中文字幕亚洲一区二区av在线 | 伊人久久国产| 亚洲欧美乱综合| 欧美精品亚洲精品| 国产18精品乱码免费看| 久久精品国产秦先生| 日本高清+成人网在线观看| 国产在线一区视频| 欧美一区二区三区另类| 在线亚洲欧美视频| a级片在线观看| 色老板在线视频一区二区| 91精品国产综合久久香蕉的特点 | 欧美亚洲日本在线| 欧美成人激情| 最近2019年日本中文免费字幕| 亚洲av片不卡无码久久| 国产伦精品一区二区三区在线播放 | 高h震动喷水双性1v1| 精品一区二区三区免费观看| 国产成人精品一区二区在线| 五月天婷婷激情| 日韩午夜激情| 高清一区二区三区日本久| 成人做爰视频网站| 综合久久99| 美女视频久久黄| 欧美三根一起进三p| 亚洲精品一区二区在线看| 日韩中文字幕在线视频| 一本一本久久a久久| 成人三级视频| 色哟哟网站入口亚洲精品| 免费在线观看a视频| 日本一区二区高清不卡| 在线中文字幕日韩| 少妇的滋味中文字幕bd| 色777狠狠狠综合伊人| 中文字幕久热精品在线视频| 欧美性生给视频| 亚洲国产精品成人| 欧美久久久精品| 欧美色图亚洲视频| 亚洲日本激情| 久久久久成人精品| 久久亚洲av午夜福利精品一区| 午夜精品偷拍| 97人人爽人人喊人人模波多| 中文字幕亚洲高清| 日本va欧美va瓶| 国产有码在线一区二区视频| 99热这里只有精品99| 成人午夜电影网站| 美女主播视频一区| 99精品老司机免费视频| 《视频一区视频二区| 国产免费内射又粗又爽密桃视频| h片在线观看| 在线中文字幕不卡| 久久发布国产伦子伦精品| 影音先锋欧美激情| 亚洲美女www午夜| 在线观看天堂av| 欧美日韩午夜| 人九九综合九九宗合| 一二三区免费视频| 国产精品88av| 欧美三日本三级少妇三99| 好了av在线| 精品国产91乱高清在线观看 | 19禁羞羞电影院在线观看| 欧美日韩中文字幕综合视频| 蜜臀av免费观看| xxxxxhd亚洲人hd| 国产亚洲xxx| 国产精品九九九九九九| 久久综合婷婷| 高清一区二区三区视频| 国产美女视频一区二区三区| 亚洲综合色婷婷| 超碰在线97免费| 99久久婷婷国产综合精品青牛牛 | 国产偷人妻精品一区| 99精品在线观看| 992tv成人免费影院| 一级全黄裸体免费视频| 91在线视频网址| 中国黄色录像片| 色是在线视频| 欧美视频一二三区| 精品少妇一区二区三区免费观| 久久久久久久久丰满| 日韩av理论片| 天天操天天干天天爽| 亚洲丝袜美腿综合| 欧美黑人又粗又大又爽免费| 北条麻妃一区二区三区在线观看| 最新91在线视频| 日本熟女毛茸茸| 国产v综合v亚洲欧| av不卡在线免费观看| 向日葵视频成人app网址| 亚洲精品ady| 久久黄色免费网站| 国内精品写真在线观看| 日本免费高清一区| 中文在线а√在线8| 亚洲国产精彩中文乱码av| 麻豆明星ai换脸视频| 老色鬼精品视频在线观看播放| 国产精品青青草| 四虎久久免费| 欧美性猛交丰臀xxxxx网站| a视频免费观看| 国产毛片一区| 精品午夜一区二区| 欧美gv在线| 日韩成人网免费视频| 久久久久久免费观看| 国产精品自拍一区| 亚洲黄色网址在线观看| 精品国产一区二| 久久在线免费视频| 国产又粗又猛又爽又黄的视频一| 中文字幕欧美日韩一区| 日韩一级免费在线观看| 国产成人影院| 国产精品久久久久久超碰| 国产视频二区在线观看| 欧美日韩一区二区在线视频| 在线观看国产精品一区| 日韩激情视频网站| 一本久久a久久精品vr综合| 性高爱久久久久久久久| 精品视频久久久| 日韩精品人妻中文字幕| 91女人视频在线观看| 91福利国产成人精品播放| 无码一区二区三区视频| 成人欧美一区二区三区黑人免费| 妞干网免费在线视频| 亚洲精品自在久久| 日本妇乱大交xxxxx| 国产精品美女久久久久久久网站| 一区二区三区欧美精品| 欧美久久99| 精品综合在线| 性欧美18一19sex性欧美| 久久精品免费电影| 欧美一级做性受免费大片免费| 色噜噜夜夜夜综合网| 超碰人人人人人人人| 成熟亚洲日本毛茸茸凸凹| 欧美日韩黄色一级片| 欧美影院三区| 国产欧美欧洲| 国产综合色区在线观看| 欧美精品免费在线观看| 亚洲色图狠狠干| 欧美日韩免费视频| 久久国产精品波多野结衣av| 久久久久久久免费视频了| 亚洲美女性囗交| 伊人久久大香线蕉综合热线 | 欧美精品一区二区三区国产精品 | 亚洲国产精品成人一区二区| 中文字幕在线字幕中文| 国产日韩欧美制服另类| 日韩欧美中文在线视频| 久久99伊人| 国产精品一二三在线观看| 亚洲精品一级二级三级| 91亚洲永久免费精品| 中文字幕在线直播| 久久精品久久久久| 亚洲日本在线播放| 91精品国产综合久久国产大片 | 成人在线免费电影| 欧美成人高清电影在线| 国产精品成人久久久| 亚洲一区二区三区视频在线| 国产国语性生话播放| 久久精品久久99精品久久| 人妻少妇被粗大爽9797pw| 欧美一区二区三区免费看| 欧美一区2区三区4区公司二百 | 国产视色精品亚洲一区二区| 久久电影天堂| 欧美重口另类videos人妖| 精品国产99久久久久久| 一个人看的www久久| 成人毛片在线精品国产| 在线播放/欧美激情| 午夜影院免费在线观看| 亚洲成av人综合在线观看| 男人的天堂久久久| 国产精品视频线看| 日韩乱码人妻无码中文字幕久久| 国产91在线观看丝袜| 午夜视频在线网站| 日韩高清一区在线| 99蜜桃臀久久久欧美精品网站| 亚洲欧洲美洲一区二区三区| 欧美精品一区二区三区在线四季| 66精品视频在线观看| 国产在线精品自拍| www.久久| 国产精品久久久久久久久久新婚| 日本不卡免费高清视频在线| 欧美精品久久久久久久久| 日韩少妇视频| 欧美成人免费播放| 日本不卡不卡| 视频直播国产精品| av色图一区| 亚洲精品一区二区三区婷婷月| 亚洲 国产 欧美 日韩| 欧美精品一区二区蜜臀亚洲| www.av在线.com| 日韩欧美的一区| 成人av手机在线| 日韩三级免费观看| 国产高清免费观看| 日韩精品一区二区三区四区视频| 国产又粗又黄又爽| 欧美一区二区三区喷汁尤物| 在线播放亚洲精品| 欧美裸体一区二区三区| 国产美女www爽爽爽视频| 欧美日韩亚洲综合在线| 91久久国语露脸精品国产高跟| 欧美日韩亚洲国产综合| 在线免费看av片| 欧美电影一区二区| 性生活免费网站| 亚洲第一精品久久忘忧草社区| 黄色三级网站在线观看| 亚洲国产成人精品久久| 深夜福利免费在线观看| 亚洲欧美综合区自拍另类| 成人18在线| 欧美刺激性大交免费视频| 182在线视频观看| 日本亚洲欧洲色| 日韩av一级| 亚洲综合国产精品| 久久精品色播| 日本视频精品一区| 亚洲大全视频| 隔壁人妻偷人bd中字| 美女黄色成人网| 91极品视频在线观看| 国产乱子轮精品视频| 伊人网综合视频| 中文在线一区二区| 欧美国产在线看| 大荫蒂欧美视频另类xxxx| 精品国产青草久久久久96| 日韩你懂的在线观看| 欧洲毛片在线| 中文字幕亚洲一区二区三区| 国产盗摄在线视频网站| 日本电影亚洲天堂| 精品久久国产一区| 久久久久久欧美精品色一二三四| av在线不卡顿| 男女日批视频在线观看| 视频一区国产视频| 中文字幕一二三区| 久久这里只有精品6| 国产十六处破外女视频| 色噜噜狠狠成人网p站| 五月婷婷丁香在线| 亚洲成人久久一区| 一广人看www在线观看免费视频| 久久久久久九九九| 日韩国产激情| 国产 高清 精品 在线 a| av一区二区高清| 日韩av综合在线观看| 经典三级在线一区| 亚洲一区二区自偷自拍 | 日韩在线观看视频一区二区| 欧美色视频日本版| 亚洲va欧美va| 日韩在线不卡视频| 欧美一区国产| 国产日本一区二区三区| 国产aⅴ精品一区二区三区久久| 日韩视频免费播放| 国产一区二区毛片| 国产毛片欧美毛片久久久| 精品国产精品自拍| 亚洲欧美另类一区| 久久影视电视剧免费网站| 亚洲www啪成人一区二区| 韩国成人一区| 狠狠色综合网| 污污的视频免费观看| 久久久久久久精| 九九热精品视频在线| 精品国产91洋老外米糕| 黄色精品免费看| 成人h猎奇视频网站| 国产尤物久久久| av免费观看网| 99久久婷婷国产精品综合| av激情在线观看| 欧美成人精品3d动漫h| 尤物视频在线看| 1区1区3区4区产品乱码芒果精品| 一区二区视频在线免费观看| 日本不卡的三区四区五区| 毛茸茸free性熟hd| 亚洲综合丁香婷婷六月香| 男人天堂一区二区| 久久久久久亚洲精品中文字幕| 亚洲国产精品免费视频| 狠狠干视频网站| 国产精品自拍在线| 国产女人18水真多毛片18精品| 欧美www视频| 韩国精品一区| 免费成人在线观看av| 夜久久久久久| 少妇精品一区二区| 91国模大尺度私拍在线视频| 精品资源在线看| 国产91|九色| 久久国产精品成人免费观看的软件| jizz欧美激情18| 国产精品久久久久9999吃药| ,一级淫片a看免费| 另类少妇人与禽zozz0性伦| 欧美黄色一级| www.avtt| 成人短视频下载| 日韩精品一区二区在线播放 | 性无码专区无码| 亚洲视频视频在线| 欧美成人精品一区二区男人小说| 久久综合九色综合久99| 青青国产91久久久久久| www.黄色com| 日韩欧美国产wwwww| 草草视频在线| 日韩精品一区二区三区丰满| 九九九久久久精品| 精品自拍偷拍视频| 亚洲免费福利视频| 亚洲tv在线| 国产午夜福利100集发布| 国产欧美一区视频| 亚洲大尺度网站| 国产精品国产三级国产专播精品人|