誰不用誰虧!Karpathy吹爆GPT-5:10分鐘編碼完勝Claude一小時,奧特曼秒回感謝
GPT-5 Pro再次得到了AI大佬的認可。
今天,Karpathy一早激動發(fā)文,「必須再吹一波OpenAI的GPT-5 Pro,真的太強了」!
這究竟是腫么回事兒?

在工作流中,Karpathy遇到了一個棘手的問題,但Claude Code折騰了一個小時還是沒有搞定。
最后,他決定換GPT-5 Pro去跑,沒想到僅用十分鐘,就直出一個開箱即用的解決方案。
更有趣的是,他讓Claude看了GPT-5 Pro的解法,它居然寫了「兩段小作文」瘋狂夸贊。

最后,Karpathy還真誠地建議,「誰要是不把最刁鉆的問題交給GPT-5 Pro,簡直虧大了」。
在編碼PK的這一局中,GPT-5 Pro又上分了。
奧特曼立即感謝Karpathy,順便好奇地問了一句,「你是更希望它變得更聰明,還是跑得更快」?

OpenAI總裁Greg還不忘借此宣傳一波,「GPT-5 Pro就是編碼的下一代產(chǎn)品」。

編碼王者之戰(zhàn) GPT-5 Pro上大分
當前,在編碼領域,每位開發(fā)者都有各自青睞的模型。
有的人喜歡Claude,有的人喜歡Gemini,還有的人更傾向于GPT-5/Codex,又或是Grok Code。
評論區(qū),一位網(wǎng)友問Karpathy有沒有嘗試過grok-code-fast-1?
顯然沒有,不過已在他的計劃之中。每隔幾天,Karpathy就會把現(xiàn)有的工具輪著用一遍。
接下來,他再次談了自己使用OpenAI模型的感受——
說實話,大概三周前,我還覺得Codex在處理基準編輯和整體體驗上,還不如現(xiàn)在Claude Code好用。
不過單說GPT-5 Pro,目前確實甩別的模型好幾條街。

另一位網(wǎng)友稱,「AI模型互相贊賞彼此的工作成果,這才是未來感拉滿的巔峰時刻」!
在Karpathy看來,這是一個超強的評估方法,而且自己經(jīng)常這樣做。
讓所有模型都生成一段內(nèi)容,然后把所有結(jié)果混在一起,再讓每個模型去給所有內(nèi)容輸出排名。
一開始,比較令人擔心的是,AI會偏向自己的生成結(jié)果,但在Karpathy有限的測試中,事實并非如此。
這就好像是「生成-判別差距」的現(xiàn)實版演示——寫好內(nèi)容很難,但識別優(yōu)秀的東西容易多了,而且模型在這方面做的確實不錯。

沒想到,這一觀點,深得網(wǎng)友認同。

給GPT-5 Pro編碼好評的,可不止Karpathy一人。
一位開發(fā)者測試后,深刻感受到了GPT-5 Pro的強大。在大約6分鐘,一次性完成應用開發(fā),能夠自由組合各種圖像、文本、箭頭等元素。
多輪交流后,GPT-5 Pro還能將SMILES轉(zhuǎn)換為ASCII的代碼。

HubSpot聯(lián)創(chuàng)也是非常認可GPT-5 Pro的實力,但OpenAI Codex的用戶體驗還沒有CC更友好,不過這一差距正在逐漸縮小。

半個月 使用量暴增10倍
今年5月,OpenAI正式推出了AI編程智能體Codex,這是一款專為軟件工程設計的模型。
最初,它是基于o3打造的codex-1模型提供能力。

自GPT-5發(fā)布后,Codex又集成了最新模型,性能一夜暴漲,吸引了不少開發(fā)者的使用。
兩天前,奧特曼曾官宣,過去兩周Codex使用量增長了大約10倍。

他還表示,內(nèi)部有一個非常高效的模型,能提供大量的使用量。

在PR競技場中,Codex實力最強,大幅超越了Devin、GitHub Copilot、Cursor Agent。
或許你根本無法想象,不用一行代碼,就能打造一個應用的感受。


一位Claude Code資深開發(fā)者,在嘗試Codex 48小時后,分別點評了它們的之間的差異:

這位開發(fā)者同樣認為,Codex在Claude遇到棘手問題上,以及編寫代碼方面表現(xiàn)良好。

不知,大家更傾向于哪個編碼模型?





























