誰不用誰虧！Karpathy吹爆GPT-5：10分鐘編碼完勝Claude一小時，奧特曼秒回感謝

2025-09-08 08:53:00

GPT-5，一夜又成為了編碼圈的頂流。AI大牛Karpathy發(fā)文狂贊，Claude Code折騰一小時沒搞定的難題，GPT-5 Pro十分鐘就完成了，奧特曼秒回感謝。

GPT-5 Pro再次得到了AI大佬的認可。

今天，Karpathy一早激動發(fā)文，「必須再吹一波OpenAI的GPT-5 Pro，真的太強了」！

這究竟是腫么回事兒？

在工作流中，Karpathy遇到了一個棘手的問題，但Claude Code折騰了一個小時還是沒有搞定。

最后，他決定換GPT-5 Pro去跑，沒想到僅用十分鐘，就直出一個開箱即用的解決方案。

更有趣的是，他讓Claude看了GPT-5 Pro的解法，它居然寫了「兩段小作文」瘋狂夸贊。

最后，Karpathy還真誠地建議，「誰要是不把最刁鉆的問題交給GPT-5 Pro，簡直虧大了」。

在編碼PK的這一局中，GPT-5 Pro又上分了。

奧特曼立即感謝Karpathy，順便好奇地問了一句，「你是更希望它變得更聰明，還是跑得更快」？

OpenAI總裁Greg還不忘借此宣傳一波，「GPT-5 Pro就是編碼的下一代產(chǎn)品」。

當前，在編碼領域，每位開發(fā)者都有各自青睞的模型。

有的人喜歡Claude，有的人喜歡Gemini，還有的人更傾向于GPT-5/Codex，又或是Grok Code。

評論區(qū)，一位網(wǎng)友問Karpathy有沒有嘗試過grok-code-fast-1？

顯然沒有，不過已在他的計劃之中。每隔幾天，Karpathy就會把現(xiàn)有的工具輪著用一遍。

接下來，他再次談了自己使用OpenAI模型的感受——

說實話，大概三周前，我還覺得Codex在處理基準編輯和整體體驗上，還不如現(xiàn)在Claude Code好用。

不過單說GPT-5 Pro，目前確實甩別的模型好幾條街。

另一位網(wǎng)友稱，「AI模型互相贊賞彼此的工作成果，這才是未來感拉滿的巔峰時刻」！

在Karpathy看來，這是一個超強的評估方法，而且自己經(jīng)常這樣做。

讓所有模型都生成一段內(nèi)容，然后把所有結(jié)果混在一起，再讓每個模型去給所有內(nèi)容輸出排名。

一開始，比較令人擔心的是，AI會偏向自己的生成結(jié)果，但在Karpathy有限的測試中，事實并非如此。

這就好像是「生成-判別差距」的現(xiàn)實版演示——寫好內(nèi)容很難，但識別優(yōu)秀的東西容易多了，而且模型在這方面做的確實不錯。

沒想到，這一觀點，深得網(wǎng)友認同。

給GPT-5 Pro編碼好評的，可不止Karpathy一人。

一位開發(fā)者測試后，深刻感受到了GPT-5 Pro的強大。在大約6分鐘，一次性完成應用開發(fā)，能夠自由組合各種圖像、文本、箭頭等元素。

多輪交流后，GPT-5 Pro還能將SMILES轉(zhuǎn)換為ASCII的代碼。

HubSpot聯(lián)創(chuàng)也是非常認可GPT-5 Pro的實力，但OpenAI Codex的用戶體驗還沒有CC更友好，不過這一差距正在逐漸縮小。

今年5月，OpenAI正式推出了AI編程智能體Codex，這是一款專為軟件工程設計的模型。

最初，它是基于o3打造的codex-1模型提供能力。

自GPT-5發(fā)布后，Codex又集成了最新模型，性能一夜暴漲，吸引了不少開發(fā)者的使用。

兩天前，奧特曼曾官宣，過去兩周Codex使用量增長了大約10倍。

他還表示，內(nèi)部有一個非常高效的模型，能提供大量的使用量。

在PR競技場中，Codex實力最強，大幅超越了Devin、GitHub Copilot、Cursor Agent。

或許你根本無法想象，不用一行代碼，就能打造一個應用的感受。

一位Claude Code資深開發(fā)者，在嘗試Codex 48小時后，分別點評了它們的之間的差異：

這位開發(fā)者同樣認為，Codex在Claude遇到棘手問題上，以及編寫代碼方面表現(xiàn)良好。

不知，大家更傾向于哪個編碼模型？

責任編輯：張燕妮來源：新智元