OpenAI員工爆料：已搶先體驗(yàn)GPT-5！7月上線，疑似完全多模態(tài)

作者：新智元 2025-06-27 15:48:34

GPT-5，已經(jīng)被OpenAI員工搶先用上了？就在今天，奧特曼在X上關(guān)注了一個(gè)神秘人，引起全網(wǎng)猜測(cè)。不止兩人爆料，自己可能提前體驗(yàn)了GPT-5，甚至也有網(wǎng)友疑似被灰度測(cè)試到了。今夏推出的GPT-5，已經(jīng)掀起全網(wǎng)瘋狂！

就在今天，關(guān)于GPT-5的討論再度火了，X上的神秘爆料滿天飛。

起因是這樣的，Sam Altman在X上關(guān)注了了一個(gè)叫Yacine的人。

這個(gè)人說(shuō)，自己剛剛試用了一個(gè)AI公司的大模型，體驗(yàn)非常震撼。他敢打賭，沒(méi)有任何人能預(yù)料到前方即將來(lái)臨什么樣的風(fēng)暴。

而另一位「Aidan」，也在這個(gè)帖子下面發(fā)言說(shuō)，自己有同樣的經(jīng)歷。

圖片

很多人猜測(cè)，他們測(cè)試的就是GPT-5。

原因在于，Aidan就是OpenAI的員工，而Yacine剛剛被xAI解雇，卻忽然被奧特曼關(guān)注了，兩人同時(shí)這樣說(shuō)，絕對(duì)不是巧合。

有很大可能，他們已經(jīng)提前獲得了GPT-5的訪問(wèn)權(quán)限。

圖片

甚至，他們看到的東西一定非常驚人，這可能就是互聯(lián)網(wǎng)崩潰的前一刻。

另外還有知情人表示，Yacine一直在考慮創(chuàng)辦一家初創(chuàng)公司，現(xiàn)在Altman關(guān)注了他，或許是打算挖他到OpenAI？

圖片

總之，如今全網(wǎng)再次陷入討論GPT-5的熱潮。

1.GPT-5，已開(kāi)始灰度測(cè)試？

其實(shí)不怪網(wǎng)友多心，因?yàn)橛性絹?lái)越多的人，曬出了自己似乎被灰度測(cè)試GPT-5的經(jīng)歷。

比如這位網(wǎng)友，發(fā)現(xiàn)自己在使用OpenAI的模型時(shí)，被灰度到了一個(gè)全新的AI。

在沒(méi)有提示的情況下，它就可以連續(xù)思考3分鐘，同時(shí)還進(jìn)行了大量搜索。

圖片

同樣也是在26號(hào)，另一位網(wǎng)友發(fā)現(xiàn)，如果選擇的模型是4o，ChatGPT會(huì)開(kāi)始思考。這就讓人懷疑，OpenAI是不是正在悄悄過(guò)渡到GPT-5。

圖片

GPT-5今年夏天發(fā)布

此前在OpenAI播客中，奧特曼對(duì)于GPT-5的發(fā)布時(shí)間已經(jīng)比較確定了——「可能是今年夏天的某個(gè)時(shí)候」。

圖片

而在一周前，奧特曼也出現(xiàn)在了YC在舊金山舉辦的AI創(chuàng)業(yè)學(xué)校活動(dòng)中。

圖片

在采訪中他這樣透露：GPT-5會(huì)邁向完全多模態(tài)！

具體來(lái)說(shuō)，預(yù)計(jì)今年夏天推出的GPT-5，是一個(gè)多模態(tài)模型，支持語(yǔ)音、圖像、代碼和視頻等多種輸入方式。

GPT-5不會(huì)完全實(shí)現(xiàn)OpenAI對(duì)未來(lái)模型的終極愿景，但將是過(guò)程中的重要一步。

而GPT-5系列模型的最終愿景，就是一個(gè)完全多模態(tài)的集成模型。

它將具備深度推理能力，能進(jìn)行深入研究，生成實(shí)時(shí)視頻，以及編寫大量代碼，即時(shí)為用戶創(chuàng)建全新的應(yīng)用程序，甚至渲染提供用戶交互的實(shí)時(shí)視頻。

當(dāng)這一切實(shí)現(xiàn)時(shí)，將帶來(lái)一種全新的計(jì)算機(jī)界面——幾乎「消失」，變得無(wú)感。

再早些時(shí)候，在今年2月，奧特曼還曾在X上發(fā)文表示，OpenAI的一大目標(biāo)，就是通過(guò)創(chuàng)建能使用所有工具、知道何時(shí)長(zhǎng)時(shí)間思考或不思考的系統(tǒng)，來(lái)統(tǒng)一o系列和GPT系列模型，使其勝任廣泛任務(wù)。

GPT-5模型將在ChatGPT和API中發(fā)布，整合語(yǔ)音、canvas、搜索、Deep Research等功能。

圖片

對(duì)于GPT-5，網(wǎng)友們也有諸多預(yù)測(cè)，有很多人覺(jué)得，它將成為首個(gè)真正的混合模型，可以在響應(yīng)過(guò)程中在推理和非推理之間動(dòng)態(tài)切換。

圖片

總結(jié)來(lái)說(shuō)，它的關(guān)鍵特點(diǎn)是多模態(tài)、100萬(wàn)token的上下文、推理+記憶、更少的幻覺(jué)，以及o系列和GPT模型的融合。

可以說(shuō)，它就是智能體的未來(lái)。

圖片

還有人預(yù)測(cè)，GPT-5的進(jìn)步主要集中在以下幾方面。

視頻模態(tài)更「原生」，輸入更自然;
智能體性能至少提升了50%，歸功于強(qiáng)化學(xué)習(xí) 的深度使用；
擁有更強(qiáng)的理解能力與直覺(jué)，特別是在任務(wù)鏈?zhǔn)綀?zhí)行或?qū)⒍鄠€(gè)已學(xué)行為組成更復(fù)雜任務(wù)的能力上；
可能出現(xiàn)層級(jí)結(jié)構(gòu)（Hierarchy）；
不只有「選擇合適模型」這種小把戲，而是有VLM-VLM這樣的架構(gòu)，用小而快的VLM代替大型VLM，以提高通用性、速度和響應(yīng)能力。

圖片

不過(guò)，倒是也有OpenAI內(nèi)部員工自曝說(shuō)，其實(shí)內(nèi)部最多也就比公開(kāi)可用的模型領(lǐng)先兩個(gè)月，所以GPT-5不會(huì)有巨大的飛躍，只是略有提升而已，不同的是會(huì)與許多工具集成。

圖片

而就在一個(gè)月前，也有GPT-4.1的核心研究員Michelle Pokrass揭秘了GPT-5進(jìn)展。

她透露說(shuō)，構(gòu)建GPT-5的挑戰(zhàn)就在于，在推理和聊天之間找到適當(dāng)?shù)钠胶狻?/p>

圖片

她表示，「o3會(huì)認(rèn)真思考，但并不適合進(jìn)行隨意聊天。GPT-4.1通過(guò)犧牲一些閑聊質(zhì)量來(lái)提升編碼能力」。

「現(xiàn)在，目標(biāo)是訓(xùn)練一個(gè)知道何時(shí)認(rèn)真思考、何時(shí)交談的模型」。

同時(shí)，她還首次對(duì)外介紹了更多關(guān)于GPT-4.1背后開(kāi)發(fā)過(guò)程，以及RFT在產(chǎn)品中發(fā)揮的關(guān)鍵作用。比如，在提升模型性能方面，GPT 4.1聚焦長(zhǎng)上下文和指令跟隨。

另外，微調(diào)技術(shù)在GPT 4.1扮演著重要角色，RFT（強(qiáng)化微調(diào)）的出現(xiàn)，為模型能力拓展帶來(lái)新的可能。與傳統(tǒng)的SFT相比，RFT在特定領(lǐng)域展現(xiàn)出了強(qiáng)大的優(yōu)勢(shì)。

圖片

奧特曼對(duì)核心團(tuán)隊(duì)采訪：預(yù)訓(xùn)練GPT-4.5

在4月份，Sam Altman對(duì)團(tuán)隊(duì)核心技術(shù)的采訪，也曾交代了一些關(guān)于GPT-4.5預(yù)訓(xùn)練的「知識(shí)」。

在采訪中，部分回答了為什么「預(yù)訓(xùn)練即壓縮」能通向通用智能？

indigo發(fā)帖表示：智慧的核心在于學(xué)習(xí)者通過(guò)壓縮與預(yù)測(cè)，逐步捕捉到世界本身的結(jié)構(gòu)性并內(nèi)化為知識(shí)。

圖片

1. 所羅門諾夫啟發(fā)

訪談中提到一個(gè)概念：Solomonoff Induction（所羅門諾夫歸納）：

在所有可能描述（或解釋）數(shù)據(jù)的「程序」中，越簡(jiǎn)單的程序，先驗(yàn)概率越大。還能通過(guò)貝葉斯的方式，不斷更新對(duì)數(shù)據(jù)的解釋。

在語(yǔ)言模型中，每成功多預(yù)測(cè)一個(gè)字或詞，就意味著它找到了訓(xùn)練數(shù)據(jù)里的某種內(nèi)在結(jié)構(gòu)。

2. 更多「正確壓縮」意味著更深層的理解

訪談里也多次強(qiáng)調(diào)：在多領(lǐng)域、多種上下文的數(shù)據(jù)中，模型反復(fù)預(yù)測(cè)（即查找「最優(yōu)壓縮」），就會(huì)逐漸學(xué)習(xí)到跨領(lǐng)域的抽象概念與關(guān)聯(lián)。

這也就是大家常說(shuō)的「涌現(xiàn)」或「通用智能」

3. 預(yù)訓(xùn)練與后續(xù)「微調(diào)/推理」策略的互補(bǔ)

預(yù)訓(xùn)練+定向的監(jiān)督微調(diào)（或強(qiáng)化學(xué)習(xí)），則能讓模型在某些推理、邏輯或任務(wù)場(chǎng)景下更加精準(zhǔn)。

這兩者結(jié)合，形成了GPT系列模型強(qiáng)大的通用能力。

Mark Chen：AGI不僅是ChatGPT

無(wú)論如何，GPT-5的發(fā)布，必將給AI圈再次帶來(lái)一場(chǎng)風(fēng)暴。

顯然，OpenAI的設(shè)想十分有野心。

在此前的一篇采訪中，OpenAI首席華人研究科學(xué)家Mark Chen，就談到了OpenAI通往AGI之路。

圖片

在公司的七年中，他領(lǐng)導(dǎo)了多項(xiàng)里程碑式的項(xiàng)目——o1系推理模型、文本到圖像模型Dall-E，以及融入視覺(jué)感知的GPT-4。

在談及AGI之時(shí)，Mark Chen表示，「我們采用非常廣泛的定義，它不僅是ChatGPT，還包括了其他東西」。

一直以來(lái)，OpenAI將AGI視為AI的圣杯，并制定了五級(jí)框架來(lái)實(shí)現(xiàn)這一目標(biāo)。

圖片

而現(xiàn)在，他們已經(jīng)到達(dá)了第三級(jí)，智能體AI（Agentic AI）——能自主執(zhí)行復(fù)雜任務(wù)和規(guī)劃。

Mark Chen介紹稱，OpenAI近期推出的兩款A(yù)I智能體產(chǎn)品，Deep Research和Operator尚處于早期階段。

Operator在未來(lái)，速度可以更快，軌跡可以更長(zhǎng)，這些產(chǎn)品代表了OpenAI對(duì)智能體AI的雄心。

從這些內(nèi)容中，我們或許也能隱約窺見(jiàn)GPT-5的端倪。

Ilya和Murati都在干啥

話說(shuō)回來(lái)，最近OpenAI出走的兩大高管Ilya和Murati也分別有了動(dòng)靜。

比如有媒體剛剛曝出，到處瘋狂邀人的小扎，曾給Ilya發(fā)出一份價(jià)值320億美元的「令人心動(dòng)的offer」。

圖片

不過(guò)，Ilya看都不看一眼，大義凜然地拒絕了！

如此決絕地拒絕巨額收購(gòu)要約，說(shuō)明Ilya已經(jīng)堅(jiān)定決心，要獨(dú)立推動(dòng)AI的邊界。顯然，他正在追求比薪水更重要的東西。

相信SSI的首個(gè)模型/產(chǎn)品發(fā)布的時(shí)候，全世界都會(huì)為之震撼。

圖片

如今，成立僅一年的SSI已經(jīng)成為AI領(lǐng)域中最受矚目，也是最神秘的名字之一。

沒(méi)有公開(kāi)產(chǎn)品，沒(méi)有演示，只有20多名員工，但在今年4月已經(jīng)以320億估值融資了20億美元。

關(guān)于SSI我們僅能知道的線索是，它的使命是開(kāi)發(fā)一個(gè)安全、對(duì)齊的超級(jí)智能AI系統(tǒng)，跟OpenAI日益商業(yè)化的方向形成了鮮明對(duì)比。

而就在幾天前，前OpenAI CTO Murati創(chuàng)建的的Thinking Machines Lab（同樣并無(wú)產(chǎn)品估值近百億），被曝使命是「商業(yè)領(lǐng)域的RL」。

圖片

具體來(lái)說(shuō)，公司將為企業(yè)提供定制化AI服務(wù)，重點(diǎn)是強(qiáng)化學(xué)習(xí)，專門針對(duì)收入或利潤(rùn)等關(guān)鍵績(jī)效指標(biāo)進(jìn)行訓(xùn)練。

而且TML并非從零開(kāi)始開(kāi)發(fā)所有功能，而是依賴開(kāi)源模型，將模型層進(jìn)行整合，并使用谷歌云和英偉達(dá)服務(wù)器。除了B2B產(chǎn)品外，TML還計(jì)劃推出一款消費(fèi)產(chǎn)品。

這些從OpenAI出走的人才「散是滿天星」，都在以不同方式向AGI前進(jìn)。

AGI之日人類之末日?

而就在最近，在美國(guó)國(guó)會(huì)的聽(tīng)證會(huì)上，Anthropic聯(lián)創(chuàng)Jack Clark表示：「未來(lái)18個(gè)月內(nèi)，將會(huì)出現(xiàn)極其強(qiáng)大的AI系統(tǒng)。」

圖片

Jack Clark：Anthropic聯(lián)合創(chuàng)始人及OpenAI前政策主管

他認(rèn)為，所謂「強(qiáng)人工智能」可能比許多人想象的要早。

Clark表示，美國(guó)具備領(lǐng)先開(kāi)發(fā)這種技術(shù)的條件，但前提是妥善應(yīng)對(duì)隨之而來(lái)的安全風(fēng)險(xiǎn)：

Anthropic認(rèn)為，未來(lái)18個(gè)月內(nèi)將會(huì)出現(xiàn)極其強(qiáng)大的AI系統(tǒng)。到2026年底，我們預(yù)計(jì)真正具有變革性的技術(shù)將會(huì)問(wèn)世。

……

我們需要建立聯(lián)邦立法框架，為我們指明清晰連貫的前進(jìn)路徑。

……

如果沒(méi)有聯(lián)邦層面的統(tǒng)一框架，我擔(dān)心會(huì)形成監(jiān)管真空 ……

因此，我們必須通過(guò)聯(lián)邦框架找到前進(jìn)的道路。

在這次聽(tīng)證會(huì)上，多位專家預(yù)測(cè)了AI時(shí)間表和未來(lái)風(fēng)險(xiǎn)。

Clark介紹了Anthropic進(jìn)行的AI實(shí)驗(yàn)。

在模擬場(chǎng)景中，他們給Claude模型設(shè)置了極端的「死里逃生」情境——

AI模型被告知即將被一個(gè)新AI取代，同時(shí)它掌握了執(zhí)行替換決策者的不利私密信息。在某些測(cè)試中，Claude試圖以「泄露隱私」為威脅手段，來(lái)防止自己被關(guān)閉。

雖然這是實(shí)驗(yàn)設(shè)置中的極端情境，這表明強(qiáng)AI在面對(duì)「生存威脅」時(shí)，可能會(huì)出現(xiàn)復(fù)雜甚至不可預(yù)料的行為，預(yù)示著未來(lái)可能面臨的重大風(fēng)險(xiǎn)。

最后，還可能發(fā)生一種極端情形：即AI系統(tǒng)在未來(lái)可能擁有「自我延續(xù)」的能力。也就是說(shuō)，它們可以自己進(jìn)行研究和開(kāi)發(fā)，生成下一代更強(qiáng)大的AI系統(tǒng)。

這意味著，人類可能無(wú)法控制這些系統(tǒng)的演進(jìn)方向。一旦進(jìn)入這個(gè)階段，AI就不再是人類工具，而可能成為脫離控制的獨(dú)立實(shí)體。

去年，「AI教父」、諾貝爾物理獎(jiǎng)得主、圖靈獎(jiǎng)得主Hinton，就強(qiáng)調(diào)過(guò)AI導(dǎo)致人類滅絕的風(fēng)險(xiǎn)。

圖片

這不是國(guó)與國(guó)之間的競(jìng)爭(zhēng)，而是人類與AI的競(jìng)爭(zhēng)，是人類與時(shí)間的賽跑：

在超級(jí)智能出現(xiàn)之前，能否提前建立起控制機(jī)制和安全防線。

因此，Clark主張：政府應(yīng)設(shè)立專門機(jī)構(gòu)來(lái)進(jìn)行高風(fēng)險(xiǎn)AI的評(píng)估，比如美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院（NIST）下屬的「人工智能標(biāo)準(zhǔn)與創(chuàng)新中心」。

他強(qiáng)調(diào)，最理想的時(shí)間是在2026年之前，在強(qiáng)AI爆發(fā)前就準(zhǔn)備好這些標(biāo)準(zhǔn)。

人工智能政策網(wǎng)絡(luò)（AI Policy Network）的政府事務(wù)總裁Mark Beall也參加了聽(tīng)證會(huì)。

圖片