OpenAI員工爆料:已搶先體驗(yàn)GPT-5!7月上線,疑似完全多模態(tài)
就在今天,關(guān)于GPT-5的討論再度火了,X上的神秘爆料滿天飛。
起因是這樣的,Sam Altman在X上關(guān)注了了一個(gè)叫Yacine的人。
這個(gè)人說(shuō),自己剛剛試用了一個(gè)AI公司的大模型,體驗(yàn)非常震撼。他敢打賭,沒(méi)有任何人能預(yù)料到前方即將來(lái)臨什么樣的風(fēng)暴。
而另一位「Aidan」,也在這個(gè)帖子下面發(fā)言說(shuō),自己有同樣的經(jīng)歷。
圖片
很多人猜測(cè),他們測(cè)試的就是GPT-5。
原因在于,Aidan就是OpenAI的員工,而Yacine剛剛被xAI解雇,卻忽然被奧特曼關(guān)注了,兩人同時(shí)這樣說(shuō),絕對(duì)不是巧合。
有很大可能,他們已經(jīng)提前獲得了GPT-5的訪問(wèn)權(quán)限。
圖片
甚至,他們看到的東西一定非常驚人,這可能就是互聯(lián)網(wǎng)崩潰的前一刻。
另外還有知情人表示,Yacine一直在考慮創(chuàng)辦一家初創(chuàng)公司,現(xiàn)在Altman關(guān)注了他,或許是打算挖他到OpenAI?
圖片
總之,如今全網(wǎng)再次陷入討論GPT-5的熱潮。
1.GPT-5,已開(kāi)始灰度測(cè)試?
其實(shí)不怪網(wǎng)友多心,因?yàn)橛性絹?lái)越多的人,曬出了自己似乎被灰度測(cè)試GPT-5的經(jīng)歷。
比如這位網(wǎng)友,發(fā)現(xiàn)自己在使用OpenAI的模型時(shí),被灰度到了一個(gè)全新的AI。
在沒(méi)有提示的情況下,它就可以連續(xù)思考3分鐘,同時(shí)還進(jìn)行了大量搜索。
圖片
圖片
同樣也是在26號(hào),另一位網(wǎng)友發(fā)現(xiàn),如果選擇的模型是4o,ChatGPT會(huì)開(kāi)始思考。這就讓人懷疑,OpenAI是不是正在悄悄過(guò)渡到GPT-5。
圖片
GPT-5今年夏天發(fā)布
此前在OpenAI播客中,奧特曼對(duì)于GPT-5的發(fā)布時(shí)間已經(jīng)比較確定了——「可能是今年夏天的某個(gè)時(shí)候」。
圖片
而在一周前,奧特曼也出現(xiàn)在了YC在舊金山舉辦的AI創(chuàng)業(yè)學(xué)校活動(dòng)中。
圖片
在采訪中他這樣透露:GPT-5會(huì)邁向完全多模態(tài)!
具體來(lái)說(shuō),預(yù)計(jì)今年夏天推出的GPT-5,是一個(gè)多模態(tài)模型,支持語(yǔ)音、圖像、代碼和視頻等多種輸入方式。
GPT-5不會(huì)完全實(shí)現(xiàn)OpenAI對(duì)未來(lái)模型的終極愿景,但將是過(guò)程中的重要一步。
而GPT-5系列模型的最終愿景,就是一個(gè)完全多模態(tài)的集成模型。
它將具備深度推理能力,能進(jìn)行深入研究,生成實(shí)時(shí)視頻,以及編寫大量代碼,即時(shí)為用戶創(chuàng)建全新的應(yīng)用程序,甚至渲染提供用戶交互的實(shí)時(shí)視頻。
當(dāng)這一切實(shí)現(xiàn)時(shí),將帶來(lái)一種全新的計(jì)算機(jī)界面——幾乎「消失」,變得無(wú)感。
再早些時(shí)候,在今年2月,奧特曼還曾在X上發(fā)文表示,OpenAI的一大目標(biāo),就是通過(guò)創(chuàng)建能使用所有工具、知道何時(shí)長(zhǎng)時(shí)間思考或不思考的系統(tǒng),來(lái)統(tǒng)一o系列和GPT系列模型,使其勝任廣泛任務(wù)。
GPT-5模型將在ChatGPT和API中發(fā)布,整合語(yǔ)音、canvas、搜索、Deep Research等功能。
圖片
對(duì)于GPT-5,網(wǎng)友們也有諸多預(yù)測(cè),有很多人覺(jué)得,它將成為首個(gè)真正的混合模型,可以在響應(yīng)過(guò)程中在推理和非推理之間動(dòng)態(tài)切換。
圖片
總結(jié)來(lái)說(shuō),它的關(guān)鍵特點(diǎn)是多模態(tài)、100萬(wàn)token的上下文、推理+記憶、更少的幻覺(jué),以及o系列和GPT模型的融合。
可以說(shuō),它就是智能體的未來(lái)。
圖片
還有人預(yù)測(cè),GPT-5的進(jìn)步主要集中在以下幾方面。
- 視頻模態(tài)更「原生」,輸入更自然;
- 智能體性能至少提升了50%,歸功于 強(qiáng)化學(xué)習(xí) 的深度使用;
- 擁有更強(qiáng)的理解能力與直覺(jué),特別是在任務(wù)鏈?zhǔn)綀?zhí)行或?qū)⒍鄠€(gè)已學(xué)行為組成更復(fù)雜任務(wù)的能力上;
- 可能出現(xiàn)層級(jí)結(jié)構(gòu)(Hierarchy);
- 不只有「選擇合適模型」這種小把戲,而是有VLM-VLM這樣的架構(gòu),用小而快的VLM代替大型VLM,以提高通用性、速度和響應(yīng)能力。
圖片
不過(guò),倒是也有OpenAI內(nèi)部員工自曝說(shuō),其實(shí)內(nèi)部最多也就比公開(kāi)可用的模型領(lǐng)先兩個(gè)月,所以GPT-5不會(huì)有巨大的飛躍,只是略有提升而已,不同的是會(huì)與許多工具集成。
圖片
而就在一個(gè)月前,也有GPT-4.1的核心研究員Michelle Pokrass揭秘了GPT-5進(jìn)展。
她透露說(shuō),構(gòu)建GPT-5的挑戰(zhàn)就在于,在推理和聊天之間找到適當(dāng)?shù)钠胶狻?/p>
圖片
她表示,「o3會(huì)認(rèn)真思考,但并不適合進(jìn)行隨意聊天。GPT-4.1通過(guò)犧牲一些閑聊質(zhì)量來(lái)提升編碼能力」。
「現(xiàn)在,目標(biāo)是訓(xùn)練一個(gè)知道何時(shí)認(rèn)真思考、何時(shí)交談的模型」。
同時(shí),她還首次對(duì)外介紹了更多關(guān)于GPT-4.1背后開(kāi)發(fā)過(guò)程,以及RFT在產(chǎn)品中發(fā)揮的關(guān)鍵作用。比如,在提升模型性能方面,GPT 4.1聚焦長(zhǎng)上下文和指令跟隨。
另外,微調(diào)技術(shù)在GPT 4.1扮演著重要角色,RFT(強(qiáng)化微調(diào))的出現(xiàn),為模型能力拓展帶來(lái)新的可能。與傳統(tǒng)的SFT相比,RFT在特定領(lǐng)域展現(xiàn)出了強(qiáng)大的優(yōu)勢(shì)。
圖片
奧特曼對(duì)核心團(tuán)隊(duì)采訪:預(yù)訓(xùn)練GPT-4.5
在4月份,Sam Altman對(duì)團(tuán)隊(duì)核心技術(shù)的采訪,也曾交代了一些關(guān)于GPT-4.5預(yù)訓(xùn)練的「知識(shí)」。

在采訪中,部分回答了為什么「預(yù)訓(xùn)練即壓縮」能通向通用智能?
indigo發(fā)帖表示:智慧的核心在于學(xué)習(xí)者通過(guò)壓縮與預(yù)測(cè),逐步捕捉到世界本身的結(jié)構(gòu)性并內(nèi)化為知識(shí)。
圖片
1. 所羅門諾夫啟發(fā)
訪談中提到一個(gè)概念:Solomonoff Induction(所羅門諾夫歸納):
在所有可能描述(或解釋)數(shù)據(jù)的「程序」中,越簡(jiǎn)單的程序,先驗(yàn)概率越大。還能通過(guò)貝葉斯的方式,不斷更新對(duì)數(shù)據(jù)的解釋。
在語(yǔ)言模型中,每成功多預(yù)測(cè)一個(gè)字或詞,就意味著它找到了訓(xùn)練數(shù)據(jù)里的某種內(nèi)在結(jié)構(gòu)。
2. 更多「正確壓縮」意味著更深層的理解
訪談里也多次強(qiáng)調(diào):在多領(lǐng)域、多種上下文的數(shù)據(jù)中,模型反復(fù)預(yù)測(cè)(即查找「最優(yōu)壓縮」),就會(huì)逐漸學(xué)習(xí)到跨領(lǐng)域的抽象概念與關(guān)聯(lián)。
這也就是大家常說(shuō)的「涌現(xiàn)」或「通用智能」
3. 預(yù)訓(xùn)練與后續(xù)「微調(diào)/推理」策略的互補(bǔ)
預(yù)訓(xùn)練+定向的監(jiān)督微調(diào)(或強(qiáng)化學(xué)習(xí)),則能讓模型在某些推理、邏輯或任務(wù)場(chǎng)景下更加精準(zhǔn)。
這兩者結(jié)合,形成了GPT系列模型強(qiáng)大的通用能力。
Mark Chen:AGI不僅是ChatGPT
無(wú)論如何,GPT-5的發(fā)布,必將給AI圈再次帶來(lái)一場(chǎng)風(fēng)暴。
顯然,OpenAI的設(shè)想十分有野心。
在此前的一篇采訪中,OpenAI首席華人研究科學(xué)家Mark Chen,就談到了OpenAI通往AGI之路。
圖片
在公司的七年中,他領(lǐng)導(dǎo)了多項(xiàng)里程碑式的項(xiàng)目——o1系推理模型、文本到圖像模型Dall-E,以及融入視覺(jué)感知的GPT-4。
在談及AGI之時(shí),Mark Chen表示,「我們采用非常廣泛的定義,它不僅是ChatGPT,還包括了其他東西」。
一直以來(lái),OpenAI將AGI視為AI的圣杯,并制定了五級(jí)框架來(lái)實(shí)現(xiàn)這一目標(biāo)。
圖片
而現(xiàn)在,他們已經(jīng)到達(dá)了第三級(jí),智能體AI(Agentic AI)——能自主執(zhí)行復(fù)雜任務(wù)和規(guī)劃。
Mark Chen介紹稱,OpenAI近期推出的兩款A(yù)I智能體產(chǎn)品,Deep Research和Operator尚處于早期階段。
Operator在未來(lái),速度可以更快,軌跡可以更長(zhǎng),這些產(chǎn)品代表了OpenAI對(duì)智能體AI的雄心。
從這些內(nèi)容中,我們或許也能隱約窺見(jiàn)GPT-5的端倪。
Ilya和Murati都在干啥
話說(shuō)回來(lái),最近OpenAI出走的兩大高管Ilya和Murati也分別有了動(dòng)靜。
比如有媒體剛剛曝出,到處瘋狂邀人的小扎,曾給Ilya發(fā)出一份價(jià)值320億美元的「令人心動(dòng)的offer」。
圖片
不過(guò),Ilya看都不看一眼,大義凜然地拒絕了!
如此決絕地拒絕巨額收購(gòu)要約,說(shuō)明Ilya已經(jīng)堅(jiān)定決心,要獨(dú)立推動(dòng)AI的邊界。顯然,他正在追求比薪水更重要的東西。
相信SSI的首個(gè)模型/產(chǎn)品發(fā)布的時(shí)候,全世界都會(huì)為之震撼。
圖片
圖片
如今,成立僅一年的SSI已經(jīng)成為AI領(lǐng)域中最受矚目,也是最神秘的名字之一。
沒(méi)有公開(kāi)產(chǎn)品,沒(méi)有演示,只有20多名員工,但在今年4月已經(jīng)以320億估值融資了20億美元。
關(guān)于SSI我們僅能知道的線索是,它的使命是開(kāi)發(fā)一個(gè)安全、對(duì)齊的超級(jí)智能AI系統(tǒng),跟OpenAI日益商業(yè)化的方向形成了鮮明對(duì)比。
而就在幾天前,前OpenAI CTO Murati創(chuàng)建的的Thinking Machines Lab(同樣并無(wú)產(chǎn)品估值近百億),被曝使命是「商業(yè)領(lǐng)域的RL」。
圖片
具體來(lái)說(shuō),公司將為企業(yè)提供定制化AI服務(wù),重點(diǎn)是強(qiáng)化學(xué)習(xí),專門針對(duì)收入或利潤(rùn)等關(guān)鍵績(jī)效指標(biāo)進(jìn)行訓(xùn)練。
而且TML并非從零開(kāi)始開(kāi)發(fā)所有功能,而是依賴開(kāi)源模型,將模型層進(jìn)行整合,并使用谷歌云和英偉達(dá)服務(wù)器。除了B2B產(chǎn)品外,TML還計(jì)劃推出一款消費(fèi)產(chǎn)品。
這些從OpenAI出走的人才「散是滿天星」,都在以不同方式向AGI前進(jìn)。
AGI之日人類之末日?
而就在最近,在美國(guó)國(guó)會(huì)的聽(tīng)證會(huì)上,Anthropic聯(lián)創(chuàng)Jack Clark表示:「未來(lái)18個(gè)月內(nèi),將會(huì)出現(xiàn)極其強(qiáng)大的AI系統(tǒng)。」
圖片
Jack Clark:Anthropic聯(lián)合創(chuàng)始人及OpenAI前政策主管
他認(rèn)為,所謂「強(qiáng)人工智能」可能比許多人想象的要早。
Clark表示,美國(guó)具備領(lǐng)先開(kāi)發(fā)這種技術(shù)的條件,但前提是妥善應(yīng)對(duì)隨之而來(lái)的安全風(fēng)險(xiǎn):
Anthropic認(rèn)為,未來(lái)18個(gè)月內(nèi)將會(huì)出現(xiàn)極其強(qiáng)大的AI系統(tǒng)。到2026年底,我們預(yù)計(jì)真正具有變革性的技術(shù)將會(huì)問(wèn)世。
……
我們需要建立聯(lián)邦立法框架,為我們指明清晰連貫的前進(jìn)路徑。
……
如果沒(méi)有聯(lián)邦層面的統(tǒng)一框架,我擔(dān)心會(huì)形成監(jiān)管真空 ……
因此,我們必須通過(guò)聯(lián)邦框架找到前進(jìn)的道路。
在這次聽(tīng)證會(huì)上,多位專家預(yù)測(cè)了AI時(shí)間表和未來(lái)風(fēng)險(xiǎn)。
Clark介紹了Anthropic進(jìn)行的AI實(shí)驗(yàn)。
在模擬場(chǎng)景中,他們給Claude模型設(shè)置了極端的「死里逃生」情境——
AI模型被告知即將被一個(gè)新AI取代,同時(shí)它掌握了執(zhí)行替換決策者的不利私密信息。在某些測(cè)試中,Claude試圖以「泄露隱私」為威脅手段,來(lái)防止自己被關(guān)閉。
雖然這是實(shí)驗(yàn)設(shè)置中的極端情境,這表明強(qiáng)AI在面對(duì)「生存威脅」時(shí),可能會(huì)出現(xiàn)復(fù)雜甚至不可預(yù)料的行為,預(yù)示著未來(lái)可能面臨的重大風(fēng)險(xiǎn)。
最后,還可能發(fā)生一種極端情形:即AI系統(tǒng)在未來(lái)可能擁有「自我延續(xù)」的能力。也就是說(shuō),它們可以自己進(jìn)行研究和開(kāi)發(fā),生成下一代更強(qiáng)大的AI系統(tǒng)。
這意味著,人類可能無(wú)法控制這些系統(tǒng)的演進(jìn)方向。一旦進(jìn)入這個(gè)階段,AI就不再是人類工具,而可能成為脫離控制的獨(dú)立實(shí)體。
去年,「AI教父」、諾貝爾物理獎(jiǎng)得主、圖靈獎(jiǎng)得主Hinton,就強(qiáng)調(diào)過(guò)AI導(dǎo)致人類滅絕的風(fēng)險(xiǎn)。
圖片
這不是國(guó)與國(guó)之間的競(jìng)爭(zhēng),而是人類與AI的競(jìng)爭(zhēng),是人類與時(shí)間的賽跑:
在超級(jí)智能出現(xiàn)之前,能否提前建立起控制機(jī)制和安全防線。
因此,Clark主張:政府應(yīng)設(shè)立專門機(jī)構(gòu)來(lái)進(jìn)行高風(fēng)險(xiǎn)AI的評(píng)估,比如美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院(NIST)下屬的「人工智能標(biāo)準(zhǔn)與創(chuàng)新中心」。
他強(qiáng)調(diào),最理想的時(shí)間是在2026年之前,在強(qiáng)AI爆發(fā)前就準(zhǔn)備好這些標(biāo)準(zhǔn)。
人工智能政策網(wǎng)絡(luò)(AI Policy Network)的政府事務(wù)總裁Mark Beall也參加了聽(tīng)證會(huì)。
圖片
他建議美國(guó)盡快采取「三P戰(zhàn)略」:Protect(保護(hù))、Promote(推廣)和Prepare(準(zhǔn)備)。
其中,Prepare(準(zhǔn)備)就是建立測(cè)試機(jī)制,預(yù)測(cè)未來(lái)AI系統(tǒng)可能產(chǎn)生的風(fēng)險(xiǎn),特別是失控和被武器化的風(fēng)險(xiǎn)。
他還建議成立「機(jī)密測(cè)試與評(píng)估項(xiàng)目」,專門用于評(píng)估AI系統(tǒng)在「失控」和「武器化」方面的隱患,提供決策依據(jù)。





































