編輯 | 云昭
出品 | 51CTO技術棧(微信號:blog51cto)
國慶假期期間,OpenAI 可謂賺足了全球的注意力。
先是各種 Sora2 的生成視頻刷屏,然后是三天前掌舵者 Sam Altman 在 DevDay2025 主題演講中高密度發布了許多利好AI開發者的功能和工具,可以說熱鬧空前。
但這些都不足以用來形容此時此刻 OpenAI 的未來藍圖。
在 DevDay 期間,這位 OpenAI 的掌舵者接受邀請錄制了一期播客,主持人跟他進行了一場非常全面的深度腦暴。
訪談中,Altman 分享了自己對于 ChatGPT、Sora 的核心優勢和商業模式的考量。他坦承,其實自己一開始也不清楚 ChatGPT 的核心優勢是什么,但如今沒想到“記憶功能”卻成了最大的競爭優勢之一。
而談及Sora的商業模式,他指出現在還為時尚早。主要看Sora的使用場景,如果是信息流,那自然會考慮引入廣告,但如果只是分享聊天,群發,那就是另一種商業模式。
而對于AI開發者最看好的 Agentbuilder 工具,Altman 坦言以后真的可以實現 Agent 的無代碼革命。
而 Codex 這一類的AI編程智能體以后甚至可以連續運行一周,期間都不需要人類監督和反饋。
對于大洋彼岸很火的一個名詞:“workslop”(工作糊料,即看起來挺體面,但實際很糟糕的交付結果),Altman 認為經濟會自我糾偏,因為人類本身自己也會產出工作糊料。
OpenAI的版圖還有哪些?是要打造美國版微信嗎?Altman 一口否認了,他認為微信模式在美國走不通,但的確計劃會在 ChatGPT 整合一些新功能。
“如果我們突然把一個「社交型體驗」塞進去,會讓人感覺很怪。”
“用戶對 ChatGPT 的心理預期和他們使用娛樂應用時的狀態完全不同,這兩種體驗放在一起會產生不協調。”
OpenAI 籌劃之中的藏貨還有多少呢?
訪談中,至少可以探秘出以下幾種:
一、ChatGPT 接下來會整合許多有交互能力的功能;
二、Sora 之后會在半年內探索商業付費模式;
三、新的AI硬件方面,AI語音交互將會是一大值得期待的亮點;
四、Agent方面,OpenAI 已經在籌劃在法律、金融領域版本的 Codex。
五、而接下來的 GPT-6 構建的設想,他表示最近發布的新基準“GDPval”會考慮在內,會在后訓練中做出相應調整,但大方向不變。
對于 AGI,Altman 認為實現它的時刻,不在于某個分數,而是 AI 真正開始為人類創造新知識時。
臨近最后,Altman 還討論到了未來的工作情況。他指出,在不久的將來,當今經濟中發生的 40% 的任務將由人工智能完成。AI 會讓數十億人的工作變得不再是真實的工作。
料還很多,建議大家自行收藏細讀。
最看好ChatGPT內置應用
主持人:Sam,非常感謝你來到這里。現在是 2025 年的 DevDay,你能先給我們介紹一下這次發布的內容,以及你個人最期待的部分嗎?
Sam:其實我對所有內容都很興奮。不過要我挑一個,我想說——ChatGPT 內置應用(Apps in ChatGPT)。這其實是我很早就想做的事。剛才我和幾位開發者聊了聊他們用 Agent Builder(或 Agent Kit)做的項目,真的有不少我自己都想立刻用的。如果只能選一個,那就是 Apps in ChatGPT。
主持人:我也喜歡 Agent Builder,不過 Apps in ChatGPT 的確很酷。我們可以從這里聊起。順便說一句,恭喜你們現在 ChatGPT 已經有 8 億周活用戶了。
Sam:謝謝,這數字確實令人震驚。ChatGPT 正在成為一個新的“分發平臺”。
主持人:那開發者或創業者要如何利用這次發布的 App SDK,在 ChatGPT 之上構建產品?
Sam:我認為這還需要一段探索期,去觀察大家最終會怎么用這些 App。比如,人們會直接叫出 App 的名字嗎?還是希望 ChatGPT 能自動記住他們常用的 App 并主動推薦?這些新的分發機制需要開發者自己去摸索。但每次我們把東西交給世界時,總會被實際使用方式所驚喜到。
主持人:我聽說你們今天也會發布文檔,幫助開發者提高被推薦的幾率?
Sam:是的,不過要說明的是,這些都是全新的產品,變化會很快,我們也會邊學邊改。但沒錯,文檔今天就會放出。
Agent Builder 與 GPT Builder 的演進
主持人:回到第一次 DevDay,兩年前你們發布了 GPT Builder,當時引起了不小的轟動。我記得自己是最早做出公開 GPT 的開發者之一。這次的 Agent Builder,相比當年,有哪些突破?
Sam:最大的不同是模型能力的躍升。這 22、23 個月的進步實在太驚人了。除此之外,我們也學到了很多關于人們如何想要構建 agent 的經驗,包括他們希望能在 ChatGPT 之外的服務上構建。讓我印象最深的是,現在你能用一個可視化界面,上傳幾個文件、連接數據源、定義目標,幾分鐘內就能部署出一個能做復雜任務的 agent。
昨天彩排時我看完整個流程,真有點震撼——像 Codex、Agent Kit 這樣的工具,讓“構建軟件”的速度發生了地殼級的變化。我現在還沒完全理解這會帶來多大的影響。
AI Agent 的低代碼革命
主持人:如果我理解沒錯,現在通過 Agent Builder 已經可以實現零代碼構建 agent?
Sam:完全可以。當然,如果你懂一點編程,會做得更細致更好;但一般的知識型工作者,現在也能自己做 agent。
主持人:那這基本就是“AI Agent 的無代碼革命”了。
Sam:沒錯。你會寫一點代碼能做更多,但入門門檻已經非常低。我在想這會對下一波創業者、企業會有什么影響。昨天我看了 Romain 的現場演示,真是震撼——這些東西在一年前可能要花很久才能做出來,現在幾乎能“現場生成”。感覺創意的產生速度都跟不上實現的速度了。我還不能完全判斷這意味著什么,但顯然,軟件的生產速度將大幅提升,而從實驗到改進的周期會越來越短。我們能更快驗證想法、篩選出好點子——只是我還不知道這會改變哪些更大的東西。
“零人公司”的賭局
主持人:我聽說你和朋友之間有個賭局,賭什么時候會出現第一個由 agent 運營的十億美元公司?Agent Builder 能把我們帶到那個階段嗎?
Sam Altman:還沒那么快。我們以前的賭是“第一個一人公司”何時出現;現在大家開始猜“零人公司”要多久。我們還沒正式開盤,但確實很多人在討論。我覺得至少要幾年時間。不過,僅僅是能認真地討論“零人公司”這個概念,就已經很不可思議了。
讓 Agent 一周不出錯地工作,需要什么
主持人:很多人都說這是“Agent 元年”,但目前的 agent 還需要大量人工監督。你覺得什么時候才能出現能連續工作一周都不需要反饋的 agent?
Sam:我覺得 Codex 離那不遠了——這話聽起來都像科幻。或許 2025 年內還達不到,但我們今天已經看到它能完成“一天級任務”。進步速度快得驚人。我很少會覺得“AI 進步太快”,但在觀察 Codex 任務持續時長的提升時,確實有這種感覺。我猜,能持續工作一周的 agent,不會太遠。
主持人:要實現那一步,還缺什么技術?
Sam:更聰明的模型、更長的上下文、更好的記憶系統。
世界變了,但核心優勢的類型沒變
主持人:現在有了這一切工具,如果讓 20 歲、剛從斯坦福輟學的你穿越到今天,你會選擇做什么?又會避免做什么?
Sam:我前幾天其實剛想過這個問題。我真有點羨慕現在的年輕一代。他們面前的機會空間巨大到難以想象。我已經很多年沒能空出一大段時間去思考“我想做什么項目”,但我知道,如果我現在 20 歲,我一定會有一堆想做的酷東西。今天跟這么多開發者聊天,看到他們在構建的那些新東西——真的很讓人振奮。
主持人:有沒有什么建議,能幫助開發者在構建這些產品時,找到屬于自己的“獨特優勢”?比如分發渠道、數據壁壘,或者某種特定工作流?
Sam:這是個很難抽象回答的問題。我認為最好的獨特優勢,往往是獨屬于你自己、你必須親自摸索出來的東西。我們在 OpenAI 身上也花了極大的努力去找出那種差異化優勢。但總體來說,這不是一個“通用解”。真正重要的優勢,往往只在你所在的時機、市場定位、技術方向下才成立。而這種探索,本身就構成了創業帶來的獨特價值。
如果要說一條普遍適用的經驗,我會說——邊做邊找,策略是從戰術中長出來的。我很喜歡一句商業名言:“讓戰術演變成戰略。”你可以從一些“眼下有效的小事”開始做,而在不斷嘗試的過程中,往往會自然衍生出一個更長遠的戰略方向。
舉個例子,如果你在 ChatGPT 推出時問我:“你們未來的核心優勢會是什么?”我可能會回答:“不知道。”我可以猜一堆,但不會有信心。結果現在看來,“記憶功能”成了我們最大的競爭優勢之一——它讓用戶愿意長期留在 ChatGPT。而當初我們完全沒想到這一點。所以很多時候,你只是不斷構建功能,然后在某個瞬間突然意識到:“哦,這東西居然能成為我們的長期壁壘。”
主持人:那有沒有一些線索,提示我們現在該往哪些“優勢方向”去構建,比如為 GPT-6 時代提前布局?
Sam:那就得你自己去摸索了(笑)。我很樂意哪天和你一起頭腦風暴一下,因為那會挺有趣的。但老實說,OpenAI 已經占據了我全部的腦容量,我都沒法再認真去想怎么做新創業項目了——這點有點遺憾。雖然世界變了,但企業的核心優勢類型其實沒怎么變:網絡效應、品牌與營銷、用戶數據、市場網絡效應……這些仍然是競爭力的基礎。不過,建立這些優勢的新“戰術”,會隨著時代變化而更新。
GPT-5 vs Claude:GDPval 測試結果
主持人:OpenAI 最近發布了一個名為 GDPval 的新基準,用來衡量模型在各種知識型工作中執行“經濟上有價值任務”的能力。讓我驚訝的是,GPT-5 的表現排在 Claude Opus 之后,而你們依然選擇公開這個結果。你本人對此意外嗎?
Sam:首先,如果我們因為排名第二就不發布,那才真糟糕。我們會在某些領域最好,也會在別的地方被超越。要建立一個能持續進步的文化,關鍵是坦然承認別人暫時做得更好。我認為 Anthropic 在理解企業級使用場景、以及讓模型輸出更優雅的結構化結果方面,做得非常出色。所以我并不驚訝,只是被激勵得想更快追上。
主持人:這次的評測結果,會改變你們構建 GPT-6 的方式嗎?
Sam:可能會在后訓練階段帶來一些調整,但總體戰略不會因此改變。
我們何時真正實現 AGI?
主持人:你最近提過,你對 AGI 的定義是“在大多數經濟上有價值的任務中超越人類”。那 GDPval 的哪個分數會讓你說:“我們已經實現了 AGI”?
Sam:我一直在思考這個問題。首先——就像很多人一樣,我對 AGI 有多個定義。離它越近,這個概念反而越模糊。不過,對我來說最重要的一點,也是最讓我意外的是——我們終于開始看到模型能進行“原創發現”。比如,它能擴展人類的知識邊界。
現在在 X(Twitter)上,你會看到越來越多科學家發帖說:模型提出了一個新的假設、發現了一個小規律、或者想出一種新的研究思路。這些都還非常微小,我不想夸大,但也不能忽視它的意義——我們正處在 AI 發現能力的起點。而我們有理由相信,在未來幾個月乃至幾年內,這方面會迎來加速。這,可能是我最在乎的“AGI 時刻”。它不是某個分數,而是當 AI 真正開始為人類創造新知識時。
AI 將要解決的科學突破
主持人:有沒有什么具體的科學突破,是你特別期待 AI 能去解決或推動的?
Sam:當然,治愈疾病、發現新的物理定律——那種事情會非常令人振奮。但其實,眼下正在發生的一些“小事”,比如數學領域的進展,也讓我感覺意義非凡。當 GPT-4 發布時,我記得很多人還在爭論“圖靈測試”的定義——但大眾心中的“圖靈測試”一直像是一個遙不可及的目標。然而突然之間,它就被跨越了。而社會的反應基本是——毫無波瀾。大家驚呼兩周,然后立刻抱怨:“這玩意怎么不夠快?”、“怎么不夠聰明?”、“能不能再好一點?” 這其實挺能說明人性的:那個長期以來代表 AI 極限的“考驗”被我們一瞬間甩在身后,而人類幾乎瞬間適應了。我覺得接下來也會出現類似的情況——我們會非常快地習慣 AI 進行科學發現。這有點像 Waymo(無人駕駛):第一次上車確實怪異,但那種感覺只持續三分鐘,然后就變得理所當然了。
從工作糊料到同意自己形象在Sora上對外公開
主持人:我想插一句。最近斯坦福有個研究,提出一個新詞——“工作糊料(workslop)”。簡單解釋一下,就是“看起來很體面、其實低質量”的產出。他們調查了一千多位辦公室職員,41% 的人說最近一個月遇到過這種來自同事的“AI 糊料”。平均每次清理需要 1 小時 56 分鐘,每名員工每月因此損失約 186 美元。所以問題是:AI 能讓一部分人效率提升 10 倍,那我們在教育或新人培訓中缺了什么?為什么很多人不知道什么時候該用 AI,什么時候不該用?
Sam:首先得說,很多人類自己也在制造“工作糊料”。這不是 AI 獨有的現象——比如那些只制造工作量的郵件,或者毫無意義的會議。其實從很久以前開始,就存在兩類人:一種人用工具提升效率;另一種人用工具給組織制造阻力。AI 也會一樣——不會例外。但經濟會自我糾偏。那些能用工具提高產出的人和公司,會更有能力塑造未來;反之,那些拖慢效率的,會被邊緣化。當然,每種新工具都有學習曲線,但這次我認為會非常快。
主持人:那 OpenAI 是否在教育或培訓上,做些什么來幫助人們更好地建立“AI 直覺”?
Sam:有的,我們確實在做。但人們總會以他們自己的方式使用工具。我學到的一點是——你可以做出極好的教育內容、培訓課程,但人們一旦發現他們能讓模型“用海盜口音說話”,他們就會去玩這個。不過我們確實在努力,制作大量幫助人們把 AI 整合進日常工作流的內容。在某些場景下,比如 Codex,企業的采用非常快——從試用到深度融合,只需要幾天或幾周。
主持人:說到“糊料”,你現在也是世界上第一個被 Sora 做成病毒級 meme 的 CEO。網上那些把你“換臉成 GPU 盜賊”的視頻,會讓你感到害怕嗎?
Sam:其實比我預想的沒那么怪異。很奇怪的是——看一個視頻會覺得不適,但連刷一百個反而沒那么怪。我記得那時我正在環球出差,有個團隊成員發消息問我:“我們能不能把你的 cameo(出鏡形象)開放訪問?”我當時八秒內就回復“可以”,其實那應該是個值得深思的問題。但我想,既然我們在做這項新技術,我自己都不愿去嘗試,那就太說不過去了。結果我決定開放。之后在飛機上我想,這可能會挺奇怪的。但上線后我醒來一看,整個社交媒體都是 meme。我笑了。真的就是那種 Waymo 式的體驗——前 3 分鐘有點怪,然后就完全習慣了。唯一讓我擔心的,是今天早上有幾家公司發布了“去水印工具”。如果別人能把 Sora 的水印去掉,用我的形象發視頻,這可能會影響我的個人品牌。那我為什么還要開放自己的 cameo 呢?
主持人:所以你的意思是,提前發布帶有防護的版本,其實是為了幫助社會提前適應?
Sam:沒錯。我們經常會預見到某項技術遲早會被廣泛開放——幾個月或幾年后,任何人都能用開源模型生成視頻,甚至可以讓“你”做任何事。社會終會適應,但我們希望通過提前發布 + 加入防護,讓社會和技術能夠共同進化。文本時代我們已經這么做過了。視頻更難,因為它帶來的情緒沖擊更強。但最終我們會學會適應。未來網上會充斥著各種“假視頻”,很多都沒有水印、也無法追溯來源。這種情況一定會發生。讓社會對它提前“免疫”,是有價值的。
主持人:那最終目標是做出“真假難辨”的 AI 視頻嗎?
Sam:最終目標還是 AGI(通用人工智能)。高質量視頻只是其中的重要一步。它能推動空間推理、世界模型學習,甚至是機器人研究的進展。我認為“生成式視頻”是好事。我不希望未來人機交互只局限于文本。我很期待一個新形態的界面——你能在實時視頻流中與系統互動,它會動態生成屬于你的界面與體驗。所以,是的,高質量視頻是通向真正 AGI 的寶貴一步。
考慮Sora視頻生成付費
主持人:你們上周五發布了一篇博客,說正在考慮為允許自己肖像 cameo(客串)的視頻創作者推出分成機制。能透露下具體怎么運作嗎?
Sam:就像很多新產品一樣——一旦上線,你總會發現用戶的使用方式和我們想象的不一樣。我們原本以為,Cameo 主要會由少數創作者制作一些很酷、精致、有創意的視頻內容,然后被更大范圍的觀眾觀看和分享。確實有一些這樣的案例,但我們也看到大量用戶在為自己、或幾個朋友制作視頻,在群聊中互相分享。我還不確定這是不是一時的新鮮感,但如果這種使用方式真的能持續下去,那它將徹底改變我們對計算量與用戶參與度之間關系的模型。
未來,我們可能會允許用戶為視頻生成付費。比如你想一天做 100 個表情包視頻發給朋友,那就可以直接付費生成;如果視頻里出現某位名人,而那位名人也同意授權,那他們也可以按生成次數獲得分成。當然,現在這個產品才上線六天,所以我不敢太早下定論——也許這些用法只是階段性的熱度。但至少目前看,這確實是一個非常大的使用場景。
主持人:你們有沒有考慮過在 Sora 應用里加入廣告?
Sam Altman:目前還沒有,但那確實是一個值得探索的方向——雖然也挺讓人害怕的(笑)。和 ChatGPT 不同,ChatGPT 的商業模式是訂閱制,但如果 Sora 未來的主要使用場景是用戶刷視頻流、看搞笑或美學內容,那廣告模型會更自然。但如果用戶主要是在私信或群聊中分享視頻(DM 模式),那可能就該采用不同的商業邏輯。樂觀一點的話,我希望在今年年底前(或者保守點,明年一季度)我們能看清產品真正的使用形態,到那時就能決定合適的商業模式。我個人認為——按視頻生成次數收費是合理的嘗試,其他想法還得看產品演化方向再定。
工作的未來:被 AI 改寫的十億個崗位
主持人:我常用“農民的比喻”來形容現在的變革。如果你在 50 年前告訴一個農民:未來會有個叫“互聯網”的東西,能創造十億個新崗位——比如程序員、營銷人員、內容創作者——他一定不會相信。現在我們進入“智能時代”,很多人認為也會有大量新崗位誕生。但不同的是:互聯網時代是從零創造新崗位,而智能時代則可能先影響現有的知識型崗位,然后才逐步催生新的機會。這點你會擔心嗎?
Sam:非常擔心。你提到了一個讓我又稍微放心、又更焦慮的問題。那位農民,不僅不會相信未來的事情,他可能還會覺得我們今天的工作——比如你采訪我、我做科技公司——根本不算“真正的工作”。在他看來,“真正的工作”是種地、養娃、維持生命。我們這些現代人,只是在玩“虛擬的游戲”,讓自己感覺重要而已。也許再過幾十年,未來的人回頭看我們現在的工作,也會說:“那不算真正的工作,只是比游戲稍微認真一點。”
所以我完全能想象——“工作”這個概念會發生深刻的變化。人們依然會找到意義,但“有意義的事情”未必還像現在這樣和“勞動”綁定。我認為社會契約也會隨之重構,尤其是如果這場轉型來的很快的話。短期確實會有陣痛,但我依然相信——人類的創造欲和行動欲是不會消失的。我們總會找到值得去做的新事情。
AGI 之后:人類會去哪里?
主持人:那在 AGI 之后,你覺得人類會把注意力轉向什么?太空?腦機接口?
Sam:我希望是一切方向都能同時展開。太空探索當然很酷,但也許你、我,或其他人會被別的事情吸引。我希望未來的世界是一塊廣闊無邊的可能性畫布,每個人都能在上面創造屬于自己的新事物。
全球 AI 安全框架
主持人:如果你明天可以制定一條全球政策,會是什么?
Sam:要把這個問題縮小到一個具體點其實挺難的。但我腦海里反復浮現的,是關于 AI 監管的那場大辯論:到底這是好事還是壞事?會不會反而讓大公司獲益太多?我能理解各方的觀點。不過我確實認為,當我們進入「超強模型」的階段時,應該有一個全球性的框架來降低災難性風險——至少針對最前沿的那部分,要有一套機制去思考、評估最嚴重的安全問題。如果能有一個全球政策來處理這些問題,那會是一件好事。
主持人:你能大概描述一下這個框架的輪廓嗎?
Sam:我覺得可以先從一個完善的測試體系開始。
否認打造美國版微信
主持人:還有一點我想談的是微信。在中國,它幾乎是一款「萬能應用」——可以購物、刷社交媒體、聊天,幾乎所有功能都集中在里面。現在看起來,ChatGPT 也有購物、網頁搜索、Sora 等等新功能。你是不是在嘗試打造一個「美國版微信」?
Sam:不是。有很多原因讓我認為那種模式在美國市場行不通。我們不是要做「萬能 App」,而是想打造一個真正出色的 AI 超級助手。
主持人:那為什么要把功能分開發布?比如 Sora 為什么是單獨的 App,而不是直接整合進 ChatGPT?
Sam:因為 ChatGPT 對很多人來說,已經成了他們最個人化的賬戶。如果我們突然把一個「社交型體驗」塞進去,會讓人感覺很怪。當然,有一些功能比如消息協作是合理的,因為用戶確實會互相分享內容、一起創作。但用戶對 ChatGPT 的心理預期和他們使用娛樂應用時的狀態完全不同,這兩種體驗放在一起會產生不協調。不過我們確實會把很多功能整合進 ChatGPT,只是會分階段來做。
關于 Agent 構建:看法法律、金融版本的Codex
主持人:你覺得有哪些特別重要或有潛力的智能體(Agent)是你最期待看到的?
Sam:我會參考 Codex 的影響力去思考其他行業。比如,能不能有一個「法律版 Codex」、一個「金融建模版 Codex」?現在已經有很棒的創業公司在嘗試這些方向。但如果技術繼續成熟,能讓這些行業的 AI 體驗像 Codex 之于編程那樣強大,那將是我最興奮的事情。我甚至能想象未來,一個人就能通過與一組智能體的對話來創建一家公司。目前的 Agent Builder、Agent Kit 還沒到那個水平,但我能看到從現在到那一步的路徑。
我們低估了語音設備
主持人:你在主題演講里提到,語音可能是 AI 或 Agent 的「最終交互界面」,能展開講講嗎?
Sam:我不會說它是最終界面,因為在很多場景下語音并不合適。比如你在地鐵上,對著手機講話就挺尷尬的。但在很多時候,語音又是最自然的接口。廣義上說,「語言」才是核心交互方式,有時是語音,有時是打字。我們曾經低估了語音設備。大家喜歡拿智能音箱開玩笑,但其實很多人真的在用,也很喜歡它們——只是它們的 AI 水平還不夠好,生態也不完善。如果未來你能直接「對設備說話,它就精準執行并不再打擾你」,那才是我真正想用的計算機。
新的 I/O 硬件設備:留足創造空間
主持人:那你們在做的 I/O 設備呢?是否也會以語音為主要交互?
Sam:那還需要一些時間。要在高質量、高規模的前提下打造一種全新的計算機使用方式,我們需要留出足夠的創造空間。我們現在確實有一些很讓人興奮的想法,但還沒準備好公開討論。短期內也不會公布,但我們會努力讓它「值得等待」。
主持人:好的,這就是我所有的問題了。
Sam:謝謝,能聊得這么深入我也很高興。





























