奧特曼警告AI會讓數十億人類工作無意義，否認打造美國版微信，Sora會考慮收費，自曝自己的臉被玩廢了，Agent將持續一周工作

原創精選

作者：云昭 2025-10-10 20:55:22

人工智能

先是各種 Sora2 的生成視頻刷屏，然后是三天前掌舵者 Sam Altman 在 DevDay2025 主題演講中高密度發布了許多利好AI開發者的功能和工具，可以說熱鬧空前。但這些都不足以用來形容此時此刻 OpenAI 的未來藍圖。

編輯 | 云昭

出品 | 51CTO技術棧（微信號：blog51cto）

國慶假期期間，OpenAI 可謂賺足了全球的注意力。

先是各種 Sora2 的生成視頻刷屏，然后是三天前掌舵者 Sam Altman 在 DevDay2025 主題演講中高密度發布了許多利好AI開發者的功能和工具，可以說熱鬧空前。

但這些都不足以用來形容此時此刻 OpenAI 的未來藍圖。

在 DevDay 期間，這位 OpenAI 的掌舵者接受邀請錄制了一期播客，主持人跟他進行了一場非常全面的深度腦暴。

訪談中，Altman 分享了自己對于 ChatGPT、Sora 的核心優勢和商業模式的考量。他坦承，其實自己一開始也不清楚 ChatGPT 的核心優勢是什么，但如今沒想到“記憶功能”卻成了最大的競爭優勢之一。

而談及Sora的商業模式，他指出現在還為時尚早。主要看Sora的使用場景，如果是信息流，那自然會考慮引入廣告，但如果只是分享聊天，群發，那就是另一種商業模式。

而對于AI開發者最看好的 Agentbuilder 工具，Altman 坦言以后真的可以實現 Agent 的無代碼革命。

而 Codex 這一類的AI編程智能體以后甚至可以連續運行一周，期間都不需要人類監督和反饋。

對于大洋彼岸很火的一個名詞：“workslop”（工作糊料，即看起來挺體面，但實際很糟糕的交付結果），Altman 認為經濟會自我糾偏，因為人類本身自己也會產出工作糊料。

OpenAI的版圖還有哪些？是要打造美國版微信嗎？Altman 一口否認了，他認為微信模式在美國走不通，但的確計劃會在 ChatGPT 整合一些新功能。

“如果我們突然把一個「社交型體驗」塞進去，會讓人感覺很怪。”

“用戶對 ChatGPT 的心理預期和他們使用娛樂應用時的狀態完全不同，這兩種體驗放在一起會產生不協調。”

OpenAI 籌劃之中的藏貨還有多少呢？

訪談中，至少可以探秘出以下幾種：

一、ChatGPT 接下來會整合許多有交互能力的功能；

二、Sora 之后會在半年內探索商業付費模式；

三、新的AI硬件方面，AI語音交互將會是一大值得期待的亮點；

四、Agent方面，OpenAI 已經在籌劃在法律、金融領域版本的 Codex。

五、而接下來的 GPT-6 構建的設想，他表示最近發布的新基準“GDPval”會考慮在內，會在后訓練中做出相應調整，但大方向不變。

對于 AGI，Altman 認為實現它的時刻，不在于某個分數，而是 AI 真正開始為人類創造新知識時。

臨近最后，Altman 還討論到了未來的工作情況。他指出，在不久的將來，當今經濟中發生的 40% 的任務將由人工智能完成。AI 會讓數十億人的工作變得不再是真實的工作。

料還很多，建議大家自行收藏細讀。

最看好ChatGPT內置應用

主持人：Sam，非常感謝你來到這里。現在是 2025 年的 DevDay，你能先給我們介紹一下這次發布的內容，以及你個人最期待的部分嗎？

Sam：其實我對所有內容都很興奮。不過要我挑一個，我想說——ChatGPT 內置應用（Apps in ChatGPT）。這其實是我很早就想做的事。剛才我和幾位開發者聊了聊他們用 Agent Builder（或 Agent Kit）做的項目，真的有不少我自己都想立刻用的。如果只能選一個，那就是 Apps in ChatGPT。

主持人：我也喜歡 Agent Builder，不過 Apps in ChatGPT 的確很酷。我們可以從這里聊起。順便說一句，恭喜你們現在 ChatGPT 已經有 8 億周活用戶了。

Sam：謝謝，這數字確實令人震驚。ChatGPT 正在成為一個新的“分發平臺”。

主持人：那開發者或創業者要如何利用這次發布的 App SDK，在 ChatGPT 之上構建產品？

Sam：我認為這還需要一段探索期，去觀察大家最終會怎么用這些 App。比如，人們會直接叫出 App 的名字嗎？還是希望 ChatGPT 能自動記住他們常用的 App 并主動推薦？這些新的分發機制需要開發者自己去摸索。但每次我們把東西交給世界時，總會被實際使用方式所驚喜到。

主持人：我聽說你們今天也會發布文檔，幫助開發者提高被推薦的幾率？

Sam：是的，不過要說明的是，這些都是全新的產品，變化會很快，我們也會邊學邊改。但沒錯，文檔今天就會放出。

Agent Builder 與 GPT Builder 的演進

主持人：回到第一次 DevDay，兩年前你們發布了 GPT Builder，當時引起了不小的轟動。我記得自己是最早做出公開 GPT 的開發者之一。這次的 Agent Builder，相比當年，有哪些突破？

Sam：最大的不同是模型能力的躍升。這 22、23 個月的進步實在太驚人了。除此之外，我們也學到了很多關于人們如何想要構建 agent 的經驗，包括他們希望能在 ChatGPT 之外的服務上構建。讓我印象最深的是，現在你能用一個可視化界面，上傳幾個文件、連接數據源、定義目標，幾分鐘內就能部署出一個能做復雜任務的 agent。

昨天彩排時我看完整個流程，真有點震撼——像 Codex、Agent Kit 這樣的工具，讓“構建軟件”的速度發生了地殼級的變化。我現在還沒完全理解這會帶來多大的影響。

AI Agent 的低代碼革命

主持人：如果我理解沒錯，現在通過 Agent Builder 已經可以實現零代碼構建 agent？

Sam：完全可以。當然，如果你懂一點編程，會做得更細致更好；但一般的知識型工作者，現在也能自己做 agent。

主持人：那這基本就是“AI Agent 的無代碼革命”了。

Sam：沒錯。你會寫一點代碼能做更多，但入門門檻已經非常低。我在想這會對下一波創業者、企業會有什么影響。昨天我看了 Romain 的現場演示，真是震撼——這些東西在一年前可能要花很久才能做出來，現在幾乎能“現場生成”。感覺創意的產生速度都跟不上實現的速度了。我還不能完全判斷這意味著什么，但顯然，軟件的生產速度將大幅提升，而從實驗到改進的周期會越來越短。我們能更快驗證想法、篩選出好點子——只是我還不知道這會改變哪些更大的東西。

“零人公司”的賭局

主持人：我聽說你和朋友之間有個賭局，賭什么時候會出現第一個由 agent 運營的十億美元公司？Agent Builder 能把我們帶到那個階段嗎？

Sam Altman：還沒那么快。我們以前的賭是“第一個一人公司”何時出現；現在大家開始猜“零人公司”要多久。我們還沒正式開盤，但確實很多人在討論。我覺得至少要幾年時間。不過，僅僅是能認真地討論“零人公司”這個概念，就已經很不可思議了。

讓 Agent 一周不出錯地工作，需要什么

主持人：很多人都說這是“Agent 元年”，但目前的 agent 還需要大量人工監督。你覺得什么時候才能出現能連續工作一周都不需要反饋的 agent？

Sam：我覺得 Codex 離那不遠了——這話聽起來都像科幻。或許 2025 年內還達不到，但我們今天已經看到它能完成“一天級任務”。進步速度快得驚人。我很少會覺得“AI 進步太快”，但在觀察 Codex 任務持續時長的提升時，確實有這種感覺。我猜，能持續工作一周的 agent，不會太遠。

主持人：要實現那一步，還缺什么技術？

Sam：更聰明的模型、更長的上下文、更好的記憶系統。

世界變了，但核心優勢的類型沒變

主持人：現在有了這一切工具，如果讓 20 歲、剛從斯坦福輟學的你穿越到今天，你會選擇做什么？又會避免做什么？

Sam：我前幾天其實剛想過這個問題。我真有點羨慕現在的年輕一代。他們面前的機會空間巨大到難以想象。我已經很多年沒能空出一大段時間去思考“我想做什么項目”，但我知道，如果我現在 20 歲，我一定會有一堆想做的酷東西。今天跟這么多開發者聊天，看到他們在構建的那些新東西——真的很讓人振奮。

主持人：有沒有什么建議，能幫助開發者在構建這些產品時，找到屬于自己的“獨特優勢”？比如分發渠道、數據壁壘，或者某種特定工作流？

Sam：這是個很難抽象回答的問題。我認為最好的獨特優勢，往往是獨屬于你自己、你必須親自摸索出來的東西。我們在 OpenAI 身上也花了極大的努力去找出那種差異化優勢。但總體來說，這不是一個“通用解”。真正重要的優勢，往往只在你所在的時機、市場定位、技術方向下才成立。而這種探索，本身就構成了創業帶來的獨特價值。

如果要說一條普遍適用的經驗，我會說——邊做邊找，策略是從戰術中長出來的。我很喜歡一句商業名言：“讓戰術演變成戰略。”你可以從一些“眼下有效的小事”開始做，而在不斷嘗試的過程中，往往會自然衍生出一個更長遠的戰略方向。

舉個例子，如果你在 ChatGPT 推出時問我：“你們未來的核心優勢會是什么？”我可能會回答：“不知道。”我可以猜一堆，但不會有信心。結果現在看來，“記憶功能”成了我們最大的競爭優勢之一——它讓用戶愿意長期留在 ChatGPT。而當初我們完全沒想到這一點。所以很多時候，你只是不斷構建功能，然后在某個瞬間突然意識到：“哦，這東西居然能成為我們的長期壁壘。”

主持人：那有沒有一些線索，提示我們現在該往哪些“優勢方向”去構建，比如為 GPT-6 時代提前布局？

Sam：那就得你自己去摸索了（笑）。我很樂意哪天和你一起頭腦風暴一下，因為那會挺有趣的。但老實說，OpenAI 已經占據了我全部的腦容量，我都沒法再認真去想怎么做新創業項目了——這點有點遺憾。雖然世界變了，但企業的核心優勢類型其實沒怎么變：網絡效應、品牌與營銷、用戶數據、市場網絡效應……這些仍然是競爭力的基礎。不過，建立這些優勢的新“戰術”，會隨著時代變化而更新。

GPT-5 vs Claude：GDPval 測試結果

主持人：OpenAI 最近發布了一個名為 GDPval 的新基準，用來衡量模型在各種知識型工作中執行“經濟上有價值任務”的能力。讓我驚訝的是，GPT-5 的表現排在 Claude Opus 之后，而你們依然選擇公開這個結果。你本人對此意外嗎？

Sam：首先，如果我們因為排名第二就不發布，那才真糟糕。我們會在某些領域最好，也會在別的地方被超越。要建立一個能持續進步的文化，關鍵是坦然承認別人暫時做得更好。我認為 Anthropic 在理解企業級使用場景、以及讓模型輸出更優雅的結構化結果方面，做得非常出色。所以我并不驚訝，只是被激勵得想更快追上。

主持人：這次的評測結果，會改變你們構建 GPT-6 的方式嗎？

Sam：可能會在后訓練階段帶來一些調整，但總體戰略不會因此改變。

我們何時真正實現 AGI？

主持人：你最近提過，你對 AGI 的定義是“在大多數經濟上有價值的任務中超越人類”。那 GDPval 的哪個分數會讓你說：“我們已經實現了 AGI”？

Sam：我一直在思考這個問題。首先——就像很多人一樣，我對 AGI 有多個定義。離它越近，這個概念反而越模糊。不過，對我來說最重要的一點，也是最讓我意外的是——我們終于開始看到模型能進行“原創發現”。比如，它能擴展人類的知識邊界。

現在在 X（Twitter）上，你會看到越來越多科學家發帖說：模型提出了一個新的假設、發現了一個小規律、或者想出一種新的研究思路。這些都還非常微小，我不想夸大，但也不能忽視它的意義——我們正處在 AI 發現能力的起點。而我們有理由相信，在未來幾個月乃至幾年內，這方面會迎來加速。這，可能是我最在乎的“AGI 時刻”。它不是某個分數，而是當 AI 真正開始為人類創造新知識時。

AI 將要解決的科學突破

主持人：有沒有什么具體的科學突破，是你特別期待 AI 能去解決或推動的？

Sam：當然，治愈疾病、發現新的物理定律——那種事情會非常令人振奮。但其實，眼下正在發生的一些“小事”，比如數學領域的進展，也讓我感覺意義非凡。當 GPT-4 發布時，我記得很多人還在爭論“圖靈測試”的定義——但大眾心中的“圖靈測試”一直像是一個遙不可及的目標。然而突然之間，它就被跨越了。而社會的反應基本是——毫無波瀾。大家驚呼兩周，然后立刻抱怨：“這玩意怎么不夠快？”、“怎么不夠聰明？”、“能不能再好一點？” 這其實挺能說明人性的：那個長期以來代表 AI 極限的“考驗”被我們一瞬間甩在身后，而人類幾乎瞬間適應了。我覺得接下來也會出現類似的情況——我們會非常快地習慣 AI 進行科學發現。這有點像 Waymo（無人駕駛）：第一次上車確實怪異，但那種感覺只持續三分鐘，然后就變得理所當然了。

從工作糊料到同意自己形象在Sora上對外公開

主持人：我想插一句。最近斯坦福有個研究，提出一個新詞——“工作糊料（workslop）”。簡單解釋一下，就是“看起來很體面、其實低質量”的產出。他們調查了一千多位辦公室職員，41% 的人說最近一個月遇到過這種來自同事的“AI 糊料”。平均每次清理需要 1 小時 56 分鐘，每名員工每月因此損失約 186 美元。所以問題是：AI 能讓一部分人效率提升 10 倍，那我們在教育或新人培訓中缺了什么？為什么很多人不知道什么時候該用 AI，什么時候不該用？

Sam：首先得說，很多人類自己也在制造“工作糊料”。這不是 AI 獨有的現象——比如那些只制造工作量的郵件，或者毫無意義的會議。其實從很久以前開始，就存在兩類人：一種人用工具提升效率；另一種人用工具給組織制造阻力。AI 也會一樣——不會例外。但經濟會自我糾偏。那些能用工具提高產出的人和公司，會更有能力塑造未來；反之，那些拖慢效率的，會被邊緣化。當然，每種新工具都有學習曲線，但這次我認為會非常快。

主持人：那 OpenAI 是否在教育或培訓上，做些什么來幫助人們更好地建立“AI 直覺”？

Sam：有的，我們確實在做。但人們總會以他們自己的方式使用工具。我學到的一點是——你可以做出極好的教育內容、培訓課程，但人們一旦發現他們能讓模型“用海盜口音說話”，他們就會去玩這個。不過我們確實在努力，制作大量幫助人們把 AI 整合進日常工作流的內容。在某些場景下，比如 Codex，企業的采用非常快——從試用到深度融合，只需要幾天或幾周。

主持人：說到“糊料”，你現在也是世界上第一個被 Sora 做成病毒級 meme 的 CEO。網上那些把你“換臉成 GPU 盜賊”的視頻，會讓你感到害怕嗎？

Sam：其實比我預想的沒那么怪異。很奇怪的是——看一個視頻會覺得不適，但連刷一百個反而沒那么怪。我記得那時我正在環球出差，有個團隊成員發消息問我：“我們能不能把你的 cameo（出鏡形象）開放訪問？”我當時八秒內就回復“可以”，其實那應該是個值得深思的問題。但我想，既然我們在做這項新技術，我自己都不愿去嘗試，那就太說不過去了。結果我決定開放。之后在飛機上我想，這可能會挺奇怪的。但上線后我醒來一看，整個社交媒體都是 meme。我笑了。真的就是那種 Waymo 式的體驗——前 3 分鐘有點怪，然后就完全習慣了。唯一讓我擔心的，是今天早上有幾家公司發布了“去水印工具”。如果別人能把 Sora 的水印去掉，用我的形象發視頻，這可能會影響我的個人品牌。那我為什么還要開放自己的 cameo 呢？

主持人：所以你的意思是，提前發布帶有防護的版本，其實是為了幫助社會提前適應？

Sam：沒錯。我們經常會預見到某項技術遲早會被廣泛開放——幾個月或幾年后，任何人都能用開源模型生成視頻，甚至可以讓“你”做任何事。社會終會適應，但我們希望通過提前發布 + 加入防護，讓社會和技術能夠共同進化。文本時代我們已經這么做過了。視頻更難，因為它帶來的情緒沖擊更強。但最終我們會學會適應。未來網上會充斥著各種“假視頻”，很多都沒有水印、也無法追溯來源。這種情況一定會發生。讓社會對它提前“免疫”，是有價值的。

主持人：那最終目標是做出“真假難辨”的 AI 視頻嗎？

Sam：最終目標還是 AGI（通用人工智能）。高質量視頻只是其中的重要一步。它能推動空間推理、世界模型學習，甚至是機器人研究的進展。我認為“生成式視頻”是好事。我不希望未來人機交互只局限于文本。我很期待一個新形態的界面——你能在實時視頻流中與系統互動，它會動態生成屬于你的界面與體驗。所以，是的，高質量視頻是通向真正 AGI 的寶貴一步。

考慮Sora視頻生成付費

主持人：你們上周五發布了一篇博客，說正在考慮為允許自己肖像 cameo（客串）的視頻創作者推出分成機制。能透露下具體怎么運作嗎？

Sam：就像很多新產品一樣——一旦上線，你總會發現用戶的使用方式和我們想象的不一樣。我們原本以為，Cameo 主要會由少數創作者制作一些很酷、精致、有創意的視頻內容，然后被更大范圍的觀眾觀看和分享。確實有一些這樣的案例，但我們也看到大量用戶在為自己、或幾個朋友制作視頻，在群聊中互相分享。我還不確定這是不是一時的新鮮感，但如果這種使用方式真的能持續下去，那它將徹底改變我們對計算量與用戶參與度之間關系的模型。

未來，我們可能會允許用戶為視頻生成付費。比如你想一天做 100 個表情包視頻發給朋友，那就可以直接付費生成；如果視頻里出現某位名人，而那位名人也同意授權，那他們也可以按生成次數獲得分成。當然，現在這個產品才上線六天，所以我不敢太早下定論——也許這些用法只是階段性的熱度。但至少目前看，這確實是一個非常大的使用場景。

主持人：你們有沒有考慮過在 Sora 應用里加入廣告？

Sam Altman：目前還沒有，但那確實是一個值得探索的方向——雖然也挺讓人害怕的（笑）。和 ChatGPT 不同，ChatGPT 的商業模式是訂閱制，但如果 Sora 未來的主要使用場景是用戶刷視頻流、看搞笑或美學內容，那廣告模型會更自然。但如果用戶主要是在私信或群聊中分享視頻（DM 模式），那可能就該采用不同的商業邏輯。樂觀一點的話，我希望在今年年底前（或者保守點，明年一季度）我們能看清產品真正的使用形態，到那時就能決定合適的商業模式。我個人認為——按視頻生成次數收費是合理的嘗試，其他想法還得看產品演化方向再定。

工作的未來：被 AI 改寫的十億個崗位

主持人：我常用“農民的比喻”來形容現在的變革。如果你在 50 年前告訴一個農民：未來會有個叫“互聯網”的東西，能創造十億個新崗位——比如程序員、營銷人員、內容創作者——他一定不會相信。現在我們進入“智能時代”，很多人認為也會有大量新崗位誕生。但不同的是：互聯網時代是從零創造新崗位，而智能時代則可能先影響現有的知識型崗位，然后才逐步催生新的機會。這點你會擔心嗎？

Sam：非常擔心。你提到了一個讓我又稍微放心、又更焦慮的問題。那位農民，不僅不會相信未來的事情，他可能還會覺得我們今天的工作——比如你采訪我、我做科技公司——根本不算“真正的工作”。在他看來，“真正的工作”是種地、養娃、維持生命。我們這些現代人，只是在玩“虛擬的游戲”，讓自己感覺重要而已。也許再過幾十年，未來的人回頭看我們現在的工作，也會說：“那不算真正的工作，只是比游戲稍微認真一點。”

所以我完全能想象——“工作”這個概念會發生深刻的變化。人們依然會找到意義，但“有意義的事情”未必還像現在這樣和“勞動”綁定。我認為社會契約也會隨之重構，尤其是如果這場轉型來的很快的話。短期確實會有陣痛，但我依然相信——人類的創造欲和行動欲是不會消失的。我們總會找到值得去做的新事情。

AGI 之后：人類會去哪里？

主持人：那在 AGI 之后，你覺得人類會把注意力轉向什么？太空？腦機接口？

Sam：我希望是一切方向都能同時展開。太空探索當然很酷，但也許你、我，或其他人會被別的事情吸引。我希望未來的世界是一塊廣闊無邊的可能性畫布，每個人都能在上面創造屬于自己的新事物。

全球 AI 安全框架

主持人：如果你明天可以制定一條全球政策，會是什么？

Sam：要把這個問題縮小到一個具體點其實挺難的。但我腦海里反復浮現的，是關于 AI 監管的那場大辯論：到底這是好事還是壞事？會不會反而讓大公司獲益太多？我能理解各方的觀點。不過我確實認為，當我們進入「超強模型」的階段時，應該有一個全球性的框架來降低災難性風險——至少針對最前沿的那部分，要有一套機制去思考、評估最嚴重的安全問題。如果能有一個全球政策來處理這些問題，那會是一件好事。

主持人：你能大概描述一下這個框架的輪廓嗎？

Sam：我覺得可以先從一個完善的測試體系開始。

否認打造美國版微信

主持人：還有一點我想談的是微信。在中國，它幾乎是一款「萬能應用」——可以購物、刷社交媒體、聊天，幾乎所有功能都集中在里面。現在看起來，ChatGPT 也有購物、網頁搜索、Sora 等等新功能。你是不是在嘗試打造一個「美國版微信」？

Sam：不是。有很多原因讓我認為那種模式在美國市場行不通。我們不是要做「萬能 App」，而是想打造一個真正出色的 AI 超級助手。

主持人：那為什么要把功能分開發布？比如 Sora 為什么是單獨的 App，而不是直接整合進 ChatGPT？

Sam：因為 ChatGPT 對很多人來說，已經成了他們最個人化的賬戶。如果我們突然把一個「社交型體驗」塞進去，會讓人感覺很怪。當然，有一些功能比如消息協作是合理的，因為用戶確實會互相分享內容、一起創作。但用戶對 ChatGPT 的心理預期和他們使用娛樂應用時的狀態完全不同，這兩種體驗放在一起會產生不協調。不過我們確實會把很多功能整合進 ChatGPT，只是會分階段來做。

關于 Agent 構建：看法法律、金融版本的Codex

主持人：你覺得有哪些特別重要或有潛力的智能體（Agent）是你最期待看到的？

Sam：我會參考 Codex 的影響力去思考其他行業。比如，能不能有一個「法律版 Codex」、一個「金融建模版 Codex」？現在已經有很棒的創業公司在嘗試這些方向。但如果技術繼續成熟，能讓這些行業的 AI 體驗像 Codex 之于編程那樣強大，那將是我最興奮的事情。我甚至能想象未來，一個人就能通過與一組智能體的對話來創建一家公司。目前的 Agent Builder、Agent Kit 還沒到那個水平，但我能看到從現在到那一步的路徑。

我們低估了語音設備

主持人：你在主題演講里提到，語音可能是 AI 或 Agent 的「最終交互界面」，能展開講講嗎？

Sam：我不會說它是最終界面，因為在很多場景下語音并不合適。比如你在地鐵上，對著手機講話就挺尷尬的。但在很多時候，語音又是最自然的接口。廣義上說，「語言」才是核心交互方式，有時是語音，有時是打字。我們曾經低估了語音設備。大家喜歡拿智能音箱開玩笑，但其實很多人真的在用，也很喜歡它們——只是它們的 AI 水平還不夠好，生態也不完善。如果未來你能直接「對設備說話，它就精準執行并不再打擾你」，那才是我真正想用的計算機。

新的 I/O 硬件設備：留足創造空間

主持人：那你們在做的 I/O 設備呢？是否也會以語音為主要交互？

Sam：那還需要一些時間。要在高質量、高規模的前提下打造一種全新的計算機使用方式，我們需要留出足夠的創造空間。我們現在確實有一些很讓人興奮的想法，但還沒準備好公開討論。短期內也不會公布，但我們會努力讓它「值得等待」。

主持人：好的，這就是我所有的問題了。

Sam：謝謝，能聊得這么深入我也很高興。

責任編輯：武曉燕來源： 51CTO技術棧

AI Sora Agent