熬夜看完OpenAI DevDay發布會,你想要的信息都在這了 原創
聊天框正成為AI時代的操作系統,而OpenAI希望成為新時代的微軟。
OpenAI的開發者日,向世界展示了一張遠比我們想象更為宏大的商業版圖。
CEO山姆·奧特曼在主題演講中分享了一組里程碑數據:ChatGPT周活躍用戶已突破8億,開發者數量從200萬增長至400萬,API每分鐘處理60億token。
這些數字背后,是OpenAI從一家AI模型公司向平臺型企業的徹底轉型。
Apps SDK徹底改變人機交互
奧特曼在DevDay上明確表示:“別把ChatGPT當插件,這是一個‘應用入口’”。這一判斷揭示了OpenAI的核心戰略——將ChatGPT從單純的聊天工具轉變為AI應用的首選平臺。
Apps SDK是本次發布最受矚目的功能,它讓開發者能夠在ChatGPT內部構建真正的交互式應用程序。
過這套SDK,開發者可以連接自己的數據、觸發具體操作、并渲染出完全交互式的用戶界面。
現場演示展示了這一能力的革命性影響。
當用戶為寵物狗業務進行頭腦風暴時,可以直接“@”出Canva應用,后者會根據“色彩豐富、異想天開”的模糊要求,生成一系列精美的海報。
如果靈感迸發,用戶甚至可以要求它將一張海報直接擴展成一份完整的商業計劃書。
而當業務需要擴張時,ChatGPT會根據上下文建議用戶考慮“匹茲堡”這個城市,并無縫喚起Zillow應用,幫助尋找合適的房源。
用戶只需要在ChatGPT內提出新要求,就能讓它篩選出“帶院子的三居室”。
AgentKit大幅降低開發門檻
如果說Apps SDK是OpenAI構建的“入口”,那么AgentKit則是讓這個入口能夠真正干活的核心工具。
AgentKit是一套完整的智能體開發工具集,旨在解決企業級智能體開發“碎片化推進、高門檻入門”的困境。
它覆蓋了AI智能體“構建、部署、優化、連接”的全生命周期。
AgentKit的核心包括三大組件:
- Agent Builder:通過可視化畫布與拖拽式操作,讓開發者無需復雜編碼即可設計智能體的邏輯。
- ChatKit:簡單易用的工具包,讓開發者快速將聊天式智能體界面嵌入自有應用或網站。
- Connector Registry:企業級數據治理門戶,為大型組織提供智能體與外部系統連接的統一管理平臺。
產品經理Christina在現場展示了如何在8分鐘內從零開始為DevDay官方網站構建并上線一個名為“Ask Froge”的智能問答AI。
她通過簡單的拖拽操作,設計了工作流:一個分類器節點判斷用戶提問是關于“會議日程”還是“一般信息”,然后創建了兩個專門的智能體節點處理不同類型的查詢。
Codex重構開發流程:從寫代碼到說意圖
除了前端的應用入口和中層的智能體開發,OpenAI還深入到底層的軟件開發環節。
Codex正式結束研究預覽,進入通用可用階段。自8月初以來,Codex的日活躍使用量增長了10倍以上,處理了超過40萬億token。
Codex的能力已從代碼生成擴展到完整的工作流參與。
OpenAI開發者負責人Romain Huet在現場做了一個震撼演示:他需要讓舞臺攝像頭被實時控制并聯動現場燈光。
他在終端對Codex說:“你能制定一個控制Sony FR7攝像頭的方案嗎?”
Codex立即識別需求,自動查閱技術文檔,用13分鐘完成了完整的控制系統,包括協議實現、服務器搭建和接口連接。
接著,他繼續讓Codex連接無線控制器、構建燈光控制接口、集成語音功能。
最終,他用語音發出指令“把燈光照向觀眾”,現場燈光立即響應——整個過程沒有手寫一行代碼。
模型更新:GPT-5 Pro API全面開放,Sora 2接入開發者
為支撐這一宏大的平臺愿景,OpenAI同時升級了其底層模型能力。
GPT-5 Pro API已向所有開發者開放。
該模型在處理高精度、深度推理復雜任務時表現更出色,特別是在金融、法律、醫療保健等行業。
其訓練截止時間是2024年9月30日,擁有400k上下文窗口,最大支持272k token輸出。
同時,OpenAI還發布了gpt-realtime-mini語音模型,成本比之前的版本降低了70%。
幾天前剛剛上線的Sora 2,預覽版API也正式向開發者開放,這意味著任何應用都可以直接集成OpenAI頂級的視頻生成能力。
本文轉載自???AI 博物院??? 作者:longyunfeigu

















