精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

o3 pro一手真體驗!上下文喂到斷供!大神:o3 pro不會聊天,上帝渴望上下文,認知能力降維打擊Gemini、Claude

原創 精選
人工智能
今天凌晨,Sam Altman 動作非常密集。先是宣布 o3 價格“截肢”(價格直接降至 1/5 ),緊接著不到 2 小時后就發布了 o3-pro。

編輯 | 云昭

出品 | 51CTO技術棧(微信號:blog51cto)

經歷了 5 月份的“買買買”的節奏之后,6月的 OpenAI 終于開始對谷歌的Gemini 2.5 Pro 發起了反擊。

今天凌晨,Sam Altman 動作非常密集。先是宣布 o3 價格“截肢”(價格直接降至 1/5 ),緊接著不到 2 小時后就發布了 o3-pro。

圖片圖片

那么,o3-pro 究竟怎么樣?

現在 OpenAI 放出來的各種測評評分顯示:o3-pro 是目前認知能力、智商最高的 SOTA 模型,甚至超過了人類的平均水平。

一項 IQ 測試結果顯示,o3 的智商得分為 135,遠高于人類 90-110 的平均水平。 

其他高分產品包括 Anthropic 的 Claude-4 Sonnet(127 分)和 Google 的 Gemini 2.0 Flash(126 分)。

還有一位此前已經“秘密測試”的大牛,進行了經典的“六角彈珠跳”測試,而且難度也升級了幾倍。最后呈現的結果非常驚艷、絲滑。

比 o1-pro 便宜得多、更快、更精確(而且使用 o3 和 o3-pro 進行編碼簡直是天壤之別)  即將進行一些很酷的測試,首先是(當然)更堅固的六角彈跳球  o3-pro 是第一個能夠近乎完美地處理球與墻壁之間真實碰撞的模型。

當然,沒有完美的模型。更好的智慧往往也伴隨著更慢的思考。已經有手快的網友對 o3-pro 的速度表示汗顏。

在 X 上,Hyerbolic Labs 聯合創始人兼首席技術官 Yuchen Jin發布了他使用 o3-pro 的幾張截圖,結果就簡單一句“Hi,I'm Sam Altman”,結果就浪費了他 3 分鐘和價值 80 美元的token。

只能說,推理王者,恐怖如斯,氪金更如斯,這跟進了大觀園的劉姥姥吃鴿子蛋一樣,一不留神,一兩銀子一個的鴿子蛋就掉地上了。

圖片圖片

但,提前對 o3-pro 進行“秘密測試”不止上面那位,接下來才是重頭戲。

Altman 在接下來的推文中引用這樣一段用戶的評論——

“o3 給我們的計劃是可行的、合理的;但 o3 Pro 給我們的計劃是具體的、根深蒂固的,它實際上改變了我們對未來的看法。”

圖片圖片

這句評論深得 Altman 的贊同。而這篇文章就出自一位大神,Raindrop.ai 聯合創始人 Ben Hylak,博文的名字:《God is hungry for Context: First thoughts on o3 pro》。

圖片圖片

這篇博文篇幅不長,但非常具有啟發性,甚至可以說是:細思極恐。

比如 Hylak 指出:這不是大模型在「回答問題」,這是它在「接管問題」。

再比如:我們遇到的瓶頸不再是模型太笨,而是它們太聰明,卻還不能真正“落地”。

與 Claude、Gemini相比,它的認知水平像是換了一個維度(降維打擊)!

Hylak 還給出了創作者一個實用的建議:多喂給 o3-pro 上下文!

o3 Pro 不適合做「碎片問題」處理器,而是做「背景清晰的執行者」。

想讓它出彩?你需要給它足夠多的背景信息、清晰目標、甚至系統級提示(system prompt),然后看它如何把碎片拼成答案。

好話不多說,這就幫大家奉上這篇干貨。建議大家收藏細讀。

o3-pro 版本的威力

正如「泄露」的一樣,OpenAI 今天將 o3 的價格大砍 80%(從每百萬 token $10/$40 降到 $2/$8,和 GPT-4.1 持平!),為 o3-pro 的發布鋪平了道路(定價為 $20/$80)。這個定價也支持了社區的一種未經證實的猜測:-pro 版本相當于「10 倍調用基礎模型 + 多數表決」的組合,在 OpenAI 的論文和我們 Chai 節目中都有提及。

根據 OpenAI 提供的數據,o3-pro 在人類測試者中的勝率為 64%,在 4 項穩定性測試中也略優于 o3。但正如 Sam Altman 所說,當你「以不同方式」使用它時,才能真正看到它的能力擴展。

圖片圖片

我在過去一周里拿到了 o3 pro 的早期訪問權限,以下是我的一些初步看法:

上帝渴望上下文

我們正處在「任務特化模型」的時代。一方面,是像 GPT-3.5 Sonnet、GPT-4o 這樣的“普通”模型——我們像朋友一樣和它們聊天,它們幫我們寫東西、回答日常問題;另一方面,是那些龐大、緩慢、昂貴、智商拉滿的推理模型,我們會在需要深度分析、解決復雜問題、探索智力邊界時調用它們(它們擅長批判性思維)。

關注我 X(推特)的人知道,我與 o 系列推理模型的關系是一段旅程。o1/o1-pro 初體驗其實挺差的,但看著大家都在贊美它,我硬著頭皮堅持用了一陣,才意識到——原來是我用錯了方式。

我寫了篇總結,被 @sama ratio(按)了,還被 @gdb 轉推。

關鍵在于: 不要「聊天」,而要把它當作「報告生成器」來用。給它足夠多的上下文、設定清晰目標,然后放手讓它去跑。

而這正是我現在使用 o3 的方式。

注:這里的“報告生成器”,其實是我們在 AINews、Deep Research、Brightwave 中最常見的 LLM 用法。

o3 pro 更聰明,真的更聰明——但你得喂它很多上下文

問題也正出在這里:它確實更聰明,但你必須給它大量上下文才能看到。我幾乎要把上下文喂到斷供。

沒有那種“問它一個問題就被震撼到”的瞬間。

但我換了種方式。

我和我的聯合創始人 Alexis 把我們所有的公司會議記錄、目標設定歷史,甚至語音備忘錄統統整理出來,打包喂給 o3-pro,然后讓它制定一個規劃方案。

結果令人震撼:它給出的計劃不僅具體、合理,而且包含了關鍵指標、時間線、優先級排序、哪些事情該砍,全部都有——這正是我一直希望 LLM 能做出來的東西。

o3 給的是「合理」的建議,o3 pro 給的是「扎實具體,足以改變我們未來規劃思路」的方案。

這種能力,在評測表格上是體現不出來的。

融入真實世界,是下一個挑戰

使用 o3 pro 讓我意識到:模型的“單兵作戰”能力已經太強,我們幾乎要用光「標準測試題」了。

接下來的挑戰,不是它聰不聰明,而是它能不能真正融入世界。就像一個 IQ 超高的 12 歲少年要上大學:再聰明也沒用,如果沒法融入社會,還是無法工作。

目前這種「融入」主要靠工具調用:模型能不能和人協作、能不能接入外部數據、能不能與其他 AI 協同?

o3 pro 在這方面確實邁出了一大步。它明顯比 o3 更擅長感知自己的環境、準確知道自己有哪些工具、什么信息需要去問外部、該怎么選對工具來完成任務。

如下圖左側所示:o3 pro 對自己處境的理解,明顯比 o3 要準確得多。

圖片圖片

圖片圖片

不足之處

在早期使用中,我也注意到:

如果不給足夠上下文,它會有點“過度思考”。它在分析方面很強,使用工具執行任務也很棒,但“直接動手做”的能力反而不如 o3。

比如有些關于 ClickHouse SQL 的問題,反而是 o3 表現更好。

你的使用體驗可能會有所不同(YMMV)。

圖片圖片

與其他模型相比

o3 pro 給人的感覺和 Claude Opus、Gemini 2.5 Pro 完全不同。

Claude Opus 讓人覺得「很大」,但我從沒真正感受到它的“大”體現在哪。而 o3 pro 的回答就是比別人好,它的認知水平像是換了一個維度。

OpenAI 現在顯然在深耕“垂直強化學習”(Vertical RL)這條路,比如 Deep Research、Codex——不僅是讓模型會用工具,而是要讓它學會「何時」用工具、為什么用工具。

結語:上下文仍是王道

推理模型的最佳提示方式,其實沒變。我之前寫的 o1 提示指南依然有效。

上下文就像是喂給餅干怪獸的餅干:這是種“人肉加持的記憶體系”,但它很有效,因為它是有目標的。

系統提示(System Prompt)現在也變得非常重要,模型已經非常可塑,提示詞、工具、記憶這些組成的“harness”(約束機制)決定了最終產品的好壞。

像 Cursor 之所以好用,就是 harness 設計得好。

作者最后還附加了一些其他雜項觀察,比如:
  • 系統提示對模型行為的塑造,遠比 o3 時代更強。
  • 與 Claude Opus、Gemini 相比,o3 pro 是「質的飛躍」。
  • OpenAI 真正在做的是:不是教模型“怎么做”,而是教它“什么時候做、是否該做”。

好了,文章到這里結束了。

多說一嘴,蘋果前不久還炮轟了各種推理大模型,說大模型壓根不會推理,所謂的深度推理不過是另一種形式的模式匹配而已。

大家如何看待此次 OpenAI 新推理模型的發布呢?有沒有一種“天塌了”的感覺,小編認為:或許,我們的確應該重新思考一個問題——

我們繼續讓大模型聊天、回答問題,已經不重要了!因為聰明不聰明已經不重要了!畢竟智商都超過了人類,剩下的應該問:

大模型「能不能融入現實」,真正成為生產力的人類參與者!

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2025-05-13 08:24:14

2025-06-17 08:40:44

2017-05-11 14:00:02

Flask請求上下文應用上下文

2025-06-11 08:56:54

2025-06-04 04:25:00

Claude 4ChatGPT o3模型

2012-12-31 10:01:34

SELinuxSELinux安全

2022-09-14 13:13:51

JavaScript上下文

2023-07-11 10:02:23

2025-05-29 02:11:00

2021-07-26 07:47:36

Cpu上下文進程

2022-09-15 08:01:14

繼承基礎設施基礎服務

2015-10-09 09:43:28

CSS CSS3

2025-04-21 16:27:18

AIGPT?3.5工具

2023-09-16 13:47:47

人工智能數據

2022-10-28 16:24:33

Context上下文鴻蒙

2024-09-30 14:10:00

2017-12-17 17:01:23

限界上下文系統模型

2025-03-18 08:14:05

2024-02-27 11:46:40

2020-07-24 10:00:00

JavaScript執行上下文前端
點贊
收藏

51CTO技術棧公眾號

a毛片在线免费观看| 免费在线观看a级片| 一呦二呦三呦精品国产| 综合婷婷亚洲小说| 狠狠久久综合婷婷不卡| 波多野结衣高清视频| 亚洲最大av| 亚洲欧美中文字幕在线一区| 三级一区二区三区| av中文资源在线资源免费观看| 国产午夜精品在线观看| 91青青草免费观看| 特级西西444www高清大视频| 亚洲午夜黄色| 中文字幕精品视频| 国产草草浮力影院| 欧美第一在线视频| 欧美日韩一区二区在线观看| 男人天堂a在线| avtt亚洲| 91老师片黄在线观看| 亚洲综合一区二区不卡| 亚洲国产成人无码av在线| 久久精品影视| 永久555www成人免费| 高清中文字幕mv的电影| 日韩久久99| 在线日韩av片| 无码人妻h动漫| 丁香花在线电影| 一区二区激情小说| 无码人妻精品一区二区三区99v| 国产在线一在线二| 91免费视频大全| 翡翠波斯猫1977年美国| 国产精品久久久久毛片| 男女性色大片免费观看一区二区 | 超碰在线免费公开| 欧美国产乱子伦| 日韩av一级大片| 国产日韩精品在线看| 97se亚洲国产综合自在线观| 国产精选一区二区| www.av在线.com| 国产a级毛片一区| 国产精品久久久对白| 精品久久久久中文慕人妻| 狠狠色丁香久久婷婷综合丁香| 日韩美女免费观看| 69亚洲精品久久久蜜桃小说| 国产亚洲激情| 日韩**中文字幕毛片| 日韩免费不卡视频| 亚洲精品影视| 91成人在线观看国产| 日韩免费一级片| 性8sex亚洲区入口| 国产成人精品午夜| 中文字幕人妻一区二区三区视频 | 欧美激情四色| 免费不卡在线观看av| 麻豆亚洲av熟女国产一区二| 欧美区日韩区| 久久久女女女女999久久| 1级黄色大片儿| 香蕉精品999视频一区二区| 欧美整片在线观看| 中文字幕日本人妻久久久免费| 久久er99精品| 成人区精品一区二区| 欧洲成人一区二区三区| 久久久噜噜噜久久人人看| 亚洲狠狠婷婷综合久久久| 国产在线69| 亚洲综合999| 国产精品丝袜久久久久久消防器材| 中文字幕在线看片| 欧美男女性生活在线直播观看 | 99国产精品视频免费观看| 久久综合给合久久狠狠色| 国产人成在线观看| 樱花草国产18久久久久| 国产97在线 | 亚洲| 激情亚洲影院在线观看| 欧美一级二级三级乱码| 在线观看日韩精品视频| 天天天综合网| 欧美一区二区三区免费视| 中文字幕+乱码+中文字幕明步| 国产老肥熟一区二区三区| 精品乱色一区二区中文字幕| 成人影院免费观看| 亚洲国产精品一区二区久久恐怖片 | 一本一本久久a久久精品综合麻豆| 一区二区xxx| 91成人午夜| 亚洲一区二区久久久| 欧美高清视频一区二区三区| 久久精品毛片| 91精品免费| 国产福利在线| 天天影视色香欲综合网老头| 日本不卡一区二区在线观看| 国产精品极品国产中出| 日韩在线视频一区| 日本网站在线播放| 国产精品一二三区| 翔田千里亚洲一二三区| 啊啊啊久久久| 日韩一区国产二区欧美三区| 人妻精品久久久久中文| 在线播放不卡| 91九色蝌蚪国产| 国产女主播在线写真| 亚洲国产精品天堂| 99中文字幕在线| 欧美综合另类| 日韩美女写真福利在线观看| 亚洲乱码国产乱码精品精软件| 国产精品嫩草影院com| 久草热视频在线观看| 日韩最新av| 久久亚洲精品网站| 亚洲一区在线观| 日本一区二区三级电影在线观看| 亚洲美免无码中文字幕在线| 麻豆国产一区二区三区四区| 色婷婷**av毛片一区| 中国a一片一级一片| 久久奇米777| 免费毛片小视频| 中文字幕一区二区三区四区久久| 久久精品国产一区二区电影| 国产午夜无码视频在线观看| 久久久久国产成人精品亚洲午夜| www国产精品内射老熟女| 国产精品tv| 久久露脸国产精品| 人人妻人人澡人人爽人人欧美一区| 自拍偷拍欧美激情| 制服丝袜中文字幕第一页| 欧美综合视频| 国产日韩精品电影| 日本网站在线免费观看视频| 欧美日韩欧美一区二区| 黄色片网站在线播放| 青椒成人免费视频| 一本一道久久久a久久久精品91| 欧美日韩成人影院| 中文字幕国产精品久久| 在线观看色网站| 国产精品全国免费观看高清| 日韩中文字幕a| 亚洲久久久久| av一本久道久久波多野结衣| 激情图片在线观看高清国产| 亚洲第一免费播放区| 日韩少妇高潮抽搐| 99精品久久久久久| 50路60路老熟妇啪啪| av资源久久| 91色p视频在线| 日本在线观看大片免费视频| 亚洲国产日韩一区| 91青青草视频| 1区2区3区欧美| 亚洲熟女乱综合一区二区| 国内久久视频| 欧美日韩大片一区二区三区| 国语自产精品视频在线看抢先版结局 | 色综合久久综合网97色综合 | 国产成人亚洲精品| 午夜免费播放观看在线视频| 欧美一区二区三区免费| 国产成人无码精品久在线观看| 久久综合色天天久久综合图片| 日韩一级片播放| 亚洲va在线| 精品国产乱码一区二区三区四区| 成人免费av电影| 欧美不卡视频一区发布| 亚洲 欧美 激情 另类| 欧美视频你懂的| 美女视频黄免费| 国产婷婷色一区二区三区四区| gai在线观看免费高清| 亚洲国产精品一区| 视频一区国产精品| а√中文在线天堂精品| 国产精品老女人精品视频| 国产成人在线视频免费观看| 日韩精品在线视频| 国产人妻精品一区二区三区| 欧美日韩一区免费| 黄色录像二级片| 91久色porny| 丰满少妇中文字幕| 肉色丝袜一区二区| 成人网站免费观看入口| 99九九热只有国产精品| 免费国产一区| 一区二区三区免费在线看| 国产成人亚洲综合青青| xxxx在线视频| 久久天天躁狠狠躁夜夜av| 九色蝌蚪在线| 精品国产3级a| 国产同性人妖ts口直男| 欧美性受xxxx| 亚洲天堂视频网站| 亚洲第一福利一区| 18岁成人毛片| 中文字幕一区二区三区乱码在线| 泷泽萝拉在线播放| 成人av午夜电影| 欧美性猛交xx| 国内一区二区视频| 日日噜噜噜噜久久久精品毛片| 亚洲激情综合| 800av在线免费观看| 91欧美在线| 亚洲不卡1区| 久久综合色占| 精品网站在线看| 国产精品对白| 99久久精品免费看国产一区二区三区| 亚洲成人精品综合在线| 国产精品福利小视频| 3d欧美精品动漫xxxx无尽| 91av在线免费观看视频| h片在线观看视频免费| 欧美精品www在线观看| 成人福利片网站| 久久影院在线观看| 成人av黄色| 久久成人综合视频| 日p在线观看| 久久亚洲一区二区三区四区五区高| 成人在线免费公开观看视频| 在线观看日韩av| 国产精品视频二区三区| 伊人久久久久久久久久久| 国产一二三在线观看| 亚洲视频电影图片偷拍一区| 飘雪影视在线观看免费观看| 国产婷婷成人久久av免费高清| 三级做a全过程在线观看| 亚洲精选中文字幕| 麻豆影视在线| 影音先锋日韩有码| 美女黄视频在线观看| 久久国产精彩视频| 性欧美猛交videos| 97视频在线观看播放| 中文在线8资源库| 国产成人精品国内自产拍免费看| 高清av一区| 国产区亚洲区欧美区| 91国产一区| 亚洲一区二区三区四区视频| 亚洲国产欧美国产第一区| 国产日本一区二区三区| 三级精品视频| 天堂√在线观看一区二区| 91亚洲一区| 日韩在线观看a| 国产精品美女久久久| 欧美伦理视频在线观看| 久久99精品久久久久久国产越南| 欧美一级大片免费看| 91丨九色丨黑人外教| 日韩影视一区二区三区| 亚洲精品日日夜夜| 日韩精品一区二区三| 欧美影院精品一区| 精品黑人一区二区三区在线观看 | 久久99精品久久久久久三级| 欧美女王vk| 99久久99久久精品| 午夜在线视频一区二区区别| 亚洲另类第一页| a美女胸又www黄视频久久| 亚洲天堂久久新| 亚洲精品欧美专区| 国产黄色免费观看| 欧美精品18+| 香蕉视频网站在线| 久久久黄色av| 另类激情视频| 99久久99| 不卡在线一区| 欧美三级在线观看视频| 精品一区二区在线看| 黄色录像a级片| 中文字幕五月欧美| 精品成人av一区二区在线播放| 337p亚洲精品色噜噜噜| 四虎影视在线播放| 久久999免费视频| av激情成人网| 国内一区在线| 在线国产一区| 天天爽天天爽夜夜爽| aa级大片欧美| 欧美极品aaaaabbbbb| 欧美午夜电影一区| 天堂av在线资源| 欧美激情第6页| 欧美黑粗硬大| 欧美一级片免费观看| 亚洲青涩在线| 少妇伦子伦精品无吗| 中文字幕免费观看一区| 亚洲综合久久网| 亚洲国产精品国自产拍av秋霞| 国产黄大片在线观看画质优化| 情事1991在线| 国产精品丝袜在线播放| 只有这里有精品| 久久99久国产精品黄毛片色诱| 日本少妇高潮喷水xxxxxxx| 夜夜嗨av一区二区三区| 色婷婷久久综合中文久久蜜桃av| 亚洲女人天堂av| 成av人片在线观看www| 成人黄动漫网站免费| 重囗味另类老妇506070| 小早川怜子一区二区三区| 国产精品欧美久久久久无广告| 在线观看污污网站| 亚洲精品视频中文字幕| 日韩激情电影| 精品久久久久久综合日本| 亚洲日本激情| 91黄色免费视频| 午夜久久久久久久久久一区二区| www.色播.com| 久久久久久香蕉网| 视频精品一区二区三区| 青草网在线观看| 成人免费观看视频| jizz国产免费| 亚洲精品suv精品一区二区| 91吃瓜在线观看| 国产三区精品| 午夜亚洲一区| 成人免费无遮挡无码黄漫视频| 欧美性猛交xxxxx水多| 久久精品国产亚洲a∨麻豆| 国产成+人+综合+亚洲欧美丁香花| 亚洲区小说区图片区qvod| 黄色片一级视频| 国产日产亚洲精品系列| 亚洲天堂网在线视频| 爱福利视频一区| 亚洲一区 二区| 丁香六月激情网| 91免费观看视频在线| 男操女视频网站| zzjj国产精品一区二区| 亚洲午夜免费| 91专区在线观看| 欧美韩日一区二区三区| 国产一区二区三区四区视频| 久久精品国产综合| 凹凸av导航大全精品| 久久精品.com| 一区精品在线播放| 成人1区2区3区| 26uuu另类亚洲欧美日本老年| 国产成人精品免费视| 中文字幕免费高清在线| 一二三区精品福利视频| 欧美日韩影视| 成人福利视频在线观看| 亚洲经典视频在线观看| 国产xxxxhd| 一区二区三区日韩欧美精品 | 大桥未久在线播放| 久久国产精品 国产精品| 蜜桃视频在线一区| 国产亚洲欧美久久久久| 亚洲天堂男人天堂| 日本成人精品| www黄色av| 亚洲精品精品亚洲| 黄色影院在线播放| 99久久久精品免费观看国产| 老牛嫩草一区二区三区日本 | 国产大片在线免费观看| 91在线免费看网站| 亚洲永久在线| 天堂网avav| 亚洲欧洲激情在线| 91亚洲无吗| 国产精品区在线| 色综合久久天天| 日本片在线观看| 亚洲在线视频一区二区| 91婷婷韩国欧美一区二区|