精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

最先進推理模型! OpenAI 推出o3 和 o4-mini模型 原創

發布于 2025-4-23 08:25
瀏覽
0收藏

開篇

就在OpenAI推出 ??GPT 4.1 系列???幾天后,又發布了o3 和 o4-mini 的推理模型,這表明大模型正式邁向 AGI(?? 人工通用智能 ??)。 o3 和 o4-mini 不僅僅是 AI 模型;它們還具備智能性、自治性、可調用工具以及與真實軟件對接的技能,是一個真正意義上的AI 系統。 新模型不會被動工作;而是主動使用工具自動完成任務! 接下來,就讓我們深入了解“O 系”模型:o3 和 o4-mini 的功能、性能和應用。

o3 和 o4-mini 是什么?

o3 和 o4-mini 是 OpenAI 最新的推理模型,取代了 o 系列之前的模型,比如 o1 和 o3-mini。o 系模型不同于主要關注模式識別和文本生成的LLMs(大語言模型),o 系模型作為推理模型采用了更長的內部“思維鏈”模式。

這種方式使模型能夠分解復雜問題,評估不同步驟,并得出更準確和慎重的解決方案。因此,在諸如 STEM、編碼和邏輯推理等領域,它們尤其擅長。此外, o 系模型首創了整合工具套件的能力,能夠主動使用和組合 ChatGPT 中提供的完整工具套件。

o3 是 OpenAI 最先進的推理模型,擅長處理在各個領域需要深入分析思考的任務。該模型的計算量是 o1 的 10 倍,引入了“圖像推理”的能力。這使其能夠直接在認知過程中處理和推理關于視覺輸入的信息。

o4-mini 是 o3 模型的替代品, 相對于o3而言o4-mini更加緊湊、高效、以及成本更低。盡管o4-mini模型的參數少于o3模型,但它在數學、編碼和視覺任務等領域表現出色。通過對模型的優化設計可以確保模型具備更快的響應速度和更高的吞吐量,使其適用于高效的應用場景。

最先進推理模型! OpenAI 推出o3 和 o4-mini模型-AI.x社區

同時,OpenAI 還發布了 o4-mini-high 變體,它會花費更多時間處理用戶請求,并給出更可靠的答案。

未來,OpenAI計劃向訂閱用戶發布更強大的o3-pro版本,它將使用更多計算資源,同時也提供更好的服務。

o3 和 o4-mini 的主要功能

o3與o4-mini的強大離不開如下關鍵特性:

  • 主動行為:主動解決問題的能力,自主確定復雜任務的最佳方法,并高效地執行多步解決方案。
  • 高級工具集成:無縫地利用諸如網絡瀏覽、代碼執行和圖像生成等工具,以增強其回答并有效應對復雜查詢 。
  • 多模態推理:直接處理和整合視覺信息到他們的推理過程中,從而解釋和分析圖像與文本數據并行。
  • 高級視覺推理(“用圖像思考”):解釋復雜的視覺輸入,例如圖表、白板草圖,甚至模糊/低質量照片。它們甚至可以將這些圖像(放大、裁剪、旋轉、增強)作為推理過程的一部分,從而提取相關信息。

o3 和 o4-mini 是否反映了 AGI?

這兩個“o 系”模型會在生成響應前執行復雜的多步推理。

當用戶給出問題時, o3先會使用“蠻力”得出解決方案。接著,會嘗試找到更智能的計算方法并以更簡潔的格式呈現。然后,繼續核對答案并簡化,從而提供給用戶簡單和易于理解的回應。

最先進推理模型! OpenAI 推出o3 和 o4-mini模型-AI.x社區

盡管整個思考過程部分基于計算和訓練,但在模型的訓練過程中,并沒有被明確教導去簡化答案或重新檢查過程。不過模型的響應過程,這使之具備自我進化和自我學習的能力,從而逐漸逼近通用人工智能。

此外,o3 能夠自主決定何時以及如何使用 ChatGPT 中的各種工具(網絡搜索、Python 數據分析、DALL·E 圖像生成和視覺),以解決復雜、多方面的查詢。它可以鏈接多個工具調用,迭代搜索網絡,分析結果,并在各種模式之間綜合信息。

對 o3、o4-mini 和 o4-mini-high 進行實際測試

現在讓我們在一些實際應用中嘗試這些備受期待的新 o 系列模型。我們將測試所有三個模型在它們擅長的任務上的表現。這包括:

  • 使用 o3 進行編碼
  • 使用 o4-mini 進行數學推理
  • 使用 o4-mini-high 進行視覺推理

讓我們開始吧!

任務 1:使用 o3 進行編碼

提示詞: “創建一個 Python 模擬,其中有 2 個球 - 一個是黃色的,另一個是藍色的 - 它們在一個順時針旋轉的五邊形內的厚六邊形框架中彈跳。每次它們相撞時,球必須變成綠色,并在下一次相撞時恢復原來的顏色。它們必須以遞增的速度移動?!?/p>

最先進推理模型! OpenAI 推出o3 和 o4-mini模型-AI.x社區

o3 在不到一分鐘內生成了完全功能的、無錯的代碼,并附加了它的解釋,輸出結果非常棒!我嘗試過在其他各種模型上使用類似的提示,這絕對是第一次生成的最佳模擬之一。無論是形狀、運動方向和速度,還是顏色的變化 - 都是十分準確的!唯一出錯的是球一直在框架外移動。

任務 2:使用 o4-mini 進行數學推理的任務

提示詞: “從給定的算式中選出兩個數字,互換位置還能夠讓等式成立?”14 + 39 – (√256 ÷ 3) + (5 × 4) – 6 = 58″

最先進推理模型! OpenAI 推出o3 和 o4-mini模型-AI.x社區

o4-mini 只花了大約 10 秒鐘來回答這個問題。它展示了在生成最終答案之前的思考過程和分析,這使其更可信。結果準確無誤,速度也很快。

任務 3:使用 o4-mini-high 進行視覺推理的任務

提示詞: “軟木板上寫的點綴色是什么?”

輸入圖像:

最先進推理模型! OpenAI 推出o3 和 o4-mini模型-AI.x社區

最先進推理模型! OpenAI 推出o3 和 o4-mini模型-AI.x社區

o4-mini-high 在約一分鐘內分析了圖像并讀取了手寫文本。它首先評估了圖像的大小,放大到便利貼貼在的部分。然后裁剪圖像,將模糊部分清晰化,然后嘗試閱讀文本。這是非常出色的,目前沒有其他模型能夠做到這一點。

盡管 o4-mini-high 可以讀到便簽上寫的“ACCENT COLOURS”,但只看到了其中提到的 4 種顏色中的 3 種,甚至讀錯了。然而,有趣的是,在它的思維過程中,該模型提到無法清楚閱讀文本是因為字體太小。

出于好奇,問 o4-mini-high“顯示器和頭盔是什么品牌?”,它立刻正確識別了它們。

最先進推理模型! OpenAI 推出o3 和 o4-mini模型-AI.x社區

o3 和 o4-mini 的可用性

這兩個模型都可以通過 OpenAI 的 ChatGPT 平臺和 API 服務進行訪問:

ChatGPT 訪問 :ChatGPT Plus、Pro 和 Team 計劃的用戶可以直接在聊天界面上使用 o3、o4-mini 和 o4-mini-high 模型。

企業和教育用戶將在一周內獲得訪問權限。

免費用戶可以在提交查詢之前選擇“Think”選項來體驗 o4-mini。

API Access:開發者可以通過 OpenAI 的API將 o3 和 o4-mini 集成到其應用程序中,從而在各種平臺上實現定制 AI 解決方案。

o3 和 o4-mini:基準性能

o3 和 o4-mini 模型在一系列標準基準測試中展現出了出色的能力。

最先進推理模型! OpenAI 推出o3 和 o4-mini模型-AI.x社區

  • SWE-Lancer:這兩個模型的高變異體在這個編碼基準測試中表現出色,令它們的前輩相形見絀。
  • 經過 SWE-Bench 驗證(軟件工程):o3 取得了 69.1%的成績,而 o4-mini 緊隨其后,達到了 68.1%。這兩個模型在表現上明顯優于以往的模型,如 o3-mini(49.3%)和像 ??Claude 3.7 Sonnet????63.7%??。?
  • Aider Polyglot(代碼編輯):這兩個模型在代碼編輯基準測試中被證明是 OpenAI 中最佳的,創下了新紀錄。

最先進推理模型! OpenAI 推出o3 和 o4-mini模型-AI.x社區

  • AIME 2025 (數學):o4-mini 通過配備 Python 解釋器創下了新的基準,得分為 99.5%,而 o3 緊隨其后,得分為 98.4%。
  • Codeforces (競技編程): o4-mini 實現了 2719 的 Elo 評分,反映了其在競技編程場景中的先進問題解決能力。與此同時,o3 得分為 2706,仍遠遠優于其他模型的表現。
  • GPQA Diamond (PhD 級):o3 在不使用任何工具的情況下,通過在該基準測試上達到 87.7%的準確性,展示了先進的科學推理能力。o4-mini 緊隨其后,準確率為 81.4%。

最先進推理模型! OpenAI 推出o3 和 o4-mini模型-AI.x社區

  • MMMU(大規模多模態多任務理解):o3 在這項基準測試中表現出色,展示出其處理涉及文本和視覺數據的多樣且復雜任務的能力。

最先進推理模型! OpenAI 推出o3 和 o4-mini模型-AI.x社區

  • Humanity’s Last Exam :在跨領域專家級推理能力的基準測試中,o3 的準確度達到了 26.6%,勝過所有其他 OpenAI 模型。與此同時,o4-mini 明顯優于其前身 o3-mini。

o3 和 o4-mini 的應用

o3 和 o4-mini 的增強推理、工具使用和視覺能力解鎖了各種潛在應用,包括:

  • 復雜數據分析和報告: 通過編寫和執行 Python 代碼分析數據集,從網絡獲取補充信息,并生成摘要或可視化。
  • 高級科學研究:通過解釋復雜圖表、分析實驗數據、搜索文獻,并可能提出新的研究方向,來協助研究人員。
  • 高級編碼和軟件工程:調試復雜的代碼,基于視覺模擬或圖表生成代碼,理解存儲庫結構,并執行多步驟的軟件開發任務。
  • 教育和輔導:使用逐步推理解釋復雜的 STEM 概念,解釋教科書圖表或手寫筆記,并提供互動問題解決協助。
  • 多模態內容創作與理解:生成圖像的詳細描述或分析,創建需要整合文本和視覺元素的內容,并根據視覺證據回答問題。
  • 商業智能與策略:使用實時網絡數據分析市場趨勢,制定預測,并基于綜合信息來源創建戰略計劃。
  • 創新問題解決:解決需要結合不同類型信息和推理步驟的開放性挑戰。

結論

OpenAI 的 o3 和 o4-mini 模型代表了人工智能能力的重大進步,特別是在推理和多模態理解方面。通過將深層推理與多才多藝的工具使用以及“以圖像思考”的新能力相結合,為人工智能的智能和效用設定了新標準。在各種基準測試中的出色表現,凸顯了在處理軟件工程以及科學研究等領域的復雜任務的潛力。

o3 即使面對最苛刻任務也展現出高性能的一面,而o4-mini 則展現了能力、速度和成本的一種平衡。無論如何,兩個模型都擁有自主能力,體現了人工智能的先進程度。隨著人工智能的不斷發展,這種創新模型將為更復雜和多樣化的應用鋪平道路,使我們更接近實現 AGI(通用人工智能)。

譯者介紹

崔皓,51CTO社區編輯,資深架構師,擁有18年的軟件開發和架構經驗,10年分布式架構經驗。

原文標題:??o3 and o4-mini: OpenAI’s Most Advanced Reasoning Models??,作者:K.C. Sabreena Basheer

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2025-4-23 08:30:26修改
收藏
回復
舉報
回復
相關推薦
免费看日本一区二区| 日本在线观看大片免费视频| 麻豆91精品视频| 久久综合网hezyo| 国产精品欧美性爱| 国产欧美一区二区三区精品酒店| 欧美国产日韩a欧美在线观看| 国产精品视频26uuu| 欧美黄色免费看| 女人av一区| 日韩欧美中文字幕一区| 成人亚洲视频在线观看| 日本天码aⅴ片在线电影网站| 久久久久久久久久久电影| 国产精品国产亚洲伊人久久| 免费在线观看黄视频| 奇米亚洲欧美| 日韩精品中文字幕一区二区三区 | 免费成人av在线| 性欧美视频videos6一9| 992在线观看| 网友自拍一区| 精品日韩成人av| 色乱码一区二区三区在线| av影院在线| 一级女性全黄久久生活片免费| 欧美一区国产一区| 欧美性受xxxx狂喷水| 久久精品国产99久久6| 欧美亚州一区二区三区| 精品无码m3u8在线观看| 亚洲精品97| 中文字幕在线日韩 | 偷拍亚洲精品| 精品国产伦一区二区三区观看方式| 2025韩国理伦片在线观看| 涩涩涩视频在线观看| 亚洲制服欧美中文字幕中文字幕| 亚洲午夜在线观看| 国产黄色在线播放| 久久久久久黄色| 久久国产精品99久久久久久丝袜 | 国产精品自拍网站| 国产在线精品自拍| 伊人网免费视频| 日韩精品五月天| 日本老师69xxx| 成年人免费高清视频| 亚洲日本视频| 69av在线播放| 中文字幕一区二区三区精品| 影院欧美亚洲| 久久久久久久一区二区| 国产精彩视频在线| 一本色道久久综合亚洲精品不| 欧美激情在线一区| 国产极品在线播放| 999亚洲国产精| 欧亚精品在线观看| 久久精品视频5| 日韩精品一二三四| 国产一区香蕉久久| 国产欧美日韩综合精品一区二区三区 | 国产日韩欧美精品综合| 日本免费高清不卡| 成人午夜电影在线观看| 久久综合视频网| 欧美日韩一区二区三| 激情小视频在线| 国产精品萝li| 日本黄网站色大片免费观看| 毛片大全在线观看| 欧美日韩国产专区| av在线播放亚洲| 欧美黑人粗大| 欧美日韩精品一区二区三区四区| 182午夜视频| av综合网页| 亚洲欧美日韩直播| 中文字幕在线观看二区| 你懂的视频一区二区| 久久久视频在线| 99re这里只有精品在线| 久久精品二区亚洲w码| 999在线观看免费大全电视剧| 隣の若妻さん波多野结衣| ww亚洲ww在线观看国产| 亚洲一区二区三区欧美| 国产经典三级在线| 在线欧美一区二区| 韩国三级hd中文字幕有哪些| 久久免费视频66| 中文国产成人精品久久一| 午夜精品一区二区三区视频| 国产欧美在线| 老牛影视av老牛影视av| 欧洲xxxxx| xxxcom在线观看| 一本到高清视频免费精品| 欧美伦理片在线看| 国产一区二区三区亚洲综合 | 亚洲中文字幕在线一区| 国产精品18久久久久久久网站| 精品欧美国产| 天堂中文а√在线| 五月婷婷激情综合网| 亚洲一级片网站| 国产精品xxx在线观看| 在线观看亚洲视频| 亚洲黄色一区二区| 国产在线看一区| 欧美日本国产精品| 日本资源在线| 欧美精品一二三四| 国产黄色网址在线观看| 欧美三级午夜理伦三级中文幕| 国产成人精品av| 蜜桃av中文字幕| 综合激情成人伊人| 国产97色在线 | 日韩| 精品少妇一区| 久久99精品视频一区97| 国产又粗又猛视频免费| 久久久久久影视| 在线天堂一区av电影| 日本免费久久| 亚洲精品大尺度| 久久久精品99| 国产一区二区三区黄视频| 色一情一乱一伦一区二区三欧美 | 成人日韩欧美| 欧美视频在线一区二区三区| 疯狂揉花蒂控制高潮h| 国户精品久久久久久久久久久不卡| 国产日韩欧美一二三区| 成年人在线免费观看| 色猫猫国产区一区二在线视频| www.555国产精品免费| 欧美精品1区| 亚洲tv在线观看| 国产区在线观看| 欧美猛男超大videosgay| 久久久久久国产免费a片| 久久狠狠婷婷| 欧美精品一区二区三区在线四季| 最新中文字幕在线播放| 日韩高清人体午夜| 4438国产精品一区二区| 久久综合九色综合97婷婷| 国产老熟妇精品观看| 日本欧美三级| 情事1991在线| 波多野结衣在线影院| 在线观看日韩av先锋影音电影院| 韩国女同性做爰三级| 日韩和欧美的一区| 一道精品一区二区三区| 国产高清精品二区| 欧美成人性生活| 成人免费一级视频| 午夜视频在线观看一区| 国产三级视频网站| 日韩中文欧美在线| 正在播放国产精品| 亚洲天堂av资源在线观看| 久久久久久有精品国产| 天堂成人在线观看| 色综合中文字幕国产| 少妇一级黄色片| 狠狠色狠狠色综合系列| 成年在线观看视频| 天堂俺去俺来也www久久婷婷| 国产91成人video| 国产露出视频在线观看| 欧美一区二区视频在线观看2020 | 日韩成人中文字幕| 国产亚洲欧美日韩高清| 中文字幕一区视频| 国产免费a级片| 久久激情婷婷| aaa免费在线观看| 国产成人精品福利| 国产激情视频一区| 亚洲精品天堂| 日韩精品在线电影| 91在线观看喷潮| 亚洲图片自拍偷拍| 亚洲无人区码一码二码三码的含义 | 亚洲靠逼com| 国产老熟女伦老熟妇露脸| 天堂影院一区二区| 91国在线高清视频| 国产videos久久| 51国偷自产一区二区三区的来源 | 国产爆初菊在线观看免费视频网站 | 国产精品国产三级国产aⅴ原创| 国产麻豆剧传媒精品国产| 久久一区国产| 国产免费裸体视频| 成人影视亚洲图片在线| 国产精品大全| 久久不卡日韩美女| 2019中文字幕在线免费观看| 成人在线免费观看av| 国产青青草在线| 日韩一级二级三级| 男人日女人网站| 亚洲黄色免费网站| 成人黄色免费网址| 丁香婷婷综合五月| 欧美日韩中文不卡| 亚洲一区黄色| 日韩中文在线字幕| jizzjizz欧美69巨大| 国产精品一区视频| 欧美成人一二区| 日韩av高清不卡| а√在线天堂官网| 久久综合伊人77777尤物| 国产一级免费在线观看| 亚洲精品成人免费| 欧美自拍第一页| 日韩一区二区三区免费看| 亚洲第一区av| 一本色道久久加勒比精品 | 国产免费无码一区二区| 另类专区欧美蜜桃臀第一页| 久草精品在线播放| 亚洲另类视频| 婷婷五月综合缴情在线视频| 欧美在线首页| 一级性生活视频| 91精品久久久久久久蜜月| 亚洲视频在线观看日本a| 国产探花一区| 日本视频一区二区在线观看| 夜夜躁狠狠躁日日躁2021日韩| 国产精品一区二区三区观看| 国产高清日韩| 成人在线中文字幕| 国产乱子精品一区二区在线观看| 国产精品久久久久久久久久久久久| 欧美aa在线| 97国产suv精品一区二区62| japanese色国产在线看视频| 欧美成人激情视频免费观看| 麻豆网站视频在线观看| 久久精品这里热有精品| 生活片a∨在线观看| 国产亚洲精品久久久久久777| 蜜芽tv福利在线视频| 亚洲精品suv精品一区二区| 亚洲精品久久久久久无码色欲四季| 色综合网色综合| 免费视频网站在线观看入口| 色偷偷成人一区二区三区91| 五月婷婷色丁香| 在线观看国产一区二区| 青青国产在线视频| 在线亚洲一区观看| 亚洲一卡二卡在线观看| 欧美日韩综合一区| 一本到在线视频| 欧美一区二区国产| 国产成人精品白浆久久69| 欧美一区二区三区免费大片 | 日韩午夜免费| 日本免费黄色小视频| 欧美日韩在线大尺度| 国产在线精品91| 视频一区国产视频| 九九热免费在线观看| 国产大陆a不卡| 午夜不卡久久精品无码免费| 91在线观看下载| 国产一级淫片久久久片a级| 亚洲婷婷在线视频| 久久久久久久久久久97| 伊人一区二区三区| 日本熟妇毛耸耸xxxxxx| 色婷婷综合五月| 国产农村妇女毛片精品| 精品国产一区二区三区四区四| 日本大片在线观看| 最近2019中文字幕一页二页 | 91免费视频网址| 欧美视频一区二区在线| 亚洲午夜在线视频| 天堂网视频在线| 欧美一区二区网站| 日韩二区三区| 久久精品人人做人人爽| 欧美13videosex性极品| 国产精品91在线| 久久99成人| 欧美男人的天堂| 图片区亚洲欧美小说区| 人妻少妇精品久久| 久久精品99国产精品| 色哟哟视频在线| 中文字幕精品在线不卡| 国产精品第九页| 在线日韩一区二区| 国产理论片在线观看| 亚洲女人天堂色在线7777| 看黄网站在线| 欧美国产日韩一区二区| 狠狠久久伊人中文字幕| 国产亚洲欧美一区二区 | 99国产精品白浆在线观看免费| 国产精品视频| 日韩在线不卡一区| 久久亚洲综合av| 欧美日韩在线观看成人| 一本到不卡免费一区二区| 黄色片一区二区三区| 深夜福利国产精品| 狼人综合视频| 999日本视频| 日本一区二区三区视频| 天天做天天躁天天躁| 蜜桃久久久久久久| 国产精品无码自拍| 亚洲欧美一区二区三区国产精品| 久久久久久久久久久久久av| 日韩欧美国产电影| 成年午夜在线| 国产精品久久久久久久久| 欧美男人操女人视频| a级免费在线观看| 国产一区二区三区免费在线观看| 神马久久久久久久久久久| 色综合咪咪久久| 六月婷婷中文字幕| 久久久国产成人精品| 亚洲欧美在线综合| 日本在线播放一区| 一本久道综合久久精品| 欧美做受喷浆在线观看| 亚洲国产视频在线| 亚洲欧美黄色片| 超薄丝袜一区二区| 外国成人毛片| 26uuu成人| 精东粉嫩av免费一区二区三区| 久久久久99精品成人| 91成人网在线| 黄色片免费在线| 日本一区二区在线播放| 亚洲人成亚洲精品| 国模吧无码一区二区三区| 91一区二区在线| 国产又大又黄视频| 亚洲桃花岛网站| 日韩成人亚洲| 亚洲免费在线精品一区| 精品亚洲成a人在线观看| 日本激情视频一区二区三区| 欧美性色欧美a在线播放| wwwww在线观看免费视频| 国产精品狼人色视频一区| 国产精品久久久乱弄| 亚洲第一成肉网| 1000部国产精品成人观看| 国产色片在线观看| 久久99精品久久久久久琪琪| 欧美日韩一区二区三区四区不卡 | 日本不卡不码高清免费观看| 日本xxxxxxxxx18| 在线电影一区二区三区| 成人无遮挡免费网站视频在线观看| 亚洲www视频| 在线一区视频| 亚洲精品一区二区三区影院忠贞| 欧美日本一区二区三区四区| 国产黄大片在线观看画质优化| 91九色蝌蚪成人| 午夜综合激情| 阿v天堂2014| 精品国产乱码久久久久久牛牛| 欧美xxxhd| 亚洲永久激情精品| 成人国产一区二区三区精品| 久久久久在线视频| 九九久久综合网站| 国产区精品视频在线观看豆花| 97超碰人人澡| 国产精品久久久久影院色老大| 99久久精品无免国产免费| 热久久免费国产视频| 欧美hd在线| 无码人妻一区二区三区一| 色综合久久中文字幕| 精品孕妇一区二区三区| 精品一区久久久久久| 青青草成人在线观看| 精品美女久久久久| 正在播放国产一区| 国产精品调教视频| 一道本在线免费视频|