Gemini-3震撼發布,Google全面追趕OpenAI
2025年11月18日,谷歌正式發布了Gemini 3,這是迄今為止最智能的AI模型。這個新模型將幫助用戶將任何想法變為現實,標志著AI技術進入了一個全新的時代。

Gemini時代的里程碑
谷歌和Alphabet首席執行官桑達爾·皮查伊(Sundar Pichai)在發布聲明中表示,近兩年前啟動的Gemini時代,是公司歷史上最重要的科學和產品努力之一。
如今,AI Overviews每月擁有20億用戶,Gemini應用每月用戶數超過6.5億,超過70%的云客戶使用谷歌的AI服務,1300萬開發者基于生成式模型進行開發。
每一代Gemini都在前一代基礎上不斷進步。
Gemini 1在原生多模態和長上下文窗口方面取得突破,擴展了可處理信息的種類和數量。
Gemini 2為智能體能力奠定了基礎,推動了推理和思考的前沿,幫助處理更復雜的任務和想法,使Gemini 2.5 Pro在LMArena排行榜上連續六個多月保持領先地位。
現在,Gemini 3作為最智能的模型,將Gemini的所有能力結合在一起,讓用戶能夠將任何想法變為現實。它擁有最先進的推理能力,能夠理解深度和細微差別——無論是感知創意想法中的微妙線索,還是剖析困難問題的重疊層次。
Gemini 3:最智能的AI模型
Google DeepMind首席執行官德米斯·哈薩比斯(Demis Hassabis)和首席技術官兼首席AI架構師科拉伊·卡武克喬格魯(Koray Kavukcuoglu)代表Gemini團隊宣布,Gemini 3的發布是在通往AGI(通用人工智能)道路上的又一個重要里程碑。
Gemini 3 Pro是多模態理解領域的最佳模型,也是迄今為止最強大的智能體和代碼生成模型,能夠提供更豐富的可視化和更深入的交互性——所有這些都建立在最先進推理能力的基礎之上。
從今天開始,Gemini 3 Pro開始預覽發布,并在谷歌產品套件中全面可用,用戶可以在日常生活中使用它來學習、構建和規劃任何事情。
同時,谷歌還推出了Gemini 3 Deep Think——增強推理模式,將Gemini 3的性能推向更高水平。
突破性的性能表現
Gemini 3 Pro在各項主要AI基準測試中都顯著超越了2.5 Pro。
它在LMArena排行榜上以1501 Elo的突破性得分位居榜首,展現了博士級別的推理能力,在"人類最后考試"(Humanity's Last Exam)中獲得了37.5%的頂級分數(未使用任何工具),在GPQA Diamond測試中達到了91.9%。
在數學領域,Gemini 3 Pro也樹立了新標準,在MathArena Apex上達到了23.4%的最新最先進水平。除了文本處理,Gemini 3 Pro在多模態推理方面重新定義了標準,在MMMU-Pro上達到81%,在Video-MMMU上達到87.6%。在SimpleQA Verified測試中,它獲得了72.1%的最先進分數,在事實準確性方面取得了巨大進步。
圖片
這意味著Gemini 3 Pro在科學和數學等廣泛主題的復雜問題解決方面具有高度可靠性,能夠以極高的準確度處理跨領域的挑戰。
Gemini 3 Pro還為每次交互帶來了新的深度和細微差別。
它的回答智能、簡潔、直接,用真正的洞察力取代了陳詞濫調和奉承——告訴你需要聽到的內容,而不僅僅是你想聽到的內容。它作為一個真正的思考伙伴,為你提供理解信息和表達自己的新方式,從通過生成代碼創建高保真可視化來翻譯密集的科學概念,到創意頭腦風暴。
Gemini 3 Deep Think:推理能力再升級
Gemini 3 Deep Think模式將智能邊界推得更遠,在Gemini 3的推理和多模態理解能力方面實現了階躍式變化,幫助用戶解決更復雜的問題。

在測試中,Gemini 3 Deep Think在"人類最后考試"中表現優于Gemini 3 Pro已經令人印象深刻的性能,達到了41.0%(未使用工具),在GPQA Diamond上達到了93.8%。它還在ARC-AGI-2上取得了前所未有的45.1%(帶代碼執行,ARC Prize Verified),展示了其解決新穎挑戰的能力。
Gemini 3的三大核心能力:學習、構建、規劃
學習任何知識
Gemini從一開始就被設計為能夠無縫綜合任何主題的信息,涵蓋文本、圖像、視頻、音頻和代碼等多種模態。
Gemini 3將多模態推理的前沿推得更遠,通過結合最先進的推理、視覺和空間理解、領先的多語言性能,以及100萬token的上下文窗口,幫助用戶以適合自己的方式學習。
例如,如果你想學習家族傳統的烹飪方法,Gemini 3可以破譯和翻譯不同語言的手寫食譜,制作成可分享的家庭食譜。
如果你想學習新主題,可以給它學術論文、長視頻講座或教程,它可以生成交互式抽認卡、可視化或其他格式的代碼,幫助你掌握材料。它甚至可以分析你的匹克球比賽視頻,識別可以改進的領域,并生成整體形式改進的訓練計劃。
為了幫助用戶更好地理解網絡上的信息,搜索中的AI模式現在使用Gemini 3,支持新的生成式UI體驗,如沉浸式視覺布局和交互式工具和模擬,所有這些都完全基于你的查詢實時生成。
構建任何應用
基于2.5 Pro的成功,Gemini 3兌現了為開發者將任何想法變為現實的承諾。
它在零樣本生成方面表現出色,能夠處理復雜的提示和指令,渲染更豐富、更具交互性的Web UI。
Gemini 3是我們構建的最佳代碼生成和智能體編碼模型——使我們的產品更加自主,并提升開發者的生產力。
它以令人印象深刻的1487 Elo得分位居WebDev Arena排行榜榜首。在Terminal-Bench 2.0測試中,它獲得了54.2%的分數,該測試評估模型通過終端操作計算機的工具使用能力。在SWE-bench Verified(衡量編碼智能體的基準)上,它大大超越了2.5 Pro,達到了76.2%。
現在,開發者可以在Google AI Studio、Vertex AI、Gemini CLI以及新的智能體開發平臺Google Antigravity中使用Gemini 3構建應用。它還在第三方平臺如Cursor、GitHub、JetBrains、Manus、Replit等平臺上可用。
規劃任何任務
自Gemini 2引入智能體時代以來,我們取得了很大進展,不僅推進了Gemini的編碼智能體能力,還提高了其在更長視野內可靠規劃的能力。
Gemini 3通過在Vending-Bench 2排行榜上位居榜首證明了這一點,該測試通過管理模擬自動售貨機業務來測試長期規劃。Gemini 3 Pro在整個模擬年度運營中保持一致的工具使用和決策制定,推動更高的回報,而不會偏離任務。
圖片
這意味著Gemini 3可以更好地幫助你在日常生活中完成任務。
通過將更深入的推理與改進的、更一致的工具使用相結合,Gemini 3可以代表你采取行動,從頭到尾導航更復雜的多步驟工作流程,如預訂本地服務或整理收件箱,所有這些都在你的控制和指導下進行。
負責任的開發:安全第一
Gemini 3是我們迄今為止最安全的模型,并經過了任何谷歌AI模型中最全面的安全評估。該模型顯示出減少的奉承性,增強了對提示注入的抵抗力,并改進了對通過網絡攻擊濫用的保護。
除了對我們前沿安全框架中關鍵領域的內部測試外,我們還與世界領先的領域專家合作進行評估,向英國AISI等機構提供早期訪問,并從Apollo、Vaultis、Dreadnode等行業專家那里獲得獨立評估。
Gemini 3時代的開始
這只是Gemini 3時代的開始。從今天開始,Gemini 3開始推出:
? 面向所有人:在Gemini應用中,以及面向Google AI Pro和Ultra訂閱用戶在搜索中的AI模式
? 面向開發者:在AI Studio的Gemini API中,新的智能體開發平臺Google Antigravity,以及Gemini CLI
? 面向企業:在Vertex AI和Gemini Enterprise中
對于Gemini 3 Deep Think模式,我們正在花費額外時間進行安全評估并收集安全測試人員的反饋,然后將在未來幾周內向Google AI Ultra訂閱用戶提供。
我們計劃很快發布Gemini 3系列的其他模型,讓你能夠用AI做更多事情。我們期待收到你的反饋,并看到你用Gemini學習、構建和規劃的內容。
Gemini 3的發布標志著AI技術進入了一個全新的時代。它不僅是最智能的模型,更是將AI能力真正融入日常生活的橋梁。無論是學習新知識、構建創新應用,還是規劃復雜任務,Gemini 3都能為用戶提供前所未有的智能支持。

































