Gemini 產品負責人 Tulsee Doshi 在媒體圓桌會上說:“它不再是把文字和圖像分開處理,而是能理解它們之間的細微聯系,并用最適合你的方式輸出?!?/div>
就在剛剛,Google 正式發布萬眾期待的 Gemini 3.0——號稱全球最強的多模態理解與推理模型,也是谷歌迄今最強的智能體模型。

官方稱,它不僅更聰明、更能看、更能理解,還能提供更強的交互性與可視化。簡單來說,就是更擅長解釋復雜概念、用更直觀的方式展示想法。

?? Gemini 3 Pro:全面碾壓 2.5 Pro
- LMArena 總榜第一,1501 Elo,直接刷新歷史記錄
- 博士級推理能力
- Humanity’s Last Exam:37.5%
- GPQA Diamond:91.9%
- 數學推理創紀錄:MathArena Apex 達到 23.4%
在多模態測試中表現同樣驚人:
- MMMU-Pro:81%
- Video-MMMU:87.6%
- SimpleQA Verified:72.1%(事實正確率顯著提升)

意味著它能高可靠地處理科學、數學到復雜視覺理解的一切問題。
?? Gemini 3 Deep Think:進一步突破智能極限
深度思考模式更猛:
- Humanity’s Last Exam:41%
- GPQA Diamond:93.8%
- ARC-AGI-2(代碼執行 AGI 測試):45.1%(史無前例)

?? Vibe 編碼能力全面升級
- WebDev Arena:1487 Elo(第一名)
- Terminal-Bench 2.0:54.2%(電腦終端工具使用能力)
- SWE-bench Verified:76.2%(遠超 2.5 Pro)

它是目前谷歌最強的“能寫代碼、能操作電腦、能獨立完成任務”的智能體。
Gemini 產品負責人 Tulsee Doshi 在媒體圓桌會上說:“它不再是把文字和圖像分開處理,而是能理解它們之間的細微聯系,并用最適合你的方式輸出。”
谷歌表示,模型加強的代碼能力,讓它能直接生成演示文稿或交互式圖形,用來解釋復雜內容。DeepMind CTO Koray Kavukcuoglu 認為,這不只是對程序員重要,對學生和用 AI 學東西的人來說,影響都會很大。
從今天起,在 Google Search 中 @Geminiapp 或 AI 模式可用 Gemini 3 Pro。開發者可在 Google AI Studio 和 Vertex AI 直接調用。
責任編輯:武曉燕
來源:
51CTO技術棧

相關推薦
2025-07-15 09:07:00


































