36個月大逆轉！他帶著谷歌AI殺回來了，下一步世界模型

2025-11-21 08:49:48

人工智能新聞

ChatGPT發布距今已近36個月，面對OpenAI的領先，哈薩比斯帶領谷歌AI全面反攻，通過新發布的Gemini 3強勢回歸。Gemini 3在LM Arena等多個模型榜單登頂，表現優于GPT-5及其他模型，上演了一場完美逆襲。

大模型排行榜，你方唱罷我登場。

馬斯克的Grok 4.1剛登頂，隨后就被Gemini 3 Pro反超了，上演了一幕AI版的「速度與激情」！

谷歌DeepMind CEO哈薩比斯（Demis Hassabis）

哈薩比斯在X平臺上興奮地曬出Gemini 3的成績單，稱其「當然地」登頂各大排行榜，并表示這是自己迄今為止最愛的模型。

就連奧特曼和馬斯克，也紛紛為Gemini 3點贊。

馬斯克連發兩個哭泣的表情包：看來我們要盡快推Grok 4.2了。

新發布的Gemini 3具備領先的推理、多媒體處理和編碼能力，擅長推理、生成視頻和寫代碼。

谷歌強調，Gemini 3不只是一個更聰明的模型或聊天機器人，更重要的是它從發布之日起，就開始全面增強谷歌現有產品，包括其利潤可觀的搜索業務。

它是谷歌這臺龐大的賺錢機器的AI引擎，用哈薩比斯的話說：

「我們是谷歌的動力引擎，現在我們正在讓AI全面接入」。

哈薩比斯認為目前確實可能存在AI泡沫的問題，比如許多尚未經過檢驗的初創公司卻拿到了數十億美元的估值。

但在他看來，即便是AI泡沫真的破裂，Gemini 3也讓谷歌有了穿越這場泡沫的底氣。

把Google搜索塞進Gemini

谷歌內部，一直有一個把Google搜索「塞」進Gemini的想法。

這一想法，甚至可以追溯到谷歌早期。

當時的Larry Page和Sergey Brin就設想過把整個互聯網都放進AI的「記憶」中，然后再對外提供服務。

因此，谷歌在上下文方面做了大量實驗，并將上下文窗口提升到了100萬個token，目前這個記錄仍沒真正被人打破。

哈薩比斯認為，機器理論上可以擁有比人類多幾百萬倍的存儲/記憶空間，但如果只是「天真地」把所有東西暴力存下來，其實并不高效。

因此，與Google搜索「塞」進Gemini相比，谷歌更多是把Gemini作為現有產品的底層模型向用戶開放。

此次Gemini 3一發布，谷歌已經正式通過Gemini應用，以及Google搜索中的AI Overviews功能向用戶開放。

據谷歌母公司Alphabet在7月的季度財報中表示，AI Overviews推動搜索查詢量提升了10%。

同時，谷歌視覺搜索也出現了70%的激增，這項功能依賴于Gemini對照片的分析能力。

與OpenAI相比，谷歌的優勢在于其產品「家底」深厚。

它擁有包括搜索、Google地圖、Gmail、云服務等非常廣泛的基礎產品線。

而且，谷歌很早就開始利用AI來增強其已有產品的能力。

這使得它在與OpenAI、xAI、Anthropic等AI廠商的競爭中進可攻，退可守。

哈薩比斯表示，「在不利的情況下，我們會更加依靠這些基礎產品；在有利的情況下，我們擁有最全面的布局和最具前瞻性的研究。」

谷歌也在考慮通過Gemini重啟谷歌眼鏡（Google Glass）項目。

哈薩比斯表示，當時谷歌眼鏡步子邁得有點超前，缺少一個真正的「殺手級用例」，而通用助手正是這樣一個用例。

因此，未來Gemini也將激活谷歌以往積累下來的「經驗和遺產」，但是重點會放在「世界理解」上。

以Gemini為例，谷歌一開始就將機器人和眼鏡視為兩個非常重要的應用場景，因此決定走多模態路線。

如今，這些押注正在逐漸顯現出成果，Gemini已經在多模態理解上顯現出明顯優勢。

除了用AI增強現有和以往的產品之外，谷歌也在積極利用AI打造越來越受歡迎的新工具。

比如，NotebookLM，它可以根據文字材料自動生成播客；AI Studio，可以借助AI快速生成應用原型，等等。

此外，谷歌還探索將這項技術應用到游戲、機器人等領域。

哈薩比斯提到谷歌AI的一個優勢，目前所有產品已經完全跑在Gemini技術棧上，實現了從產品到模型的「一體化」。

這意味著無論是產品改動，還是模型微調都會容易很多，而且產品也可以更好地學會理解和使用底層模型。

目前，哈薩比斯的重要精力，一半是將Gemini應用進一步加速做強，另一方面是將AI融入谷歌的各條業務線，使之成為谷歌的「AI動力艙」。

「我對這一切非常興奮，目前我們只是剛剛觸及未來可能性的表面，明年會更直觀地看到這些變化」。

哈薩比斯表示。

被OpenAI「搶跑」后

谷歌正快速趕上

谷歌在AI領域長期投入巨大資源，并取得了一系列關鍵性突破。

包括在2017年發現了Transformer模型架構，但沒有將其商業化，而是選擇把它公開。

一直到2022年，OpenAI基于Transformer的ChatGPT爆火，動搖了谷歌的核心搜索業務，才令它深受震動，開始奮起直追。

有意思的是，OpenAI的崛起，不僅喚醒了谷歌在AI領域的加速發展，甚至還間接幫助谷歌避免了被分拆，出售其搜索業務的命運。

如今，谷歌的搜索業務不僅沒有被OpenAI等AI新勢力所顛覆，相反它的AI模型還實現了對后者的反超。

與Gemini3相比，OpenAI在8月份發布的GPT-5令人略顯失望。

一些評論者認為它「表現平平」，用戶也抱怨其風格變得更正式。

據谷歌表示，Gemini 3在LM Arena等多個模型榜單上的表現優于GPT-5及其他模型，尤其在模擬推理以及長時間規劃方面表現更佳，這有助于提升依賴工具或互聯網的AI智能體的實際能力。

在早期的AI競賽中，經歷過一些磕磕絆絆之后，谷歌總算是「漸入佳境」了。

從用戶活躍度上看，Gemini應用的月活用戶已超過6.5億，僅次于ChatGPT的7-8億周活用戶（如果換算成月活可能在10億以上）。

每月有超過20億人通過搜索里的AI Overviews使用Gemini；還有約1300萬開發者在自己的產品中集成了Gemini。

這些數字表明谷歌正在逐漸縮短與OpenAI在AI領域的差距，作為谷歌AI總負責人的哈薩比斯也可以松口氣了。

各方面都最強才叫AGI

實現還要5-10年

哈薩比斯表示，谷歌仍然在追求做「各方面都最強」的模型。

在他看來，這才是真正意義上的通用模型，也是最終通向通用人工智能（AGI）系統的關鍵組成部分。

從之前的幾個版本到Gemini3，谷歌一直在修正Gemini模型的一些短板，使其在編程、推理、數學等能力上更進一步。

比如，此次Gemini 3就在2.5之上迭代，一方面升級它的基礎能力，另一方鞏固在多模態領域的優勢。

哈薩比斯認為未來AI的技術路線會越來越收斂，而擁有一個通用、全能的基礎模型將是一切的地基。

除此次發布的Gemini3 Pro外，Gemini模型家族里的其他成員也在打磨中，等到這些模型陸續就位之后，谷歌還將在產品分層服務上提供更大的靈活度。

簡單來說，就是更強的性能，更低的價格。正如哈薩比斯所言：

「大方向是每一代新模型，都要在整體能力上更強，同時所需算力更便宜、更高效，帶來更有競爭力的價格和更低的時延」。

目前，哈薩比斯在世界模型研究上花時間最多，在他看來這是通往AGI的關鍵組件。

同樣，他也認為未來世界模型也將迎來類似ChatGPT那樣的「爆發時刻」。

但最大的挑戰是推理/服務成本，以及還要解決在更長時間尺度上保持世界一致性等關鍵難題，才能迎來真正的「破圈」時刻。

哈薩比斯表示，目前世界模型已經有了一些內部用例，比如用來訓練其他智能體、機器人系統等。未來可能會出現一些非常酷的外部應用場景。

哈薩比斯仍然堅持他對通用人工智能（AGI）時間表的預測。

他認為距離真正意義上的完全實現AGI還有五到十年，而Gemini 3將成為未來打造更強大AI的重要平臺，還需要在現有模型不斷變強的基礎上再取得一兩次關鍵性突破。

在通往AGI的路上，哈薩比斯同樣也有算力焦慮。

他坦言「即便將現在全世界的算力加在一起，也不夠滿足我們想做的所有事情」。

因此，需要在不同項目之間衡量算力投入的回報。比如，研究上的收益、新產品探索的價值，或是直接的收入等。

除了追求AGI，哈薩比斯還在帶領DeepMind在AlphaEvolve等一些科學領域進一步擴展。

穿越AI泡沫的底氣

談到AI泡沫，哈薩比斯整體上還是比較樂觀的，但他認為仍然存在一定的泡沫。

「那些幾乎沒有什么的項目，種子輪估值就能到幾十億美元，這在邏輯上有點行不通。」

對比這些泡沫，哈薩比斯認為谷歌的位置非常好。

就DeepMind而言，既有扎實營收，同時又承擔著谷歌「AI動力艙」的重任；既有Gemini模型及App，還有基于Gemini的NotebookLM等AI優先產品。

哈薩比斯表示，目前AI已經在谷歌現有業務中看到了立竿見影的回報：正在為搜索、YouTube、云等業務「加功率」。

作為DeepMind的聯合創始人，哈薩比斯早在12年前選擇與谷歌「聯手」時，已經考量過雙方合作的價值：

谷歌可以提供海量的算力資源，同時它的產品又天然適合用AI去增強。目前，這條路正一步步變成現實。

在哈薩比斯看來，谷歌與DeepMind的結合，讓現在的谷歌在AI競爭中處于一個非常有利的位置，使它有機會穿越泡沫，笑到最后。

責任編輯：張燕妮來源：新智元

ChatGPT AI 模型