36個月大逆轉!他帶著谷歌AI殺回來了,下一步世界模型
大模型排行榜,你方唱罷我登場。
馬斯克的Grok 4.1剛登頂,隨后就被Gemini 3 Pro反超了,上演了一幕AI版的「速度與激情」!

谷歌DeepMind CEO哈薩比斯(Demis Hassabis)
哈薩比斯在X平臺上興奮地曬出Gemini 3的成績單,稱其「當然地」登頂各大排行榜,并表示這是自己迄今為止最愛的模型。

就連奧特曼和馬斯克,也紛紛為Gemini 3點贊。


馬斯克連發兩個哭泣的表情包:看來我們要盡快推Grok 4.2了。

新發布的Gemini 3具備領先的推理、多媒體處理和編碼能力,擅長推理、生成視頻和寫代碼。
谷歌強調,Gemini 3不只是一個更聰明的模型或聊天機器人,更重要的是它從發布之日起,就開始全面增強谷歌現有產品,包括其利潤可觀的搜索業務。
它是谷歌這臺龐大的賺錢機器的AI引擎,用哈薩比斯的話說:
「我們是谷歌的動力引擎,現在我們正在讓AI全面接入」。
哈薩比斯認為目前確實可能存在AI泡沫的問題,比如許多尚未經過檢驗的初創公司卻拿到了數十億美元的估值。
但在他看來,即便是AI泡沫真的破裂,Gemini 3也讓谷歌有了穿越這場泡沫的底氣。
把Google搜索塞進Gemini
谷歌內部,一直有一個把Google搜索「塞」進Gemini的想法。
這一想法,甚至可以追溯到谷歌早期。
當時的Larry Page和Sergey Brin就設想過把整個互聯網都放進AI的「記憶」中,然后再對外提供服務。
因此,谷歌在上下文方面做了大量實驗,并將上下文窗口提升到了100萬個token,目前這個記錄仍沒真正被人打破。
哈薩比斯認為,機器理論上可以擁有比人類多幾百萬倍的存儲/記憶空間,但如果只是「天真地」把所有東西暴力存下來,其實并不高效。
因此,與Google搜索「塞」進Gemini相比,谷歌更多是把Gemini作為現有產品的底層模型向用戶開放。
此次Gemini 3一發布,谷歌已經正式通過Gemini應用,以及Google搜索中的AI Overviews功能向用戶開放。

據谷歌母公司Alphabet在7月的季度財報中表示,AI Overviews推動搜索查詢量提升了10%。
同時,谷歌視覺搜索也出現了70%的激增,這項功能依賴于Gemini對照片的分析能力。
與OpenAI相比,谷歌的優勢在于其產品「家底」深厚。
它擁有包括搜索、Google地圖、Gmail、云服務等非常廣泛的基礎產品線。
而且,谷歌很早就開始利用AI來增強其已有產品的能力。
這使得它在與OpenAI、xAI、Anthropic等AI廠商的競爭中進可攻,退可守。
哈薩比斯表示,「在不利的情況下,我們會更加依靠這些基礎產品;在有利的情況下,我們擁有最全面的布局和最具前瞻性的研究。」
谷歌也在考慮通過Gemini重啟谷歌眼鏡(Google Glass)項目。
哈薩比斯表示,當時谷歌眼鏡步子邁得有點超前,缺少一個真正的「殺手級用例」,而通用助手正是這樣一個用例。
因此,未來Gemini也將激活谷歌以往積累下來的「經驗和遺產」,但是重點會放在「世界理解」上。
以Gemini為例,谷歌一開始就將機器人和眼鏡視為兩個非常重要的應用場景,因此決定走多模態路線。
如今,這些押注正在逐漸顯現出成果,Gemini已經在多模態理解上顯現出明顯優勢。
除了用AI增強現有和以往的產品之外,谷歌也在積極利用AI打造越來越受歡迎的新工具。
比如,NotebookLM,它可以根據文字材料自動生成播客;AI Studio,可以借助AI快速生成應用原型,等等。
此外,谷歌還探索將這項技術應用到游戲、機器人等領域。
哈薩比斯提到谷歌AI的一個優勢,目前所有產品已經完全跑在Gemini技術棧上,實現了從產品到模型的「一體化」。
這意味著無論是產品改動,還是模型微調都會容易很多,而且產品也可以更好地學會理解和使用底層模型。
目前,哈薩比斯的重要精力,一半是將Gemini應用進一步加速做強,另一方面是將AI融入谷歌的各條業務線,使之成為谷歌的「AI動力艙」。
「我對這一切非常興奮,目前我們只是剛剛觸及未來可能性的表面,明年會更直觀地看到這些變化」。
哈薩比斯表示。
被OpenAI「搶跑」后
谷歌正快速趕上
谷歌在AI領域長期投入巨大資源,并取得了一系列關鍵性突破。
包括在2017年發現了Transformer模型架構,但沒有將其商業化,而是選擇把它公開。
一直到2022年,OpenAI基于Transformer的ChatGPT爆火,動搖了谷歌的核心搜索業務,才令它深受震動,開始奮起直追。
有意思的是,OpenAI的崛起,不僅喚醒了谷歌在AI領域的加速發展,甚至還間接幫助谷歌避免了被分拆,出售其搜索業務的命運。

如今,谷歌的搜索業務不僅沒有被OpenAI等AI新勢力所顛覆,相反它的AI模型還實現了對后者的反超。
與Gemini3相比,OpenAI在8月份發布的GPT-5令人略顯失望。
一些評論者認為它「表現平平」,用戶也抱怨其風格變得更正式。
據谷歌表示,Gemini 3在LM Arena等多個模型榜單上的表現優于GPT-5及其他模型,尤其在模擬推理以及長時間規劃方面表現更佳,這有助于提升依賴工具或互聯網的AI智能體的實際能力。
在早期的AI競賽中,經歷過一些磕磕絆絆之后,谷歌總算是「漸入佳境」了。
從用戶活躍度上看,Gemini應用的月活用戶已超過6.5億,僅次于ChatGPT的7-8億周活用戶(如果換算成月活可能在10億以上)。
每月有超過20億人通過搜索里的AI Overviews使用Gemini;還有約1300萬開發者在自己的產品中集成了Gemini。
這些數字表明谷歌正在逐漸縮短與OpenAI在AI領域的差距,作為谷歌AI總負責人的哈薩比斯也可以松口氣了。
各方面都最強才叫AGI
實現還要5-10年
哈薩比斯表示,谷歌仍然在追求做「各方面都最強」的模型。
在他看來,這才是真正意義上的通用模型,也是最終通向通用人工智能(AGI)系統的關鍵組成部分。
從之前的幾個版本到Gemini3,谷歌一直在修正Gemini模型的一些短板,使其在編程、推理、數學等能力上更進一步。
比如,此次Gemini 3就在2.5之上迭代,一方面升級它的基礎能力,另一方鞏固在多模態領域的優勢。
哈薩比斯認為未來AI的技術路線會越來越收斂,而擁有一個通用、全能的基礎模型將是一切的地基。
除此次發布的Gemini3 Pro外,Gemini模型家族里的其他成員也在打磨中,等到這些模型陸續就位之后,谷歌還將在產品分層服務上提供更大的靈活度。
簡單來說,就是更強的性能,更低的價格。正如哈薩比斯所言:
「大方向是每一代新模型,都要在整體能力上更強,同時所需算力更便宜、更高效,帶來更有競爭力的價格和更低的時延」。
目前,哈薩比斯在世界模型研究上花時間最多,在他看來這是通往AGI的關鍵組件。
同樣,他也認為未來世界模型也將迎來類似ChatGPT那樣的「爆發時刻」。
但最大的挑戰是推理/服務成本,以及還要解決在更長時間尺度上保持世界一致性等關鍵難題,才能迎來真正的「破圈」時刻。
哈薩比斯表示,目前世界模型已經有了一些內部用例,比如用來訓練其他智能體、機器人系統等。未來可能會出現一些非常酷的外部應用場景。
哈薩比斯仍然堅持他對通用人工智能(AGI)時間表的預測。
他認為距離真正意義上的完全實現AGI還有五到十年,而Gemini 3將成為未來打造更強大AI的重要平臺,還需要在現有模型不斷變強的基礎上再取得一兩次關鍵性突破。
在通往AGI的路上,哈薩比斯同樣也有算力焦慮。
他坦言「即便將現在全世界的算力加在一起,也不夠滿足我們想做的所有事情」。
因此,需要在不同項目之間衡量算力投入的回報。比如,研究上的收益、新產品探索的價值,或是直接的收入等。
除了追求AGI,哈薩比斯還在帶領DeepMind在AlphaEvolve等一些科學領域進一步擴展。
穿越AI泡沫的底氣
談到AI泡沫,哈薩比斯整體上還是比較樂觀的,但他認為仍然存在一定的泡沫。
「那些幾乎沒有什么的項目,種子輪估值就能到幾十億美元,這在邏輯上有點行不通。」
對比這些泡沫,哈薩比斯認為谷歌的位置非常好。
就DeepMind而言,既有扎實營收,同時又承擔著谷歌「AI動力艙」的重任;既有Gemini模型及App,還有基于Gemini的NotebookLM等AI優先產品。
哈薩比斯表示,目前AI已經在谷歌現有業務中看到了立竿見影的回報:正在為搜索、YouTube、云等業務「加功率」。
作為DeepMind的聯合創始人,哈薩比斯早在12年前選擇與谷歌「聯手」時,已經考量過雙方合作的價值:
谷歌可以提供海量的算力資源,同時它的產品又天然適合用AI去增強。目前,這條路正一步步變成現實。
在哈薩比斯看來,谷歌與DeepMind的結合,讓現在的谷歌在AI競爭中處于一個非常有利的位置,使它有機會穿越泡沫,笑到最后。


























