65歲圖靈巨頭離職創業!LeCun憤然與小扎決裂,Meta巨震
圖靈巨頭LeCun真的要跑路了!
剛剛,FT獨家爆料,現任Meta首席AI科學家LeCun,決定將在未來幾個月離職。
下一步,開啟人生創業的第二階段。
圖片
消息一出,瞬間引爆全網。此前,坊間傳聞稱,LeCun因不滿內部架構調整想要離職。
如今,65歲的圖靈巨頭,終于做出了這個決定。
據稱,LeCun將要成立的新公司主要推進「世界模型」,目標直指真正的人類級智能。
目前,他正在進行早期的融資洽談。
圖片
網友盲猜,LeCun離職可能和會見吳恩達有所關聯
任職12年,從創辦FAIR實驗室,到拿下圖靈獎,再到篤定的世界模型,LeCun出走對于Meta來說,是一次巨震。
或許,小扎的超級智能夢,真的要碎了。
有網友表示,這并不意外。另有人調侃道,「要始終向一個孩子匯報工作,LeCun的自尊心怎么不會受到傷害呢」。
圖片
圖片
圖片
圖片
圖片
效力12年決裂,LeCun憤然離職
不得不說,這事兒來的太突然,但卻早有苗頭。
當前,正值Meta對公司AI業務進行大刀闊斧的改革之際,希望開發出更強大的AI,挑戰OpenAI、谷歌等競爭對手。
今年初,Llama 4發布翻車,且性能遠不及ChatGPT、Gemini等模型。而且,Meta AI聊天機器人推出后,許多人并不買賬。
圖片
在認定Meta在競爭中落后之后,小扎的戰略重心也隨之改變——
從LeCun領軍的FAIR實驗室,轉向更快推出模型和AI產品。
先是今年4月,小扎斥資143億美元聘請了28歲Alexandr Wang,去領導全新「超級智能」團隊。
圖片
在此過程中,他親自組建TBD Lab,開出高達1億美元的薪酬包,從谷歌、OpenAI搶人。
其中包括,ChatGPT的核心研究員Shengjia Zhao,被挖來出任MSL首席科學家。
目標很簡單,推動其下一代大語言模型的開發。
僅在今年,Meta內部就進行了超4次架構調整和優化,并將MSL分立出四大部門,全部由Alexandr Wang掌舵:
1. TBD Lab (To Be Determined,待確定,負責探索/先導研究)
2. FAIR (Fundamental AI Research,長期前沿研究)
3. 產品和應用團隊 (含Meta AI助手等)
4. 基礎設施 (訓練與推理的算力、數據與平臺)
因此,此前向首席產品官Chris Cox匯報的LeCun,現在轉而向Wang匯報。
不僅如此,LeCun長期領導的FAIR也逐漸被邊緣化,向比他小30多歲的Wang匯報,包括論文,也需得到審批后才可發表。
圖片
另一方面,LeCun認為小扎置于其戰略核心的LLM雖然「有用」,但永遠無法像人類一樣進行推理和規劃。
在FAIR內部,LeCun也一直專注于開發「世界模型」,但在短期內,是看不到KPI的。
而小扎現在要的是,立即就能變現的AI產品。
看得出,LeCun所堅持的路線和個人觀點,與Meta的AI愿景出現了明顯的分歧。
種種因素的疊加,早已成為LeCun離職的導火索。而現在,就是最好的時機。
全力押注「世界模型」
慶幸的是,LeCun終于可以在「世界模型」上大展身手了。
一直以來,他堅信大模型最終沒有出路,永遠學不會真正的推理和規劃,也根本無法通往AGI。
LLM不如阿貓阿狗,LeCun已在多種公開場合中多次提出。
在他看來,AI的終局就是「世界模型」。
圖片
前段時間,他在MIT訪談中直言,未來3-5年內,「世界模型」會成為AI架構的主流模型。
這話可讓我在硅谷得罪了不少人,包括某些巨頭公司。
到那時候,但凡頭腦清醒的人,都不會再用現在這種生成式LLM的路子了。
世界模型不僅僅學習語言,還通過視頻和空間數據,來理解物理世界。
直白講,它讓AI可以像嬰兒一樣,從觀察中學習世界的規律。
圖片
不過,LeCun表示,開發出這個架構需要十年的時間才能成熟。
即便時間漫長,他終于可以堅定按著目標方向前進了。
未來幾個月,LeCun將正式離職Meta,下一步計劃將專注于深化在「世界模型」領域的研究。
AI掌舵人出走,這意味著,FAIR實驗室就徹底被邊緣化了。
圖靈巨頭,開啟AI革命
1960年7月8日出生的Yann LeCun,在法國巴黎的郊區長大。
他的姓氏原本是Le Cun,但他發現美國人常對此感到困惑,將Le誤作他的中間名,于是便去掉了中間的空格。
他的父親是一名工程師,在LeCun充滿修補創造的童年中,將自己對電子和機械的熱愛傳給了他。
青少年時期,LeCun既喜歡在樂隊中演奏,也熱愛科學與工程。
后來,他在法國精英工程師學校之一的巴黎高等電子與電工工程師學院(ESIEE Paris)獲得了相當于碩士的學位。在那里,他專注于微芯片設計與自動化。
他從本科時代就開始獨立進行機器學習研究,并將其作為他在索邦大學(當時稱為皮埃爾和瑪麗·居里大學)博士階段的核心工作。
圖片
LeCun的研究與Geoffrey Hinton獨立做出的發現高度相似。
- 與Hinton一樣,他被當時尚屬非主流的神經網絡人工智能方法所吸引;
- 也與Hinton一樣,他發現可以通過使用后來被稱為「反向傳播」的算法來有效訓練輸入和輸出節點之間中間層的「隱藏」神經元,從而克服簡單神經網絡眾所周知的局限性。
1985年在法國阿爾卑斯山區舉辦的一場研討會,首次讓LeCun與從事相關研究的國際學術界有了直接接觸。
正是在那里,他結識了Hinton的密切合作者Terry Sejnowski。當時,Sejnowski關于反向傳播的研究尚未發表。
幾個月后,Hinton到訪巴黎,并主動向LeCun作了自我介紹。
再之后,LeCun則受邀參加卡內基梅隆大學的夏季研討會,并在多倫多Hinton新成立的研究小組進行了一年的博士后研究。
圖片
1988年,博士后研究結束時,LeCun加入了著名的計算機科學研究中心——貝爾實驗室。
在貝爾實驗室,LeCun的工作專注于神經網絡架構和學習算法。
他影響最為深遠的貢獻是一種名為「卷積神經網絡」的新方法。這是他早期成就的延伸,因為卷積網絡依賴反向傳播技術來訓練其隱藏層。
除了開發卷積方法,LeCun還率先將其應用于「圖Transformer網絡」,用于識別印刷體和手寫文本。這項技術被用于一個廣泛部署的系統,以讀取支票上的手寫數字。
他在貝爾實驗室的另一項主要貢獻是開發了「最佳腦損傷」(Optimal Brain Damage)正則化方法。
這個名字生動的概念旨在通過移除神經網絡中不必要的連接來簡化網絡。如果操作得當,這種「腦損傷」可以產生更簡單、更快速的網絡,其性能與完整版本相當甚至更優。
圖片
1996年,在計算機行業未能立足的AT&T公司,將貝爾實驗室的大部分業務及其電信硬件業務分拆成立了一家新公司——朗訊科技。
LeCun留在了AT&T,負責一個專注于圖像處理研究的實驗室小組。
在那里,他的主要成就是DjVu圖像壓縮技術。
圖片
2003年,LeCun離開工業界,前往紐約大學庫朗數學科學研究所擔任計算機科學教授。
在紐約大學,LeCun負責計算與生物學習實驗室,繼續他在機器學習算法和計算機視覺應用方面的工作。
他至今仍在紐約大學任教,盡管隨著聲譽日隆,他又增添了幾個新頭銜和額外職位。
圖片
到2010年代初,各大科技公司競相部署基于神經網絡的機器學習系統。與其他頂尖研究人員一樣,LeCun也受到了科技巨頭的青睞。
2013年12月,他加入Facebook并創建了FAIR(Facebook AI Research),同時,他也還兼顧在紐約大學的工作。
2018年,他卸任主任一職,轉任Facebook首席人工智能科學家,專注于戰略規劃和科學領導力。
同年,他與Geoffrey Hinton和Yoshua Bengio,共同獲得了圖靈獎。
圖片
圖片
時至今日,LeCun一直保持著對動手創造的熱愛,他的愛好包括制造飛機、電子樂器和機器人。
或許,這也是他在65歲時,毅然決定下海創業的動力之一。
參考資料:https://www.ft.com/content/c586eb77-a16e-4363-ab0b-e877898b70de





































