Ilya之后,兩位90后撐起OpenAI核心研究
Ilya之后,誰是支撐起OpenAI研究的人?
GPT-5發布前夕,奧特曼公開了他背后的兩位90后得力干將。

Mark Chen,首席研究官,小扎挖人首份名單,“拒絕了小扎10億美金薪酬”。
Jakub Pachocki,Ilya的接替者,OpenAI的新首席科學家,曾被奧特曼稱贊為“我們這一代最杰出的頭腦之一”。
正是他們兩個人撐起了OpenAI的核心研究,Chen負責組建和管理研究團隊;Pachocki 負責制定研究路線圖,并確立長期技術愿景。
除此之外,他們兩個還透露了不少細節,比如為什么要解散超級對齊團隊,平時又是如何協作等細節。在這樣一個特別的時間節點,小扎瘋狂挖人、GPT-5發布前夕,不排除有奧特曼一些特殊的考量,也許是給大家一顆定心丸。

網友調侃:合作伙伴關系如此牢固,甚至ChatGPT都稱他們為爸爸媽媽。

小扎剛剛更新了他的名單。

不過,你又怎知小扎沒有早早下手,但卻又是現在這樣一個結果。(Doge)
兩位90后OpenAI頂梁柱
這兩位OpenAI頂梁柱有不少共同點,都是90后(Mark Chen 90年,Jakub Pachocki 91年),都有奧賽經驗,都是OpenAI資深員工,參與了包括GPT系列核心項目。
接下來那就來好好了解下這兩個人。
Mark Chen
相信持續關注小扎挖人的朋友應該對他很熟悉。他應該是小扎的第一個名單對象,也是他給到小扎「加大人才投資」的靈感。

Mark Chen是OpenAI的首席研究官。他曾經牽頭創建了DALL-E、參與GPT-3、GPT-4的開發——構建了GPT-3模型并行策略的早期版本;為GPT-4添加圖像識別功能,此外還領導了編碼模型Codex的開發。

今年春天的時候小扎和Mark Chen進行了一次閑聊,內容主要是小扎向對方請教如何改進自家的生成式AI部門。
Mark Chen當時也沒多想,所以就認真建議他加大對人才的投資。結果這一下仿佛就打通了小扎的任督二脈,堪稱硅谷史上最瘋狂的搶人大戰就此啟動。
當時小扎就向給他靈感的Mark Chen發出邀請:是否愿意考慮加入Meta,以及如何才能打動你?
后面爆料稱,報價似乎達到了10億美金。

但已經在OpenAI待了6年的Mark Chen沒咋考慮就回絕了,并表示自己在OpenAI干得很開心。

他本科畢業于MIT計算機專業,在OpenAI之前,他曾在華爾街公司Jane Street Capital、Integral Technology LLC擔任量化研究員,開發了用于期貨交易的機器學習模型。
Jakub Pachocki
在OpenAI剛成立的第三年,他就加入了,Ilya是他的工作導師?,F在已經在OpenAI呆了8年,今年34歲。他曾負責Dota的AI應用項目,先后擔任推理團隊負責人、深度學習科學團隊負責人。

2024年,在他導師llya離職后被提升為首席科學家,負責監督GPT-4和o1等項目,曾被奧特曼稱贊為“我們這一代最杰出的頭腦之一”。

他的工作經歷更為簡單。在哈佛大學搞完博士后研究就來了OpenAI,在此之前,他在CMU讀博,只讀了三年就獲得了博士學位,在華沙大學讀的本科。

除此之外,他還有個競技程序員的身份。

高中期間,他曾六次入圍IOI競賽決賽,2009年他獲得銀牌。 2012 年,他代表大學參加了國際大學生程序設計競賽,他的團隊贏得了金牌并獲得了總成績第二名。同年,他還是Google Code Jam的冠軍。
這兩個人撐起OpenAI核心研究
如果說奧特曼是OpenAI對外的公關名片,那么Chen和Pachocki則是這家公司的幕后支柱,在llya走后,二人共同承擔起核心研究的重任。
他們在OpenAI里的關系比想象中更為緊密,Chen主要負責塑造和管理研究團隊,而Pachocki則負責制定研究路線圖,并建立長期技術愿景。
但雙方角色并不固定,Chen描述他們二人是研究人員,只要看到可以修正的技術細節,就會立馬去做,彼此之間相互協同配合。
也許這種默契來源于他們都曾參與過國際編碼比賽,Chen還是美國計算機奧林匹克隊的教練,這也影響了OpenAI積極參與國際賽事的戰略部署。

最近OpenAI就在全球編程競賽AtCoder中斬獲第二名,僅次于人類選手Psyho,成績突破人類表現層級,極具開創性意義,另外OpenAI又剛剛取得IMO金牌成績,實現在復雜推理問題上的進步。
有意思的是,Psyho既是OpenAI的頭號競爭對手,也曾是OpenAI旗下的員工,Pachocki和他亦是朋友關系,曾經一起參加比賽,現在OpenAI的LLM正在試圖跨越這座編程界的大山,就像當年AlphaGo和李世石。

這也是Chen和Pachocki的共同觀點,只有去積極挑戰數學和編碼上的頂級人類,模型才能飛速進步,因為數學和編碼才是通向更強大的通用模型的關鍵。
例如Psyho在本次比賽中也給出了一個非常新穎的解決方案,這是模型之前從未見過的解法,而這也恰恰讓模型獲得知識提升的機會。
Pachocki表示:
編程和數學實際上關乎創造力,提出新穎的想法,以及連接來自不同地方的想法。
誠然,OpenAI一直在飛速發布新產品,從GPT-4到o系列推理模型,再到即將發布的GPT-5,OpenAI始終保持著這種創新勢頭。
至于OpenAI是如何同時兼顧開放式研究和產品開發,Pachocki表示,他們始終在嘗試構建通用人工智能,但在走向AGI的過程中,延伸出的新技術就可能成為一個支線產品。
OpenAI始終對構建AGI充滿熱情,他們現在所做的就是在了解并突破其技術瓶頸,例如它能做什么,它不能做什么?
目前最前沿的推理模型,雖然可以將問題分解,也知道很多知識,但無法真正像人類一樣串聯起知識,仍舊處于推理范式初期,而OpenAI正在試圖回答這個問題。
他們相信,縮放定律在該推理范式的構建上并沒有完全崩潰,只需要找到合適的模型構建方式,或者挑選可用的數據訓練,就能逼近AGI的瓶頸。
當然關鍵還是在于模型的自主時間(autonomous time),即模型如何在沒有停滯的情況下,在有效時間內完成對復雜問題的自主研究。
Chen和Pachocki更重視AGI作為工具的實用性,認為發展應當循序漸進,而llya和他們的觀點則截然不同,llya曾在采訪中表示,AGI將會是里程碑式的改變世界的存在。
因此llya希望從設計更優秀的模型轉向控制模型,于是他曾在OpenAI內部成立超級對齊團隊,旨在投入OpenAI五分之一的資源以控制超級智能。

但當llya離開公司后,超級對齊團隊迅速被解散。
談及解散原因,Chen和Pachocki認為所謂對齊研究已經融入OpenAI的核心業務,模型必須按照預期工作才能發揮作用,且當前應當更關注現有模型的對齊,而非假設性的超級智能。
OpenAI正在從純研究實驗室轉向兼顧研究和產品落地的公司,關于前沿研究和產品發布之間的關系,Chen表示:
這是一個非常微妙的平衡。
但有關GPT-5的更多信息,Chen和Pachocki沒有進行過多的透露,官方說法只有奧特曼的“即將發布”,以及稱之為實驗性模型。

所以當這篇文章被奧特曼轉發后,網友的關注焦點還是放在了GPT-5上:
請停止發推文并發GPT-5。
































