OpenAI官宣第一筆收購(gòu)!開(kāi)源「我的世界」8人頂級(jí)團(tuán)隊(duì)加盟,押注AI智能體
OpenAI官宣了有史以來(lái),第一次收購(gòu)。
剛剛,OpenAI收購(gòu)了制作開(kāi)源版「我的世界」的初創(chuàng)公司Global illumination,具體收購(gòu)金額未知。

根據(jù)公告,Global illumination整個(gè)團(tuán)隊(duì)將加入OpenAI,未來(lái)專注于ChatGPT研發(fā)。
Global illumination是由Thomas Dimson、Taylor Gordon和Joey Flynn三人共同創(chuàng)立,是一家利用AI構(gòu)建創(chuàng)意工具、基礎(chǔ)設(shè)施和數(shù)字體驗(yàn)的公司。

OpenAI收購(gòu)這個(gè)動(dòng)作暗示著什么?
對(duì)此,英偉達(dá)高級(jí)研究科學(xué)家Jim Fan表示非常好奇:「下一步是什么?在GPT-5上運(yùn)行多智能體文明模擬?也許「我的世界」就是打造AGI所需要的一切?」
圖片
「八大金剛」加入OpenAI
Global Illumination于2021年創(chuàng)立,是一家總部位于紐約的數(shù)字產(chǎn)品公司。
最近,這家公司開(kāi)發(fā)了最受歡迎的產(chǎn)品——開(kāi)源多人在線角色扮演游戲「Biomes」。


項(xiàng)目地址:https://github.com/ill-inc/biomes-game
一直以來(lái),Global Illumination所做的工作側(cè)重在面向視覺(jué)的產(chǎn)品和服務(wù)上。
也就是說(shuō),OpenAI有可能正為ChatGPT拓展更多的圖像/視頻類功能,或者是為了構(gòu)建Dall-E 2圖像生成服務(wù),又或是推出一個(gè)文本-視頻產(chǎn)品,以與初創(chuàng)公司Runway的Gen-2競(jìng)爭(zhēng)。

從另一面看,這家公司命名也是與眾不同。
「Global Illumination」(全局光照)一詞在計(jì)算機(jī)圖形學(xué)領(lǐng)域已經(jīng)使用了很多年,用于描述在3D物體上創(chuàng)建逼真光照效果的算法。
全局光照的最初算法之一是加州理工學(xué)院(Caltech)的研究員James Jim Kajiya在1986年提出的。

這家公司共有8位成員組成,3位創(chuàng)始人。有趣的是,官網(wǎng)每個(gè)人頭像都用的是像素小人。

一些網(wǎng)友表示,此舉是OpenAI的一次出色的「收購(gòu)」,通過(guò)收購(gòu)來(lái)收攬新人才。
在OpenAI公告中,也列出了Global Illumination團(tuán)隊(duì)在Instagram、Facebook、YouTube、谷歌、Pixar, Riot Games等著名公司做出貢獻(xiàn)。

一起看看,OpenAI從這次收購(gòu)得到背后團(tuán)隊(duì)的強(qiáng)大之處在哪?
Thomas Dimson
Thomas Dimson是Global illumination首席執(zhí)行官。

在創(chuàng)辦公司前,他大部分職業(yè)生涯在Ins度過(guò)。
2013年,Thomas加入Ins,成為首席工程師,并在5年后,升任為工程總監(jiān)。
他被稱為Ins「第16號(hào)工程師」,「Instagram內(nèi)容排名算法原始創(chuàng)作者」,于2020年正式離職。
在Ins工作的7年里,他在Ins在迭代平臺(tái)的發(fā)現(xiàn)算法方面發(fā)揮了重要作用,比如信息排名算法、探索排名、故事排名。
另外,他還發(fā)明了故事投票貼紙、Hyperlapse,emojineering等產(chǎn)品,并被Fast Company評(píng)為商業(yè)領(lǐng)域十大最具創(chuàng)造力的人之一。

去年,Thomas在為Future寫(xiě)的一篇文章中,透露了他領(lǐng)導(dǎo)的團(tuán)隊(duì)開(kāi)發(fā)了Instagram的個(gè)性化內(nèi)容排名/推薦系統(tǒng),取代了默認(rèn)的反向時(shí)間順序推薦。

Taylor Gordon
Taylor Gordon是Global Illumination的首席技術(shù)官。

Taylor已有20多年的編程經(jīng)驗(yàn),并有8年以上的計(jì)算機(jī)科學(xué)教育,在領(lǐng)先的科技公司有10多年的工作經(jīng)驗(yàn)。
他本人豐富經(jīng)歷,遍布許多實(shí)驗(yàn)室Facebook AI、Instagram、YouTube、谷歌、微軟。
2019年,他在Facebook AI主要做計(jì)算機(jī)視覺(jué)研究。
同樣,他在2015年加入Ins后,就領(lǐng)導(dǎo)了Feed排名的開(kāi)發(fā),專注于機(jī)器學(xué)習(xí)和基礎(chǔ)設(shè)施組件的排名。
2012年,作為YouTube機(jī)器學(xué)習(xí)工程師,他主要負(fù)責(zé)視頻推薦,領(lǐng)導(dǎo)了核心基礎(chǔ)排名設(shè)施重構(gòu)。
在微軟期間,為必應(yīng)搜索結(jié)果中的站內(nèi)鏈接設(shè)計(jì)并構(gòu)建了生產(chǎn)算法。在谷歌,負(fù)責(zé)內(nèi)部核心服務(wù)和基礎(chǔ)設(shè)施開(kāi)發(fā)分析,以及監(jiān)控軟件。

Joey Flynn
Joey Flynn是Global Illumination的首席產(chǎn)品官。

他本人也曾在Facebook、Ins工作過(guò),被外界譽(yù)為Facebook的頂級(jí)設(shè)計(jì)師之一。
2010年,他加入了Facebook,領(lǐng)導(dǎo)了一些重要的項(xiàng)目,比如,Chat Heads,以及Facebook的移動(dòng)軟件Home。
2014年,F(xiàn)lynn構(gòu)思并打造了一款Facebook即時(shí)通訊應(yīng)用Slingshot。

Alexei Karpenko

Alexei Karpenko本人也曾在Facebook、Midnox、蘋(píng)果工作過(guò)。

Andrew Top

Andrew Top是YouTube電視應(yīng)用程序背后應(yīng)用程序平臺(tái)Cobalt的技術(shù)主管,在YouTube工作了7年。
2012年,他作為一位圖形負(fù)責(zé)人加入團(tuán)隊(duì),為PlayStation 3、PlayStation 4和WiiU實(shí)現(xiàn)各自專有圖形應(yīng)用程序接口GLES圖形API子集。
他還設(shè)計(jì)了Cobalt圖形渲染堆棧,讓嵌入式設(shè)備上的動(dòng)畫(huà)幀率速度比Chrome更快。
Andrew的其他貢獻(xiàn)包括:
-設(shè)計(jì)了主要瀏覽器組件的高級(jí)布局,JavaScript引擎、Web API(包括DOM)、網(wǎng)絡(luò)引擎和圖形。
-設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)跨平臺(tái)的低延遲基于網(wǎng)絡(luò)的解決方案,可以在電視和VR頭顯上觀看YouTube的3D 360球形視頻。
-設(shè)計(jì)用于監(jiān)控和分析性能問(wèn)題的系統(tǒng)。

Nick Cooper

Nick Cooper曾在Artifact、Ins、谷歌工作過(guò)。

Ian Silber

根據(jù)他的主頁(yè),Ian Silber也曾在Artifact、Ins任職。

Brandon Wang

團(tuán)隊(duì)里唯一一位華人研究員,曾在Riot Games、Pixar致力于游戲動(dòng)畫(huà)的研究。
他個(gè)人也是非常擅長(zhǎng)實(shí)時(shí)渲染、基于物理渲染、以及Networked Gameplay。

如下,是Brandon Wang設(shè)計(jì)的部分項(xiàng)目。

開(kāi)源版「我的世界」,用瀏覽器就能跑
「Biomes」是一個(gè)為Web構(gòu)建的開(kāi)源沙盒MMORPG(大型多人在線角色扮演游戲)。
只需打開(kāi)瀏覽器,就可以建造、采集、玩小游戲等等。




而對(duì)于OpenAI來(lái)說(shuō),其實(shí)早在2022年的時(shí)候就提出了一種全新的VPT「視頻預(yù)訓(xùn)練模型」,能夠讓AI學(xué)會(huì)了在「我的世界」里從頭開(kāi)始造石鎬。

而整套流程需要一個(gè)骨灰級(jí)玩家至少20分鐘的時(shí)間才能完成,總計(jì)要操作24000次。

研究地址:https://openai.com/research/vpt
具體來(lái)說(shuō),研究人員首先收集一波數(shù)據(jù)標(biāo)注外包們玩游戲的數(shù)據(jù),其中包含視頻和鍵鼠操作的記錄。

VPT方法概述
然后,利用這些數(shù)據(jù)制作逆動(dòng)力學(xué)模型(inverse dynamics model,IDM),從而推測(cè)出視頻里每一步在進(jìn)行的時(shí)候,鍵鼠都是怎么動(dòng)的。
這樣,整個(gè)任務(wù)就變得簡(jiǎn)單多了,只需要比原來(lái)少很多的數(shù)據(jù)就可以實(shí)現(xiàn)目的。

基礎(chǔ)模型訓(xùn)練數(shù)據(jù)對(duì)微調(diào)的影響
在訓(xùn)練了70000個(gè)小時(shí)以后,OpenAI的行為克隆模型就能實(shí)現(xiàn)其他模型做不到的工作了。
比如,怎么砍樹(shù)收集木頭,怎么用木頭做木條,怎么用木條做桌子。而這一套事兒需要一個(gè)比較熟練的玩家操作小50秒的時(shí)間。

除了做桌子,模型還能游泳,打獵,吃東西。
甚至還有「跑跳搭」的騷操作,也就是起跳的時(shí)候腳下放個(gè)磚塊或者木塊,跳著跳著就能搭個(gè)柱子。這屬于是骨灰級(jí)玩家的必修課了。

「跑跳搭」簡(jiǎn)陋版
而難度更大的制作鉆石鎬,則需要一系列漫長(zhǎng)而復(fù)雜的子任務(wù)。
為了使這項(xiàng)任務(wù)易于處理,研究人員為序列中的每個(gè)項(xiàng)目獎(jiǎng)勵(lì)智能體。

他們發(fā)現(xiàn),利用傳統(tǒng)方法訓(xùn)練的RL策略幾乎沒(méi)有獲得任何獎(jiǎng)勵(lì),從不學(xué)習(xí)收集日志,而且很少收集木棍。
與之形成鮮明對(duì)比的是,基于人來(lái)數(shù)據(jù)微調(diào)后的VPT模型不僅可以學(xué)習(xí)如何制作鉆石鎬,而且在收集所有物品方面的成功率,甚至達(dá)到人類水平。

制作石鎬
對(duì)此,有網(wǎng)友認(rèn)為OpenAI Gym playgrounds就是一個(gè)「我的世界」。

在現(xiàn)實(shí)世界中應(yīng)用這些系統(tǒng)之前,最好先在虛擬世界中進(jìn)行練習(xí),看看會(huì)發(fā)生什么。訓(xùn)練的速度可能也會(huì)更快。期待幾個(gè)月后能看到一些「我的世界」加速運(yùn)行的驚人視頻。

這家初創(chuàng)公司的工程師團(tuán)隊(duì)來(lái)自高水平的設(shè)計(jì)團(tuán)隊(duì),我認(rèn)為ChatGPT很快得到大幅升級(jí)。

還有人認(rèn)為,從Global Illumination做過(guò)的事情來(lái)看。他們的產(chǎn)品能力是OpenAI非常需要的,但是結(jié)合前幾天的斯坦福AI小鎮(zhèn)來(lái)看,這種高自由度運(yùn)行成本低的沙盒游戲結(jié)合AI會(huì)有無(wú)限可能,所以O(shè)penAI可能是看重了他們成員的產(chǎn)品能力,也可能純粹的看上了這個(gè)高自由度的游戲。





































