我為馬斯克扮演機(jī)器人!擎天柱背后竟是最貴「演員團(tuán)」
萬(wàn)圣節(jié)當(dāng)天,特斯拉擎天柱(Optimus)亮相紐約時(shí)代廣場(chǎng),為現(xiàn)場(chǎng)觀眾分發(fā)糖果。

在特斯拉餐廳里,它還為馬斯克賣苦力,親自為顧客遞上了一份爆米花。

這些光鮮演示的背后,是由一支血肉之軀組成的「數(shù)據(jù)大軍」在默默支撐。
外媒BI獨(dú)家揭秘了,訓(xùn)練擎天柱模仿人類,全是靠收集的人工數(shù)據(jù)撐起的。

在特斯拉工程總部,一間玻璃墻實(shí)驗(yàn)室內(nèi),上演著這樣的一幕——
數(shù)十名員工正模仿著日常生活中的各種動(dòng)作,舉杯子、擦桌子、拉窗簾,甚至是跳舞、模仿大猩猩。
這些動(dòng)作,他們要在8小時(shí)輪班中重復(fù)數(shù)百次,由固定在頭盔和沉重背包上的5臺(tái)攝像機(jī)全程記錄。
不僅如此,馬斯克和投資人還時(shí)不時(shí),來(lái)圍觀這場(chǎng)「模仿秀」。
一名前員工這樣形容這份工作,「感覺(jué)就像是顯微鏡下的小白鼠」。

馬斯克擎天柱,全靠人類「演技」撐?
馬斯克的目標(biāo)很簡(jiǎn)單:就是教會(huì)擎天柱,像人類一樣行動(dòng)自如。
他將人形機(jī)器人——擎天柱,視為特斯拉未來(lái)的核心,更是業(yè)務(wù)的重中之重。
第三季度財(cái)報(bào)電話會(huì)議上,馬斯克稱其「有潛力成為史上最重磅的產(chǎn)品」,并表示最終年產(chǎn)量將達(dá)到100萬(wàn)臺(tái)。
在9月公布《宏偉藍(lán)圖4》后,他甚至豪言,未來(lái)特斯拉80%的價(jià)值,全部來(lái)自于擎天柱。

自2021年擎天柱首次官宣之后,馬斯克一直描繪著他理想的未來(lái)——
讓機(jī)器人走進(jìn)工廠完成高危險(xiǎn)的作業(yè),承擔(dān)家務(wù)勞動(dòng)、看護(hù)服務(wù),解放人類的雙手。
在實(shí)現(xiàn)這一宏偉藍(lán)圖之前,還需要「數(shù)據(jù)收集操作員」,為擎天柱最終取代人類的目標(biāo)鋪路。

五名現(xiàn)任及前任員工透露,這份工作體力消耗極大,有時(shí)甚至荒誕不經(jīng),但始終要求一絲不茍。
舉個(gè)栗子,沖刺、下蹲、跳舞這些,都是基本動(dòng)作。若是做得不夠「像人」,還會(huì)當(dāng)場(chǎng)挨批。
起舞下蹲擦桌子,當(dāng)場(chǎng)扮演大猩猩
顯然,這可不是什么光鮮的工作。
大多數(shù)數(shù)據(jù)采集員的入門工作就是擦桌子,有時(shí)一干就是好幾周。
你走一步,擦一下桌子,回到初始姿勢(shì),然后從頭再來(lái)。
然后,不斷重復(fù),直到休息時(shí)間。
員工會(huì)收到關(guān)于如何執(zhí)行簡(jiǎn)單任務(wù)的詳細(xì)文件,并需遵循一本厚厚且不斷更新的「操作手冊(cè)」。
此外,他們還會(huì)與一位同事結(jié)對(duì)工作,以確保任務(wù)執(zhí)行的準(zhǔn)確性。
特斯拉對(duì)所有事情的完成方式都要求得非常嚴(yán)格,這對(duì)身心都是巨大的考驗(yàn)。
自數(shù)據(jù)采集工作開(kāi)始以來(lái),員工主要使用動(dòng)捕服來(lái)遠(yuǎn)程操控機(jī)器人——通過(guò)手動(dòng)操作來(lái)「言傳身教」。
然而,此前報(bào)道稱,在項(xiàng)目總監(jiān)Milan Kovac離職后,特斯拉于6月告知員工,將從動(dòng)捕服和遠(yuǎn)程操控,轉(zhuǎn)向僅使用攝像頭收集數(shù)據(jù)。

如前所述,每人全身需佩戴5臺(tái)攝像機(jī),就是為了在環(huán)境中360°無(wú)死角地精確定位數(shù)據(jù)采集員的位置。
他們還被告知,不使用動(dòng)捕服,可以更快地?cái)U(kuò)大數(shù)據(jù)采集規(guī)模。
與此同時(shí),6月策略轉(zhuǎn)變后,特斯拉還引入了多種新的訓(xùn)練流程,包括在員工執(zhí)行任務(wù)時(shí),在周圍架設(shè)多臺(tái)攝像機(jī)。
謝菲爾德大學(xué)的機(jī)器人專家Jonathan Aitken稱,這些攝像機(jī)陣列可以提供更廣闊的環(huán)境視角,進(jìn)而補(bǔ)充數(shù)據(jù)。
他們有時(shí)會(huì)佩戴觸覺(jué)手套,以追蹤手部的精細(xì)動(dòng)作。

馬斯克曾表示,特斯拉投入了巨大精力為擎天柱開(kāi)發(fā)一只類人手,稱其為「一項(xiàng)極其艱巨的工程挑戰(zhàn)」。
三位知情人士說(shuō),員工們還曾錄制過(guò)彼此模仿對(duì)方動(dòng)作的視頻。
另外,在位于加州弗里蒙特的工廠,數(shù)據(jù)采集員曾在佩戴頭盔和背包的情況下,整理汽車零部件并在傳送帶上工作。
其他一些任務(wù)則簡(jiǎn)單到,被一名前員工形容為「如同教嬰兒」。
兩名數(shù)據(jù)采集員說(shuō),他們?cè)浿谱约和嬲鎸?shí)嬰兒益智玩具的視頻:按大小和顏色套環(huán),或?qū)⒉煌螤畹姆e木放入相應(yīng)的槽中。


不僅如此,特斯拉還采用AI生成的指令,來(lái)輔助訓(xùn)練機(jī)器人。
在某些訓(xùn)練中,員工通過(guò)頭戴設(shè)備接收一系列AI生成的動(dòng)作提示,該設(shè)備通過(guò)電線與一個(gè)重達(dá)約14-18公斤的背包相連。
雖然他們通常背著這個(gè)背包,但有時(shí)它也會(huì)被放在旁邊的椅子或桌子上。
員工們說(shuō),這些訓(xùn)練內(nèi)容包括下蹲、跳「小雞舞」、模仿大猩猩、假裝吸塵、沖刺數(shù)米、假裝打高爾夫和扭臀舞。
而且,每個(gè)動(dòng)作要求在3-5秒內(nèi)完成。
有兩人回憶道,有些AI生成的任務(wù)指令讓自己感到不適,比如要求四肢爬行,或是脫下一件衣服。
全天不停做有氧
可想而知,這項(xiàng)工作對(duì)身體消耗是多么地巨大。一名前員工將其描述為——基本上是「全天的有氧運(yùn)動(dòng)」。
有人稱,在訓(xùn)練機(jī)器人時(shí)因背包不均衡的重量,讓自己感覺(jué)總是在一瘸一拐地走路。
「我的右腿失去了知覺(jué),背部劇痛難忍,」他說(shuō)。
這種相同的經(jīng)歷,在內(nèi)部比比皆是。許多人曾目睹同事因工作性質(zhì),導(dǎo)致背部和頸部受傷。
還有一些人,穿著動(dòng)捕服進(jìn)行遠(yuǎn)程操控時(shí),因長(zhǎng)時(shí)間佩戴VR頭顯和低質(zhì)量的圖像,引發(fā)了嚴(yán)重的暈動(dòng)癥。
他們說(shuō),當(dāng)機(jī)器人摔倒時(shí),那種方向感錯(cuò)亂的感覺(jué)尤為強(qiáng)烈。
你會(huì)感覺(jué)自己正在摔倒,因?yàn)槟阏ㄟ^(guò)它的眼睛看世界,但你本人其實(shí)站得筆直。
不過(guò),「遠(yuǎn)程操控」主要是在投資人參觀時(shí),做做樣子用的。

穿著動(dòng)捕服控制擎天柱,可以讓其動(dòng)作看起來(lái)更流暢
這場(chǎng)演示,更像是精心編排的「一場(chǎng)盛大的表演」。
投資者希望看到的是,機(jī)器人實(shí)際動(dòng)起來(lái)的樣子,或許才能證明這錢投的值不值。
有時(shí)候,馬斯克還會(huì)帶著5歲的兒子X(jué),陪同金主爸爸一同來(lái)現(xiàn)場(chǎng)參觀。
前員工透露,在執(zhí)行需要彎腰或傾斜的任務(wù)時(shí),機(jī)器人有一半的概率會(huì)摔倒,有時(shí)還會(huì)損壞昂貴的設(shè)備。
除非執(zhí)行需要移動(dòng)超過(guò)幾英尺的任務(wù),否則機(jī)器人通常會(huì)被固定在一個(gè)「龍門架式」支架上,保持直立。

團(tuán)隊(duì)近百人,不達(dá)標(biāo)就挨罰
據(jù)BI稱,擎天柱數(shù)據(jù)采集團(tuán)隊(duì)一度超100人。在半年一次的績(jī)效評(píng)估后,9月曾裁掉了數(shù)十名數(shù)據(jù)采集員。
具體評(píng)估,主要基于員工執(zhí)行任務(wù)的表現(xiàn),具體涵蓋了從身體角度到站位的所有細(xì)節(jié)。
數(shù)據(jù)采集員有一個(gè)在線儀表盤,上面會(huì)根據(jù)數(shù)據(jù)的質(zhì)量和數(shù)量給出評(píng)分。
每位員工每個(gè)班次,即每8個(gè)小時(shí),被要求收集至少4小時(shí)的可用視頻素材。如果視頻素材被認(rèn)為不合格,比如姿勢(shì)不夠標(biāo)準(zhǔn),員工就可能受到處罰。
然而,對(duì)于訓(xùn)練機(jī)器人的員工來(lái)說(shuō),擎天柱的性能指標(biāo)卻不那么清晰。
當(dāng)訓(xùn)練主要依賴遠(yuǎn)程操控時(shí),數(shù)據(jù)操作員可以按下一個(gè)按鈕,看擎天柱能否自主完成任務(wù)。
如今,這類評(píng)估越來(lái)越少,員工們表示,他們對(duì)機(jī)器人的進(jìn)展情況也越來(lái)越不了解。
時(shí)薪48美金
至于這么損耗身體,評(píng)估如此嚴(yán)格的活,能夠拿到多少錢?
此前,BI曾有一篇報(bào)道稱,特斯拉數(shù)據(jù)采集員時(shí)薪高達(dá)48美金,一天8小時(shí),也就意味著384美金/天(2733元)。

根據(jù)招聘職位介紹,除了收集數(shù)據(jù)之外,員工還需分析所收集的信息,撰寫每日?qǐng)?bào)告,并處理與其設(shè)備及軟件相關(guān)的一些次要任務(wù)。
而且,應(yīng)聘者的身高必須在1.7米-1.8米之間。因?yàn)榍嫣熘俜缴砀撸褪?.73米。

而且,該職位提供了多個(gè)班次選擇,其中包括:
8:00-16:30
16:00-00:30
00:00-8:30

2024年數(shù)據(jù)采集員職位
特斯拉宣傳的視頻中,擎天柱可以行走、疊衣服,在《創(chuàng):戰(zhàn)神》首映式上表演功夫,還能在時(shí)代廣場(chǎng)分發(fā)糖果。

俄勒岡州立大學(xué)AI與機(jī)器人專家Alan Fern直言不諱,機(jī)器人演示「永遠(yuǎn)是他們能拿出的最佳表現(xiàn)」。
當(dāng)你看到它表演功夫時(shí),它似乎在做一些智能的事情,這會(huì)讓人們高估它的真實(shí)能力,但這并非事實(shí)。
它只是在對(duì)環(huán)境做出反應(yīng),背后并沒(méi)有認(rèn)知思維。
與此同時(shí),馬斯克還在瘋狂畫「大餅」。
10月份他曾告訴投資者,「它甚至看起來(lái)都不像個(gè)機(jī)器人,就像一個(gè)穿著機(jī)器人套裝的大活人」。

但眼下,擎天柱仍在通過(guò)重復(fù)、試錯(cuò)和無(wú)數(shù)小時(shí)的人類勞動(dòng),蹣跚學(xué)步。



































