黃仁勛像押注OpenAI一樣押注中國機(jī)器人,英偉達(dá)首批Jetson Thor芯片給了他
黃仁勛正在像押注OpenAI一樣在中國押注未來的具身智能巨頭。
英偉達(dá)給剛創(chuàng)辦的OpenAI送超算這個事已經(jīng)被大家津津樂道,現(xiàn)在他們正在把這個經(jīng)驗復(fù)用到機(jī)器人領(lǐng)域。
中國首批Jetson Thor芯片送到了銀河通用手里,在機(jī)器人世界大會展示無人售貨場景機(jī)器人的絲滑漂移、規(guī)劃能力也明顯提升,驚艷全場。
背后的Jetson Thor的性能提升也令人印象深刻:計算能力是上一代Jetson Orin的7.5倍,接近10倍;每瓦性能提升3.5倍;I/O吞吐量提升10倍,滿足高帶寬感知需求。

同樣與英偉達(dá)密切合作的還有宇樹科技。
宇樹科技創(chuàng)始人王興興、銀河通用CTO王鶴上午還在世界機(jī)器人大會,下午就來到英偉達(dá),與英偉達(dá)Omniverse和仿真技術(shù)副總裁Rev Lebaredian一起出席活動。

兩位創(chuàng)始人風(fēng)格迥異。
王興興語速飛快,連英偉達(dá)副總裁耳機(jī)里的AI翻譯都跟不上他的節(jié)奏。談起人形機(jī)器人落地,他的觀點直接而犀利:“人形機(jī)器人最大的問題還是模型不夠泛化,硬件在過去一兩年已經(jīng)足夠用了。”
作為北大副教授的王鶴則像在講課,條理清晰地分析著機(jī)器人產(chǎn)業(yè)的發(fā)展路徑,對于人形機(jī)器人的市場前景,他給出了一個大膽的預(yù)測:每三年產(chǎn)值乘10。
兩家公司做的事風(fēng)格也大有不同,宇樹科技主打足式機(jī)器人,走“運動優(yōu)先”的路線;而銀河通用依托仿真合成數(shù)據(jù)推動人形機(jī)器人在輕工業(yè)和零售場景快速落地,走“智能優(yōu)先”的路線。
除了銀河通用和宇樹科技,阿里云、北京人形機(jī)器人創(chuàng)新中心、傅利葉、加速進(jìn)化、優(yōu)必選、智元機(jī)器人等企業(yè)都在與英偉達(dá)深度合作。阿里云更是宣布,英偉達(dá)全棧機(jī)器人及物理AI組件已通過其云端服務(wù)開放使用。
就像當(dāng)年英偉達(dá)押注OpenAI一樣,不同的是,具身智能時代不會只有一家獨大——黃仁勛這次把籌碼分散下注在了多家中國機(jī)器人公司身上。
踩著AI大模型產(chǎn)業(yè)發(fā)展的經(jīng)驗,具身智能時代的一切都在加速。
宇樹科技王興興:未來組裝機(jī)器人像組裝電腦

我們在過去幾年中一直非常重視人形機(jī)器人這一方向。
某種意義上,我將人形機(jī)器人視為通用機(jī)器人的重要載體。眾所周知,通用AI是目前全球最主流的發(fā)展方向,而真正的通用AI在執(zhí)行任務(wù)時必然離不開機(jī)器人,尤其是通用型機(jī)器人。
對比來看,目前人形機(jī)器人反而是最理想的專業(yè)機(jī)器人形態(tài)。雖然看上去較為復(fù)雜,但實際結(jié)構(gòu)并不如想象中那么復(fù)雜,本質(zhì)上是由若干關(guān)節(jié)電機(jī)串聯(lián)而成。因此結(jié)構(gòu)相對簡單,不像履帶式小車或其他形式的機(jī)器人反而更復(fù)雜。由于主要是電機(jī)和連桿的組合,所以整體設(shè)計簡潔。我一直相信,當(dāng)通用AI大規(guī)模成熟后,每個人都可以輕松制造一臺人形機(jī)器人,就像今天人們可以購買電腦零部件組裝一臺電腦一樣。未來若AI足夠強(qiáng)大,對硬件的要求會越來越低。
我們在去年5月發(fā)布了一款機(jī)器人,當(dāng)時售價約9.9萬元人民幣,至今依然具備很強(qiáng)的市場競爭力。它的關(guān)節(jié)數(shù)量和靈活性表現(xiàn)優(yōu)秀,且在發(fā)布后,其架構(gòu)已成為全球較為主流的設(shè)計構(gòu)型。去年下半年及今年,不少新興機(jī)器人公司的新產(chǎn)品在架構(gòu)上與這款相似,僅在外觀上存在差異。我們設(shè)計的造型流暢且結(jié)構(gòu)簡單,而其他造型可能更復(fù)雜且不夠美觀,因此該產(chǎn)品在市場上競爭力較強(qiáng)。
近期我們又發(fā)布了新的版本。雖然涂裝稍顯花哨,但我們希望客戶可以自由改裝和噴涂外觀,例如更改顏色或增加個性化裝飾。許多客戶在戶外直播時會為機(jī)器人穿衣、戴帽或假發(fā),創(chuàng)造出多種造型。外觀和造型的可定制性對于客戶體驗至關(guān)重要。這款新版本售價約3.9萬元人民幣,全球競爭力強(qiáng),且性能表現(xiàn)出色。目前現(xiàn)貨可供,預(yù)計量產(chǎn)在年底前完成。
此外,我們近期發(fā)布了A2機(jī)器狗,其最大特點是在緊湊輕量化設(shè)計下實現(xiàn)了較大負(fù)載能力。自重約37千克,持續(xù)負(fù)載可達(dá)30千克,空載續(xù)航可行駛20公里。其外觀吸取了以往的設(shè)計經(jīng)驗,更具科幻感,且具備防塵防水性能。我們一直希望機(jī)器人能在工業(yè)場景中替代人類完成繁重、危險或重復(fù)性工作。我們的機(jī)器狗在一些公益項目中已實現(xiàn)24小時不間斷運行,具備自動充電和巡邏檢測功能。
去年底我們升級了輪式機(jī)器人,這款產(chǎn)品較大,自重約70~80千克,因此部分場景不便使用。為此,我們推出了更小型且防塵防水的版本,適用于室內(nèi)外多種場景。雖然體型較大,但靈活性依然優(yōu)秀。通常小型機(jī)器人靈活性更強(qiáng),而大型機(jī)器人靈活性較差,但我們在較大尺寸下依然保證了良好的運動性能。
今年1月,我們的機(jī)器人登上央視春晚,最大亮點是全自動編隊跳舞。它在頭部配備三個激光雷達(dá),可自動建圖并變換隊形。為適應(yīng)舞臺演出,我們將后臺控制權(quán)交給舞臺控臺,使音樂與動作實現(xiàn)毫秒級同步。此次演出共有16臺機(jī)器人,統(tǒng)一連接至我們后臺服務(wù)器,再接入舞臺系統(tǒng)。該項目的最大挑戰(zhàn)在于多機(jī)協(xié)作及復(fù)雜的編程維護(hù)。目前,這些機(jī)器人在澳門美高梅每日進(jìn)行表演。
在動作學(xué)習(xí)方面,我們通過采集人體動作數(shù)據(jù)并結(jié)合深度強(qiáng)化學(xué)習(xí)進(jìn)行訓(xùn)練。不同于語言模型訓(xùn)練,動作訓(xùn)練只需少量真實數(shù)據(jù),其余由強(qiáng)化學(xué)習(xí)完成。我們主要使用NVIDIA的Isaac Sim平臺進(jìn)行訓(xùn)練,已掌握舞蹈、跳躍、空翻等多種動作。當(dāng)前限制機(jī)器人執(zhí)行更復(fù)雜動作的最大因素并非算法,而是硬件物理極限。例如,要將奔跑速度從每秒3~4米提升到10米,對硬件的改進(jìn)需求極高。
我們同樣重視機(jī)器人上肢和手部的研發(fā),目前已自主開發(fā)一款約20自由度的靈巧手,目標(biāo)是讓機(jī)器人真正能夠執(zhí)行日常任務(wù),而不僅是完成展示性動作。希望在未來一到兩年內(nèi)實現(xiàn)自然交互,例如在沒有預(yù)先適配的情況下,直接指令機(jī)器人去為某人倒水。
今年5月底,我們與央視合作舉辦了一場機(jī)器人格斗賽,時長約1.5小時,包含4個團(tuán)隊參賽。格斗賽的算法復(fù)雜度高于舞蹈或功夫表演,因為動作組合是隨機(jī)且存在強(qiáng)干擾,要求動作銜接流暢并可自由組合。我們的目標(biāo)是在未來實現(xiàn)“任意動作的任意實時生成”。
此外,我們還發(fā)布了R1機(jī)器人,重量約25千克,輕便且安全。雖然體積較小,但動力性能強(qiáng)勁,主要面向工業(yè)應(yīng)用。其算法與人形機(jī)器人類似,但由于四足機(jī)器人的穩(wěn)定性更好,可完成更劇烈的動作而不易損壞,且具備較強(qiáng)的越障能力。
回顧過去,AI與機(jī)器人技術(shù)的發(fā)展始終是全球協(xié)作的成果。包括NVIDIA在內(nèi)的多方力量一直推動機(jī)器人與AI領(lǐng)域的全球合作。在通用智能大模型和真正能執(zhí)行任務(wù)的機(jī)器人普及之前,我們?nèi)孕韫餐Γ苿尤祟愡M(jìn)入下一個科技時代。我相信,AI與機(jī)器人技術(shù)將像電力與蒸汽機(jī)的發(fā)明一樣,使人類文明邁向新的高度。
銀河通用王鶴:通用機(jī)器人將成為下一個數(shù)萬億人民幣市場

今天我想與大家分享,銀河通用通過與NVIDIA的一系列合作,從仿真到可落地的產(chǎn)品,利用合成大數(shù)據(jù)賦能的VLA驅(qū)動工業(yè)級機(jī)器人。
首先,我認(rèn)為今天在場的所有機(jī)器人公司,包括NVIDIA和銀河通用在內(nèi),我們的共同目標(biāo)都是打造通用機(jī)器人。這樣的通用機(jī)器人將成為下一個價值數(shù)萬億美元、數(shù)萬億人民幣市場的關(guān)鍵性、革命性產(chǎn)品。這種革命性產(chǎn)品背后包含多個核心要素:
- 第一個要素是機(jī)器人的本體;
- 第二個要素是驅(qū)動它運轉(zhuǎn)的具身智能模型;
- 模型背后則是數(shù)據(jù)支撐——什么樣的數(shù)據(jù)能訓(xùn)練出這樣的能力。
接下來,我將依次分享銀河通用在這些方面的探索與成果,并介紹最終落地的產(chǎn)品。
一、機(jī)器人硬件本體銀河通用與其他公司的不同之處在于,我們的機(jī)器人并非完全人形,而是輪式雙臂雙手的形態(tài)。我們采用輪式底盤,主打高續(xù)航、工業(yè)級安全性,以及可實現(xiàn)大規(guī)模、高可靠交付的能力。銀河通用G1機(jī)器人于2024年5月首次亮相,經(jīng)過一年多迭代,目前在自動充電、運行流暢度與穩(wěn)定性方面均已達(dá)到大規(guī)模自主商用的標(biāo)準(zhǔn)。
特別感謝NVIDIA,我們率先在中國將NVIDIA Jetson Thor芯片部署于人形機(jī)器人之中,也是全球最早收到該芯片的公司之一,并在本次WRC大會上實現(xiàn)了現(xiàn)場部署。在演示中,配備該芯片的機(jī)器人展現(xiàn)出絲滑的運動性能以及實時的貨箱視覺處理與運動規(guī)劃能力,速度顯著提升,贏得現(xiàn)場觀眾一致評價為“最快的人形機(jī)器人”。這背后離不開強(qiáng)大芯片的支撐。
二、具身智能大模型我們的機(jī)器人之所以能夠在復(fù)雜環(huán)境中高效導(dǎo)航,源于銀河通用長期研發(fā)的大規(guī)模具身大模型VLA。其中,導(dǎo)航大模型只需一句話指令即可在場景中自主運動。 “六一”兒童節(jié)前夕,我們?nèi)蚴装l(fā)了無需建圖、可在任何復(fù)雜場景中跟隨人的TrackVLA,能夠自然語言交互、穿梭障礙物,全程自主運行,即使在人流干擾下也能穩(wěn)定跟隨。
上半身操作方面,我們?nèi)蚴装l(fā)了抓取基礎(chǔ)大模型Grasp VLA,實現(xiàn)了抓取動作的實時閉環(huán)生成。在各種光照條件和挑戰(zhàn)性背景下,均能實現(xiàn)指定物體的零樣本抓取,且無需事先訓(xùn)練該物體。這為未來“自然語言+即時執(zhí)行”奠定了基礎(chǔ)。
基于Grasp VLA,我們打造了零售場景應(yīng)用。無論瓶裝、袋裝、散裝、掛裝或軟體物品,均可由同一模型完成抓取與遞送。這是全球首個可應(yīng)對50多種不同物體擺放、且從剛體到軟體全覆蓋的端到端零售大模型。
三、合成數(shù)據(jù)與仿真技術(shù)銀河通能在全球率先推出多款基礎(chǔ)大模型,并能在真實商店場景穩(wěn)定應(yīng)用,得益于NVIDIA提供的全套仿真引擎。我們與NVIDIA一致認(rèn)為,合成數(shù)據(jù)是推動具身智能快速落地的關(guān)鍵。目前,真實世界數(shù)據(jù)僅占我們訓(xùn)練數(shù)據(jù)的1%,其余99%均為合成數(shù)據(jù)。
我們將自研機(jī)器人模型、大量物體與材質(zhì)資產(chǎn)輸入合成管線,經(jīng)NVIDIA引擎完成仿真驗證與物理渲染,生成全球首個百億級抓取操作大數(shù)據(jù)集,以及全球首個百億級柔性物體操作大數(shù)據(jù)集。這些數(shù)據(jù)使我們的模型在真實環(huán)境中具備極高的魯棒性與泛化能力。
四、下一代人形機(jī)器人研發(fā)我們還與NVIDIA聯(lián)合官宣了基于Isaac平臺的下一代人形機(jī)器人項目。目前銀河通用為輪式形態(tài),下一代將采用純雙足設(shè)計,基于OpenWBT_Isaac進(jìn)行數(shù)據(jù)采集與遙控控制。無論在仿真環(huán)境還是現(xiàn)實環(huán)境,該平臺可訓(xùn)練并部署多種任務(wù)能力,例如推車、拾取地面物體等。
五、商業(yè)化落地案例銀河通用的多項技能已實現(xiàn)完全商用。我們推出了全球首個24小時無人藥房解決方案,在北京、上海、深圳等地簽約超過100家藥店。用戶通過APP下單后,由機(jī)器人在店內(nèi)完成取藥并交付外賣員,該方案已吸引多位政府領(lǐng)導(dǎo)與外國元首參觀。
2024年,我們還官宣了24小時無人零售店項目,將在10個城市的百處核心商圈和旅游景點部署銀河通用“太空艙”零售終端,銷售飲品等商品。目前已在北京海淀區(qū)大融城落地。
銀河通用成立兩年來已完成超過20億元人民幣融資。我們將繼續(xù)與NVIDIA等合作伙伴攜手,打造服務(wù)千行百業(yè)、千家萬戶的通用機(jī)器人。
英偉達(dá):為具身智能提供三臺計算機(jī)

NVIDIA也為這幅拼圖貢獻(xiàn)了獨特的一塊。
從一開始,我們的使命就不是解決所有問題,而是打造專門針對“最難問題”的計算機(jī)。我們打造的特殊計算機(jī),能夠解決幾乎不可能完成的難題——而機(jī)器人就是其中最難的問題之一。我們早已夢想?yún)⑴c解決這一問題,并為此努力了很長時間。
在機(jī)器人領(lǐng)域,我們必須打造三臺計算機(jī):
1. 機(jī)器人本體計算機(jī):嵌入在機(jī)器人內(nèi)部,例如自動駕駛汽車或人形機(jī)器人中的計算機(jī)。專門為人形機(jī)器人打造的Jetson Thor就屬于這一類,今年在 WRC 展會上,就可以在 Galbot 和其他展出的機(jī)器人上看到它們的身影。
2. AI工廠計算機(jī):在使用機(jī)器人本體計算機(jī)之前,必須先開發(fā)它的“大腦”。需要依賴 DGX 和 HGX 系統(tǒng),處理海量原始數(shù)據(jù),生成物理 AI 算法、物理 AI 模型和神經(jīng)網(wǎng)絡(luò),再部署到機(jī)器人上。
3. 仿真計算機(jī):物理世界的數(shù)據(jù)無法直接從互聯(lián)網(wǎng)獲取,只能通過兩種方式獲得:真實世界傳感器采集;基于物理定律和世界規(guī)則進(jìn)行計算機(jī)仿真生成。仿真不僅能生成數(shù)據(jù),還能在部署前測試機(jī)器人,確保它們在真實環(huán)境中安全運行,且測試速度可快于現(xiàn)實時間。
四、Isaac平臺與Jetson Thor
在機(jī)器人領(lǐng)域,NVIDIA 擁有完整的Isaac 平臺,它結(jié)合了硬件與三臺計算機(jī)所需的軟件棧,包括:
- 運行時和計算環(huán)境
- 仿真工具
- 訓(xùn)練框架NVIDIA Jetson Thor是一款專為物理世界中的智能推理代理(特別是機(jī)器人)打造的超級計算機(jī),黃仁勛稱它為“實時推理機(jī)器”。
Jetson Thor 性能亮點:
- 計算能力是上一代Jetson Orin的7.5倍,接近10倍;
- 每瓦性能提升3.5倍;
- CPU 性能提升3.1倍;
- I/O 吞吐量提升10倍,滿足高帶寬感知需求。
Isaac 平臺還包括 NVIDIA 的模擬器與仿真框架:
- Isaac Sim:環(huán)境和傳感器仿真、機(jī)器人測試、生成合成數(shù)據(jù)。
- Isaac Lab:強(qiáng)化學(xué)習(xí)的仿真平臺。
- NVIDIA Cosmos:世界基礎(chǔ)模型及框架,支持構(gòu)建理解物理世界的 AI,并與 Omniverse 等模擬器結(jié)合,生成更精確、更大規(guī)模的數(shù)據(jù)。
世界基礎(chǔ)模型雖然還處在起步階段,尚不能完全理解世界,但已經(jīng)非常有用,并為機(jī)器人研發(fā)帶來了全新能力。



































