精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

推理延展到真實物理世界,英偉達Cosmos-Reason1:8B具身推理表現超過OpenAI ο1

人工智能 新聞
近日,英偉達發布了一系列針對物理常識推理進行了專門優化的新模型:Cosmos-Reason1。從實際結果看,該模型的表現確實不錯。

在基于物理世界的真實場景進行視覺問答時,有可能出現參考選項中沒有最佳答案的情況,比如以下例子:

根據視頻中本車的動作,它接下來最有可能立即采取的行動是什么?

A:右轉,B:左轉,C:換到右車道,D:換到左車道

圖片

很顯然,這里最佳的答案應該是直行,但預先提供的 4 個選項中并沒有這個答案。也因此,目前的大多數 AI 在面臨這個問題時往往并不能識別題中陷阱,會試圖從選項中找到正確答案。比如下面展示了 ChatGPT 的回答:

圖片

當然,在日常的視覺問答任務中,這樣的錯誤無傷大雅,但一旦涉及到真實的任務場景(比如真正的自動駕駛),這樣的錯誤就是無法容忍的了。

而要正確解答這類問題,物理常識必不可少。

近日,英偉達發布了一系列針對物理常識推理進行了專門優化的新模型:Cosmos-Reason1。從實際結果看,該模型的表現確實不錯。比如針對以上問題,該模型經過一番推理后,認為給出的選項都不對,因此沒有給出選擇。

圖片

Cosmos-Reason1 針對以上視覺問答問題輸出的思考過程和答案。

據介紹,Cosmos-Reason1 不僅包含模型,更是英偉達開發的一個包含模型、本體(ontologies)和基準的套件,其目標是讓多模態 LLM 能夠生成有物理依據的響應。

目前他們已經發布了兩個多模態 LLM:Cosmos-Reason1-8B 和 Cosmos-Reason1-56B。

這兩個模型都經過了四個階段的訓練:視覺預訓練、通用 SFT物理 AI SFT 和物理 AI 強化學習。此外,他們還為物理常識和具身推理定義了本體,并構建了用于評估多模態 LLM 的物理 AI 推理能力的基準。

圖片

下面我們就來具體看看英偉達的這項研究成果。

圖片

  • 論文標題:Cosmos-Reason1: From Physical Common Sense To Embodied Reasoning
  • 論文地址:https://arxiv.org/abs/2503.15558
  • 代碼地址:https://github.com/nvidia-cosmos/cosmos-reason1

物理 AI 推理

物理 AI(Physical AI)并不是一個新概念,但肯定算是英偉達近段時間最為推崇的發展方向之一 —— 在黃仁勛前些天的 GTC 2025 大會 Keynote 演講中,物理 AI 也是核心關鍵詞之一。

根據英偉達官網的定義:物理 AI 是指使用運動技能理解現實世界并與之進行交互的模型,它們通常封裝在機器人或自動駕駛汽車等自主機器中。

在今天介紹的這篇論文中,英偉達首先定義了物理常識(physical common sense)的本體論(ontology)。

圖片

可以看到,其中包含三大類別:空間、時間和其它基本物理。這三大類又被進一步分為 16 類,如下表 1 所示。

圖片

此外,該團隊也定義了具身推理的本體論,其中涉及處理復雜的感官輸入、預測動作效果、尊重物理約束、從互動中學習;詳見下表。

圖片

Cosmos-Reason1

下面將介紹 Cosmos-Reason1 的多模態架構以及 LLM 主干選擇。

多模態架構

為了構建多模態 LLM,現在已經有多種不同的架構選擇。常用的架構是僅解碼器架構(例如 LLaVA)和基于交叉注意力的架構(例如 Flamingo 和 Llama 3-V)。

英偉達采用了類似于 LLaVA 和 NVLM-D 的僅解碼器架構,因為它簡單且可通過將其它模態 token(圖像或視頻)對齊到文本 token 嵌入空間來統一處理所有模態。

具體來說,該模型的架構首先是一個視覺編碼器,然后是包含下采樣兩層 MLP 的 projector,然后是僅解碼器的 LLM 主干。

圖片

具體選擇上,英偉達這里使用了 InternViT-300M-V2.5 作為 Cosmos-Reason1-8B 和 Cosmos-Reason1-56B 的視覺編碼器。

對于每張輸入圖像,該架構會動態調整圖像以達到預定義的寬高比,并將其分割成 1 到 12 個圖塊,每個圖塊的尺寸為 448 × 448 像素,具體取決于圖像的分辨率。此外,還會生成一個縮略圖圖塊 —— 完整圖像的縮小版本,以保留全局上下文。

對于每段輸入視頻,則以最高每秒 2 幀的速率均勻采樣最多 32 幀,并將每幀的大小調整為 448 × 448 像素。對于每個 448×448 視頻幀輸入,視覺編碼器會生成 1,024 個視覺 token,其圖塊大小為 14×14,然后使用 PixelShuffle 將其下采樣 2×2 倍,通過將空間維度轉換為通道維度將其減少到 256 個 token。

來自多個圖塊的圖像 token 與交錯的圖塊 ID 標簽連接在一起,而來自多個幀的視頻 token 則會直接連接在一起。

Cosmos-Reason1 的 LLM 主干采用了混合 Mamba-MLP-Transformer 架構設計。

表 3 總結了其模型配置:

圖片

混合 Mamba-MLP-Transformer 主干

最近英偉達發布了不少 Mamba-Transformer 混合架構的研究成果,事實上我們昨天就正巧介紹過其中兩個:Nemotron-H 和 STORM。

而今天我們介紹的 Cosmos-Reason1 系列模型則采用了 Mamba-MLP-Transformer 混合架構,如下圖所示。

圖片

在訓練時,Cosmos-Reason1-8B 模型采用了 4 的張量并行化(TP=4),而 Cosmos-Reason1-56B 模型則采用了 8 的張量并行化和 2 的管道并行化(TP=8, PP=2)—— 可支持更長視頻的訓練。

實驗表現

下面我們簡單看看 Cosmos-Reason1 系列模型的實驗表現。有關實驗的更多詳細設置和討論請閱讀原論文。

物理 AI 監督式微調的效果

首先來看經過物理 AI 監督式微調后,Cosmos-Reason1 的物理常識表現。如表 7 所示,Cosmos-Reason1-8B 和 Cosmos-Reason1-56B 在各自的主干網絡基礎上都有明顯提升,其中 56B 版本的準確度表現最好,甚至略微超過了 OpenAI ο1。

圖片

要知道,這個結果是在強化學習訓練之前取得的。這彰顯了該團隊精心挑選的常識數據集的有效性,為進一步的 RL 改進奠定了堅實的基礎。

接下來看看經過物理 AI 監督式微調后,Cosmos-Reason1 的具身推理表現。從表 8 可以看到,Cosmos-Reason1 模型在此基準上取得了比所有基線模型明顯更好的結果,8B 和 56B 變體與各自的主干 VLM 相比均有超過 10% 的提升。

圖片

那 Cosmos-Reason1 的直覺物理理解能力如何呢?該團隊觀察到,許多 VLM 在基本物理推理方面存在困難。該團隊針對三個任務對模型的能力進行了測試,包括時間箭頭、空間拼圖和物體持久性。

表 10 展示了測試結果,可以看到在時間箭頭和物體持久性任務上,現有模型的表現和胡亂猜測差不多。而在空間拼圖任務上,GPT-4o 和 OpenAI o1 的表現卻比隨機亂猜好得多。

圖片

這表明當前的多模態模型在推理空間關系方面比推理時間動態方面更熟練。鑒于這些模型通常在 MMMU 等標準基準上表現良好,這說明現有評估其實無法體現它們對物理世界的理解能力。

然而,該團隊精心設計的直覺物理數據集可使 8B 模型能夠在所有三個任務上有顯著提升,就展現 Cosmos-Reason1 在直覺物理推理方面的基本能力。

物理 AI 強化學習的效果

對于上面得到的模型,該團隊又進行了進一步的后訓練,以進一步增強它們的物理 AI 推理能力。為此,該團隊構建了自己的 RL 基礎設施,并基于其針對物理常識、具身推理和直覺物理推理任務對模型進行了后訓練。注意,這里并沒有使用復雜獎勵,都是簡單的、基于規則的可驗證獎勵。

首先來看在物理常識和具身推理任務上的結果,如表 9 所示。

圖片

可以看到,物理 AI RL 后訓練可以提高模型在大多數基準上的性能,但 RoboFail 是個明顯的例外。

不過該團隊表示這并不奇怪,因為 RoboFail 是經過精心設計的人工整編的基準,具有測試「動作可供性(action affordance)」和「任務完成驗證」的高難度現實場景。該基準的難度源于幾個因素:(1) 需要高度觀察的感知或全面的時間上下文處理的樣本,(2) 與 RoboVQA 中的問題不同,可供性問題涉及動作執行中的復雜物理約束。

該團隊認為,在 RoboFail 上的表現不提升的主要原因是代表性訓練數據不足。

該團隊還發現了一個有趣現象:新提出的模型學會了仔細評估所提供的選項,如果問題不明確,則會全部拒絕。如本文開始時舉的例子所示,該模型會評估每個選項的可行性,并在出現歧義時采取不在選擇范圍內的保守行動。

最后,在直覺物理推理任務上,如上表 10 所示,通過精心的監督式微調數據整編和針對性訓練,Cosmos-Reason1-8B 在所有任務上都取得了顯著的進步,而物理 AI RL 能夠進一步增強模型的空間拼圖和物體持久性能力。然而,推理時間箭頭仍然很困難。

整體來說,物理 AI RL 可以提升模型在空間、時間和物體持久性方面的推理能力。

圖 9 展示了在 RL 前后 Cosmos-Reason1 的時間推理能力的差異??梢钥吹?,該模型能夠識別反物理的運動 —— 例如粉末違背重力上升到碗中,同時不受視頻中靜止干擾物的影響。這表明它的推理不僅僅是感知。

圖片

類似地,在圖 10 中可以看到,有 RL 的模型傾向于將空間問題與時間推理混淆。雖然他們可以感知到第二幀與第一幀缺乏相似性,但它們固有的偏見會導致它們遵循默認的視頻順序,這表明它們更多地依賴于時間線索而不是真正的空間理解。

圖片

使用空間謎題來進行 RL 可讓模型從第一幀中提取關鍵特征,并在多幀之間系統地比較它們,從而準確地確定空間關系。

最后,圖 11 表明,即使 CoT 較長,沒有物理 AI RL 的模型也會難以理解物體持久性,經常難以推理物體的出現和消失。相比之下,經過 RL 的模型可通過直接而簡潔的推理快速得出結論。

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-08-13 09:03:00

2025-03-19 09:52:50

2025-07-30 09:05:00

2024-09-24 11:01:03

2025-03-19 10:10:43

2025-03-07 10:24:43

2024-08-28 13:34:13

2024-12-26 11:45:48

2025-06-04 13:56:06

英偉達訓練模型

2022-06-01 16:47:53

AI模型開源

2025-02-03 14:06:32

2025-08-19 09:14:44

2024-08-16 12:46:08

2025-10-28 09:16:38

2025-10-27 08:54:00

2023-03-22 13:53:26

芯片英偉達

2025-05-12 09:02:00

2022-02-19 18:39:34

AI數據訓練

2025-04-23 15:25:27

語言模型Eagle 2.5英偉達
點贊
收藏

51CTO技術棧公眾號

亚洲人成免费网站| 美女搞黄视频在线观看| 韩国av一区二区三区在线观看| 欧美成年人视频网站欧美| 午夜男人的天堂| 日韩成人亚洲| 一区二区三区在线不卡| 久久久精品有限公司| 在线观看免费视频a| 亚洲第一黄网| 久久久国产一区| 中文字幕 亚洲一区| 香港三级韩国三级日本三级| 91video| 99久久久久久中文字幕一区| 亚洲第一网站免费视频| 国产精品区在线| 国产自产自拍视频在线观看| 中文字幕日韩一区| 欧美精品人人做人人爱视频| av中文字幕播放| 日本亚洲最大的色成网站www| 欧美俄罗斯性视频| 视频国产一区二区| 精品久久久久久久| 日韩黄在线观看| 美女露出粉嫩尿囗让男人桶| 国产福利亚洲| 色婷婷国产精品久久包臀| 成人免费在线视频播放| 亚洲乱亚洲乱妇| 久久午夜免费电影| 韩国精品一区二区三区六区色诱| 99精品国产99久久久久久97| 久久精品一本| 欧美在线一区二区三区四| 免费人成在线观看| 一本一道久久a久久精品蜜桃| 伊人久久免费视频| 日本高清www| 国产精品一区二区三区美女| 日韩视频免费观看高清完整版| 色婷婷综合网站| 久久电影tv| 疯狂做受xxxx高潮欧美日本| 男女啪啪免费视频网站| 大香伊人中文字幕精品| 亚洲综合精品久久| 蜜臀av色欲a片无码精品一区| 1024在线播放| 亚洲精品久久久久久国产精华液| 在线丝袜欧美日韩制服| 免费大片黄在线| 亚洲人吸女人奶水| 一区二区三区四区免费观看| 国产人成网在线播放va免费| 亚洲美女在线国产| 日本黄大片在线观看| 久久五月精品中文字幕| 精品久久中文字幕久久av| 国产白丝袜美女久久久久| 天堂av中文在线观看| 色综合网色综合| 国产福利影院在线观看| 精品国产欧美日韩一区二区三区| 欧美午夜一区二区三区免费大片| 色综合色综合色综合色综合| 在线观看欧美| 精品国产亚洲一区二区三区在线观看| 看全色黄大色黄女片18| 网曝91综合精品门事件在线| 亚洲欧洲午夜一线一品| 九九热久久免费视频| 综合激情网站| 97超碰国产精品女人人人爽| 最近中文字幕在线观看| 国内精品久久久久影院色| a级国产乱理论片在线观看99| 涩涩视频免费看| 久久久亚洲精品一区二区三区 | 国产区一区二| 精品乱人伦小说| 极品粉嫩小仙女高潮喷水久久| 国产伦精品一区二区三区视频| 99视频精品视频高清免费| 51久久夜色精品国产麻豆| 免费看的av网站| 四虎5151久久欧美毛片| 精品国产一区二区三区久久狼黑人 | av资源免费观看| 日本欧美一区二区三区| 97超碰人人看人人| 国产鲁鲁视频在线观看免费| 亚洲丝袜自拍清纯另类| 成人综合视频在线| 在线日韩三级| 亚洲欧美中文字幕| 欧美人妻一区二区| 视频一区二区欧美| 成人激情直播| 91av资源在线| 午夜欧美2019年伦理| 午夜精品久久久久久久99热影院| 国产精品巨作av| 久久好看免费视频| 欧美 日韩 精品| 高清在线观看日韩| 亚洲一区二区三区色| 日本三级一区| 欧美v日韩v国产v| 亚洲激情图片网| 美女爽到呻吟久久久久| 99国精产品一二二线| melody高清在线观看| av免费在线观看网址| 久久亚洲综合色一区二区三区| 91免费视频黄| 播放一区二区| 日韩精品在线视频观看| 欧美成欧美va| 久久国内精品自在自线400部| 精品视频导航| 丁香花在线影院| 91精品国产美女浴室洗澡无遮挡| 韩国女同性做爰三级| 99成人精品| 99国产视频| 伊人影院蕉久影院在线播放| 欧美日韩高清一区二区三区| 无码人妻aⅴ一区二区三区69岛| 一本一本久久| 国产美女在线精品免费观看| 在线观看三级视频| 欧美一区二区久久| 情侣偷拍对白清晰饥渴难耐| 日本不卡免费在线视频| 欧美亚洲国产免费| jk漫画禁漫成人入口| 日韩精品中文字幕在线| 日韩免费观看一区二区| 成人av在线一区二区三区| 日韩激情视频一区二区| 一区二区三区四区精品视频| 久99九色视频在线观看| 国产v在线观看| 亚洲精品视频在线| 999久久久精品视频| 色88久久久久高潮综合影院| 麻豆成人在线| 欧美一级在线亚洲天堂| 性感美女一级片| 欧美日韩免费区域视频在线观看| 91黄色免费视频| 国产精品毛片在线| 欧美一区二区三区在线播放 | 中文字幕第九页| 日韩一级大片| 日本精品一区二区三区视频 | 精品视频一区二区不卡| 久久一级免费视频| 国模一区二区三区白浆| 成人手机在线播放| 国产精品丝袜在线播放| 日韩免费不卡av| 调教视频免费在线观看| 91麻豆精品国产91久久久使用方法| 黄色一级视频免费| 99久久99久久综合| 国产主播中文字幕| 亚洲一区在线| 精品国产免费久久久久久尖叫 | 91福利视频网站| 国产一区在线观看免费| 国产精品一区二区不卡| 欧美一区二区中文字幕| 欧美日韩水蜜桃| 91久久嫩草影院一区二区| 国精一区二区三区| 亚洲精品自拍视频| 午夜精品99久久免费| 波多野结衣一区二区在线| 国产精品乱人伦| 免费看三级黄色片| 性伦欧美刺激片在线观看| 五月婷婷综合色| 91精品尤物| 国产大片精品免费永久看nba| 成人福利网站| 日韩精品中文字幕在线播放| 国产人妖在线播放| 色综合视频在线观看| 欧美在线视频第一页| 91在线免费播放| 久久久久久综合网| 久色成人在线| 性高湖久久久久久久久aaaaa| 欧美日韩激情在线一区二区三区| 91午夜理伦私人影院| 周于希免费高清在线观看| 粗暴蹂躏中文一区二区三区| 青青草在线播放| 欧美大片免费久久精品三p| 日本黄色中文字幕| 亚洲自拍偷拍麻豆| 成人三级视频在线观看| 97超碰欧美中文字幕| 性鲍视频在线观看| 日韩av中文字幕一区二区三区 | 中文字幕在线观看网站| 亚洲午夜小视频| 男人的天堂a在线| 在线电影欧美成精品| 国产免费一级视频| 亚洲高清久久久| 曰本女人与公拘交酡| 国产精品午夜在线| 性欧美13一14内谢| av中文一区二区三区| 国产乱国产乱老熟300部视频| 免费成人在线观看视频| 天天摸天天碰天天添| 亚洲国内欧美| 黄色三级中文字幕| 午夜影院欧美| 一区二区三区欧美在线| 蜜桃tv一区二区三区| 香蕉加勒比综合久久| 九九九九九国产| 人妖欧美一区二区| 99久久激情视频| 亚洲欧美日本视频在线观看| 欧美国产日韩激情| 欧美特黄一区| 妞干网视频在线观看| 91精品一区二区三区综合| 亚洲最大免费| 日韩毛片视频| 一区二区三区四区国产| 成人精品久久| 亚洲高清视频一区| 成人精品视频| 一本色道久久综合亚洲二区三区| 菠萝蜜一区二区| 天天好比中文综合网| 欧美日韩一区二区三区视频播放| 欧美精品亚洲精品| 成人久久久久| 午夜在线视频免费观看| 一个色综合网| 欧美激情亚洲天堂| 最新亚洲激情| 99精品免费在线观看| 日本免费新一区视频| 成人性生交免费看| 久久国产欧美日韩精品| 51自拍视频在线观看| 国产高清一区日本| 在线xxxxx| 久久亚洲精品国产精品紫薇| 中文字幕第4页| 国产精品麻豆久久久| 三级影片在线看| 亚洲高清免费在线| 亚洲国产精品无码久久久| 欧美少妇bbb| 国产色视频在线| 精品成人在线观看| 欧美zzoo| www.美女亚洲精品| 中文字幕在线三区| 欧美最顶级的aⅴ艳星| 懂色aⅴ精品一区二区三区| 成人h片在线播放免费网站| 91蜜桃臀久久一区二区| 蜜桃视频在线观看91| 久久婷婷蜜乳一本欲蜜臀| 日本一二三区视频在线| 国产欧美一区二区色老头| 黄色三级视频片| 国产成人免费xxxxxxxx| 青青草福利视频| 亚洲美女精品一区| 五月婷婷色丁香| 制服丝袜亚洲精品中文字幕| 少妇无码一区二区三区| 一区二区三区回区在观看免费视频| 黄色av电影在线播放| 91精品国产91久久久| 久久精品 人人爱| 国产伦精品一区二区三区在线 | 国产免费视频传媒| 国产一区二区免费在线| 一二三不卡视频| 亚洲人成亚洲人成在线观看图片| 亚洲第一精品在线观看| 6080午夜不卡| 黄色美女网站在线观看| 欧美人与性动交| 韩国成人在线| 国产综合18久久久久久| 亚欧美无遮挡hd高清在线视频| 伊人成色综合网| 韩日欧美一区二区三区| av电影在线不卡| 欧美日韩国产在线看| 精品国产亚洲AV| 最新的欧美黄色| 欧美日韩大片| 国产一区二区三区高清| 一区二区三区四区电影| 爱情岛论坛成人| 91一区二区在线| 精品97人妻无码中文永久在线 | 亚洲国产cao| 国产精品天天操| 中文字幕少妇一区二区三区| 午夜裸体女人视频网站在线观看| 999视频在线观看| 91综合视频| 久久久精品麻豆| 国产性天天综合网| 日韩一区二区视频在线| 精品欧美一区二区三区精品久久| 91最新在线| 国产精品久久91| 要久久电视剧全集免费| 精品久久久久久久久久中文字幕| 国产精品亚洲成人| 日本午夜在线观看| 欧美福利视频一区| 午夜在线观看视频| 国产精品免费久久久久影院| 国产亚洲电影| 激情婷婷综合网| 国产亚洲欧美在线| 国产女主播喷水视频在线观看 | 校园春色亚洲| 精选一区二区三区四区五区| 亚洲三级毛片| 日本japanese极品少妇| 午夜精品久久久久久久99樱桃 | 中文字幕免费精品一区| 免费观看成人性生生活片| 日韩性感在线| 日本美女一区二区| 亚洲区一区二区三| 欧美日韩免费视频| 男人和女人做事情在线视频网站免费观看| 国产精品久久久久77777| 不卡在线一区二区| 污污视频网站在线| 亚洲免费电影在线| 国产91绿帽单男绿奴| 性欧美xxxx交| 国产91精品对白在线播放| 欧美日韩亚洲自拍| 中文字幕一区二区三区精华液 | 一级片在线观看视频| 日韩少妇与小伙激情| 亚洲五码在线| 国产中文字幕视频在线观看| 久久久综合视频| 中文字幕无码乱码人妻日韩精品| 一区二区三区视频免费| 先锋影音一区二区| 亚洲精品少妇一区二区| 北条麻妃国产九九精品视频| 国产日产精品一区二区三区| 伊人伊成久久人综合网小说| 57pao成人永久免费| 91.com在线| 国产欧美日韩中文久久| a视频免费在线观看| 97免费视频在线| 激情综合网五月| 五月天视频在线观看| 亚洲高清久久久| av国产在线观看| 国产超碰91| 秋霞电影一区二区| 九九视频免费观看| 亚洲日本欧美中文幕| www久久久| 男人揉女人奶房视频60分| 国产精品美女久久久久久久| 亚洲大尺度网站| 国产精品久久二区| 午夜久久tv| av手机在线播放| 亚洲成人激情在线| 欧美黄页免费| 鲁一鲁一鲁一鲁一色| 亚洲欧洲av色图| 日韩欧美亚洲系列| 97超级碰碰| 美女网站一区二区| 国产乱国产乱老熟| 久久99久久99精品中文字幕| 国产精品欧美三级在线观看| 少妇搡bbbb搡bbb搡打电话|