精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

50條數據解鎖空間智能,RL視覺語言模型3D空間推理框架MetaSpatial |西北大學

人工智能 新聞
西北大學計算機系與基礎模型與生成式AI中心的研究人員潘震宇 (Zhenyu Pan) 以及其導師劉晗 (Han Liu) 提出了核心問題:是否可以通過規則驅動的強化學習策略,為視覺語言模型注入空間推理能力?

在三維空間理解任務中,讓視覺語言模型(VLM)生成結構合理、物理一致的場景布局仍是一項挑戰。以“請將這些家具合理擺放在房間中”為例,現有模型盡管能夠識別圖像中的物體,甚至給出語義連貫的布局描述,但通常缺乏對三維空間結構的真實建模,難以滿足基本的物理約束與功能合理性。

為了解決這一問題,已有研究嘗試采用多智能體交互(multi-agent interaction)方法,通過多個語言模型或代理之間的迭代協商與驗證優化布局結果。然而,這類方法不僅計算成本高,而且在迭代過程中容易陷入死鎖,導致無法收斂至有效解。

另一類方法則通過構建大規模真實房間布局的描述語料,結合監督微調(Supervised Fine-Tuning, SFT)對模型進行訓練。這種方式可以在一定程度上提升模型基礎能力,但受到空間任務本身的限制:空間布局任務不存在唯一的標準答案。對于同一個輸入,合理的三維布局可以有多種形式,因此以單一ground truth為監督信號的SFT方法無法全面覆蓋可能的合理解空間,限制了模型的泛化能力與生成多樣性。

針對這一挑戰,西北大學計算機系與基礎模型與生成式AI中心的研究人員潘震宇 (Zhenyu Pan) 以及其導師劉晗 (Han Liu) 提出了核心問題:是否可以通過規則驅動的強化學習策略,為視覺語言模型注入空間推理能力?

三維布局任務具備強化學習適用的若干關鍵特性:

  • 不存在標準解,目標是生成符合約束的多樣性解;
  • 缺乏精確標注,導致監督信號稀缺;
  • 存在可程序化檢測的目標函數,如物體重疊、越界、功能邏輯合理性等。

強化學習(Reinforcement Learning)通過獎勵函數(reward function)而非依賴人工標注,引導模型在與環境交互中不斷優化策略。這使其天然適用于空間布局這類缺乏唯一標準答案、解空間復雜多樣的任務。近年來,結合規則獎勵機制的強化微調范式(Reinforcement Fine-Tuning, RFT)已在結構化任務中取得顯著成果,如文本生成、數學推理、代碼理解等,典型代表包括DeepSeek-R1和OpenAI o1。

然而,在三維空間推理這一融合視覺、語言與結構理解的多模態任務中,這一策略仍未被充分探索。

為此,他們提出了MetaSpatial框架。該方法首次將基于規則獎勵的RFT策略成功遷移至視覺語言模型(VLMs)的空間布局場景中,在僅使用約50條無ground truth數據的條件下,即可顯著提升模型的空間推理能力與布局生成質量。

具體而言,MetaSpatial構建了一套可程序化評估的獎勵函數,衡量布局結構是否合理、是否滿足物理約束,以及是否符合用戶偏好。同時引入多輪布局 refinement 機制,引導模型在訓練過程中逐步優化空間決策。借助這一策略,模型無需依賴大規模標注數據,即可學習到具備泛化能力與結構適應性的空間推理策略

實驗結果顯示,MetaSpatial在多個空間生成指標上顯著優于傳統SFT方法,充分驗證了基于規則獎勵的強化學習在三維空間智能建模中的有效性與通用性。

MetaSpatial:引入R1突破3D空間推理壁壘

MetaSpatial 將訓練3D空間推理過程建模為一個多輪決策過程,其基本形式是:給定一組多模態輸入,模型通過一系列推理步驟生成結構化布局輸出,并基于可程序化評估的獎勵信號進行策略優化。

圖片

輸入與輸出形式

在每一輪交互中,MetaSpatial的輸入包括:

  • 場景圖像或房間結構圖;
  • 房間的幾何尺寸信息(長、寬、高);
  • 用戶提供的偏好描述(如功能用途、風格要求等);
  • 需要布局的目標物體列表(包含物體類型、狀態等)。

圖片

模型輸出為兩個部分:

  1. 語言化的推理過程:記錄模型在布局時的決策理由;
  2. 結構化布局 JSON:每個物體的三維坐標位置(x, y, z)和名稱等,作為布局結果。
<think>
The goal is to arrange the objects in a dinning room setting that includes a ,..., and respect the spatial constraints and user preferences. Here's how we can approach this:


1. **Kitchen Island**: Place it centrally ...
2. **Hanging Pot Rack**: Hang it above ...
...
Let's compute the positions:
- **Kitchen Island**: (3, 2.5, 0.45)
- **Hanging Pot Rack**: (3, 2.5, 0.65)
...
Now, let's generate the JSON output.
</think>


<answer>
[{"new_object_id": "kitchen_island_1", "x": 3.0, "y": 2.5, "z": 0.45}, ......]
</answer>

該布局JSON文件既作為最終輸出,也作為強化學習中的環境狀態,用于評估和反饋。

獎勵函數與懲罰機制設計

為了衡量布局結果的好壞,MetaSpatial構建了三級獎勵信號,分別從結構合法性、物理合理性和主觀偏好三個維度評價模型輸出:

1. 格式獎勵(Format Reward)

  • 檢查輸出的 JSON 是否完整;
  • 所有目標物體是否都被覆蓋;
  • 每個物體是否都包含完整的空間參數(x/y/z 坐標、尺寸、方向等)。

2. 物理獎勵(Physics Reward)

  • 利用輸出中的幾何信息重建場景;
  • 計算是否存在物體之間的重疊(collision);
  • 檢查物體是否越界、浮空或違反場景邊界;
  • 對不滿足物理約束的比例部分施加懲罰。

圖片

3. 物理獎勵(Physics Reward)

  • 將輸出布局通過腳本用Blender渲染為三維場景圖;
  • 輸入至 GPT-4o 進行審美評分;
  • 綜合評分其物理一致性、美學質量與用戶偏好匹配度。
{'realism_and_3d_geometric_consistency': {'mean': 5.0, 'std': 0.0}, 
 'functionality_and_activity_based_alignment': {'mean': 6.0, 'std': 0.0}, 
 'layout_and_furniture': {'mean': 5.0, 'std': 0.0},
 'color_scheme_and_material_choices': {'mean': 4.0, 'std': 0.0}, 
 'overall_aesthetic_and_atmosphere': {'mean': 4.0, 'std': 0.0}}

最終獎勵為三者的加權組合,提供連續型反饋信號,以供強化學習優化使用。

Trajectory 生成與多輪布局優化

與傳統一次性生成不同,MetaSpatial 在訓練階段采用multi-turn rollout策略,允許模型對布局結果進行多輪 refinement:

  • 初始布局生成后,模型可查看自己生成的坐標結構與得分;
  • 根據獎勵反饋進行布局更新并重復多輪;
  • 每一輪的輸入、輸出、獎勵構成一條布局軌跡(trajectory);
  • 多輪優化后選取最終布局作為當前 episode 的最終結果。

這種機制不僅提高了模型的布局能力,也為策略訓練提供了更多的高質量決策路徑。

策略優化:基于 GRPO 的強化學習訓練

為實現穩定、高效的策略更新,MetaSpatial引入了Group Relative Policy Optimization(GRPO)。與常規的策略梯度方法不同,GRPO 不依賴于單條軌跡進行更新,而是利用同一輸入樣本生成的多條trajectory作為一個group進行比較性學習。

具體過程如下:

  • 對于每組輸入,執行多次layout generation,得到若干個軌跡;
  • 比較這些候選軌跡的獎勵得分,計算相對優勢;
  • 根據組內得分排序結果,優化策略網絡,使高獎勵軌跡的概率增加,低獎勵軌跡的概率下降;
  • 避免了對某一“絕對最優”解的依賴,提升了學習過程的穩定性與策略的泛化能力。

借助GRPO,MetaSpatial能夠在樣本極少(如僅50條無標注數據)的情況下,穩定學得適應性強的空間決策能力。

MetaSpatial實驗結果

1. Qwen2.5 的 7B 和 3B 兩個視覺語言模型(VLM)都從 MetaSpatial 框架中受益,但其中 7B 模型的性能提升更加顯著。相比之下,3B 模型仍然在輸出格式的生成方面存在困難,比如無法始終保持與輸入一致的物體數量和名稱,或是未能為所有物體持續穩定地提供完整的三維坐標(x, y, z)。

圖片

2. 實驗結果表明,MetaSpatial 能夠有效提升Qwen2.5-VL的3B和7B 模型的空間布局能力,但其中7B模型的提升更加明顯。具體表現為:隨著訓練的進行,7B模型能夠生成更長、更穩定、結構更清晰的響應,而3B模型的輸出則表現出較大的不一致性,其響應長度波動較大,最小值和最大值之間頻繁跳變,顯示出在保持輸出格式一致性方面的困難(例如:物體數量正確、結構化空間坐標完整等)。相比之下,7B模型的響應更加穩定,這也進一步印證了一個趨勢:規模更大的模型在強化學習驅動的空間推理任務中更具適應能力。

圖片


3. 在“RL-Before vs RL-After”的對比實驗中,MetaSpatial 框架在提升模型三維空間推理能力方面的效果得到了清晰體現。強化學習訓練前,模型生成的物體布局普遍混亂、錯位,且常出現物體漂浮、重疊或放置在不符合物理規律的位置等問題。訓練后,生成的布局則變得更加結構化、逼真,并且在語義上更加連貫,表現出更強的空間感知能力、物體對齊能力以及功能合理性。


圖片這些結果進一步強化了一個核心結論:強化學習能夠有效優化視覺語言模型的空間推理策略,使其具備更自然、更實用的三維場景生成能力,可廣泛應用于如元宇宙、AR/VR 以及游戲開發等多種現實場景中。

總結

總的來說,MetaSpatial的貢獻主要有下面四部分:

  1. 提出 MetaSpatial 框架:提出了 MetaSpatial,第一個基于強化學習(RL)的三維空間推理框架,使視覺語言模型(VLMs)能夠在無需復雜后處理的情況下直接生成結構合理的三維場景。
  2. 引入多輪布局優化機制與 GRPO 策略:設計了一種多輪布局 refinement 機制,結合 Group Relative Policy Optimization(GRPO)方法,使模型能通過多次調整與推理路徑,學習更具泛化性與適應性的空間推理能力。
  3. 構建三重獎勵體系:設計了一套結構化評估體系,涵蓋格式檢測、物理合理性檢測與基于渲染的視覺評價,為強化學習提供自適應、可擴展的獎勵信號。
  4. 驗證方法有效性:在多種模型和空間場景上進行的實驗證明,MetaSpatial 能顯著提升模型在三維場景生成中的布局連貫性、物理一致性和整體質量。

目前,項目已全面開源,包含訓練代碼、評測流程、數據集生成腳本以及完整的數據集。

項目地址: https://github.com/PzySeere/MetaSpatial

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-07-09 11:29:34

模型視頻生成AI

2024-02-19 07:10:00

視覺模型

2025-09-22 09:16:00

2024-08-07 13:00:00

2023-10-30 15:12:29

人工智能AI

2025-11-13 09:02:54

2024-12-10 09:40:00

AI3D模型

2022-05-23 10:26:10

人工智能機器學習機器視覺

2025-03-03 08:50:00

AI目標檢測模型

2025-06-03 03:15:00

2024-11-21 13:45:00

神經網絡AI

2024-04-11 11:35:03

大語言模型LLMs

2025-06-03 08:12:00

模型框架訓練

2025-09-29 09:15:28

2025-10-20 08:49:00

AI數據模型

2024-04-12 15:10:12

框架模型

2025-09-17 09:18:56

2020-08-26 10:37:21

阿里3D

2025-08-05 09:06:00

2025-01-02 12:22:09

點贊
收藏

51CTO技術棧公眾號

一区二区三区色| 日韩欧美亚洲一区二区三区| 国产成人无码专区| 国产69精品久久久久9999人| 欧美午夜国产| 欧美视频一区在线| 久久亚洲精品欧美| 清纯粉嫩极品夜夜嗨av| 成人黄色图片网站| a在线欧美一区| 中文字幕在线成人| 无码播放一区二区三区| 国产精品永久久久久久久久久| 亚洲综合福利| 精品福利在线观看| 超碰97人人人人人蜜桃| av资源在线免费观看| xxx欧美xxx| 99re热视频这里只精品| 久久久伊人日本| 国产人妖在线观看| 男人的天堂在线视频免费观看| 国产精品一线天粉嫩av| 图片区小说区区亚洲影院| 日本视频一区二区在线观看| 国产一级aa大片毛片| av在线成人| 国产精品国产三级国产普通话蜜臀| 91精品国产91久久久久福利| www.黄色网| 朝桐光一区二区| 国产欧美日韩不卡| 国产精品女主播| 中文字幕第二区| 久久青草免费| 尤物在线观看一区| 日韩一区二区电影在线观看| 免费av中文字幕| 成人区精品一区二区婷婷| 色综合久久99| 五月天久久狠狠| 中文字幕精品在线观看| 99国产**精品****| 7777女厕盗摄久久久| 特色特色大片在线| www.好吊色| 亚洲美女色禁图| 日韩精品视频免费在线观看| 女人扒开屁股爽桶30分钟| 日漫免费在线观看网站| 久久精品人人做人人爽电影蜜月| 亚洲人高潮女人毛茸茸| 国产精品久久a| 男人天堂久久久| 国产三级精品视频| 成人激情av在线| 久久久久久久久久久久国产| 999久久久91| 日韩欧美精品在线视频| 男女猛烈激情xx00免费视频| 亚洲日本在线播放| 久久视频一区| 美女国内精品自产拍在线播放| 成人做爰www看视频软件| 日本三级一区| 国产精品理论片在线观看| 97伦理在线四区| xxxx.国产| 68国产成人综合久久精品| 亚洲第一免费播放区| 男人天堂成人在线| 欧美卡一卡二| 国产精品丝袜一区| 国产一区二区中文字幕免费看| 无码人妻精品一区二区50| 久久婷婷一区| 国产在线观看91精品一区| 国产稀缺真实呦乱在线| 日韩在线观看| 日韩成人在线电影网| 亚洲熟女乱综合一区二区三区| 久久久久久一区二区三区四区别墅| 欧美日韩视频不卡| 免费看国产曰批40分钟| 欧美jizz18性欧美| 伊人开心综合网| 日韩精品―中文字幕| 欧美专区福利免费| 亚洲一区二区免费视频| 亚洲第一综合| 亚洲人在线观看视频| 国产亚洲福利社区一区| 黄频视频在线观看| 猫咪在线永久网站| 丁香五精品蜜臀久久久久99网站| 国产精品久久久久久久久久ktv| 日韩在线观看免费高清完整版| 国产传媒一区| 中文字幕 自拍偷拍| 韩国午夜理伦三级不卡影院| 国产成人免费av| 久久精品国产亚洲AV无码男同 | 一本一本久久a久久精品综合麻豆| 国产淫片av片久久久久久| av软件在线观看| 国产日韩精品久久久| 欧美日韩一级在线| 在线天堂资源| 亚洲成人av一区二区| 日韩精品福利片午夜免费观看| 1024免费在线视频| 久久久久久久综合色一本| 狠狠色噜噜狠狠色综合久| 丰满少妇被猛烈进入| 国产综合久久久久影院| 成人激情在线播放| 青青草免费在线| 亚洲精品亚洲人成人网| 麻豆传媒网站在线观看| 欧亚在线中文字幕免费| 欧美一区二区三区视频在线观看| 五月婷婷六月丁香激情| 成人在线免费av| 精品福利av导航| 朝桐光av一区二区三区| 国产精品精品| 国产91网红主播在线观看| 激情五月色婷婷| 激情久久五月天| 色之综合天天综合色天天棕色| 成入视频在线观看| 福利一区福利二区微拍刺激| jizzjizz国产精品喷水| 国产精品日本一区二区不卡视频| 欧美老女人在线| 欧美一级免费在线| 看亚洲a级一级毛片| 欧美一级黄色大片| 催眠调教后宫乱淫校园| 久久婷婷蜜乳一本欲蜜臀| 热99精品里视频精品| 国产精品成人无码| 久久国产三级精品| 91色p视频在线| 亚洲精品一区二区三区区别| 成人av电影在线网| 欧美一区二区三区在线播放| 97在线视频免费观看完整版| 精品日韩中文字幕| 国产精品成人无码专区| 国产欧美高清视频在线| 97超碰蝌蚪网人人做人人爽| 好吊色在线观看| 亚洲一二三四久久| 欧美日韩一区二区三区四区五区六区| 欧美久久九九| 国产高清一区二区三区| 大香伊人中文字幕精品| 色综合天天综合| 天堂久久精品忘忧草| 色777狠狠狠综合伊人| 国产精品第3页| www黄在线观看| 亚洲国产综合人成综合网站| 亚洲高清无码久久| 亚洲乱码视频| 成人亚洲激情网| 波多野结衣在线网站| 欧美色图天堂网| 精品亚洲乱码一区二区| 一区二区三区国产盗摄| 国产在线资源一区| 都市激情亚洲一区| 在线亚洲男人天堂| 国产农村老头老太视频| 久久女同精品一区二区| 国产精品啪啪啪视频| 深夜激情久久| 中文字幕精品久久| 一区不卡在线观看| 久久久午夜精品理论片中文字幕| 国产精品亚洲a| 成人av二区| 1卡2卡3卡精品视频| 韩日毛片在线观看| 在线电影av不卡网址| 日韩欧美不卡视频| 国产色91在线| 国产人妻精品久久久久野外| 日本一区二区三区视频| 91亚洲精华国产精华| av2020不卡| 中文字幕欧美精品日韩中文字幕| 国产日韩免费视频| 欧美性xxxxx极品| 久久福利小视频| 日韩经典中文字幕一区| 精品视频免费观看| 久久久久黄色| 91av在线免费观看视频| 色多多视频在线观看| 在线精品视频一区二区三四| 男生裸体视频网站| 第九色区aⅴ天堂久久香| 亚洲va男人天堂| 日本在线播放| 日韩精品小视频| 97免费在线观看视频| 国产精品私房写真福利视频| 一边摸一边做爽的视频17国产| 秋霞午夜鲁丝一区二区老狼| 日本一区视频在线| 亚洲超碰在线观看| 国产精品99久久久久久www| 日本小视频在线免费观看| 日韩精品中午字幕| 国产第一页在线观看| 亚洲影视资源网| 亚洲欧洲综合网| 久久人人超碰精品| 四虎精品一区二区| 国产另类ts人妖一区二区| 国产一区一区三区| 精品国产一区二区三区久久久樱花 | 亚洲综合久久av| 久久久久久无码精品人妻一区二区| 色一区二区三区四区| 精品国产福利| 日韩在线视频一区二区三区| 国产精品影院在线观看| av在线第一页| 日韩激情视频在线播放| 懂色av成人一区二区三区| 在线综合亚洲欧美在线视频| 国产偷人爽久久久久久老妇app| 精品国产精品自拍| 国产系列精品av| 亚洲成人资源在线| 国产一卡二卡在线播放| 亚洲综合自拍偷拍| 青青草激情视频| av在线播放成人| 精品国产午夜福利在线观看| 韩国三级电影一区二区| 国产乱女淫av麻豆国产| 一区二区影院| 国产伦精品一区二区三区高清版| 在线观看爽视频| 91高潮精品免费porn| √天堂8资源中文在线| 久久全国免费视频| 岛国在线视频网站| 91国产视频在线播放| 欧美三级网站| 欧美在线视频一区| 高清电影一区| 国产精品美女久久久久久免费| 日韩精品免费观看视频| 国产精品亚洲网站| 成人在线视频www| 1卡2卡3卡精品视频| 国产精品任我爽爆在线播放| 国产精品流白浆视频| 天堂久久一区| 91爱视频在线| 中文字幕在线官网| 国产精品6699| 在线成人免费| 国产不卡一区二区在线观看 | 免费观看成人在线| 精品国产乱码久久久久久1区2匹| 亚洲精品国产精品国自产| 午夜精品毛片| 91免费黄视频| 久久一日本道色综合久久| www午夜视频| 国产高清不卡一区| 黄色三级视频片| 蓝色福利精品导航| 无码人妻精品一区二区三| www国产成人免费观看视频 深夜成人网 | 亚洲一二三精品| 亚洲精品国久久99热| 日韩欧美a级片| 欧美系列一区二区| 成人av一区二区三区在线观看| 日韩av在线免费| 中国日本在线视频中文字幕| 欧美疯狂做受xxxx高潮| 成人免费在线电影| 久久av.com| 91看片在线观看| 欧美猛少妇色xxxxx| 午夜视频在线看| 久久久久中文字幕2018| 精品裸体bbb| 国产欧美一区二区在线播放| 国内精品久久久久久久久电影网| 少妇高潮大叫好爽喷水| 亚洲一区二区毛片| 成熟丰满熟妇高潮xxxxx视频| 久久久一二三| 国产精久久久久| 国产99一区视频免费| 久久久福利影院| 91视频精品在这里| 永久免费看黄网站| 色综合久久中文字幕| 亚洲成人久久精品| 色偷偷噜噜噜亚洲男人| 求av网址在线观看| 午夜精品福利在线观看| 国产中文在线播放| 91精品久久久久久久久中文字幕| 日本午夜精品| 欧美一级二级三级九九九| 欧美精品啪啪| 亚洲精品www.| 国内精品自线一区二区三区视频| 性色av蜜臀av色欲av| 一区二区三区日韩在线观看| 在线观看国产精品入口男同| 欧美精品丝袜中出| 精品无吗乱吗av国产爱色| 在线观看精品自拍私拍| 中国字幕a在线看韩国电影| 福利精品视频| 在线精品小视频| www.超碰97.com| 欧美韩日一区二区三区| 日韩一区二区视频在线| 亚洲国产一区自拍| 精品视频一二三| 欧美亚洲伦理www| 成人视屏在线观看| 久久久精品国产一区二区三区| 国产成人手机高清在线观看网站| 久久人人爽人人爽人人av| 在线亚洲精品| 伊人网综合视频| 午夜精品久久久久久不卡8050| 亚洲精品成人在线视频| 欧美日韩二区三区| 国产高清免费av| 精品香蕉一区二区三区| 69av成人| 好吊色欧美一区二区三区| 亚洲日本激情| 国产又爽又黄无码无遮挡在线观看| 亚洲成人av一区| 天天爽夜夜爽夜夜爽| 深夜福利一区二区| 久久久久久久性潮| 影音先锋欧美在线| 999在线观看精品免费不卡网站| 日本少妇激三级做爰在线| 亚洲日本在线视频观看| 国产专区第一页| 6080国产精品一区二区| 久操视频在线| 992tv在线成人免费观看| 日本欧美高清| 天堂在线资源视频| 波多野结衣91| 国产精品第5页| 一区二区三区高清国产| 日韩久久99| 男人c女人视频| 日韩av网站免费在线| 99精品全国免费观看| 这里只有精品电影| 91福利在线免费| 欧美日韩免费高清| 影音先锋久久| 欧洲美女亚洲激情| 亚洲韩国精品一区| 国产在线视频资源| 91精品国产综合久久香蕉922| 国模 一区 二区 三区| 亚洲欧美在线精品| 亚洲三级小视频| 少妇高潮久久久| 国产精品视频自在线| 欧美日韩国产亚洲一区| 亚洲av无码一区二区二三区| 欧美日韩免费一区二区三区视频| av网站大全在线| 欧美系列一区| 国产福利一区在线| 最新中文字幕一区| 久久国产精品久久久久久| 亚洲警察之高压线| 一级黄色大片儿| 欧美丝袜美女中出在线| 成人片在线看| 成人免费在线网址| 免费久久99精品国产自在现线| 中文字幕乱码在线| 欧美日韩亚洲国产综合| www.youjizz.com在线|