精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

英偉達&斯坦福打破陳規!Gen-Drive:生成-評估的全新規劃范式,直接SOTA!

人工智能 新聞
在本文中,我們提出了Gen-Drive算法框架,標志著自動駕駛的決策向生成-評估的方式進行轉變。

寫在前面&筆者的個人理解

在復雜環境中導航需要自動駕駛代理能夠熟練地預測未來場景(比如其他代理的行為),同時做出明智的決策。一般而言,傳統的預測性和確定性規劃方法通常將預測和規劃過程分開,從而將自車與社會環境信息隔離開來,并常常導致不符合社會駕駛規范的行為。盡管目前工業界和學術界已經提出了集成預測和規劃框架的算法模型來解決這一問題,但這類算法仍然依賴于確定性規劃,這對解決代理行為的不確定性、多模態性和相互作用的動態性提出了挑戰。

為了克服上述提到的這些挑戰,我們建議在規劃任務中采用生成-評估的方法。這個方法的關鍵是將自車代理集成到社會互動環境中,為整個場景中的所有代理生成一系列可能的結果,并使用學習場景評估器來指導決策過程。同時,我們考慮到生成模型在自動駕駛的仿真和預測任務中得到了廣泛的應用,但它們在決策任務中的應用相對有限。我們認為是兩個主要限制阻礙了生成模型在規劃任務中的應用。

  • 評估生成的場景并選擇符合人類期望和價值觀的最佳決策場景非常復雜。為了解決這個問題,我們引入了一個場景評估(獎勵)模型,該模型基于從 VLM 反饋中得出的偏好數據進行訓練,從而實現更好的決策;
  • 與受益于樣本多樣性的仿真或者場景生成任務不同,使用生成模型進行規劃需要用更少的樣本生成更可能的未來場景,以最大限度地減少計算開銷和運行時延遲。我們通過引入強化學習 (RL) 微調框架來解決這個問題,該框架基于獲得的獎勵模型來提高擴散生成的質量;

考慮到上述提到的主要限制阻礙以及相應的解決措施,我們提出了Gen-Drive算法模型,一種擴散生成驅動策略以及相應的訓練框架。我們設計的基礎模型使用 nuPlan數據集進行訓練,并在nuPlan閉環規劃基準上進行評估。結果表明,我們的擴散驅動策略取得了良好的性能。

完整的Gen-Drive算法框架以及訓練過程如下圖所示。

圖片

Gen-Drive算法模型整體訓練框架圖

網絡模型的整體架構&細節梳理

在詳細介紹我們提出的Gen-Drive算法模型細節之前,下圖展示了我們提出的Gen-Drive算法模型的整體架構。

圖片提出的Gen-Drive框架的整體結構圖

通過上圖可以看出,整體而言,我們采用生成(擴散)模型來取代傳統范式中的預測規劃模型。二者之間的關鍵的區別在于,自車代理并不是孤立于場景之外的;相反,它被視為場景中不可或缺的一部分,所有代理的行為都相互依賴。為了利用該生成模型進行規劃,我們設計了一個場景評估(獎勵)模型。該模型使用精選的成對人類偏好數據集進行訓練,使其能夠直接對生成的場景(規劃)進行評分,并促進選擇最佳且符合上下文的決策。此外,我們利用獎勵模型來微調擴散生成過程,使其朝著生成高回報計劃的方向發展。RL微調步驟可以增強整體規劃性能并減少大量采樣的需要。

場景生成器

對于當前時間戳的初始駕駛場景,我們考慮N個目標(包括自車)和M個地圖元素,追蹤這些目標在個時間步內的歷史軌跡。當前的場景輸入到編碼器中的包括目標的軌跡以及地圖線。其中,是路徑點的個數,和是每個點的特征維度。

  • 編碼器部分:當前場景輸入最初通過時間軸自注意力Transformer層對目標軌的跡進行編碼,得到,然后通過多層感知機對地圖數據進行最大池化,得到。他們被拼接起來形成初始的編碼。我們采用以查詢為中心的Transformer編碼器來融合場景元素的特征并生成全面的場景條件編碼。
  • 去噪器部分:擴散過程在所有感興趣目標的聯合動作空間中進行,動作由加速度和偏航角比率組成。噪聲直接添加到動作序列中。給定噪聲輸入,其中是噪聲等級,是未來時間戳,此外場景條件為,我們采用具有自注意力和交叉注意力層的去噪Transformer來預測去噪后的動作序列。對于自車代理,額外的路線信息被提供,并采用了額外的交叉注意層來模擬自車的路線關系。
  • 生成:未來場景(聯合目標動作)是從隨機高斯噪聲開始生成的,隨后,每個擴散步驟k涉及從下面指定的過程進行采樣。其中以及是根據預先確定的噪聲得到的。通過迭代地反轉擴散步驟,我們獲得最終的去噪聯合動作輸出。隨后,通過使用動態模型將目標動作轉換為狀態。該狀態包括目標的坐標、朝向和速度。

圖片

場景評估器

場景評估器將擴散生成器生成的個未來場景作為輸入,這些場景可以通過從一批高斯噪聲開始并行生成。這些生成的場景結構化為,評估器的另外一個輸入是矢量地圖。這些未來場景使用以查詢為中心的Transformer編碼器進行編碼,類似于歷史場景的編碼,從而產生場景特征表示。隨后,我們利用從場景編碼中提取的自車代理的未來或規劃編碼,以及將場景編碼作為Transformer解碼器中的鍵和值,得出未來場景中以規劃為中心的特征。需要注意的是,Transformer解碼器分別關注每個場景中的個元素。兩個多層感知機頭模塊附加到這個特征張量用于分別重建自車代理的規劃軌跡并輸出不同生成場景的分數。自車規劃重建的頭模塊作為輔助任務來增強穩定性和有效性。

基于擴散模型的訓練

基礎的擴散模型經過訓練,可以在各種噪聲水平和場景條件下從帶噪聲的軌跡輸入中恢復干凈的軌跡。在每個訓練步驟中,我們都會從噪聲級別和高斯噪聲中進行采樣來擾亂原始的動作軌跡。由于該模型預測場景級的軌跡,因此所有目標軌跡都受到相同噪聲水平的影響。基礎擴散模型的訓練損失函數可以表示為:

圖片

其中,代表數據集,代表Smooth L1損失函數,是動態模型,是目標的未來真值狀態。

訓練獎勵模型

  • 成對偏好數據收集:為了構建一個有效的獎勵模型,整理全面的數據集是非常有必要的。一種方法是利用人為設計的指標,例如PDM分數。但是,依賴此類指標存在很大的局限性,因為它們可能無法準確反映不同場景中的實際人類價值觀。此外,即使對于人類評估者來說,準確地用獎勵值標記場景也是一項挑戰。或者,我們可以讓人類標注員進行成對的比較,確定哪些場景更符合人類偏好。然而,整理大規模獎勵數據集會給人類標注員帶來巨大的工作量。為了解決這個問題,我們使用VLM來提高流程的效率和可擴展性。
    VLM輔助獎勵標記流程如下圖所示。為了增加規劃軌跡的多樣性,我們首先利用K-means聚類算法從數據中提取32個5秒錨定目標,并采用引導擴散策略為自車代理生成32條不同的規劃軌跡,以及模型對場景中其他物體的反應行為。隨后,我們對這些場景進行成對采樣。我們首先計算規劃軌跡之間的差異,然后檢查碰撞和過濾掉明顯的失敗情況。如果這些措施不足以區分,我們將使用GPT-4o提供結論性評估。如下圖所示,GPT-4o根據當前場景上下文對兩個生成的場景進行了合理的評估。

圖片

使用VLM收集規劃偏好數據的整體流程

  • 訓練過程:在每個訓練步驟中,我們從相同的初始條件中采樣一批成對比較結果,即接受的場景和拒絕的場景。訓練場景評估模型的損失函數如下,其中,是成對偏好獎勵數據集,表示預測生成場景得分的獎勵模型。

圖片

下圖顯示了一些獎勵模型輸出的示例,結果表明,我們訓練的獎勵模型為生成的計劃和場景產生了合理的分數。

圖片

場景評估輸出的示例

微調生成模型

為了提高擴散生成在規劃任務中的效率,我們建議使用訓練好的獎勵模型和RL對擴散模型進行微調。我們可以將擴散去噪過程公式化為多步驟的MDP,其中去噪器函數作為以每一步的噪聲輸入為條件的策略。軌跡包含K個時間戳,在擴散過程結束時發出獎勵信號。RL目標是最大化沿軌跡的累積獎勵,我們可以利用去噪擴散策略優化來改進生成策略。微調損失公式如下,其中,是所有目標的去噪狀態軌跡,是真實軌跡。

圖片

需要注意的是,微調損失會在整個擴散軌跡上累積,并且只有去噪器是可學習的,而編碼器在微調期間是固定的。下圖展示了使用DDPO的RL微調算法流程。

圖片

實驗結果&評價指標

整體實驗結果分析

為了驗證我們提出的算法模型的有效性,我們實施了不同模型的閉環規劃實驗,結果如下表所示。

圖片

此外,為了更加直觀的展示生成過程中的一些典型場景,微調后的策略表現出更好的規劃性能,我們也進行了相關的可視化。

圖片規劃過程示意圖

通過相應的實驗和可視化結果可以看出,生成和評估優于單樣本推理。多樣本規劃方法通過批處理并行生成 16 個場景,并使用學習到的獎勵模型選擇最佳場景。該方法增強了生成計劃的多樣性,從而提高了整體規劃得分。此外,具有我們學習到的獎勵模型的生成規劃器在規劃方面優于基于 PDM 分數的評估器。此外,微調可提高性能。規劃效率仍然在很大程度上取決于生成質量,我們證明 RL 微調可以顯著提高質量和性能。值得注意的是,即使使用單樣本方法,微調策略的整體規劃得分也優于沒有微調的多樣本方法。此外,使用我們學習到的獎勵模型進行微調比使用基于 PDM 的評分器效果更好。我們也注意到,與基于學習的預測規劃器相比,我們的模型通過使用先生成后評估的方法表現出卓越的性能。然而,使用基于規則的軌跡生成器和評分器的PDM-Closed規劃器獲得了最高分。值得注意的是,它針對 nuPlan 指標進行了優化,這可能缺乏人類相似性和對現實世界場景的適應性。

消融實驗結果分析

首先,我們先分析了建模目標數量的影響。數量范圍從 1到 100,相關的實驗結果下表所示。我們在模型訓練中調整建模目標的數量,并在測試中使用單樣本生成。結果表明,僅生成自車的規劃會導致性能較差,主要是因為在某些情況下缺乏運動。相反,過多的建模目標(例如 100)也會導致性能和運行效率下降。因此,在保持運行效率的同時,對 50 個自車和周圍對象進行建模表現最佳。

圖片

此外,我們也對RL微調階段訓練步驟對結果的影響進行了實驗,并在測試中采用了多樣本生成和評分方法,相關實驗結果如下表所示。結果表明,1000 個微調步驟可實現最佳規劃指標,超過此指標,微調策略的性能就會下降。這是 RLHF 框架中的一個常見問題,因為策略可能會利用獎勵函數并產生不合理的行為。因此,我們將 RL 微調階段限制為 1000 個步驟,以防止性能下降。

圖片

結論

在本文中,我們提出了Gen-Drive算法框架,標志著自動駕駛的決策向生成-評估的方式進行轉變。實驗結果表明,與其他基于學習的規劃方法相比,我們的模型通過適當的獎勵建模表現出更優異的性能,并且通過 RL 微調得到了進一步的增強。

責任編輯:張燕妮 來源: 自動駕駛之心
相關推薦

2025-10-15 09:05:05

2021-07-06 10:37:37

模型人工智能深度學習

2025-04-10 09:26:56

2013-01-31 09:45:14

斯坦福超級電腦百萬內核

2012-03-21 21:38:27

蘋果

2025-10-24 17:29:54

2023-12-12 13:45:00

模型訓練

2024-09-26 10:23:46

2009-05-19 09:06:41

Apple斯坦福iPhone

2019-12-16 14:33:01

AI人工智能斯坦福

2025-06-23 08:52:00

2025-09-08 09:10:00

2025-01-17 10:26:19

模型開發ChatGPT

2024-05-13 12:58:30

2024-12-19 13:28:54

2024-11-25 08:20:00

2022-10-08 12:38:23

模型開源

2017-11-28 14:18:29

2025-09-24 18:02:55

2018-12-03 09:35:26

互聯網
點贊
收藏

51CTO技術棧公眾號

91久久久久久白丝白浆欲热蜜臀| 日韩xxx视频| 精品国产18久久久久久洗澡| 福利一区视频在线观看| 欧美中日韩一区二区三区| 中文字幕在线播放不卡| 欧美区亚洲区| 亚洲人午夜精品免费| 亚洲精品mv在线观看| 超碰91在线观看| 国产精品日产欧美久久久久| 国产精品久久一区二区三区| 波多野结衣视频在线看| 亚洲视屏一区| 久久精品91久久久久久再现| 五月婷婷综合在线观看| 玖玖精品一区| 欧美日韩一区二区在线视频| 日本精品久久久久久久久久| 日本在线看片免费人成视1000| 99亚偷拍自图区亚洲| 91免费欧美精品| 免费在线不卡av| 日韩视频不卡| 欧美日韩国产二区| av片在线免费看| 亚洲精品合集| 亚洲电影免费观看高清| 少妇愉情理伦片bd| 亚洲国产一区二区久久| 91国偷自产一区二区使用方法| 日韩精品在线中文字幕| 宅男网站在线免费观看| 中文字幕永久在线不卡| 欧美日韩视频在线一区二区观看视频| 亚洲成人中文字幕在线| 精品亚洲国产成人av制服丝袜 | 国产美女精品久久久| 亚洲中文字幕在线一区| 石原莉奈在线亚洲二区| 136fldh精品导航福利| 国产精品suv一区二区| 欧美不卡高清| 免费99精品国产自在在线| 久久精品亚洲a| 色999国产精品| 最新国产精品亚洲| 夜夜春很很躁夜夜躁| 精品一区不卡| 在线中文字幕日韩| 亚洲天堂精品一区| 欧美激情777| www.亚洲免费视频| 午夜剧场免费在线观看| 欧美国产一级| 欧美另类老女人| 九九热精品在线观看| 精品1区2区3区4区| 韩国视频理论视频久久| 香蕉免费毛片视频| 久久久精品性| 国产精品美女www爽爽爽视频| 五月激情丁香网| 精品一区中文字幕| 亚洲影视九九影院在线观看| 午夜精品久久久久久久99热黄桃| 大白屁股一区二区视频| 国产一区喷水| 久草福利在线视频| 欧美国产一区二区| 中文字幕乱码免费| 暧暧视频在线免费观看| 欧美视频第一页| 一区二区三区入口| 国产精品18| 欧美精品一区二区在线播放| 成人免费av片| 香蕉国产精品| 97在线看福利| 一卡二卡在线视频| 国产很黄免费观看久久| 鲁鲁视频www一区二区| av小片在线| 夜夜精品视频一区二区| 日韩激情免费视频| 日韩黄色在线| 欧美精品一区男女天堂| a资源在线观看| 欧美日韩国产色综合一二三四| 91精品国产99| 亚洲影视一区二区| av不卡在线播放| 亚洲欧洲精品在线| 91制片在线观看| 欧美在线播放高清精品| 久久久久久久久久久久国产精品| 欧美猛男同性videos| 久热精品视频在线观看一区| 亚洲精品男人的天堂| 国内一区二区视频| 免费国产一区二区| 青春草免费在线视频| 色94色欧美sute亚洲线路一久| 一级黄色高清视频| 精品国产一区二区三区| 久久免费视频这里只有精品| 国产精品xxxxxx| 懂色av一区二区在线播放| 日韩欧美三级一区二区| 538在线精品| 日韩亚洲欧美高清| 日本人亚洲人jjzzjjz| 亚洲黄色影院| 亚洲一区二区免费| аⅴ资源新版在线天堂| 富二代精品短视频| 亚洲国产精品狼友在线观看| 欧美hd在线| 国产精欧美一区二区三区| 日本高清视频在线| 一区二区三区四区五区视频在线观看| 成人性生生活性生交12| 人人网欧美视频| 欧美激情亚洲激情| 国产精国产精品| 黄色一级大片在线免费看国产一 | 午夜小视频在线| 午夜精品一区在线观看| 91丨porny丨九色| 色婷婷热久久| 国产精品∨欧美精品v日韩精品| 蜜臀久久99精品久久久| 一区二区三区美女| 中文字幕色网站| 久久人人99| 国产精自产拍久久久久久| 青青草免费在线| 五月婷婷久久丁香| 欧美图片自拍偷拍| 欧美片第1页综合| 91久久极品少妇xxxxⅹ软件| 久热国产在线| 91精品国产综合久久久久久久久久| 亚洲午夜久久久久久久国产| 久久久久网站| 日本不卡在线播放| 欧美成人资源| 亚洲人成电影网站色| 无码人妻精品一区二区蜜桃色欲| 91蜜桃网址入口| 东京热加勒比无码少妇| 亚洲国产合集| 国产精品都在这里| 在线免费黄色| 欧美一区二区三区视频免费| 国产又黄又爽又无遮挡| 粉嫩aⅴ一区二区三区四区 | av在线无限看| 超碰国产精品一区二页| 久久视频免费在线播放| www.黄色国产| 亚洲va韩国va欧美va| 无码一区二区精品| 视频一区二区不卡| 日本免费在线视频观看| 国产亚洲字幕| 91国内在线视频| 飘雪影院手机免费高清版在线观看 | 国产精品一区在线| 九九热只有这里有精品| 美女久久久久| 国产精品亚洲欧美导航| av在线免费网址| 日韩av在线免费观看| 精品成人无码久久久久久| 国产精品系列在线| 99久久综合网| 久久国产精品99国产| 亚洲最新在线| 成人线上播放| 日韩av片永久免费网站| 最新av网站在线观看 | 国产精品亚洲精品| 女人天堂av在线播放| 亚洲精品有码在线| 97精品人妻一区二区三区在线 | 96sao在线精品免费视频| 欧美伊久线香蕉线新在线| 米奇777四色精品人人爽| 精品国产3级a| 中文字幕观看在线| 亚洲高清免费观看| 国产18无套直看片| 99精品视频一区| 日韩视频在线观看一区二区三区| 9久re热视频在线精品| 艳色歌舞团一区二区三区| 久久国产精品色av免费看| 国产精品青草久久久久福利99| 毛片大全在线观看| 色偷偷88888欧美精品久久久| 欧洲av在线播放| 欧美久久久久久久久| 久久艹免费视频| 亚洲另类春色国产| 免费在线观看你懂的| 国产在线精品免费| 999精品网站| 99精品视频免费观看视频| 综合久久国产| 国产精品嫩模av在线| 国产99视频精品免费视频36| 欧美日韩国产网站| 97在线看福利| 激情av在线| 久久久91精品国产| 成人亚洲综合天堂| 亚洲精品一区av在线播放| 亚洲精品一区二区三区不卡| 欧美区一区二区三区| 黄色片中文字幕| 午夜精品久久久久久久99水蜜桃 | 午夜欧美精品久久久久久久| 日韩资源av在线| 欧美巨大xxxx| 国产三区二区一区久久| 欧美2区3区4区| 91欧美视频网站| 一区二区三区无毛| 国产精品一区二区久久精品| 91看片一区| 日韩av大片在线| 中文字幕在线中文字幕在线中三区| 欧美国产在线电影| 婷婷色在线播放| 久久夜色精品国产亚洲aⅴ| av大片在线观看| 在线视频精品一| 国产精品免费观看| 亚洲欧美视频在线| 激情福利在线| 亚洲一二三在线| 国产高清视频在线| 中文字幕日韩电影| 3p视频在线观看| 国产91久久婷婷一区二区| 国产精品久久久久久久免费 | 影音先锋成人资源网站| 91亚洲国产成人久久精品| 亚洲一卡二卡| 91精品国产乱码久久久久久| 伊人久久av导航| 99国产精品一区二区| 中文字幕精品一区日韩| 中文字幕一区二区av| 91大学生片黄在线观看| 亚洲午夜精品久久久久久app| 久久人人爽人人爽人人av| 亚洲人成高清| 亚洲人成色77777| 全部av―极品视觉盛宴亚洲| 深夜黄色小视频| 韩国精品一区二区| 国产乱淫av麻豆国产免费| 成人美女视频在线看| 青青草视频成人| 国产精品美女久久久久久2018 | 91免费版网站入口| 日韩最新av| 久久精品二区| 欧美日韩精品一区二区视频| 亚洲欧洲另类精品久久综合| 一区二区电影| 欧洲精品一区二区三区久久| 国产午夜精品一区二区三区欧美| 久久精品影视大全| 国产成人在线观看| 欧美bbbbb性bbbbb视频| 中日韩av电影| 国产网址在线观看| 欧美色综合天天久久综合精品| 99精品视频在线播放免费| 日韩av资源在线播放| 91porn在线观看| 国内精品一区二区三区四区| 国模一区二区| 中文字幕一区二区三区四区不卡| 国产免费看av| 亚洲欧美一区二区三区孕妇| 国产成人在线观看网站| 欧美亚洲一区三区| 亚洲女人18毛片水真多| 国产一区二区精品丝袜| 曰本三级在线| 国产精品视频网址| 欧美福利在线播放网址导航| 黄频视频在线观看| 亚洲欧美日韩视频二区| 中文字幕第22页| 久久久.com| 日本熟妇成熟毛茸茸| 欧美电影影音先锋| 毛片免费在线| 久久免费福利视频| 青青国产精品| 日本高清不卡三区| 亚洲激情另类| 四川一级毛毛片| 中文字幕国产精品一区二区| 国产午夜视频在线播放| 欧美一级一区二区| 在线免费av网站| 国产成人亚洲综合| 精品国产午夜肉伦伦影院| 潘金莲一级淫片aaaaaa播放1| 秋霞午夜鲁丝一区二区老狼| aaaaa一级片| 亚洲成人在线网站| 国产成人麻豆精品午夜在线| xvideos亚洲人网站| 日韩和的一区二在线| 欧美日韩在线观看一区二区三区| 亚洲国产午夜| 欧美图片自拍偷拍| 亚洲黄色免费网站| 99视频免费看| 欧美成年人视频| 高清国产一区二区三区四区五区| 亚洲精品乱码视频| 日本中文字幕一区| 亚洲精品91在线| 欧美在线你懂的| 精品视频三区| 国产精品va在线播放| 亚洲人成精品久久久 | 福利所第一导航| 欧美精品日韩一本| 欧美成人视屏| 成人有码视频在线播放| 天天久久综合| 天天操夜夜操很很操| 亚洲男人天堂av| 99久久er热在这里只有精品66| www.毛片com| 欧美视频一区二| a√在线中文网新版址在线| 亚洲影视资源网| 国产精品无码一区二区桃花视频 | 色视频成人在线观看免| 日本高清中文字幕二区在线| 欧洲亚洲免费在线| 美女毛片一区二区三区四区最新中文字幕亚洲| 日韩欧美一区二| 久久久国产午夜精品| 日韩国产成人在线| 中文字幕久久精品| 国产精品美女久久久久人| 青青草影院在线观看| 国产91丝袜在线播放九色| 国产无套内射又大又猛又粗又爽| 精品国产一区二区三区久久影院 | 黄色免费在线观看| 成人免费看吃奶视频网站| 欧美aa国产视频| 亚洲美女在线播放| 日韩欧美国产高清91| 国产黄色片在线播放| 国产这里只有精品| 欧美精品一卡| 中文字幕一区二区人妻在线不卡| 色八戒一区二区三区| 欧美性天天影视| 国产视频一区二区三区四区| 男女精品网站| 我要看黄色一级片| 亚洲国产精品电影| 91亚洲精品| 少妇久久久久久被弄到高潮| 97久久超碰国产精品电影| 中文字幕黄色av| 久久久久久欧美| 精品国产99| 精产国品一区二区三区| 粉嫩av一区二区三区免费野| 成人性爱视频在线观看| 5g国产欧美日韩视频| 麻豆精品网站| 午夜免费激情视频| 亚洲视频在线视频| 亚洲国产中文在线二区三区免| 成人小视频在线看| 一区二区在线观看免费视频播放| 免费在线看v| 懂色中文一区二区三区在线视频| 日韩精品一二三区| 日韩三级小视频| 九九热r在线视频精品| 欧美少妇xxxx| 国产精品久久久免费观看| 91精品国产福利|