自動駕駛行業現狀,端到端大模型,訓練,數據合成方法

自動駕駛行業現狀
1、當前行業主要玩家有
第一梯隊有:華為,momenta,元戎
第二梯隊有:鑒智, 絕影智能等
2、主機廠現在都要求自動駕駛廠商白盒交付,本質上就是前兩年依賴供應商,后面打算自己做。 整個行業基本上是賠本賺吆喝的階段。沒有收入,每年還要自己投入幾個億進行模型的訓練,人才等。
3、行業競爭非常激烈,獨立的自動駕駛廠商未來可能存活的不會超過 5 家。未來的格局大概率是頭部tier1廠商+主機廠自己。
4、可能存活的玩家有華為,momenta,小馬智行等等。
自動駕駛分級
自動駕駛分為 6 級。
L0至L2級為駕駛輔助,現階段多家車企提出的“智駕平權”,都屬于L2級范疇,駕駛員需全程監控駕駛。
從L3級開始,就進入了自動駕駛的范疇,屬于有條件自動駕駛,緊急情況下需要駕駛員接管車輛;
而L4級和L5級則分別代表高度自動駕駛和完全自動駕駛,車輛幾乎可以在所有場景下自主運行。
自動駕駛模型以及端到端大模型是什么
1、主流的自動駕駛架構分為三個部分,感知,決策和執行三大模塊。
2、感知模型復制物體識別。決策和執行負責執行指令,包括汽車的操作,車內控制等。傳統方案通過感知模型感知物體,然后通過寫各種規則進行決策和執行。這一個比較大的問題就是很難窮盡所有的場景,進化也非常消耗人力。
3、大模型出來之后,業界也都在訓練端到端大模型,就是感知模型和決策和執行模型到一起。理論上只需要不停的灌數據,模型就不停的升級。
4、自動駕駛模型參數量一般是 7B~12B,相比幾百 B 的大語言模型非常小。
激光雷達方案和純視覺方案
激光雷達方案是通過發射激光束并接收反射信號,生成高精度的三維環境地圖,并與其他傳感器(如攝像頭、雷達)結合使用,形成多傳感器融合的感知系統。
優勢在于可靠性、高精度感知和全天候性能;缺點也顯而易見,就是成本高昂。另外,激光雷達通常體積較大、功耗高,對于產品設計和能源管理要求很高。
相比之下,純視覺方案主要依賴攝像頭作為核心傳感器,通過計算機視覺算法對攝像頭捕捉到的圖像進行處理,識別道路上的車輛、行人、交通標志、信號燈等物體,并基于這些信息做出駕駛決策。
核心在于深度學習和神經網絡,通過大量的數據訓練,逐步提升系統對復雜環境的理解能力。優勢在于成本較低、技術成熟和數據豐富,缺點在于受環境影響較大,精度有限,對于計算資源需求高。
自動駕駛數據采集和訓練方法
一般是通過采集車去采集各種道路數據,這個有專門的團隊去負責這個事情。
采集車的設備一般比量產車的設備精度要更高,獲得數據更多。
用這些數據去訓練自動駕駛模型,然后量產車上更低的精度的數據作為輸入,進行推理。
數據合成方法
物理采集有非常多多限制,典型比如各種下雨天場景,或者限速比較容易采集 80,120,但是有些特別的場景比如限速 30,40。就比較難采集。需要用到數據合成的方法。
典型的一個自動駕駛公司 40PB 圖片視頻數據,80% 靠采集,20% 靠合成。
合成數據也是用到模型,合成感知模型數據的模型叫世界大模型,合成規劃控制的叫規控模型。
自動駕駛廠商,算法工程師,PM 需要把 corner case 找出來,然后用世界大模型,規控模型合成相應的數據然后再 fine tune 自動駕駛模型。
自動駕駛需要用到的數據處理相關工作
視頻,圖片數據需要處理的比較少。主要有處理的部分有:
1、采集數據不清晰,需要過濾能力。
2、多模態檢索能力,算法工程師,PM 需要將一定場景的視頻數據通過檢索,挖掘出來用于合成之后,進行二次訓練。
3、對場景驚醒均勻化,比如前面提到的限速問題。
所以綜合來說,自動駕駛行業主要用到的是數據管理,多模態檢索的能力。




































