技術(shù)
導(dǎo)讀:商湯絕影發(fā)布「與世界模型協(xié)同交互的端到端自動(dòng)駕駛技術(shù)路線 R-UniAD」。
2 月 22 日消息,在全球開(kāi)發(fā)者先鋒大會(huì)上,商湯絕影發(fā)布「與世界模型協(xié)同交互的端到端自動(dòng)駕駛技術(shù)路線 R-UniAD」。
據(jù)介紹,商湯絕影的 R-UniAD 是「多階段強(qiáng)化學(xué)習(xí)」端到端自動(dòng)駕駛技術(shù)路線,具體分為三個(gè)階段:
首先是依靠冷啟動(dòng)數(shù)據(jù)通過(guò)模仿學(xué)習(xí)進(jìn)行云端的端到端自動(dòng)駕駛大模型訓(xùn)練;
然后基于強(qiáng)化學(xué)習(xí),讓云端的端到端大模型與世界模型協(xié)同交互,持續(xù)提升端到端模型的性能;
最后云端大模型通過(guò)高效蒸餾的方式,實(shí)現(xiàn)高性能端到端自動(dòng)駕駛小模型的車(chē)端部署。
商湯絕影「開(kāi)悟」世界模型與主車(chē)閉環(huán)交互的方式,是通過(guò)場(chǎng)景庫(kù)文件導(dǎo)入一個(gè) BEV 視角下的初始主車(chē)和他車(chē)位置,世界模型自動(dòng)生成主車(chē)視角下 11V(11 個(gè)攝像頭)的傳感器仿真數(shù)據(jù),端到端模型接收到這一數(shù)據(jù)后,生成自車(chē)下一時(shí)刻位置并進(jìn)行反饋,世界模型根據(jù)刷新的主車(chē)位置和預(yù)測(cè)的他車(chē)位置渲染新的 11V 傳感器仿真數(shù)據(jù)。
據(jù)悉,商湯絕影的量產(chǎn)端到端智駕方案預(yù)計(jì)將在年底交付,「開(kāi)悟」世界模型也正式用于數(shù)據(jù)生產(chǎn)。在 4 月的上海車(chē)展,商湯絕影將會(huì)展示「與世界模型協(xié)同交互的端到端自動(dòng)駕駛方案」的實(shí)車(chē)部署。