“以后的汽車,沒(méi)有高階智駕,就沒(méi)有競(jìng)爭(zhēng)力。”近段時(shí)間,有不少行業(yè)專家向蓋世汽車表達(dá)了相似的觀點(diǎn)。
從自動(dòng)泊車到全自動(dòng)駕駛,從簡(jiǎn)單的輔助系統(tǒng)到復(fù)雜的決策算法,智能駕駛已經(jīng)成為衡量一款新車是否先進(jìn)、是否具有吸引力的重要標(biāo)準(zhǔn)之一。對(duì)于各大車企而言,加大在智能駕駛領(lǐng)域的研發(fā)投入已成為必然趨勢(shì)。
隨著又一屆廣州車展的召開,汽車產(chǎn)業(yè)的最新技術(shù)和趨勢(shì)再一次在這里匯聚,各大車企競(jìng)相展示創(chuàng)新成果,高階智能駕駛技術(shù)的競(jìng)爭(zhēng)愈發(fā)激烈,端到端和車位到車位等關(guān)鍵詞也站在了新一輪技術(shù)競(jìng)爭(zhēng)的C位。。
其中,理想汽車展示了其最新的智能駕駛技術(shù)——端到端+VLM雙系統(tǒng)方案。與此同時(shí),理想汽車正式發(fā)布了其車位到車位智駕功能。
借助廣州車展引發(fā)的廣泛關(guān)注,理想汽車近日舉辦了端到端智駕體驗(yàn)日活動(dòng)。為了更深入地了解這一技術(shù)的實(shí)際應(yīng)用效果,蓋世汽車通過(guò)在真實(shí)城市道路的實(shí)際體驗(yàn),對(duì)理想“端到端+VLM”加持下的車位到車位功能的真實(shí)能力,做了一次實(shí)地測(cè)試。

圖源:理想汽車
“車位到車位”功能實(shí)測(cè)
在體驗(yàn)過(guò)程中,我們選擇了一段包含多種路況的路線,包括城市狹窄、擁堵路段、環(huán)島、高速公路以及園區(qū)內(nèi)部道路等。就實(shí)際操作而言,用戶只需在車載系統(tǒng)中輸入目的地車位信息,車輛便能夠自動(dòng)規(guī)劃路線并引導(dǎo)前往。在到達(dá)目的地后,車輛也能夠自動(dòng)識(shí)別并泊入指定的車位。
具體來(lái)看,在上車選定導(dǎo)航路線之后,點(diǎn)擊“一鍵智駕”或者跟語(yǔ)音激活,車位到車位的過(guò)程就能直接啟動(dòng)。此后車輛,順利駛出車位、地庫(kù)、狹窄的小區(qū)道路,遇到閘機(jī)車輛也會(huì)自動(dòng)停下,等繳費(fèi)抬桿之后繼續(xù)行駛,無(wú)需接管。
理想汽車透露,無(wú)論是露天停車場(chǎng)、園區(qū)內(nèi),還是多層的地庫(kù)、立體停車場(chǎng),其車位到車位功能都可以支持。
行駛到公共道路上后,智駕系統(tǒng)也可以應(yīng)對(duì)環(huán)島、掉頭和各種施工場(chǎng)景,復(fù)雜的博弈和交通燈情況下,通行也較為順暢。
這背后的技術(shù)支撐是理想基于端到端+VLM雙系統(tǒng)的智能駕駛方案,簡(jiǎn)單來(lái)看,端到端不依賴規(guī)則式邏輯,具備更擬人化的駕駛方式,VLM則具備理解物理世界復(fù)雜的交通環(huán)境和中文語(yǔ)義的能力,賦予了智駕車輛更強(qiáng)大的通行能力。
對(duì)于U型掉頭功能,理想汽車方面告訴蓋世汽車,端到端基于人類司機(jī)數(shù)據(jù),在不同的掉頭場(chǎng)景中(有無(wú)中央隔離帶,寬窄車道等)都可以輸出一條合理軌跡,不再?gòu)?qiáng)依賴于導(dǎo)航信息和前后車道的拓?fù)溥B接關(guān)系。此外端到端具備更強(qiáng)的側(cè)向感知能力(看得遠(yuǎn)+看得準(zhǔn)),在掉頭過(guò)程中,可以更準(zhǔn)確識(shí)別和預(yù)測(cè)對(duì)向直行車輛的行駛軌跡并做出避讓。
更值得注意的是理想汽車全國(guó)高速收費(fèi)站ETC通行能力,其旨在打通城市與高速駕駛場(chǎng)景。據(jù)理想汽車介紹,該功能不限范圍、無(wú)需學(xué)習(xí)過(guò)程,全國(guó)用戶都能用。
理想汽車方面指出:“通過(guò)端到端+VLM 架構(gòu),除了讓系統(tǒng)開得像人以外,還能理解真實(shí)世界復(fù)雜的語(yǔ)義信息,在實(shí)現(xiàn)ETC自主通行這個(gè)場(chǎng)景中,也是由VLM識(shí)別收費(fèi)站及ETC通道位置,引導(dǎo)端到端系統(tǒng)向ETC通道行駛并通過(guò)閘機(jī)。”
此外還有路邊起步、環(huán)島通行等功能 ,盡管當(dāng)天天氣狀況不佳,道路環(huán)境更加復(fù)雜,在整個(gè)行駛過(guò)程中,理想汽車的智能駕駛系統(tǒng)仍然表現(xiàn)出了較高的穩(wěn)定性和準(zhǔn)確性,最終順利泊入預(yù)設(shè)車位。
目前,理想基于端到端+VLM的車位到車位功能,已經(jīng)開啟了萬(wàn)人團(tuán)和全國(guó)門店的試駕車的推送,并將于11月底隨OTA 6.5版本車機(jī)系統(tǒng)向AD Max用戶進(jìn)行推送。
快慢雙系統(tǒng)
在過(guò)去一年中,理想汽車的智能駕駛技術(shù)經(jīng)歷了快速發(fā)展,從全場(chǎng)景NOA能力的實(shí)現(xiàn),到無(wú)圖NOA的推出,再到端到端與VLM技術(shù)的結(jié)合,共完成了三代技術(shù)的迭代。這一過(guò)程中,理想汽車在智能駕駛領(lǐng)域的地位和角色發(fā)生了轉(zhuǎn)變。
理想汽車之所以能有如此表現(xiàn),關(guān)鍵在于其創(chuàng)新策略——采用端到端與VLM相結(jié)合的雙系統(tǒng)架構(gòu)方案。

據(jù)理想汽車介紹,基于丹尼爾·卡尼曼(Daniel Kahneman)在《思考,快與慢》中提出的人類兩套思維系統(tǒng)理論,理想汽車將端到端系統(tǒng)(相當(dāng)于系統(tǒng)1)與視覺(jué)語(yǔ)言模型(VLM,相當(dāng)于系統(tǒng)2)融合應(yīng)用于自動(dòng)駕駛技術(shù)方案中,旨在賦予車端模型更高的性能上限和發(fā)展?jié)摿Α?/div>
其中,系統(tǒng)1,即端到端模型,是一種直覺(jué)式、快速反應(yīng)的機(jī)制,它直接從傳感器輸入(如攝像頭和激光雷達(dá)數(shù)據(jù))映射到行駛軌跡輸出,無(wú)需中間過(guò)程,是One Model一體化的模型。

這種設(shè)計(jì)確保了信息的高效傳遞、推理的高效計(jì)算以及模型的快速迭代能力。
系統(tǒng)1端到端模型的輸入包括攝像頭和激光雷達(dá),通過(guò)為英偉達(dá)Orin-X專門優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)(CNN)主干網(wǎng)絡(luò)提取和融合多傳感器的特征,并投影到BEV空間。
為提升模型的表征能力,理想專門設(shè)計(jì)了記憶模塊,不僅有時(shí)間維度的記憶,還有空間維度的記憶。除了攝像頭和激光雷達(dá),理想還在模型的輸入中加入了車輛狀態(tài)信息和導(dǎo)航信息。最終經(jīng)過(guò)Transformer的編碼后,與BEV特征共同解碼出動(dòng)態(tài)障礙物、道路結(jié)構(gòu)、通用礙物,并規(guī)劃出行車軌跡。
系統(tǒng)2,則是由一個(gè)22億參數(shù)的視覺(jué)語(yǔ)言大模型(VLM)實(shí)現(xiàn),它的輸出給到系統(tǒng)1綜合形成最終的駕駛決策。

理想方面表示,VLM整體的算法架構(gòu)由一個(gè)統(tǒng)一的Transformel模型組成,將提示詞(Prompt)文本進(jìn)行Tokenizer編碼,然后將前視120度和30度相機(jī)的圖像以及導(dǎo)航地圖信息進(jìn)行視覺(jué)信息編碼,通過(guò)圖文對(duì)齊模塊進(jìn)行模態(tài)對(duì)齊,統(tǒng)一交給Transformer模型進(jìn)行自回歸推理。
除此之外,理想還運(yùn)用云端世界模型對(duì)系統(tǒng)1和系統(tǒng)2進(jìn)行能力的訓(xùn)練和考試,從而使這套系統(tǒng)能夠快速迭代。

理想將視覺(jué)語(yǔ)言模型成功部署在車端芯片,意圖使自動(dòng)駕駛能像人類一樣深刻理解物理世界的復(fù)雜交通環(huán)境和中文語(yǔ)義,并且輔助端到端,解決安全、導(dǎo)航、法規(guī)和舒適等方面的自動(dòng)駕駛業(yè)內(nèi)難題。
端到端+VLM架構(gòu)已經(jīng)得到越來(lái)越多車企和智駕供應(yīng)商的青睞,不過(guò)其在自動(dòng)駕駛領(lǐng)域的應(yīng)用也面臨諸多挑戰(zhàn),并非誰(shuí)都玩得轉(zhuǎn)。
目前,端到端模型和VLM都需要大量的高質(zhì)量數(shù)據(jù)進(jìn)行訓(xùn)練。然而,獲取并標(biāo)注這些數(shù)據(jù)既耗時(shí)又昂貴,且需要確保數(shù)據(jù)的多樣性和代表性,以覆蓋各種駕駛場(chǎng)景和環(huán)境條件。此外,數(shù)據(jù)處理和存儲(chǔ)也是一大挑戰(zhàn),需要高效的算法和硬件支持。端到端+VLM模型的復(fù)雜性,不僅增加了研發(fā)成本,還對(duì)車載計(jì)算平臺(tái)的算力提出了更高要求。
作為參考,理想汽車的智能駕駛累計(jì)里程已達(dá)26.7億公里,訓(xùn)練算力目前已達(dá)6.83EFLOPS,并且在年底將超過(guò)10EFLOPS?;诔?6億公里智駕里程的打磨驗(yàn)證、不斷增長(zhǎng)的訓(xùn)練算力以及世界模型在云端的提前部署,理想汽車端到端+VLM智能駕駛系統(tǒng)得以實(shí)現(xiàn)快速迭代。
第一梯隊(duì)的智駕競(jìng)爭(zhēng)
端到端已經(jīng)成為企業(yè)智駕能力的一道分水嶺,正在從技術(shù)路線之爭(zhēng)進(jìn)入了落地體驗(yàn)之爭(zhēng),而從頭部智駕企業(yè)的動(dòng)態(tài)來(lái)看,這場(chǎng)落地體驗(yàn)之爭(zhēng),其核心應(yīng)用之一就是車位到車位。
理想汽車智能駕駛技術(shù)規(guī)劃負(fù)責(zé)人文治宇在接受蓋世汽車采訪時(shí)表示:回顧過(guò)去兩年時(shí)間內(nèi),大家的關(guān)注點(diǎn)是去實(shí)現(xiàn)各個(gè)智駕使用場(chǎng)景的功能實(shí)現(xiàn),比如高速NOA、城市NOA等。
“但當(dāng)我們嘗試把它們串聯(lián)起來(lái)的時(shí)候,也會(huì)發(fā)現(xiàn)之前的一些思路能夠解決部分?jǐn)帱c(diǎn),但解決的方式不夠“優(yōu)雅”或者說(shuō)面向全國(guó)所有的泛化場(chǎng)景,解決效率不夠高。”
這也是理想和行業(yè)對(duì)端到端、“車位到車位”更加關(guān)注的原因之一。
“車位到車位”功能要求自動(dòng)駕駛系統(tǒng)能夠從指定的起始車位自動(dòng)行駛到目標(biāo)車位,并在此過(guò)程中處理各種復(fù)雜的交通情況和障礙物。這一功能的實(shí)現(xiàn)對(duì)于現(xiàn)有的智駕系統(tǒng)來(lái)說(shuō)是一個(gè)巨大的挑戰(zhàn),因?yàn)樗枰到y(tǒng)具備高度的環(huán)境感知、決策規(guī)劃和執(zhí)行控制能力。
端到端技術(shù)在車位到車位的應(yīng)用中發(fā)揮了重要作用。通過(guò)端到端技術(shù),車輛可以在沒(méi)有預(yù)先設(shè)定路線的情況下,通過(guò)實(shí)時(shí)感知周圍環(huán)境和障礙物,自主判斷和規(guī)劃行駛軌跡,從而實(shí)現(xiàn)自動(dòng)泊車和進(jìn)出車位的功能。這種技術(shù)使得車輛在停車場(chǎng)內(nèi)的操作更加擬人化,能夠更好地適應(yīng)復(fù)雜的環(huán)境變化。
此屆廣州車展上,多家車企展示了基于端到端的車位到車位功能。
其中小鵬汽車宣布基于小鵬圖靈AI智駕體系,成為行業(yè)首家用一套智駕軟件實(shí)現(xiàn)“車位到車位”的企業(yè)。小鵬的方案以一套軟件邏輯,打通地庫(kù)、閘機(jī)、城區(qū)道路等場(chǎng)景,未來(lái)將在AI天璣5.5.0上全量推送。
小米汽車也在廣州車展上展示了其“車位到車位”的智駕能力,按照小米規(guī)劃,從11月16日起,小米的車位到車位智駕功能會(huì)開啟定向內(nèi)測(cè)邀請(qǐng),從 12 月底,則會(huì)開啟開啟先鋒版推送。
小米汽車方面介紹,后續(xù)推送的“車位到車位”智駕功能,其路線建立過(guò)程是完全在后臺(tái)自動(dòng)創(chuàng)建地圖和路徑。比如通勤路線,只要上下班來(lái)回,人駕各一次通過(guò)停車場(chǎng),不需要額外任何的引導(dǎo)操作,即可在后臺(tái)幫用戶建好停車場(chǎng)地圖。
還有極氪同樣發(fā)布其D2D車位到車位領(lǐng)航輔助功能,預(yù)計(jì)在2025年1月左右分批推送。
“車位到車位”功能正在成為評(píng)估端到端性能的關(guān)鍵指標(biāo)之一,某種程度上,車位到車位已經(jīng)成為車企智駕能力的一塊試金石。
近段時(shí)間,有不少車企宣布進(jìn)入智駕第一梯隊(duì),這一隊(duì)伍現(xiàn)在變得越來(lái)越擁擠,玩家們也各有自己的拿手好戲,小鵬云端大模型、蔚來(lái)NWM世界模型、理想端到端+VLM的雙系統(tǒng)方案等。在新一輪以端到端為核心的智駕競(jìng)爭(zhēng)中,距離行業(yè)格局穩(wěn)定,距離尚遠(yuǎn)。
關(guān)于我們:ICC鑫欏資訊成立于2010年,主要服務(wù)于炭素、鋰電、電爐鋼3大行業(yè),是中國(guó)領(lǐng)先的專業(yè)產(chǎn)業(yè)研究和顧問(wèn)公司。鑫欏資訊以研究為中心,提供媒體資訊、研究咨詢、數(shù)據(jù)庫(kù)和市場(chǎng)營(yíng)銷等解決方案。
鑫欏鋰電專注于鋰電池原材料、鋰電池及其下游等相關(guān)產(chǎn)業(yè)鏈跟蹤,對(duì)市場(chǎng)價(jià)格、行情動(dòng)態(tài)等資訊的搜集與研究,常年跟蹤行業(yè)內(nèi)400多家生產(chǎn)企業(yè),擁有完善的產(chǎn)業(yè)數(shù)據(jù)庫(kù)。根據(jù)企業(yè)需求提供定制報(bào)告,為企業(yè)提供專業(yè)化服務(wù)。
鑫欏鋰電以研究為中心,服務(wù)于行業(yè)企業(yè)、金融機(jī)構(gòu)(一二級(jí)市場(chǎng)私募基金/券商/銀行等)、高校/科研院所、政府等,為客戶提供的獨(dú)特洞見(jiàn)、分析和資源,幫助客戶高效決策,以實(shí)現(xiàn)高質(zhì)量的業(yè)務(wù)增長(zhǎng)。
鑫欏鋰電專注于鋰電池原材料、鋰電池及其下游等相關(guān)產(chǎn)業(yè)鏈跟蹤,對(duì)市場(chǎng)價(jià)格、行情動(dòng)態(tài)等資訊的搜集與研究,常年跟蹤行業(yè)內(nèi)400多家生產(chǎn)企業(yè),擁有完善的產(chǎn)業(yè)數(shù)據(jù)庫(kù)。根據(jù)企業(yè)需求提供定制報(bào)告,為企業(yè)提供專業(yè)化服務(wù)。
鑫欏鋰電以研究為中心,服務(wù)于行業(yè)企業(yè)、金融機(jī)構(gòu)(一二級(jí)市場(chǎng)私募基金/券商/銀行等)、高校/科研院所、政府等,為客戶提供的獨(dú)特洞見(jiàn)、分析和資源,幫助客戶高效決策,以實(shí)現(xiàn)高質(zhì)量的業(yè)務(wù)增長(zhǎng)。