據(jù)外媒報(bào)道,中國(guó)北京大學(xué)(Peking University)與清華大學(xué)(Tsinghua University)的研究人員發(fā)表了一篇論文,介紹“用于駕駛的生成式預(yù)訓(xùn)練版本1(Generative Pre-training for Driving version 1,GPD-1)”的創(chuàng)新框架,旨在提升自動(dòng)駕駛系統(tǒng)的能力。該方法對(duì)各種駕駛場(chǎng)景進(jìn)行建模,以簡(jiǎn)化場(chǎng)景生成、運(yùn)動(dòng)規(guī)劃和交通仿真等任務(wù),從而提升自動(dòng)駕駛車(chē)輛預(yù)測(cè)和模擬各種駕駛條件的能力。利用分層位置編碼和矢量量化自動(dòng)編碼器等先進(jìn)創(chuàng)新技術(shù),GPD-1實(shí)現(xiàn)了此次技術(shù)集成。

GPD-1(圖片來(lái)源:azoai.com)
自動(dòng)駕駛技術(shù)領(lǐng)域的進(jìn)展
近年來(lái),自動(dòng)駕駛領(lǐng)域取得了顯著進(jìn)展,主要?dú)w功于人工智能(AI)和機(jī)器學(xué)習(xí)技術(shù)的進(jìn)步。傳統(tǒng)方法通常孤立地處理駕駛場(chǎng)景的特定方面,例如地圖生成或運(yùn)動(dòng)預(yù)測(cè)。然而,由于駕駛環(huán)境中各種實(shí)體間互動(dòng)的復(fù)雜性,將此類(lèi)組件整合至一個(gè)統(tǒng)一的框架中仍面臨著挑戰(zhàn)。不過(guò),通過(guò)利用大型數(shù)據(jù)集高效模擬和預(yù)測(cè)駕駛場(chǎng)景,研發(fā)生成式模型,特別是自回歸變壓器架構(gòu),提供了有發(fā)展前景的解決方案。
GPD-1:研發(fā)一個(gè)統(tǒng)一的生成式模型
在該篇論文中,研究人員介紹了GPD-1,一款旨在整合自動(dòng)駕駛場(chǎng)景演變各個(gè)方面的模型。該框架采用標(biāo)記來(lái)代表駕駛場(chǎng)景,其中包含自主車(chē)輛(ego vehicle)、代理和地圖元素。利用一個(gè)自回歸變壓器,該框架能夠按序處理此類(lèi)標(biāo)記,捕捉時(shí)間依賴(lài)性與空間關(guān)系,為駕駛場(chǎng)景提供強(qiáng)大的表示。此外,利用場(chǎng)景級(jí)注意力機(jī)制,可進(jìn)一步促進(jìn)幀內(nèi)各標(biāo)記之間的細(xì)微互動(dòng)。
為了編碼空間和時(shí)間信息,研究人員為自主車(chē)輛和代理標(biāo)記研發(fā)了一款分層位置編碼器,融合了二維(2D)位置和朝向信息。對(duì)于地圖標(biāo)記,采用矢量量化自動(dòng)編碼器(VQ-VAE)將自主車(chē)輛為中心的語(yǔ)義地圖壓縮成離散標(biāo)記,有效降低復(fù)雜度,同時(shí)保持空間精確度。此種創(chuàng)新設(shè)計(jì)讓GPD-1能夠在交通仿真、場(chǎng)景生成、閉環(huán)仿真、地圖預(yù)測(cè)和運(yùn)動(dòng)規(guī)劃等任務(wù)中進(jìn)行歸納,無(wú)需額外微調(diào)。