阿里云宣布推出自動駕駛領(lǐng)域模型訓(xùn)練、推理加速框架PAI-TurboX。該框架通過優(yōu)化CPU親和性、動態(tài)編譯、流水線并行等策略,顯著提升模型訓(xùn)練推理效率。在數(shù)據(jù)側(cè),PAI-TurboX提出高性能的DataLoader引擎,優(yōu)化數(shù)據(jù)預(yù)處理流程,實現(xiàn)智能訓(xùn)練樣本分組,有效提升數(shù)據(jù)處理效率。此外,PAI-TurboX還提供算子優(yōu)化和量化等能力,減少訓(xùn)練階段的訪存延遲,提升吞吐效率,同時在推理任務(wù)中保障精度的同時降低計算開銷與內(nèi)存帶寬需求,實現(xiàn)異構(gòu)平臺下的高性能推理部署。

PAI-TurboX在自動駕駛的3D物體檢測模型BEVFusion訓(xùn)練任務(wù)中,可將訓(xùn)練時間縮短58.5%;在實時在線矢量化高精地圖構(gòu)建模型MapTR訓(xùn)練任務(wù)中,可將訓(xùn)練時間縮短53%;在端到端自動駕駛模型SparseDrive訓(xùn)練任務(wù)中,PAI-TurboX在感知模塊訓(xùn)練和聯(lián)合訓(xùn)練兩個階段可獲得明顯的速度提升,相同訓(xùn)練步數(shù)下兩個階段可分別縮短51.5%和48.5%。