Abstract:
在自动驾驶技术的领域中,利用鸟瞰图(bird's eye view,BEV)进行 3D目标检测任务已经引起了广泛的关注.针对现有相机至鸟瞰视图转换方法,实时性不足、部署复杂度较高的难题,提出了一种简单高效、无需任何特殊工程操作即可部署的视图转换方法.首先,针对完整图像特征存在大量冗余信息,引入宽度特征提取器并辅以单目 3D检测任务,提炼图像的关键特征,确保过程中信息损失的最小化;其次,提出一种特征引导的极坐标位置编码方法,增强相机视角与鸟瞰图表示之间的映射关系与模型空间理解能力;最后,通过单层交叉注意力机制实现可学习BEV嵌入与宽度图像特征的交互,从而生成高质量的BEV特征.实验结果表明:在nuScenes验证集上该网络架构与LSS(lift,splat,shoot)相比mAP从 29.5%提升到 32.0%,提升了 8.5%,NDS从 37.1%提升到 38.0%,提升了2.4%,表明该模型在自动驾驶场景下的3D目标检测任务的有效性.同时相比于LSS在延迟上降低了41.12%.
Keyword:
Reprint 's Address:
Email:
Source :
计算机系统应用
ISSN: 1003-3254
Year: 2025
Issue: 2
Volume: 34
Page: 246-253
Cited Count:
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 0
Affiliated Colleges: