Abstract:
针对目前基于掩模注意力机制的点云全景分割算法存在的注意力掩模预测不准确和实时性较差等问题,提出了一种基于多模态鸟瞰(BEV)特征引导的端到端点云全景分割网络模型BEVGuide-PS.首先,通过转换器(Transformer)对BEV特征进行解码,生成目标查询,并通过置信度排序与位置编码嵌入进行特征增强;然后,构建交叉注意力机制模块,融合目标查询和可学习查询特征,利用融合物体实例信息的查询特征来预测注意力掩模,提高对注意力掩模预测的准确性;最后,降低掩模注意力机制网络的输入特征维度,以提升检测速度.基于nuScenes数据集的实验结果表明,与基线网络相比,BEVGuide-PS在全景分割指标PQ、PQ†、RQ、SQ上分别提高了17.7%、17.0%、18.3%、20.9%,推理时间减少了58.4%,并且训练效率大幅提升.
Keyword:
Reprint 's Address:
Email:
Version:
Source :
激光与光电子学进展
ISSN: 1006-4125
Year: 2025
Issue: 12
Volume: 62
Page: 121-129
0 . 9 0 0
JCR@2023
Cited Count:
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 1
Affiliated Colleges: