北京2024年6月25日 /美通社/ -- 近日,浪潮在全球权威的信息CVPR 2024自动驾驶国际挑战赛(Autonomous Grand Challenge)中,浪潮信息AI团队所提交的自战赛"F-OCC"算法模型以48.9%的出色成绩斩获占据栅格和运动估计(Occupancy & Flow)赛道第一名。继22、动驾23年在纯视觉和多模态等自动驾驶感知方向,驶挑多次登顶nuSences 3D目标检测榜单后,冠军该AI团队面向Occupancy技术再一次实现突破,浪潮实现了对高度动态及不规则的信息驾驶场景更精准的3D感知及运动预测。
图1-浪潮信息AI团队斩获占据栅格和运动估计赛道第一名
CVPR 2024自动驾驶国际挑战赛是国际计算机视觉与模式识别会议(IEEE/CVF Conference on Computer Vision and Pattern Recognition)的一个重要组成部分,专注于自动驾驶领域的动驾技术创新和应用研究。2024年CVPR自动驾驶国际挑战赛,驶挑包含感知、冠军预测、浪潮规划三大方向七个赛道,信息旨在深入探索自动驾驶领域的自战赛前沿课题。
三维感知和预测是自动驾驶领域的新兴任务,要求对车辆行驶场景进行细粒度建模,对于提升自动驾驶的环境感知能力有着重要意义。此次浪潮信息AI团队所登顶的占据栅格和运动估计(Occupancy & Flow)赛道,是CVPR 2024自动驾驶国际挑战赛最受关注的赛道,聚焦感知任务,吸引了全球17个国家和地区,90余支顶尖AI团队参与挑战。比赛提供了基于 nuScenes 数据集的大规模占用栅格数据与评测标准,要求参赛队伍利用相机图像信息对栅格化三维空间的占据情况(Occupancy)和运动(Flow)进行预测,以此来评估感知系统对高度动态及不规则驾驶场景的表示能力。
道路布局的复杂性、交通工具的多样性以及行人流量的密集性,是当前城市道路交通的现状,也是自动驾驶领域面临的现实挑战。为了应对这一挑战,有效的障碍物识别和避障策略,以及对三维环境的感知和理解就变得至关重要。传统的三维物体检测方法通常使用边界框来表示物体的位置和大小,但对于几何形状复杂的物体,这种方法往往无法准确描述其形状特征,同时也会忽略对背景元素的感知。因此,基于三维边界框的传统感知方法已经无法满足复杂道路环境下的精准感知和预测需求。
图2 - 针对挖车中的力臂,3D目标检测算法只能给出挖车整体的轮廓框(左),但占据栅格网络却可以更精准地描述挖车具体的几何形状这类细节信息(右)
Occupancy Networks(占据栅格网络) 作为一种全新的自动驾驶感知算法,通过获取立体的栅格占据信息,使系统能够在三维空间中确定物体的位置和形状,进而有效识别和处理那些未被明确标注或形状复杂的障碍物,如异形车、路上的石头、散落的纸箱等。这种占据栅格网络使得自动驾驶系统能够更准确地理解周围的环境,不仅能识别物体,还能区分静态和动态物体。并以较高的分辨率和精度表示三维环境,对提升自动驾驶系统在复杂场景下的安全性、精度和可靠性至关重要。
在占据栅格和运动估计(Occupancy & Flow)赛道中,该AI团队所提交的"F-OCC"算法模型,凭借先进的模型结构设计、数据处理能力和算子优化能力,实现了该赛道最强模型性能,在RayIoU(基于投射光线的方式评估栅格的占用情况)及mAVE(平均速度误差)两个评测指标中均获得最高成绩。
■ 更简洁高效的模型架构,实现运算效率与检测性能双突破
首先,模型整体选择基于前向投影的感知架构,并采用高效且性能良好的FlashInternImage模型。同时,通过对整体流程进行超参调优、算子加速等优化,在占据栅格(Occupancy)和运动估计(Flow)均获得最高分的同时,提升了模型的运算效率,加快了模型迭代与推理速度。在实际应用场景中,这种改进使得模型能够更快速、高效地处理大规模3D体素数据,使得自动驾驶车辆能更好地理解环境,进而提升决策的准确度和实时性。
图3 - F-OCC算法模型架构图
■ 更强大完善的数据处理,全面提升模型检测能力
在数据处理方面,比赛提供的体素(Voxel)标签包含了大量在图像中无法观测到的点,例如被物体遮挡的体素和物体内部不可见的体素,这些标签在训练过程中会对基于图像数据的预测网络训练产生干扰。在训练数据中,该AI团队通过模拟LiDAR光束的方法,生成可视化掩码,提升了模型的预测精度;另一方面,通过引入感知范围边缘的体素点参与训练,有效解决出现在感知边缘区域的误检问题,将模型的整体检测性能提升11%。
■ 更精细的3D体素编码,模型占据预测能力提升超5%
在3D体素特征编码模块中,该算法团队将具有较大感知范围和编码能力的可形变卷积操作应用于3D体素数据,以提升3D特征的表示能力。通过使用CUDA对可形变3D卷积(DCN3D)进行实现与优化,大幅提升了模型的运算速度,并有效降低了显存消耗。通过DCN3D替代传统3D卷积,模型整体占据预测能力提升超5%。
基于OCC 3D空间感知算法的创新, "F-OCC"算法模型成功登顶占据栅格和运动估计任务(Occupancy & Flow)榜单,以48.9%的出色成绩创造了本赛道的最高成绩,为探索更高级别的自动驾驶技术提供了有力的支撑与经验。未来,浪潮信息AI团队将践行多角度切入,发挥算法、算力融合的AI全栈优化能力,推动自动驾驶领域的技术创新发展。
* 备注:文内所涉术语解释如下 |
Occupancy:在自动驾驶领域,通常称为“占据栅格”或“占用栅格”,其是一种3D语义占用感知方法,通过生成车辆周围环境的三维占用网格,为自动驾驶车辆提供障碍物检测、路径规划和车辆控制等关键功能; |
RayIoU:是指通过光线投射的方式评估占据网格的占用情况(Ray-based Intersection over Union),RayIoU可以用来衡量预测的占据网格与实际占据网格之间的重叠程度。RayIoU越高意味着预测准确度越高,模型性能越好; |
mAVE: 是指平均速度误差(Mean Absolute Velocity Error),其用于评估预测速度与真实速度之间的平均误差。mAVE值越低意味着预测结果与真值越接近; |
体素(Voxel):体积元素(Volume Pixel)的简称体积元素(Volume Pixel)的简称,其类似于二维图像中的像素,是构成三维图像的基本单元。 |
文章
8513
浏览
68338
获赞
87
雅安市召开“春雷行动2022”执法行动第二次推进会
本网讯2月25日,我市召开“春雷行动2022”执法行动第二次推进会。会议强调,全市市场监管系统要将“春雷行动2022”与当前“铁拳行动”、“粮食购销领域专项整治”等工作紧密结合,聚焦目标导向和问题导向正本清源+推进创新试点 养老金融正在经历新变局
养老金融将迎新变局阅读提示市场上所谓的一些养老金融产品,名字上冠以“养老”二字的金融产品、投资产品比较多,但实际上相当一部分不具备养老的特征,都是一些短期的投资工具,与其他理财产品、基金投资没什么差别中国国际人才交流大会达成合作项目390个揭榜逾8.6亿元
疫情再来怎么办?科学家开出终极药方——“同一健康”
疫情再来怎么办?科学家开出终极药方——“同一健康”◎本报记者 张佳星仅一种新型冠状病毒的全球大流行,目前已经导致了300万人的死亡。但在医学微生物学家、中国工程院院士徐建国的知识库里,世界还存在许多潜为民办实事 居民送锦旗
“正是这段护栏救了我的命!”近日,市民严雅琴将写有“思民生解民难,做实事暖民生”的锦旗赠送给雨城区河北街道沙溪社区,以此表达她的感激之情。3月7日清晨,严雅琴因骑电瓶车时操作失误,致使电瓶车撞上道路尽韩国延世大学留学读研费用
韩国延世大学是一所享有盛誉的知名高校,许多学生梦想在这里深造。对于许多准备前往延世大学攻读研究生的同学来说,了解相关费用是非常重要的。学费韩国延世大学的研究生学费会根据所选专业和课程的不同而有所变化。韩国理工科研究生留学学制与课程设置
韩国的理工科研究生课程通常为硕士或博士学位,学制根据不同学校和项目有所不同。一般来说,硕士课程的学制为2年,而博士课程则为3至4年,具体时长会根据研究进展和学科要求有所变化。1. 硕士课程韩国的理工科加拿大留学适合哪些学生申请
在选择合适的教育路径时,许多学生考虑去加拿大的大学或学院深造。加拿大的学院college)与大学有所不同,它们更侧重于实践性和职业技能的培养,适合那些希望获得具体职业技能、实现早期就业的人群。选建议延长春节假期 避免调休造成工作疲倦
本报讯十三届全国人大五次会议召开期间,我市全国人大代表庹庆明提交的《关于将春节法定假期由3天调整为5天的建议》,引发各级媒体广泛关注,登上微博热搜。庹庆明表示,春节是中华民族最隆重、最热闹、最具特色的大专出国留学需要哪些条件?
随着国际化教育的发展,越来越多的大专生选择出国留学,进一步提升自己的学术水平和职业竞争力。对于有意出国留学的大专生来说,了解清楚出国留学的基本条件至关重要。一、学历要求大专生出国留学首先需要满足所申请黑土之殇 谁在伤害耕地“大熊猫”
黑土之殇 谁在伤害耕地“大熊猫”一辆辆大卡车,装满黑色的土壤,慢慢驶进黑龙江五常市沙河子镇福太村附近的一处农田中,卸下的黑土堆成了几座小山,三台挖掘机不断把运来的黑土,填进此前因被盗挖而留下的大坑里。韩国语言学校留学申请攻略
对于想要去韩国深造的国际学生来说,申请韩国语言学校是进入韩国高等教育的重要一步。韩国语言学校不仅是提升语言能力的理想场所,同时也是了解韩国文化和融入当地生活的关键。无论是为未来的大学或研究生课程做准备敬业奉献 道无止境 “中国骑侠”传递好人力量
本报讯3月18日,“敬业奉献·道无止境”——罗维孝骑行法国8周年纪念活动在罗维孝骑行游历博物馆举行。从2005年到2014年,罗维孝历时九年行程达10万公里,足迹遍及全国。2014年,在中法建交50周最严新政约束APP过度索权
最严新政约束APP过度索权本报记者 赵鹏时至今日,APP过度索取权限、违规收集使用个人信息等痼疾依然困扰大众。一边是工信部今年已完成了对29万款APP的技术检测,对1862款违规APP提出整改要求,另中国内地每万人口发明专利拥有量达15.8件
《中国知识产权保护与营商环境新进展报告2020)》发布:中国内地每万人口发明专利拥有量达15.8件◎本报记者 崔 爽4月26日是第21个世界知识产权日。世界知识产权组织发布的《2020年全球创新指数》