黑芝麻智能端到端算法参考模型公布,一文了解技术亮点
上海2024年12月3日 /美通社/ -- 最近一两年,黑芝"端到端"是麻智模型自动驾驶领域最热门的话题,不管是到端整车企业还是自动驾驶公司,开发布会几乎言必提"端到端",算法整个行业进一步拥抱AI技术。参考
自动驾驶系统是公布一个软、硬件高度耦合的文解系统,当软件算法跨入端到端的技术时代,如何在不同算力的亮点芯片上都能够发挥出足够好的性能?
作为智能汽车计算芯片的引领者,黑芝麻智能从成立之初就意识到了软硬一体的黑芝重要性,在开发芯片的麻智模型同时也组建团队对智驾算法进行研究,保证产品能够满足当下和未来数年的到端算法发展需求。
黑芝麻智能计划推出支持华山及武当系列芯片的算法端到端算法参考方案。该方案采用One Model架构,参考并在决策规划单元引入了VLM视觉语言大模型和PRR行车规则的公布概率化表征子模块,进一步提升了智驾系统的决策规划能力。
该方案分为标准版和高阶版两个版本。前者在单颗武当C1200家族中算力平台上即可部署,而后者可在即将推出的华山A2000家族中发挥全部实力。
一、采用One Model架构 最大化信息传递
现阶段量产的端到端系统,相当一部分采用了分段式架构,即将端到端系统分成几个不同的模块级联而成。虽然这些模块也使用AI模型进行工作,但各模块之间仍存在人为定义的接口来传输数据,这就必然导致有一定的信息损失,加上不同模块经常采用独立训练的模式,其效果并非全局最优。
黑芝麻智能的端到端智驾系统,一步到位采用了One Model的架构。一端可输入摄像头、激光雷达、4D毫米波雷达、导航地图等信息,另一端直接输出驾驶决策所需要的信息,即本车的预期轨迹。
端到端的总体架构
具体到模型内部,其可以分为BEV编码器和决策(轨迹预测)两个神经网络单元。
BEV编码的工作过程中,车外摄像头或 激光雷达、4D 毫米波雷达等各类传感器的数据进入 ResNet 和 FPN 等主干网络,提取并融合多层特征,生成多尺度特征金字塔。经过几何变换,特征图对齐成俯视视角(BEV),实现统一的空间表示。
随后,系统通过多尺度时序聚合将当前与历史 BEV特征融合,减少噪声干扰,增强动态物体感知精度和系统鲁棒性,最终生成特征图(Feature Maps)传递至决策单元,用于生成车辆的预期行驶轨迹。
BEV和决策两个神经网络单元之间传递的是特征图(Feature Maps)。由于这些基础特征图没有人为定义的接口和处理过程,所以信息可以更为原始和完整地传递,以便于网络进行优化和决策。
与此同时,用Feature Maps将两个单元进行连接,还可以以back-propagation反向传播的方式——即通过计算最终输出的轨迹与实际目标之间的误差,然后将该误差反向传播到决策和BEV单元——来进行两个神经网络单元的联合训练和参数调优。
通过前面的分析可以看出,黑芝麻智能的One Model架构既解决了多模块之间可能存在的信息传递损耗问题,又实现了感知和决策单元的联合训练,实际效果会更佳优秀。
二、决策单元引入多源输入 提升轨迹预测准确性
在此基础之上,黑芝麻智能团队还更进一步,通过引入VLM(视觉语言大模型)和规则的概率化表征(Probabilistic Representation of Rules,以下简称 PRR)两个模块,来进一步提升端到端系统决策的准确性和灵活性。
VLM 模型基于开源 VLM 模型改进而来,该模型可同时接收图像和语言输入信息(比如用户的导航指令),然后通过 Transformer 结构中的交叉注意力机制将视觉和语言两种模态的信息相互关联,从而让模型更深层地理解当前的场景,并以符号特征的形式,将对于场景的理解输入到决策单元中。
例如,当系统识别到行人在斑马线上移动的视觉信息,VLM 可以通过语言规则的匹配,理解这个场景是"行人在过马路",并且知道此时应该停车或者减速——将这种信息传递给轨迹预测模块,显然能够帮助其做出更加正确的驾驶决策。
除了有 VLM 子模块的帮助,决策单元还有行车规则的概率化表征模块(PRR)提供信息。
规则的概率化表征模块
该模块用于将人类的驾驶常识和交通规则转化为自动驾驶系统可理解的概率分布,再通过概率化轨迹采样生成符合交通规则的候选轨迹,并为每个选项赋予相应的概率权重。例如,在交叉路口,系统可以生成"等待""缓慢通过"等符合规则的选项,并赋予相应的优先级。
此外,该模块还包含规则的语言描述部分,将交通规则和驾驶指令编码为语义特征,使其能够被决策模块理解和应用。例如,红灯停车或右转让行的规则会生成特定语义向量。
PRR输出的两种信息均会进入到决策单元,与BEV单元输出的特征图、VLM输出的场景理解特征互相融合,最终生成一条最佳的目标行驶轨迹。
最后补充一点,VLM和PRR模块本质上是端到端系统的增强型"外挂",它们额外引入了类人的对于场景的综合理解能力,以及常识和交规的语义表征,从而在扩展轨迹决策能力的同时维持了端到端系统的整体工作原理, 其本质上相当于一个功能增强了的One Model架构。
三、用扩散模型生成轨迹,应对不同环境
介绍完各个单元和模块后,我们再来重点看一下这套端到端系统的核心——决策部分,到底是如何进行轨迹预测的。
这里主要使用了扩散模型这种生成式模型。工作时,系统会首先生成多个可能的候选轨迹,然后通过逐层多次去噪筛选出最优轨迹。例如,在行驶过程中,如果系统预测到前方车辆可能变道,扩散模型会生成多个候选路径,并在去噪过程中逐步排除高风险的路径,确保最终选择一条安全的行驶路径。
基于扩散模型的轨迹预测模块
这种轨迹生成方法具备多种优势。首先,扩散模型采用逐步迭代的去噪过程,每一步都对预测进行细化,从而逐渐优化输出。相比于传统一次性生成结果的模型,扩散模型能够更精细地控制输出,使轨迹预测更加平滑和自然。这一特性尤其适用于动态环境中的轨迹预测,确保模型在复杂场景中生成的路径符合实际行驶需求。
其次,扩散模型的核心设计是去噪。这使其在面对噪声数据或带有随机扰动的输入时,依然能够稳定地生成合理的轨迹,让系统在应对复杂环境时具备更强的鲁棒性。
最后,该模型在处理长尾场景时表现出色,比如极端天气、异形障碍物、突然横穿的行人等,增加了智驾系统的泛化能力。
四、C1200可快速部署,A2000将大显身手
黑芝麻智能的端到端参考方案,以其创新的One Model架构和多模块协同设计,成功解决了传统分段式端到端系统中信息损耗、训练分离等核心问题。在决策单元引入VLM和PRR模块后,这套方案进一步提升了决策能力,无论在场景理解、轨迹规划,还是动态环境适应方面,都达到了新的高度。这种设计不仅提升了端到端系统的整体性能,也为行业开创了更智能、更高效的技术路径。
当然,再先进的算法也离不开芯片的支持。黑芝麻智能在设计端到端参考方案的同时,充分考虑了软硬件结合的实际需求,使其方案可以灵活适配不同性能的芯片平台。
不含 VLM 和 PRR 模块的标准版方案,可在黑芝麻智能现有的武当 C1200家族芯片上高效部署,满足车企和Tier1等合作伙伴基于算法的参考方案快速适配硬件并开发量产端到端系统的需求;而随着未来黑芝麻智能华山A2000家族芯片的推出,则可以用超高算力支持包括VLM和PRR模块的高阶版端到端系统的部署,为终端客户提供更高性能的智驾体验,并为L3和L4级自动驾驶做好准备。
未来,随着端到端架构的不断完善和芯片技术的迭代提升,黑芝麻智能将继续引领行业发展,为中国智能汽车产业的加速崛起贡献更多智慧与力量。
-
文章
23814
-
浏览
68732
-
获赞
821
热门推荐
-
一图揭秘“论文工厂”背后的产业链丨漫热点
CHF2017为普及马术运动与更多媒体达成合作
2016年中国马产业行业数据显示:全国马术俱乐部会员人数平均年增长率为33%,会员总人数超过27万人。对这个发展速度,你满意吗?CHF马展表示,并不满足!2017年,CHF马展与更多的机构和媒体达成合第四届芒果时尚小咔秀中国少儿平面模特大赛
——百变潮童捕捉1/1000秒的精彩由中国纺织品商业协会商业模特委员会指导,星羽传媒和芒果影业联合主办,中国少儿时尚产业协会承办,横店影视城协办的第三届芒果时尚小咔秀以下简称:小咔秀)中国少儿平面模特快捷通:深耕海尔产业链,做专业的产业链定制支付平台
v80后普通白领张女士是顺逛平台上100万逛爷之一。她和顺逛的初次结缘,是在2016年5月。当时张女士的家刚装修完毕,准备置办家电,正好她有同事在做顺逛微店,不仅亲自上门,还按照张女士的需求推荐了一整华为岗头公寓项目定制柜体供应商招募
【建材网】单项目采购1、招标项目概况:1.1 工程名称:华为岗头人才公寓项目之定制柜体供应及安装工程1.2 工程地址:坂田岗头水库北侧,机荷高速南侧,坂澜大道西侧。1.3 工程规模:项目规划用地面积约《网易新闻》原中国马协秘书长常伟:骑手进鸟巢等于上春晚
原标题:中国马术协会秘书长常伟:骑手进“鸟巢”等于文艺人士上春晚)这项专属于青少年的马术趣味赛事今年将在全国20个城市举办,而且总决赛选在“鸟巢”进行。“青马乐园”赛事总顾问、国家体育总局自剑中心原马《东北新闻网》:2017青马乐园赛事启动将走进20城
“华天之所以能够获得奥运会马术比赛第八名的成绩,这跟他小时候的兴趣培养密不可分。”常伟说:“如果青少年不能参与进来,这个项目就不会有前途。趣味性赛事是让青少年参与的最好方式。”在场的另一位嘉宾国际马术“十三五”规划纲要:坚决打好水、大气、土壤污染防治战役
近日,“十三五”规划纲要首次明确提出“生态环境质量总体改善”的核心目标,主要考虑大气污染防治、水污染防治和土壤污染防治,为绿色发展绘就了蓝图。下一步,就“香会”观察:“不顾一切地维护东盟的团结”
当地时间2023年6月2日,新加坡,第20届香格里拉对话会(亚洲安全峰会)会场。视觉中国/图)香格里拉对话会进入第二十个年头,它一向是观察亚太安全形势的窗口。每年仲夏,多国的防长、政要和学者会前往东盟2018年第三届青年奥运会马术项目资格体系(中文)
国际马联马术场地障碍A.项目2)B.运动员配额 1.马术项目总配额2.每个国家奥委会最多参赛运动员人数3.配额分配方式 配额分配给各个国家奥组委C.运动员资格所有运动员必须遵守现三月砀山将举办马术耐力赛达标赛
“听说咱砀山要举行马术比赛了,真高兴,听说还有不少名贵的马,太让人向往了!”3月12日,砀山县砀城镇60多岁的王先生激动地说。为进一步提高知名度和美誉度,做大做强梨花节品牌,2017年梨花节期间,砀山3月25日中信莱德嘉丽泽常规赛竞猜:黑马爆冷,全国仅6人中奖
黑马频频爆冷,本期大陆赛马网的竞猜游戏中,没有出现获得大奖的朋友。不过,仍然有6名马迷朋友们猜中了两场或以上头马。每周累计竞猜胜利达到一定场次的,还有免费大额惊喜礼品等着您!竞猜回顾:①免费竞猜赢连续3天超1000万亩“三夏”大规模小麦机收全面展开
农业农村部小麦机收调度显示,截至6月2日15时,全国已收冬小麦面积7500多万亩,麦收进度过两成。其中四川、湖北麦收进入尾声,河南进度过三成,安徽进度过两成,江苏进度过一成。全国日机收面积已连续3天超对环境违法企业的挂牌督办是不是行政处罚?
我们经常看到国家环保部对某企业的违法案件挂牌督办,有的省级环保部门和市级环保部门也对某类案件挂牌督办,请问:挂牌督办是一种行政处罚吗?还是只是给企业贴一个标签,向社会公开该企业的违法行为?47匹纯血马抵成都,迪拜杯温江·迈丹赛马经典赛即将拉开序幕
4月2日,2017第四届成都·迪拜国际杯-温江·迈丹赛马经典赛将在成都温江金马国际马术体育公园开幕,3月25日凌晨5:50左右,从迪拜飞来的DUB8号航班顺利降落成都双流机场机坪,在完成消毒程序后,成