【生态论坛】爱芯元智半导体(上海)有限公司副总经理黄烨:国产ADAS/AD 芯片的竞争力-解决场景痛点

2022-09-04 来源:中国汽车工业信息网

由中国汽车技术研究中心有限公司、中国汽车工程学会、中国汽车工业协会、中国汽车报社联合主办,天津经济技术开发区管理委员会特别支持,日本汽车工业协会、德国汽车工业协会联合协办的第十八届中国汽车产业发展(泰达)国际论坛(简称“泰达汽车论坛”)于2022年9月2-4日在天津市滨海新区召开。本届论坛以“强信念 稳发展 开新局”为年度主题,邀请重磅嘉宾展开深入研讨。

在9月4日“生态论坛:由短缺到成熟,车用芯片国产化何时迎来春天?”中,爱芯元智半导体(上海)有限公司副总经理黄烨发表了题为“国产ADAS/AD 芯片的竞争力-解决场景痛点”的演讲。

图片5.png

爱芯元智半导体(上海)有限公司副总经理  黄烨

以下为演讲实录:

感谢主办方,给了这么一个好的技术交流平台。讲芯片,听起来高端,其实如果只是把芯片的规格讲上十几个,是很容易的事。我接下来讲人工智能芯片部分,其实也有些规格,但是今天主要是讲行业里面的相关知识,跟大家分享分享,如果各位有兴趣,会后我们可以探讨。

我们公司是做人工智能芯片的公司。首先讲讲无人驾驶芯片,全球的芯片市场中无人驾驶芯片现在占比还很低,但是在未来,主要用于ADAS的无人驾驶芯片预计到2030年有300亿的市场规模。中国市场每年乘用车的销量有2000多万辆,加上几百万辆的商用车销量,这些车未来10年内基本会装上不同程度的无人驾驶的功能,芯片的市场本身也是非常巨大的。

就ADAS芯片中最细分的ADAS/AD无人驾驶的芯片算力来讲,我们现在设计这个芯片有几个要点。首先车规认证是最核心的,其次是效能比。效能比是指做出多少算力下的能耗是多少,主要还是希望通过被动散热的方式提高,所以效能比比较讲究。

算力和使用率方面,无人驾驶芯片本质上除了常用的CPU,还有GPU,还有引擎,这个单元是专门把无人驾驶里面的机器学习相关的算法嵌入成了芯片里的小算子,这些算子提供了整个无人驾驶算法的基础。算力的核心也是来自于这样一个单元。如果算法的匹配度和芯片的匹配度很高,比如这个算法正好能够把芯片上的算子单元调度起来,利用率就很高,算力和芯片就可以达到最佳状态

适配性方面,现在无人驾驶视觉是大家都需要做的,还有激光雷达等等,所以不同传感器传回来的数据都要进行计算,算法要匹配不同的传感器,芯片的算子也要考虑到这一点。同时还有感知融合的问题,如果是后融合,各自出了结果,那没有太大问题,但要想做到精确就要做到前融合。在图像识别出来的原始数据上,加上激光或者是毫米波雷达,没有识别出物体的时候要先融合计算。这对于不同算法的并行要求很高,在这种情况下,芯片的适配性要求很高,要把几种不同的算法框架跑起来。

灵活性、全面性方面,其实主要也就是说芯片本身有一个设计方案,同时还有一个比较好的迁移计划。比如说原来用的是英伟达,如果切到国产的芯片上来,要有支持的工具。

现在我们做的还是L2级的芯片,首先是ADAS。我们现在国家的交通环境复杂,但是国外也有复杂的交通环境,大家的问题是同样存在的。比如说交通标识、人车混行,但是Corner Case覆盖不全是最核心的问题。对于人工智能来讲,刚开始有神经网络,它的目标是要把所有看到的东西都能准确识别归类,所以能够识别出来是最核心的要求。到目前为止,所有的算法也都是奔着这个目标去的。但是从目前开发的过程中来讲,会存在一些极端场景,比如之前机器没有被训练过。比如说特斯拉,它的算法应该是达到比较好的高度,但也会发生撞车情况,那就是存在很极端的Corner Case,之前没有识别出来,这个时候会出现误判。像这种情况怎么解决?后面将向大家报告。

应对之道是高弹性支持和多范式支持,人工智能这个算法在进行计算的时候,有大量重复计算内容,如果把重复的内容做一个简化,理论上是可以提高算力水平,但是水平到底怎么样,是有待验证的。

因为我们使用的是无人驾驶类的芯片,这个芯片本质上是属于比较低的制程,它的整个流程是比较长的。芯片设计完之后要留片一段时间,然后把下面的工具链、开发环境配置好,还要把算法调试通。这整个流程都很长。在这个过程中,人工智能无人算法领域的算法迭代很快,如果算法本身出现了革命性突破,它的基本算子出现了大的调整,那么很可能会导致芯片出来之后的应用水平就很低,算力应用率低,因为最关键的算法的算子部署不足。所以,在设计无人驾驶芯片的时候,一定要紧跟目前世界上比较先进的无人驾驶的训练学习框架理念,对这些算法可能是怎么实现的,要用到什么样的算子等等,得有一个正确评估,这样芯片出来的时候能够更加贴近当前最好的算法,从而提高算力的应用率。

对于我们芯片公司来讲,最核心的是两个单元,一个是图象数据的ISP。在这图像上识别出来各种各样的异物,如果这个芯片能够在ISP和NPU这两个单元上能够有比较出色的效果,这就是一个比较理想的无人驾驶芯片。如果前端的图像部分处理不好,有大量噪音,实际上直接会影响到后面的识别效果。

第一方面是支持多感知的前融合,除了视觉的感知支持外,对于雷达的感知,它的前融合的算法也要做支持。可能是激光雷达,也可能是毫米波雷达,激光雷达价格还是比较贵,未来几年内不会有本质上下降,所以跟毫米波雷达搭配,大概率是中低端车型上的可能方案。当然也不排除走纯视觉。

相应的,你就得适应新的算法框架,比如说Occupancy Network,无人驾驶的算法是基于人工智能的算法过来的,核心是识别,到现在为止无人驾驶芯片核心也是识别,针对车有车的策略,针对人有人的策略。但实际上,存在一个问题,如果识别不出来怎么办?特斯拉那么多车在路上跑,极端场景应该很少,但也会发生撞车。当然,它撞车算法的水平还是有较大差异。为了解决这个问题,我们需要跟进一下国外最新的算法框架。特斯拉的软件总监说,他们用的是Occupancy Network这个概念。这个概念是一定要识别出是什么物体,因为对于车来说,最关键的只要知道前面有一个什么东西就行了,识别出来有东西之后,通过几个关键点绘制出来空间,不管是人、车、狗,都会占据一个空间,把这个空间绘出来,不要撞上就解决了。为什么要识别是什么呢?开车要避免撞上去,不管是什么都不想撞,所以只要占据了空间就绘制出来,是一堵墙还是一辆车,我都不关心。针对这个,提出来一些新的算法。我个人是非常认同的,无人驾驶的算法应该考虑的是是否相撞,至于撞的是什么,那是无所谓的。实际上对于无人驾驶来讲,只要知道物体的存在,能够把它占据的空间点位绘制出来就可以了,怎么样识别这个物体,占据空间的几个关键的点位,绘出3D的空间占位图。之前计算过的,各个占据的物体会放在后台,随着时间的演变,随时把这些物体拉出来,跟目前的占据的位置做一个比对,所以这个物体之前是静止,现在是运动的,或者运动速度有变化,都没有问题,只要通过不断跟后台对比演算,就能知道会不会撞上。芯片设计上要考虑到这一点,把相应的算子加强,一定能够得到很好的无人驾驶的效果。

无人驾驶芯片有NPO,NPO就是有若干个算子,比如说我们现在有将近60个算子,虽然不知道这些算子单元是干什么的,但基本上都是主要功能,还有基本数学操作的算子单元,还包括一些图形处理的单元。所以NPO的设计就是要跟算法尽力贴近,考虑到未来无人驾驶领域,什么样的算法会占据主流,尽量按照它的分配设计在NPO里面,算力会得到很好的应用。

现在大家的算法都是计算每秒可以进行多少T的运算,但是一个芯片的数据可能会变来变去。其实这里有一个标准,叫设计算力。一般是根据8位精度来做的,但是实际应用中可能有8位,可能有4位,是一个混合运算。虽然算力不是唯一标准,算子跟算法的匹配也是关键。

最后介绍一下我们公司的资源。我们是台积电重点支持企业,爱芯元智在留片还是有保证的。在摄像头的配合方面,我们的ISP做得相当不错。例如,隧道是典型的出口有强弱光的场景,我们这个ISP可以有效把噪点去除掉。

我就讲这么多,谢谢各位老师!

本文根据泰达汽车论坛现场速记整理,未经演讲嘉宾审阅,仅供参考。

本文版权归中国汽车工业信息网所有,未经许可,不准转载。

中国汽车工业信息网:http://www.autoinfo.org.cn/