
可能很多人都还记得儿时那个令人兴奋的感叹:“妈妈,看,我不用手也可以骑车啦!”当我们还是孩子的时候,时常尝试在骑自行车时把手从车把上移开,即“大撒把”,那是多么让人激动!如今,谁不想再次体验那种感觉?不过这次操控的不再是自行车,而是汽车!
真正的自动驾驶的确有可能实现。2014年,美国汽车工程师学会(SAE)在J3016标准中勾画了自动驾驶汽车的实现。该标准要求五个级别(从L1到L5)的驾驶自动化程度逐步升高,从0级(L0)的无自动化,到5级(L5)的无人工干预——具体而言,就是驾驶过程中不再用手或脚(图1)。
图1:自动驾驶经历了五个不断提高的自动化级别,从“一切正常”到“心不在焉”,实现了“看,妈,无需用手脚”的驾驶体验 (来源:美国汽车工程师学会)
早先,业界期待L3自动驾驶汽车在上年代末(2020年)上路,而早期的L4自动驾驶原型车也将于今年上市。然而迄今为止,这两个级别的产品发布都延迟了,有限推出的也仅仅只是概念车。
本文探讨了延迟的原因,并展望了实现原目标尚需完成的工作。
自动驾驶车辆的“大脑”
正如所料,随着自动化程度的提高,任务的复杂性呈指数级增长。因而需要一个强大的电子“大脑”,辅之以一整套全面的传感器,负责收集大量的不同类型数据。数据必须包括运动车辆周围的静态和动态物体、环境特征和地理坐标,以定位车辆、识别其周围环境并凸显可见和隐藏的障碍物。
行业确定了由三个阶段组成的“大脑”架构——感知、动作规划和执行(按顺序),参见图2。
图2:自动驾驶车辆的自动驾驶控制回路三级架构 (图片来源:LauroRizzatti)
从感知阶段开始,自主驾驶”大脑”通过从多个类型各异的传感器收集原始数据,并通过复杂算法详细解析这些数据,来感知车辆周围的环境。感知阶段完成后,动作规划阶段将接管,以做出明智的决策并规划未来的行驶路线。最后是运动执行阶段,即根据规划路线操控车辆。
3级及以上级别,传感器的类型和数量急剧增加,包括摄像机、雷达、激光雷达、声纳、红外、惯性测量装置和全球定位系统(GPS)。L4级中,估计所需的传感器多达60个左右,参见图3。
图3:L4自动驾驶所需的传感器可能多达60个 (来源:台积电)
感知阶段是达到3级及以上水平的关键阶段。先进的数据处理技术,如传感器融合,详细解析了由多个传感器实时收集的海量数据,从而改善了系统对环境的感知。如果未能准确感知车辆周围的环境,可能会影响驾驶操控结果并导致灾难性事故。
自动驾驶算法在感知阶段也发挥着关键作用。如今处理感官数据的算法仍在不断发展,一些新算法也在定期发布。
实现L4/L5自动驾驶的体系架构需求
自动驾驶场景面临着各种挑战,这些挑战带来了严格、硬性和难以满足的设计需求。现有的CPU、GPU或FPGA体系架构都已无法满足这些要求。所以,用一个创新的方式从头开始构思全新设计,至关重要。
该全新设计有七项要求:
1.高效率提供的强大计算能力
2.极低的延迟
3.最低的能耗
4.AI/ML和DSP能力的结合
5.处理确定性
6.可重编程性
7.合理的价格
上述所有七项都是必须的(参见图4)。
图4:实施L4/L5自动驾驶车辆必须满足的七项基本要求 (图片来源:LauroRizzatti)
高效率提供的强大计算能力
随着自主驾驶级别的上升,处理能力需求呈指数级增长,所需的算力从L1的数百GFLOPS,增长到L2的数十TFLOPS,再到L3的数百TFLOPS。而对于L4/L5级来说,所需的算力则高达1PFLOPS或更多。
更重要的是,能够将计算能力作为在任何给定时刻都可用的实际能力。换言之,以理论功率百分比表示的自动驾驶处理器的效率必须超过80%。
极低的延迟
感知阶段必须尽可能快地详细描述大量输入数据,延迟不超过30毫秒,以避免在不可预测的情况下造成灾难性后果,例如行人突然在车辆前方穿越道路。
最低的能耗
无论是平均功耗,还是峰值功耗,都必须是最低,因为这对于避免自动驾驶车辆电池耗尽和防止电子设备过热都至关重要。将功耗限制在100W以下比较合理。
AI/ML和DSP能力的结合
虽然机器学习和深度神经网络计算对于高级自主驾驶算法处理是必要的,但它们是不够的。
最新/最先进算法要求AI/ML与DSP器件紧密相结合,以限制延迟并降低功耗。
处理确定性
安全和安保在自动驾驶场景中发挥着关键作用。本质上,AI算法产生的响应精度低于100%,达不到确保100%确定性响应的目标,故需要DSP来帮助实现上述目标。
可重编程性
在可预见的未来,最先进的算法将继续演进。对自动驾驶车辆的“大脑”进行现场可重新编程的能力是强制性的。
合理的价格
所有消费品,即使是豪华车型,都对成本敏感。为了确保自动驾驶汽车“大脑”架构的成功,其定价应低于100美元。
结论
可能再需要一段时间,你才会惊呼:“妈,看,我不用手就能开车啦!”汽车在高速公路上自主行驶这件事,也确实会实现。不过目前还要等待技术赶上我们的想象。
设计L4/L5自动驾驶“大脑”,需要一种先进的体系架构,能够以80%或更高的效率实现PFLOPS级别的处理能力,延迟小于30毫秒,功耗小于100W,售价低于100美元。
综上所述,只有定制处理器才能满足本文中所述的所有七项要求。
(参考原文:Look Ma, No Hands! The Road to Autonomous Driving)
本文为《电子工程专辑》2022年12月刊杂志文章,版权所有,禁止转载。点击申请免费杂志订阅
暂无评论哦,快来评论一下吧!
