Kalray的加入,使得面向自动驾驶汽车的平台化竞争更激烈了,不过各家都有自己的优势,现在论输赢还太早。
每次聊起自动驾驶汽车的话题,这样的画面你一定不陌生。
我们总喜欢把这些未来社会里,可以自己上街遛弯的车子叫做“robot car”,甚至总是假想着方向盘后边坐着这样一位贴心的机器人司机。
可现实并非如此。当你超开心地坐上一辆谷歌的无人驾驶汽车,不仅找不到可以击掌吆喝的机器人哥们儿,掀开后备箱,还可能会发现这些堆砌地整整齐齐的计算机设备。
或许这个时候你明白了,原来这才是控制无人驾驶汽车的核心啊!不过未来呢?难道2020年的无人驾驶汽车的后备箱里还藏着这些硕大的主机箱和各种颜色纠缠在一起的线吗?
这显然不大可能。毕竟现在绝大多数的科技产品都在朝着轻量化、小型化的方向发展,这也是为什么NVIDIA、恩智浦、意法陆续推出了针对自动驾驶汽车的平台架构解决方案。
恩智浦NXP BlueBox自动驾驶平台化解决方案
再者,目前OEM主机厂和一级零部件供应商在自动驾驶研发上多少都面临着这些问题:需要大量功能不同的传感器,车内ECU的数量只增不减,传感器搜集的数据需要处理、分析、融合,再者安全性也是智能汽车不能忽略的重要元素。此外,像高级机器视觉、深度学习以及高精度地图绘制等功能的实现,对自动驾驶平台的计算性能和处理能力也要求颇高。
所以,面对这样一个价值6400万美元的市场,无论车企还是供应商,现在似乎谁都无法预见到2020年的自动驾驶汽车平台会是什么样。而Drive PX2、BlueBox,EyeQ5此类产品的推出,似乎从侧面印证了,具备“超级电脑计算性能+传感器融合数据处理”能力的平台架构将成为未来该领域各大供应商角力的方向。
这不,又来了个搅局的家伙。
成立于2008年的Kalray,是单芯片上实现超级计算(Supercomputingona Chip™)的发明者。Kalray也是法国原子能委员(CEA)的供应商,它的极限运算技术最开始就是为CEA的核弹实验模拟而定制开发的。除此之外,Kalray的主营项目还包括面向航空航天的重要内嵌系统开发及云计算业务。
不过正是因为在超级计算芯片领域的优势,Kalray也加入了自动驾驶性能平台竞争的队伍中,推出了第一款面向自动驾驶汽车,拥有288个VLIW内核的大规模并行处理器阵列芯片MPPA®处理器。
在Kalray CEO埃里克看来,未来自动驾驶汽车的技术竞争将主要集中在重要内嵌系统市场,因为车子需要这样的系统来完成对内外部数据的采集,迅速处理后及时发出正确的指令。因此,他认为“自动驾驶汽车亟需一种能够进行多域功能集成、具有超级计算性能和处理能力的芯片处理器”。
现实是,在SoC系统芯片领域,密切相关的处理器内核数量在不断增长,从2个或者4个增加到8个、16个,甚至更多,而所谓的“多核处理器革命”其实已经悄悄开始了。不过遗憾的是,在Kalray之前,并没有哪家公司成功设计出内核超过100的大规模并行超级计算芯片。而Kalray的新一代芯片产品Bostan,内核处理器的数量达到了288个,它集成了16个计算集群,2MB的共享内存,每秒可处理数据量为80GB,拥有16个系统核。
此外,Bostan由于采用了片上网络NoC的通信方式,结合高速以太网接口(接口标准8GbE~10GbE),具有低延迟性的特点。这也使得Bostan能够实现在运行中动态编码/解码,Bostan还提供接入GPU/FPGA加速器的简易方式。
因此,Bostan的MPPA架构可以提供DSP类型的加速(能耗低且具有时间可预测性),对多域的支持(不同的计算集群,例如,能够运行车内各部分使用的不同内嵌式操作系统),实现可扩展的大规模并行计算(内部处理器可并列整合以适应系统的复杂性)。
Kalray的大规模并行处理器阵列MPPA架构
听了这么多,你可能心里开始犯嘀咕了:年初的CES上,老黄在介绍Drive PX2的时候,不也是一个劲儿地夸自己的产品嘛,说它是“目前世界上最先进的自动驾驶汽车平台,具有深度学习、传感器融合和3D多屏显示功能”。可号称是“单芯片超级计算机”的Kalray Bostan,优势又在哪儿呢?
Kalray CEO埃里克表示,Bostan的优势主要集中在两方面:
首先,Kalray的解决方案具有低延迟性的特点,能确保系统在恰当的时机做出恰当的反应。因为在高性能运算中,一秒的延迟没太大关系。但如果涉及航空航天和汽车领域的关键内嵌式系统,10毫秒的延迟都可能是致命的;
其次,Kalray的MPPA架构芯片可以借助普通工具或Linux系统运行标准的C/C++程序。相比之下,要使用英伟达的芯片,开发人员必须会用CUDA编程,而主机厂手里已经有大量用C语言编写的遗留代码和算法,即使转移到新的无人驾驶汽车平台,遗留代码依然十分重要,显然Kalray的MPPA架构处理器要比英伟达的产品适配性更高些。
注:CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。不过似乎英伟达慢慢想开了,CUDA3.0已经开始支持C++和FORTRAN。
英伟达NVIDIA Drive PX2
除了英伟达,前段时间提前公布了EyeQ5产品计划的Mobileye,也着重强调了该芯片产品的「处理性能」。不过Mobileye这次纯粹是“纸上谈兵”,只是承诺会在2018年拿出EyeQ5的样品。
EyeQ5据说会采用10纳米甚至精度更高的FinFET新电晶体架构制程,装备8枚多线程CPU内核,同时还会搭载18枚Mobileye的下一代视觉处理器。据车云菌了解,EyeQ5的运算性能达到了12 Tera/每秒,但能耗却不到5W。
没有人,包括埃里克,会轻视Mobileye这个对手。因为和英伟达Drive PX2(有行业观察者认为它只是一款针对无人驾驶汽车的「测试平台」)不同的是,Mobileye一直紧跟消费市场的变化趋势,EyeQ系列产品的处理性能在不断提升,但功耗却在持续下降。
当然,为了平衡视觉处理算法的不足,EyeQ5已经开始要采用传感器数据融合的解决方案了。按照mobileye和意法透露的信息,EyeQ5最多支持20个外部传感器(摄像头、雷达或激光雷达)。
那么EyeQ5能hold得住无人驾驶汽车内部的ECU吗?此前,一位Mobileye发言人在接受记者采访时表示,“EyeQ5不会只进行数据融合,它还能够进行决策”。但要将决策变为行动,还需要ECU的配合才行。这位发言人也指出,会有主机厂配置的低功耗ECU使用。
不过在自动驾驶汽车领域,Kalray把它的多核处理器产品完全放在了和Mobileye、英伟达不同的位置上。
在问及未来自动驾驶汽车系统平台架构的进化方向时,埃里克拿出了下面两幅图。
现在大部分汽车采用的系统架构(Level1, Level2)
现在大部分汽车都装有数量很多的本地ECU,它们能够结合传感器,起到数据处理和功能控制的作用。
未来无人驾驶汽车时代的汽车系统架构(Level 3, Level 4, Level 5)
Kalray希望能够将这些ECU的功能整合到一枚芯片上,这样从系统架构的简洁性和成本方面考虑,都是有好处的。不过要注意的是,并非要让这枚超级ECU包揽所有功能。假设要进行机器学习时,如果需要加速算法的运行,超级ECU会通过连接加速器或具有某特定功能的ECU完成。
“你会发现,无论是传感器还是机器学习算法,一直或多或少都在进步。可似乎处理器方面鲜有作为。”Kalray CEO在接受记者采访时这么说,这也是Kalray在自动驾驶汽车身上看到的市场先机。
按照埃里克的想法,无人驾驶汽车上使用的下一代处理器应该具备不止「数据融合」一项功能,它们更多地是要扮演开放平台的角色。埃里克希望能够打造一套面向无人驾驶汽车的开放式处理枢纽系统。
在埃里克的设想中,「超级ECU」这套系统会集成大量多域功能,在“感知”、“学习”、“安防”、“网络”、“成本”等方面会产生大量的优质成果。他表示目前已经有很多知名主机厂和供应商在使用Kalray的平台产品开发第一批自动驾驶原型车,不过并没有透露具体名字。同时埃里克承认“Kalray针对无人驾驶汽车的系统架构还不够成熟”。
但事实是,搭上业界重要的合作伙伴,Kalray能够对车企的需求有更深入细致的了解,这对定义和开发其下一代无人驾驶汽车解决方案大有裨益。在谈到未来可能的商业模式时,埃里克表示“把MPPA架构授权给其他汽车芯片供应商使用,也是种不错的选择”。
我要说
登录发布评论