魔视智能虞正华:面对长尾问题,数据闭环机制是关键

铃轩之声 2024-11-21 19:39:09

撰文 / 虞正华(魔视智能创始人兼CEO)编辑 / 王雨竹

排版 / 雪梅

“智能驾驶技术的发展至今,顺应了整车电子电气架构演进的大势,由过去的分散式架构向一体化架构转变。” 魔视智能创始人兼CEO虞正华说。

虞正华是在11月8日上午在昆山开幕的2024第九届新汽车技术合作生态交流会(NAT-CES 2024)上做出此番表述。

2024第九届新汽车技术合作生态交流会主题是“平衡与突破”,这是在中国新汽车产业发展努力突破内卷环境下举行的汽车行业重要会议。

此次交流会,上百位中国主流车企研发、采购领导人,数百家主流新汽车供应链企业家,齐聚一堂,主零面对面,行业交流、技术探讨、企业赋能、产业对接,持续构建新汽车技术合作生态圈。

虞正华是作为主流新汽车供应链企业家,针对当下汽车智能驾驶发表了上述主题演讲。

他认为,智能驾驶技术正和整车电子电气架构一样,由分散式架构向一体化架构演变。在此过程中,行泊一体成为了一个关键的发展阶段,能够带来传感器复用系统的改进、系统性能的提升及成本的有效降低等诸多优势。

而对于如何做好行泊一体,他结合自身的经验给出了4个核心能力。

首先是算法能力,尤其是覆盖从感知至决策与控制全过程的原创全栈算法。这是因为行泊一体的域控制器集成了众多功能,需要对大量算法进行深度优化。其次是全栈的系统能力,涉及从算法软件到硬件的各个方面,在有限的计算资源上实现功能的最佳优化、高效调度以及性能最大化。再次是全场景的落地能力,确保技术能够无缝应用于行车、泊车等不同场景;最后是数据闭环能力,通过持续收集数据,不断优化算法模型,减少并解决长尾问题,推动算法迭代进步。

在这4个能力中,他特别强调了数据的重要性。在量产应用逐渐普及的背景下,面对层出不穷的长尾问题,有效的数据闭环机制成为了解决问题、促进技术迭代与提升的关键。

除了数据,虞正华还对算法能力本身的重要性也做出了说明。算法在智能驾驶核心技术中始终是核心。

他认为,算法的进步可分为三个方面的能力:“首先是原创算法,特别是感知算法,这是智能驾驶系统中最需积累且最难攻克的部分;其次是数据闭环,面对众多长尾数据的处理;最后是算力的提升。”

和他所关注的重点一样,多年来,魔视智能也在这几个方面做出了不少努力。

在原创算法方面,他们持续引入新技术以突破算法上限,已有多个算法竞赛夺冠经历;在数据闭环方面,他们积累了大量实际行驶数据,通过量产项目的反馈优化算法;在算力芯片方面,他们拥有强大的芯片平台支持能力,能够确保先进的算法在合适的算力平台上有效实现。这些努力共同促进了智能驾驶技术的不断进步。

在深度学习感知算法方面,他们开发了名为CYCLOPS的系统,引入了BEV+Transformer+OCC多任务一体化网络,能够识别并处理包括车辆、行人及路边各类障碍物在内的多种目标,以及车道线等道路信息,以更好地满足行车和泊车两种典型应用场景下的感知需求。

在数据处理方面,他们构建了一套名为UNIVISITY的数据治理平台。它包含多个关键组件,涵盖了多元数据、其他传感器数据、自身数据存储管理系统、数据标注平台以及数据训练平台,已经实现了基于时空感知的4D数据(三维空间加上时间维度)处理能力。他们还开发了一个自动化预标注的大模型,显著提升数据处理的效率和质量。

基于此,虞正华表示,行泊一体的发展将持续推动算法的迭代更新,包括采用BEV+Transformer等新型算法,乃至未来的端到端大模型技术,都将在行泊一体域控上得以实现,进而为更高级别的智能驾驶功能奠定基础。

虞正华在演讲前,还与许多中国主流车企研发、采购领导人,以及主流新汽车供应链企业家见面,并参观了同期举行的产品与技术展示。

主题演讲之后,当天下午的交流会举行了智能驾驶专场的圆桌讨论。围绕“智能驾驶技术产业新生存之道”,众多行业嘉宾进行了深入、专业的讨论。

为期两天的2024第九届新汽车技术合作生态交流会由世界新汽车技术合作生态协会主办,轩辕之学新供应链学院、中国汽车产业出海协作会为协办单位。

NAT-CES 2024的前身是中国汽车供应链峰会,经过长达9年的发展演变,已经成为中国新能源智能网联汽车产业年度交流盛会,标志着中国新汽车技术合作生态交流平台升级启航。

此次交流会是专业会议、技术展示和铃轩盛典三位一体的中国汽车产业主零交流重要活动,包括2大行业专场、8大技术专场,1场产品与技术展示、1场主零交流之夜和1场铃轩奖盛典。供应链优秀企业代表和主机厂相关负责人围绕动力系统、底盘系统、智能驾驶、智能座舱、热管理系统、车用芯片、轻量化与新材料,以及主被动安全等8个方面举行专场会议,就行业技术趋势发表主题演讲并进行圆桌讨论。

以下是虞正华的演讲实录,此处有删减。

智能驾驶技术的发展至今,顺应了整车电子电气架构演进的大势,由过去的分散式架构向一体化架构转变。在此过程中,行泊一体成为了一个关键的发展阶段,能够带来传感器复用系统的改进、系统性能的提升及成本的有效降低等诸多优势。

做好行泊一体的工作需要具备四个核心能力:首先是算法能力,尤其是原创性的全栈算法,覆盖从感知至决策与控制的全过程。这是因为行泊一体的域控制器集成了众多功能,需要对大量算法进行深度优化;其次是全栈的系统能力,涉及从算法软件到硬件的各个方面,如何在有限的计算资源上实现功能的最佳优化、高效调度以及性能最大化,这要求具备全面而深入的系统能力;再次是全场景的落地能力,确保技术能够无缝应用于行车与泊车等多个场景;最后是数据闭环能力,这是指通过持续收集实际运行中的数据,不断优化算法模型,解决并减少长尾问题,从而推动算法的迭代与进步。

如今,算法迭代不仅依赖于模型本身,数据同样重要。尤其是在量产应用逐渐普及的背景下,面对层出不穷的长尾问题,有效的数据闭环机制成为了解决问题、促进技术迭代与提升的关键。

魔视智能在行泊一体域控领域积累了丰富的经验和进行了多次迭代,从行车领域的1V1R到1V5R,再到泊车领域的4V12USS至5V12USS,最终整合了这些技术成果,推出了7V5R12USS行泊一体解决方案。这一过程基于坚实的技术迭代和量产落地经验,逐步形成了当前的行泊一体方案。

我们认为,行泊一体的发展将持续推动算法的迭代更新,包括采用BEV+Transformer等新型算法,乃至未来的端到端大模型技术,都将在行泊一体域控上得以实现。随着算力的增强,这些技术的集成将为实现更高级别的智能驾驶功能奠定基础。智能驾驶是一项极具挑战性和复杂度的任务,因此,在行泊一体域控制器上的算法和架构迭代尤为关键,目标是达到更高的智能驾驶水平。

关于行泊一体域控的市场定位,我们分析了不同价位段的需求。对于中算力的行泊一体域控,我们的重点在于实现高性价比,即在保证接近高端功能的同时,尽可能降低成本,以便该技术能在更多的量产车型中广泛应用,特别是在中低端配置的车型中普及。而对于高算力的行泊一体域控,我们的关注点则在于展现最强的算法能力和最新技术的应用,如BEV+Transformer和端到端技术等,以提升功能体验,并不断探索功能体验的极限。

算法的进步在智能驾驶核心技术中占据核心地位,这种进步主要源于三个方面的能力叠加:首先是原创算法,特别是感知算法,这是智能驾驶系统中最需积累且最难攻克的部分;其次是数据闭环,面对众多长尾数据的处理;最后是算力的提升。

在原创算法方面,公司已有多个算法竞赛夺冠的经历,并持续引入新技术以突破算法上限;在数据闭环方面,我们积累了大量实际行驶数据,通过量产项目的反馈优化算法;在算力芯片方面,魔视智能拥有强大的芯片平台支持能力,能够确保先进的算法在合适的算力平台上有效实现。这些努力共同促进了智能驾驶技术的不断进步。

魔视智能自2015年起便专注于智能驾驶技术的研发,最初是从感知算法入手的。经过多年努力,我们在感知算法方面已完成五代迭代,基本上每两年进行一次重大更新。目前,我们的技术已经发展到了BEV+Transformer架构,并正朝着更先进的端到端大模型方向迈进,始终处于行业的最前沿。

在深度学习感知算法方面,魔视智能开发了名为CYCLOPS的系统,该系统也经历了多次迭代,最近我们引入了BEV+Transformer+OCC多任务一体化网络,能够识别并处理包括车辆、行人及路边各类障碍物在内的多种目标,以及车道线等道路信息,以更好地满足行车和泊车两种典型应用场景下的感知需求。

基于这些先进的感知技术,我们开发了一系列行车功能,涵盖了市场上较为常见的L2+级自动驾驶功能,例如上下匝道操作,这些功能通常对算法的要求较高,还包括处理大曲率S弯、路口等复杂行车环境的能力。另外一方面是泊车的感知,它是利用四个鱼眼摄像头加上算法在BEV框架之下实现对环境障碍物的感知。

从功能角度来看,我们已经将多项技术转化为量产功能,包括但不限于调头车位泊入、极窄车位泊入,以及对各种环境障碍物的检测,特别是悬空障碍物的识别,这是行业内的一大难点,但我们通过算法的不断迭代,成功实现了高质量的解决方案。

为了进一步推进技术迭代,我们已将BEV+Transformer+OCC多任务一体化感知网络引入,并将其部署到中算力乃至中低算力的芯片上,以实现量产应用。魔视智能致力于通过极致的算法和性能,以及在成本上的深度优化,不断挑战算法能力的上限,为消费者提供极致的使用体验和性能表现,同时确保产品的高性价比。

除了算法本身的进步之外,数据处理也很重要。经过多年的积累,魔视智能构建了一套名为UNIVISITY的数据治理平台。它包含多个关键组件,涵盖了多元数据、其他传感器数据、自身数据存储管理系统、数据标注平台以及数据训练平台。此外,我们还拥有一个完整的仿真平台,确保数据可以在不同算力的芯片上得到有效部署。

在数据平台建设方面,我们已经实现了基于时空感知的4D数据(三维空间加上时间维度)处理能力。我们开发了一个自动化预标注的大模型,利用最新的大模型技术对新引入的数据进行预标注,以此扩大场景覆盖范围,有效降低数据标注的成本。这项技术已经在我们的系统中得到了广泛应用,显著提升数据处理的效率和质量。

最后花一分钟简单介绍一下魔视智能。魔视智能从2015年成立,九年多的时间中积累了很多技术、市场和客户。我们量产的客户有广汽、奇瑞、北汽、长安等乘用车方面。商用车方面也有很多量产客户。

我们一直坚守的是技术上不断迭代、不断突破,并且把它变成满足市场需要的产品,来服务众多主机厂客户的需求。非常感谢多年来大家对魔视智能的支持,我分享的就这么多,谢谢大家!

0 阅读:0