毫末智行:“毫”生态

红色星际 2021-09-30 10:14:27

作者:张叶子

编辑:Mark

出品:红色星际(ID:redplanx)

头图:毫末智行创始人团队

9月28日,毫末智行2021年第三期品牌开放日在京举办,晒出Q3成绩单,三大最新进展引人瞩目:

• 乘用车方面——“小魔盒”高速辅助驾驶开启率超过30%,行驶里程突破100万公里,比Q2数据的50万公里增长近一倍,十一假期来临,里程数有望迎来新的爆发式增长;——发布最新智慧领航辅助驾驶系统NOH(Navigation on HIPilot),对标当前特斯拉NOA和小鹏NGP,在弯道、高速换乘、汇入和汇出等方面带来更出色的驾乘体验。此系统将在WEY摩卡车型中率先上线,未来还将陆续落地于长城数十款乘用车型,预计三年内列装100万辆。

• 低速物流车方面——毫末智行与阿里达摩院官宣战略合作关系。毫末智行为阿里达摩院智能物流无人车“小蛮驴”进行生产制造、出厂测试验证、规模量产等联合创新及全生命周期服务,全面助力小蛮驴质量保障和规模化量产。国内电商最后一公里配送三大玩家美团、京东、阿里,毫末集齐二家,并建立长期唯一合作关系,是低速无人配送领域市场份额的绝对领先者。——运力服务方面,毫末智行在北京顺义地区与物美多点合作的无人配送车订单近2000单,自6月开始运营以来,目前服务范围已覆盖10个社区,较Q2增长50%。据悉,至2022年年底,公司无人配送及运营车队将达数百台。

• 数据智能方面最新的自动驾驶技术版图首次曝光。毫末智行核心技术——Transformer(视觉识别技术)与CSS(协同安全敏感模型)“双感知模型”和“认知智能”在产品量产落地中持续优化,海量数据带来的迭代速度快、成本低的优势进一步显现,在自动驾驶行业筑起更深的技术护城河。Q3的豪华成绩单不是个例,成立于2019年、年初完成Pre-A轮融资数亿元人民币融资、在不到2年的时间里完成了高速ADAS和低速场景的商业闭环,毫末智行以季度为时间单位,不断刷新行业的奔跑速度记录。速度只是表象,成绩的背后,毫末做对了什么?才是整个行业感兴趣的地方。毫末智行董事长张凯将毫末速度致胜的核心变量总结为一个“公式”:

毫末致胜公式=(数据智能*全面安全*稳定量产)^生态

毫末智行主要涉足载人和载物2个赛道,同时选择了都可以大规模量产的L2辅助驾驶和低速载物产品,通过大规模铺开自动驾驶车辆,最大化的收集数据,智能化处理数据,最终反哺自动驾驶软件,促使系统更安全,形成生态正循环。毫末是如何舞动这三个变量的,红色星际为您深度揭晓。

生态发动机:数据智能

从诞生那天起,自动驾驶行业一个含金量最高的问题一定是:自动驾驶决胜的关键是什么?什么样的企业能摘得最后的王冠?毫末智行的答案是数据,智能驾驶是一场长跑竞赛,唯有提高数据的迭代速度、降低数据迭代成本,才能持续的取得胜利,真实数据规模就是自动驾驶行业的命脉。在大家都有量产的条件下,谁能够在相同的成本下面迭代得更快,谁就会在未来的竞争中会更有优势。

(毫末智行CEO顾维灏)

数据的成本主要包括四个方面:数据收集成本、数据处理成本、 AI训练成本和系统测试成本。相应的,决定迭代速度的因素就是数据收集速度、数据处理速度、 AI训练速度和系统测试速度。毫末在数据智能的降本增效就是从这四个方面抓起的。

1. 数据收集目前,毫末已经有100万公里的数据,这以数据量与特斯拉相比虽然仍有差距,但在国内公司中,里程数排在前列。数据来源方面,公司目前的数据来源是商用车和采集车兼备,采集车队比重大于量产车,但随着量产车数量的逐渐增加,这一比例将会反转。据公司人员介绍,量产车来源数据的优点是场景更加丰富、数据多样性比采集车要高得多。雨天、老旧小区、地库、真实用户的数据会比自己想象的或者采集车上看到的数据更复杂。

(毫末智行无监督技术讲解)

虽然场景丰富带来了数据利用成本比采集车队高的缺点,但价值是不言而喻的。作为一家秉持渐进路线的公司,毫末量产车是L2+辅助驾驶,获得数据的前提是用户对辅助驾驶的开启率。张凯表示:“如果用户一开始就不喜欢用,认为辅助驾驶不好用,那我们就连学习的机会都没有,更不要说形成数据闭环,持续迭代产品的能力了。因此,持续优化的用户体验是自动驾驶商业化落地的重中之重,也可以说渐进式发展路线的关键环节就是用户体验。”如何提升用户体验?毫末设计了一个AI FEED功能,将传统的“让用户去适应车”变成“让车去适应用户”,让车能智能识别用户用车场景和驾驶习惯,进行个性化推荐。比如从最刚需的用车痛点出发进行推荐,如拥堵辅助、高速自动驾驶、自主泊车功能;再比如根据客户驾驶习惯推荐极速、标准和柔和模式;后期还可以实现对加减速力度、跟车距离、变道频率、变道时机等驾驶策略的定制化推荐。为此毫末智行和长城汽车联合举行了一项用户共创活动,邀请用户参与体验,把自己的车和竞品车开上高速、开进城区,进行两个小时的实车体验,然后进行交流汇总、问题诊断。活动持续了四个多月,得到了长城的大力支持,所有长城汽车副总裁级别、品牌公司副总级以上人员都必须参加,就连管人力和证券的副总裁都要参与。成效是显著的,毫末团队对自动驾驶的用户体验有了更深刻的理解。作为深度参与HWA策略制定的工程师团队,试车过程中难免会潜移默化的往策略上靠,站在工程师的角度去体验每个环节。但工程师角度和用户需求之间是有区别的,真正了解和满足用户体验,需要站在用户的角度思考问题。红色星际注意到,毫末将感性的用户体验细化成为可衡量的指标,包括开启、使用和结束三个动作中涉及到的将近20项主动和被动成本,在各个细化的成本上不断做功,提升用户体验。不断优化的驾驶体验回馈的成果是:Q3高速辅助驾驶开启率超过30%,比上季度提高50%。张凯表示:2021年长城汽车全系车型中,具备有效数据收集功能的车辆将达25万辆;2024 年长城汽车将累计销售具备有效数据收集功能车型530万辆,形成中国最大规模的自动驾驶数据仓。

2. 数据处理拥有数据只是第一步,如何高效找到有价值的数据呢?绕不过去的问题就是数据标注,毫末标注与业内大部分公司一样,Inhouse自研标注平台+供应商模式。具体分工是:任务简单、规则清晰、确定性强的如画框、拉线一般都是由供应商去做。类似联合标注精度要求比较高,出错之后修改也比较麻烦,和脑补等复杂场景,会放在自研标注平台上,质检团队也是完全Inhouse。即使是人工标注,也要从最有价值的部分开始标注,否则浩如烟海的数据,是无从下手的。所以,如何确定哪些是有价值的数据呢?如果靠人一点点去找,首先这里面就有两个问题:一是人工成本很高,根据毫末的评估,一个人力一天差不多看1000帧左右,假如有5000万帧,全靠人看差不多需要5万个人。二是很多情况下,公司做这个事情都是一些初级的人力,并不是一些高级的研发工程师,培训初级人力去理解和执行标注思想,可行性非常低,几乎无法实现。基于此,毫末的机制是:第一,通过预埋规则的手段,以灰度测试的模式部署在已经投产的自动驾驶系统中,这个车端上的小模型称为 Domain Model,负责一部分感知任务。

(数据偏见讲解图片)

但是这种方式对于感知来说是不完备的,很多潜在的高价值场景被遗漏了。因此毫末在云端部署了更大规模的模型,这个大模型被称为 Fundamental Model,是一个基于 Transformer 的全任务感知大模型,可以超越车端上算力和时效性约束,发现小目标漏检、目标被遮挡和截断、以及在雨天、黑夜、被遮挡的目标漏检问题。

第二,通过对比找到有问题的场景之后,就需要针对这个场景补充足够的样本数据。先以无监督学习方法将图像向量化,转化为特征向量,然后通过谱聚类,可以将相似的图像聚类在一起。得到聚类结果以后,对于问题场景我们会找到大量其同一类别的相关数据作为正样本,相似易混的其他类别数据作为负样本。并且在类别当中只挑选类中心和类边界附近的数据出来提升标注效率。以这种方式还可以非常有效的将异源数据以合适的方式混用起来,提升最终模型的效果,解决数据偏见等问题。毫末是中国第一个大规模投入Transformer架构的公司,Transformer不仅能处理各类视觉检测任务、各类分割任务、3D点云的检测任务和分割,提升后续的规划和控制的相关技术,还能有效利用海量数据进行无监督的预训练。众所周知,在自动驾驶领域,特斯拉也使用了Transformer技术,与CNN模型相比,在处理海量数据和复杂场景情况下,Transformer的优势明显。Transformer技术的进一步应用,不仅为毫末智行在各条自动驾驶产品线上的视觉算法落地带来成倍的效率提升,还能够让各项视觉性能指标快速达到业内领先水平,这是毫末构建坚实技术壁垒的核心技术之一。

3. AI训练当有了自动诊断所需要的大模型、需要快速迭代的车端模型,特别是有了更多的数据后,新的问题又出现了。在大模型时代,巨量的模型参数给模型训练带来很大的难度。在当前主流配置的服务器上,用数据并行方式训练所花的时间是近百个小时。也就是说,如果工程师稍微改一下网络结构、参数配置、或者是更换数据,迭代一次,看到结果的周期是近百个小时。但这些操作又是会频繁发生的,所以如果只是这样就严重拖慢创新速度。为了提升训练速度,毫末除了采用常见的数据并行之外,还采用了数据和模型同时并行的混合方案。将模型横向拆分,将不同层对应的 block 组,拆分到不同显卡的显存中,腾出空间存放更大的 batch size 对应的向量组。除了并行之外,毫末还优化模型前向计算、后向传播过程中、中间结果的显存占⽤,包括Optimizer States, Gradients Parameters等,一般可以减少20%-30%的整体显存占用量。这样带来的整体效果是,训练提速 50%-80%,由此带来迭代创新速度的大幅提升。4. 系统测试更快迭代模型后,接着是如何能够更快速的对新模型进行测试验证的问题。仿真作为模型验证的主要方法,面临很多挑战,第一是测试人员配置仿真场景费时费力,做了很多随意化和重复工作,效率不高。比如按照传统常规的方法,要仿一种有车要切入车道的场景,需要对道路、车辆参数、障碍物等等大量对象进行编辑,编辑出来一个场景再去运营。这样一个人一天也就能编辑30个,积累很慢。而且人编辑出来的场景,由于个体差异有很多自由发挥空间,最终结果和真实世界区别比较大。毫末开发了语义场景的自动化转化工具和参数泛化工具,可以将 CSS 中场景库的描述文本,自动转化为仿真测试场景,并且在合适的范围内离散采样得到巨量的仿真测试用例,在这个场景里面再去运行和回归程序。

(毫末智行数据闭环图片)

按照这种做法,目前公司每天能够构建14000多个场景,不但效率远高于人工,最重要的是——场景的真实度有了保障。

生态架构机:全面安全

毫末在安全方面有哪些独到之处呢?除了传统汽车的硬件安全冗余外,红色星际归纳成3点:

1. 适应中国国情的CSS算法中国道路的复杂程度,对任何一个自动驾驶公司都是巨大的挑战,技术领先如特斯拉,对城市级自动驾驶非常有信心,在中国十字路口基本上正常通过率20%不到,也就是说,10个红绿灯或者路口特斯拉能走2个就很不错了。针对中国特色交通状况的不确定性,通过知识图谱的方式,毫末开发了原创的认知算法——CSS(协同安全敏感模型),定义了最适合中国国情的自动驾驶场景策略,在同样的感知下,不仅仅能够遵守规则,更能够提前规避其他交通参与者带来的安全风险,进而让自动驾驶系统做到更安全。据悉,通过大数据,毫末已经积累了数万个场景,覆盖自动驾驶过程中“高速主路-城市开放路-城市快速路-上下匝道-路口”全路段行驶,在不同的交通场景下,均能执行可靠的自动驾驶策略动作,从而实现如行人礼让,大车同行避让,自动变道等方面的智能化场景处理。并且支持后续根据不同影响维度(如个人喜好习惯)来调整策略参数。

2. 全面安全毫末智行CEO顾维灏认为,安全是自动驾驶企业的DNA,在产品开发的每个环节,都要作为最重要的底层逻辑来实现。在设计阶段就要明确系统的运行场景,通过功能降级、用户参与,来提升系统的安全性。这种完全是以预防为主的叫做预期功能安全。在研发实现上,毫末积累了 3S 研发流程,在 6 个环节内设置 70多个检查点,保障能够实现安全设计。以毫末将要推出的 ICU3.0 上的功能安全架构为例:第一层监控在AI芯片上的软件功能是否正常;

第二层在一个高可靠芯片上监控AI芯片是否工作正常;

第三层在另外一个独立热备的控制器上监控主控制是否工作正常。车规级的三级保障系统可以最大程度保障车辆安全。最后,如何保障CSS的一致性?毫末在安全设计上实践双推理的系统。发挥深度学习速度快、泛化性强、可以找到更多解的优点,规避其可解释性弱的缺点,用符号推理系统进行校验,以此来保障CSS的一致性。3. 硬件升级如何让车更安全?看得更清更远的传感设备、更聪明的大脑是必备条件。目前汽车主流的摄像头在100万像素左右,毫末今年将开始使用 200 万像素摄像头,明年中期会与长城Sop800万像素的产品,视觉性能的提升将极大提升感知的安全系数。车端摄像数量增加、单个摄像头像素增加,都意味着数据量的剧增,对车载芯片算力需求也大大增加。为了支撑大量的感知推理计算,长城汽车、毫末智行将联合高通推出目前全球算力最高的可量产自动驾驶计算平台 ICU 3.0(“小魔盒 3.0”),平台单板算力达360TOPS,可持续升级到 1440TOPS,堪称算力怪兽。

(毫末智行董事长张凯讲解大算力平台)

ICU 3.0支持 6 路千兆以太网,数据传输能力达到 6Gbps;接入 12 路 8 百万像素摄像头,5 路毫米波雷达,3 路激光雷达,为多视觉+多毫米波+多激光雷达的前融合感知算法,完全可满足当前L3以及后续L4/L5等全场景自动驾驶功能的实现。据悉,ICU 3.0计划于2022年正式发布,目前已完成控制器设计、打板、软件 Bringup,底层 BSP 驱动等诸多开发工作。正如顾维灏所言,自动驾驶的安全是个系统工程。安全设计、产品能力、用户的正确使用、政策的指引缺一不可。

生态保障机:稳定量产

L5是所有自动驾驶公司的终极目标,业界历来存在渐进式发展与一步到位发展路线之争。毫末选择的是渐进式发展路线。张凯认为,渐进式商业化路线的落地过程可分为三个阶段:第一个阶段是自动驾驶能力的实现。这个阶段,大多数创业公司都已经实现了。第二个阶段是自动驾驶系统的规模化部署。只有将自动驾驶系统大规模的部署到车上,投入市场,才能弄清楚市场真正的需求,才能验证产品的市场竞争力。2022年,对于一个在自动驾驶赛道创业的公司而言,如果没能够解决自动驾驶规模化部署问题,将是一件非常致命的事,因为自动驾驶规模化部署的程度和收集数据的规模,与解决长尾问题的速度直接相关。而要实现规模化部署,主机厂与智能驾驶解决方案供应商之间的联系势必会变得越发紧密。横亘在Demo与量产之间的其中一道障碍,就是技术的工程化能力。

(毫末智行董事长张凯讲解自动驾驶路径)

第三个阶段是自动驾驶能力的逐步完善。自动驾驶取代人类驾驶员需要一个漫长过程,在这个过程中需要不断的积累数据,挖掘数据来打磨技术,而数据积累的成本和质量直接决定这个过程的周期。1. 技术工程化能力毫末智行的优势之一,就是将技术转变成工程化的能力。脱胎于长城,研发团队汇集众多十年以上经验的汽车研发工程师,同时可以得到长城汽车所有的车型平台和零部件资源支持。张凯介绍,自动驾驶能力的实现仅仅做到了三分之一的工作,大量的时间和精力要花费在解决技术工程化的问题。技术工程化的过程中,经验非常重要,他举了个例子:“我们经常听到功能安全ASIL等级这个词,很抽象,很难理解,ASIL等级ABCD都是统计学算出来说的,很深奥。我给大家总结一下其背后的逻辑,帮助理解:所谓ASILA简单理解就是具备了故障监控及实时诊断能力,ASILB简单说就是ASILA+全量数据的实时监控及处理能力,ASILC从工程实施角度就是ASILB+锁步能力,ASILD就是ASILC+全功能冗余能力,这就是技术工程化的基础。”毫末将技术工程化能力分解为车端工程化、云端工程化和交互工程化。车端工程化包含了实时数据监控、故障诊断、任务实时性调度等数十项工作内容。交互工程化上,目前毫末在WEY品牌摩卡上设计了大量的与自动驾驶相关的语言交互、人机交互、基于事件、位置的交互等,从而使驾乘人员能够更深刻的理解自动驾驶系统运行状态,增加驾乘人员的预期安全感。AI自动驾驶需要数据的云端工程化做支撑,这个工作也是个慢工出细活的过程。

2. 稳定订单技能工程化能力只是形成稳定量产的第一步,要形成商业闭环和正循环生态,还需要有稳定订单的加持。毫末目前订单来源于两个方向,第一个是高级别辅助驾驶和自动驾驶领域。这一领域具有广阔的市场空间,按照保守测算,到2025年高级别自动驾驶渗透率大约43%(中金),激进预测渗透率超过80%(国盛证券)。长城作为毫末最大的客户兼投资者,连续数年销量百万,2025公布的战略要卖400万辆车,提供了足够稳定和量大的订单来源。据悉,毫末智行2022年承担长城汽车34款待上市车型高级别辅助驾驶开发任务,占长城汽车全年待上市车型接近80%,这些车型中30%是标配,其余均是高配搭载。第二个订单方向是低速系列产品。毫末认为,无人配送的商业化进程遵循“自动驾驶三定律”:从低速到高速,从载物到载人,从商用到民用,低速、载物、商用的无人驾驶产品会最早被商业化。利用强大的汽车+AI研发能力,毫末快速构建了低速领域的完整产品和服务体系,并在保定建设了全球首个专为L4级低速无人车打造的柔性制造基地,快速衔接订单,完成了商业落地。针对美团、阿里这些具备一定整车自研设计能力、生产环节薄弱的客户,毫末推出 FAAS 工厂制造服务。为客户提供前置产能,加速其生产组装的效率,解决设计方案落地。

(毫末智行合作伙伴图片)

无人物流是一个几万亿的市场,美团和阿里投入意愿长期且强烈,目前毫末与两家建立了独家合作伙伴关系,订单明确,在低速领域抢占了先机。针对物流、零售、商超等有最后3-5公里末端配送痛点的公司,毫末提供MAAS(mobility as a service)运力服务。针对物美多点这样有整车和个性化品牌宣传的企业,毫末提供VAAS(vehicle as a service)整车服务 ,可以深度而灵活定制底盘性能、车体外观、运营路线。另外还有IAAS(infrastructure as a service)供应链和硬件服务,向行业开放成熟的供应链管理能力和独家合作代理硬件。对于没有软件能力的合作伙伴,毫末推出了PAAS(platform as a service)系统工具服务,为客户提供覆盖无人车研发、测试、生产全流程的工具链产品。

总结

现阶段毫末智行已经在载人和载物自动驾驶领域有了很深的布局。2020年在WEY品牌摩卡上落地HWA系统,选择了高速公路和城市快速路两个相对简单的场景,实现了快速商业化;此次品牌开放日发布的NOH进一步升级HWA系统,实现了匝道和高速连接道路两个场景的涵盖;明年推出全新的AI辅助驾驶系统,逐步实现城市开放道路高速场景的涵盖,其底层技术层面与已经落地的低速载物产品形成有效连接。

与美团和阿里合作,未来打算推出1万台无人车,同时加强生态的建设。毫末智行到目前为止,已经打通了车规量产,自动驾驶技术和运营数据的全产业链链条。可以看到,毫末智行已经谱写好一副完整的全场景自动驾驶版图,并率先实现了生态正向循环。

-END-

0 阅读:5

红色星际

简介:自动驾驶领域深度报道