2024年7月11-13日,2024中国汽车论坛在上海嘉定举办。本届论坛以“引领新变革,共赢新未来”为主题,由“闭门峰会、大会论坛、10多场主题论坛、9场重磅发布、主题参观活动”等多场会议和若干配套活动构成,各场会议围绕汽车行业热点重点话题,探索方向,引领未来。其中,在7月12日下午举办的“主题论坛四:数据链动汽车,智能驶向未来”上,中国汽车工业协会技术部总监、众链科技(北京)有限公司首席执行官韩昭发表精彩演讲。以下内容为现场演讲实录:
尊敬的各位领导、各位同仁,大家下午好!
很荣幸今天站在这里跟大家分享一下我们协会在整个数据产业生态方面建设的探索。
一、产业背景
从去年开始,整个全球和中国新能源汽车产业在呈现良好的发展势头,产销在持续地增长,尤其去年,全球的新能源汽车产量达到1400万辆,中国首次突破了950万辆,渗透率超过了30%,可以说整个新能源汽车产销发展进入了全新的阶段。今年上半年以来除了产销两旺,新能源汽车增长率产销突破了30%,市场占有率达到了35%。
在整个出海上,新能源汽车也有着非常明显的优势,今年上半年出海新能源汽车占比达到了60万辆,比去年增长了13%,在欧洲、南美已经有了一些很好的量,相比去年有很好的增长,证明了我们产品的竞争力在不断增强。
其实整个上半场的电动化成效非常明显,下半场在智能电动汽车赛道上,更多在下半场靠智能化一决胜负,因为智能网联汽车集成了先进的传感器、控制器,通过多元融合的技术完成人、车、路、云信息交换。5G、大数据、AI技术如何推动发展?可以看到左下角的“微笑曲线”,现在越来越陡峭,传统的单车制造利润在逐渐降低,随着软件定义汽车的到来,在前端的智能部件供应商和后续基于生态整个软件带来的盈利占比不断在增加,这是为什么现在很多主机厂在转型做出行服务公司、做科技公司(的原因),后续大家都在盯着赚这笔钱。车上的架构占比,硬件的、软件的,现在也在不断提升。
全球来说,可以看到在新能源渗透率上,在去年一年搭载L2级及以上的辅助驾驶功能已经超过了50%,低阶智驾国内新能源汽车上已经是标配了,高端智驾在20万以上的车也是标配。数据驱动下智能网联汽车持续的迭代进化已经成为企业竞争的焦点,同时可以看到全球各个主要的市场,像美国、日本也在不断推出自己相应的法规,还有德国,包括中国准入的试点,车路云一体化的试点不断加码给企业更好的空间,做智能化汽车相关的工作。
智能化有两方面工作,智能驾驶和智能座舱。今年比较内卷情况下,可能在主机厂产品上表现差异最明显的就是智驾NOA功能,各个车企都在不断推出自己的NOA,随着技术路线不断地迭代和演进,基本上各个企业都处于NOA 2024年快速进展,基本上每个头部企业和供应商都在不断开城、上线城市NOA,不断推广相应的城市,这是我们整理的一些主要企业的路线。
从整个技术路线来说,为什么现在说能够更快地推进呢?整个技术路线不断改变,2019年之前是规则驱动,Rule base的这种方式,我们可能到每个城市去采集图,开放高阶的智驾功能需要做大量的工作,包括要结合很多高精度地图。到2019年之后特斯拉率先提出了基于数据驱动的渐进式路线,基于把自动驾驶的数据收集和汽车量产相结合,更好地以相对低成本的数据采集方案完成数据的回传,包括形成数据的闭环,这确实比国内企业要早很多。这两年随着ChatGPT大模型的火爆,可以看到国内主机厂也在普遍采用BEV+Transformer的方式做特征融合。规则驱动向数据驱动的转变,使得整个效率、能力在得到提升,最关键我们对数据的依赖也会变得越来越多。
之前说规则驱动,每个主机厂自动驾驶的算法都在百万行的代码,数据驱动可能只需要一万多行,它带来更多可能是对数据的依赖,和对算力、显卡的依赖,更多是偏向通用人工智能的转向方式。
大模型,不光在自动驾驶智驾上端到端大模型,包括座舱上,AI大模型在助力自动驾驶、人机交互,主要的主机厂都在把自己的AI大模型产品逐渐应用到自己的汽车产品中,当前随着消费者对个性化需求越来越强,大模型也逐步在上车,这是目前来看几家主要的大模型上车的情况。左侧其实是我们梳理的关于特斯拉整个Autopilot 不断地迭代,导致端到端和FSD在当前端到端算法上还是比较先进的。
像之前所说的,整个自动驾驶本质是AI的问题,AI的三要素是数据、算法和算力,大量海量的数据和算力支撑投喂出优秀的算法。现在国内的企业来看在这方面还是落后于国外的先进企业,数据体量严重不足,整个自动驾驶的核心数据积累,包括数据获取成本偏高,这些都是目前产业面临的一些问题。
二、数据生态建设的挑战
随着这些年政策不断发出,可以看到过去三年随着《数安法》《个保法》《网络安全法》《数据安全若干规定》的推出,数据应用领域越发趋严,之前也有领导讲到,数据不仅仅作为企业研发而用,自动驾驶数据关系到公共安全、国家安全,乃至个人隐私保护等相关的问题。所以在过去三年更多对数据的监管提出了更强的数据安全监管的要求,同步在去年开始,当监管相应的政策推出之后,我们也在推动更多数据的应用领域,确保红线情况下更多去推动应用。包括像数据局的成立,“数据要素×三年行动计划”的发布,相关“数字中国”政策的提出,主机厂的这些领导,全国人大代表雷军在2024两会人大代表建议案中提出了智能网联汽车数据确权、共享交易,对于数据要素市场、数据生态有非常重要的意义。
从整个自动驾驶的数据来说,面临更大的挑战还是几点:企业数据孤岛,交互性不够。数据安全对我们有更多限制和要求。整体上数据体量不足。如何把数据变现,如何更好地利用数据,这些方面都是我们面临的挑战。
反观之前提到的特斯拉。这是特斯拉的产销量和市值的对比,销量在去年其实并不高,单一车型还算比较高,整体上和几家传统的巨头比销量并不高。但是我们看到市值,这应该是上个月的估值,估值明显比其他几家高很多,估值原理不一样,完全按照一家科技公司估值。
再一个,随着发展,数据确权到底如何来明确?如何通过标准化的格式来保证整个数据的统一?当然现在完全说统一,在智驾来说还是有难度,因为不同的车型传感器布局都不一样,包括SUV车型和轿车高度就不一样,所以本身收集的东西天然有差异。如何明确数据的标准,如何明确整个数据的权属,通过数据的处理提升相应的价值,包括如何确保数据的安全性和数据的合规性。甚至在确保这些的前提下如何能够有效形成数据交互,都是当前数据生态建设所面临的一些挑战。
三、数据生态建设的探索与实践
基于此,汇报一下协会在这方面所做的探索。
首先,从安全的角度。要推动整个数据生态的聚合,建立共享、共用。首先要确保数据足够安全。从2022年起协会在支撑相关主管部门做数据安全的试点工作,陆续对整个行业的数据收集情况进行排查,确保所有的产业数据合规,在保证合规基础上再去推动整个产业数据生态的应用。合规不具体展开,主要落实相关的管理规定和部门规章。
第二,应用。部门在数据应用方面做了很多的探索,建立了数据交互的平台,发布了开源数据集,为了拓展数据资源,除了车端车辆数据少。但是中国有大量的路,搞车路云一体化,路侧那么多数据如何应用给车端,赋能给主机厂做研发,如何提升数据的源头?从源头上给我们增加供给?这是我们一直在推动的事情。
数据交互平台,协会2020年联合几家头部企业,蔚来、博世等成立了众链科技公司,专门做整个数据交互平台的运营方,同步也在和相关的企事业单位,相关的合作伙伴,去年办了首届数据要素流通的峰会,今年也在积极准备筹备“数据要素X汽车交通领域”的比赛,可能在下半年也会正式发布。我们也在和苏州的智行众维共同来做了珊瑚数据的开源计划,包括这里有整个仿真测试场景的开源、训练场景的开源、训练数据的开源、路侧数据的开源。包括今天在隔壁的分论坛,智能网联汽车论坛上也会有专门开源数据的发布。
众链是联合几个行业头部企业做的数据交互运营机构,众链科技主要立足汽车产业,主要在做数据交互、数据存证以及新能源资产数字化的服务,通过推动产业数据空间的建设着力提升整个数据的交互效率,降低成本、增加体验,同时支持提高政府的产业治理能力,助力公平、公正、开放的数据合作生态,这是我们相关的生态合作伙伴。
现在数据平台上更多在做的是整个自动驾驶相关的数据,因为这也是现在最急需,所有人在搞端到端,在搞大模型,但是大家没有数据,在平台上大家把数据交互起来,大家都用起来。包括图像和视频的数据,所有都是脱敏后的,绝对符合数安监管要求的,有智驾仿真场景数据、有传感器数据,有相关的结构化数据和非结构化数据,包括车路云一体化多元的数据仿真场景和整个车的全量数据,我们也有相应的标准,这个全量数据其实就是智能网联汽车数据格式和定义的团体标准,是2022年发布的;多元仿真数据场景,也是刚才数据分会领导介绍提到做了三个标准,其实现在也都在公开征求意见。
这是交互平台的技术路径,搭了一条区块链,把相关所有的交易方,包括一些中立方搭了一条联盟链做一个节点,大家在这上面是互斥的过程,保证首先利用圈内技术,加智能合约,加隐私计算,保证平台不碰数据,所有人把数据标签放在链条上,通过线上智能合约的调度、交易完成之后,数据自动由双方点对点完成线下的交割。
这是整个仿真场景库相关的数据,主要是路侧的,像刚才说的,国内单车收集数据量并不够,但是在路侧交通流的数据,路侧全息智慧路口有很多,而且在不断建设。如何把这种路口的数据通过转换变成车端可应用的数据,这是当前探索的方向。当前在苏州的高铁新城和上海的国际汽车城两个地方已经完成了初步数据的转换,同时,像在苏州也形成了平台上的交易,把这些数据已经给到国内的一些主机厂来做研发。
接下来介绍一下数据存证,存证也是为智能驾驶保驾护航的功能,从大概三年前某车企刹车事件,到底是人做的还是机器在操作?如何帮助企业自证清白?我们想到通过存证方式,第三方完全中立的平台来保证它的数据有没有被篡改,当它有任何的触发在我这同步一个Hash做数据存证,已经有一些体验接入了,2024年到现在已经有超过100万辆车进行存证,存证量超过300亿条。
后续更多对于和保险的合作,本身的几个功能:原始数据存证、数据的核验、检测任务和相应的申诉环节的打通,我们已经完成了整个全部平台的开发,并且已经在实际应用了。这是我们和整个保险应用的结合。在未来当你开启智驾功能的时候,如何确认责任?正常开启智驾如果出了问题,应该L3以上的车由主机厂(车辆方)承担责任,人为驾驶是由人来承担责任,对应走不同的保险。比如说人在走个人的商业保险,主机厂可能是走产品责任险,是完全不一样相应的险种。基于我们平台,保证任何时候发生事故的时候第一时间可以确认到底有没有开启相关的智驾功能,也就是责任到底是谁的?我们和主机厂,包括我们和保司,相关保险机构也做了一些合作。
可以看到,在去年的时候,在中国汽车论坛上发布了智能网联汽车存证平台与保险应用案例。今年4月份和上海汽检,包括和吉利正式完成了整个数据的跑通,智能网联汽车数据驱动事故分析与保险理赔的服务方案,完成了实车验证的工作,后续也会有相应的发布。
这是整个基于数据存证对于新能源资产化的服务,包括充电场站,包括新能源汽车电池,整体上因为我们的技术做一些资产的管理,数字化金融的服务,这是去年在中国充换电生态大会上和北汽蓝谷共同做了一款北京出租车换电绿色债券的启动,通过场站接入平台,确保数据真实不造假,帮它做绿色债券的发行工作。
四、数据生态建设发展倡议
积极响应国家的号召,所有的企业应该加强对数据管理制度的建设,提升数据安全意识和防护水平,确保整个数据处理环节的合规。同时要更积极地去加入这种数据的共享,包括推动开源的项目和数据共享平台,来解决整个数据孤岛和体量不足的问题,通过协同共享和技术创新,帮助智能网联汽车新质生产力注入新动能,释放数据价值资源。另外有交互,做平台肯定要有标准,希望各相关的企业、研究机构和组织,我们共同来制定整合推广整个产业包括交互、安全、数据产品相关的标准,通过标准形成统一互认,促进不同品牌、不同平台之间的共享与交互,来提升数据要素的利用效率。促进跨行业协作构建整个产业数据的新生态,就像现在讲得比较热的构建整个智能网联汽车产业数据空间。
我的分享就这些,谢谢大家!
(注:本文根据现场速记整理,未经演讲嘉宾审阅)