中国信息通信研究院车联网与智慧交通研究部主任、中国汽车工程学会理事葛雨明:《智能网联汽车数据赋能与流通发展情况研究》

来源:中国汽车工程学会

2025年5月29日,由中国汽车工程学会汽车大数据应用分会、北京理工大学联合主办的“2025汽车大数据应用产业大会暨中国汽车工程学会汽车大数据应用分会成立大会”在北京亦庄隆重召开。大会以“数智驱动 擎启新章”为主题,聚焦汽车大数据在电动化、智能化、网联化转型中的核心作用。

大会专题报告环节,中国信息通信研究院车联网与智慧交通研究部主任、中国汽车工程学会理事葛雨明以《智能网联汽车数据赋能与流通发展情况研究》为题,展示了智能网联汽车数据可为行业提质增效的重要性,同时介绍了数据在企业内部、跨企业甚至跨行业间赋能的环节与实践,并对我国未来数据流通提出问题与发展建议。

中国信息通信研究院车联网与智慧交通研究部主任、中国汽车工程学会理事葛雨明

以下为演讲回顾:

首先恭喜中国汽车工程学会汽车大数据应用分会正式成立。随着技术的发展我们遇到了很多瓶颈,在做智能网联汽车相关研究时,到底应该怎么促进项目共同开发一些标准接口?后面发现数据是一个非常好的、和标准等同的工具手段,可以让大家协同在一起,有利于解决车路云一体化体系下互联互通的需求。

我的报告分以下几部分:

一、数据流通和交易的需求所在,以及现在政策标准上的进展

二、企业内的交易和企业间的交易有哪些流通的实践案例

三、在数据流通过程当中还存在很多挑战,面临哪些困难和问题,以及下一步的发展建议

随着新能源汽车智能化、网联化,汽车数据量越来越庞大,产生很多位置数据、生产制造数据、感知数据以及路侧数据。怎么和车端数据做到更好的耦合?而且智能网联的发展非常迅速,去年年底统计现在新能源汽车占比已经超过50%,车的联网率也非常高,去年超过84.43%的汽车是联网状态。除此之外,现在车辆每天产生的数据流量也非常大,从行业来看,为什么三家运营商越来越关心汽车物联网卡的销售,因为它每天的ARPU值已经超过人连网的基础数据上传数量,每天收集到10TB以上的数据,尤其是对高阶自动驾驶车辆而言。

从数据价值释放而言,前年我们信通院发布了《车联网白皮书》,当中阐述了在数据释放过程中,有三个阶段价值所在,首先让数据方便企业内部的生产制造,让生产制造环节管理更加便利;第二个阶段也是在企业内,车产生的后市场服务数据反馈到研发、生产制造环节,能够调优,跟后市场服务数据关联在一起。第三个阶段才是现在大家看到最多,但也存在最大挑战性的,怎么在不同企业间促进数据更好利用起来。

这里有两大类:同一类别企业间是否有数据流通,比如碳排放交易数据,是有共同价值为牵引的,我们将来要做数字牌照,要做碳排交易碳量的计算。另外一类,跨行业的企业之间怎么做数据流通和交易,比如路侧做了感知数据,建了很多雷达摄像头,车端也有很多感知数据,路端数据怎么赋能到车端,这就涉及到面向场景,自动驾驶训练怎么去做跨企业之间、跨行业之间的数据交易和流通。

国家十分重视数据的发展,从政策上有“数据要素x”,包括一些标准化的工作,但现在更多是集中在数据安全管理角度,包括数据怎么做接口设计、地理信息采集有更多要求,但并没有非常好的涉及到流通环节。这也是汽车大数据应用分会下一步可以发力的部分,去更好支撑国家政策出台和标准建设。

从数据要素流通来讲,涉及到技术体系,数据空间我认为是当前一个比较有效的工具和手段。我们谈数据流通,数据空间拓展了交易价值或者是流通新的方式。原来理解的数据流通是我一定要把数据给到你才算流通,但给到你之后又涉及到数据归属权问题,很多挑战都在这里。换一个思路,数据流通是为了产生新价值,如果有一种方式,数据不用给到我,但数据处理之后的价值可以给到我,这是数据空间目前探讨的一种新方式。在数据不出自己资源池的情况下,如何统一牵引做到数据价值流通,从数据流通本身拓展到数据价值怎么做到更好的流通和交易。

国际上对数据空间的探讨比较早,像最早的GAIA-X计划,之后做了Catena-X,也是在IDSA的统一框架指导下,现在主要解决的还是汽车领域,虽然涉及到了不同企业主体,但是有一个统一的牵引。除此之外,日本也在做Quranos生态系统建设。在数据流通过程中需要从企业的生产制造全链条,重点建设碳足迹的排放,相关的流通和交易,或者供应链效率提升和管理等场景。

我国把数据空间作为重要的发展底座,促进不同行业领域的数据流通,数据空间建设提出了明确的发展目标,到2028年构建100个以上可信数据空间,这里不仅涉及到企业数据空间、行业数据空间、城市数据空间,也包括我们个人的或者说跨境数据空间构建。我相信在座的很多企业,无论是从解决方案提供者来讲,还是从数据本身的所有者来讲,都去申请过可信数据空间的一些试点项目。

除此之外,国家数据局发布“数据要素x”的时候,提到要逐渐加强数据要素能够赋能智能网联汽车、智能交通领域,其中也提到了三个重点方向,一个是生产制造环节的打通;第二是与其他共性数据集之间的互动,比如红绿灯数据上车这个应用场景;第三是提到了面向未来车路协同环境下,自动驾驶训练如何更好地促进企业间的数据流通。很多行业机构也在做数据空间相关的探讨,促进跟保险行业的数据打通,包括中汽协也提出了六大应用场景,启动了汽车行业可信数据空间构建。像北汽等很多汽车厂商也在做相关探讨性工作。

大家可能还会比较困惑,我们的数据究竟用于哪,怎么用起来?流通一定是以应用需求为牵引的,我们梳理了一些案例,有“数据要素x”大赛期间企业申报的案例,有一些是已经成熟落地的,有一些是我们重点推的方向。

我们梳理的时候分为产品研发环节、生产制造环节和后市场服务环节。从企业内部来讲,最容易推动的是研发环节、生产制造环节,再是后市场服务环节。但是在企业调研的时候会发现,是后市场服务环节先有了成熟的应用案例,最难的是反而研发设计环节。

之前有一家企业跟我谈,现在越来越多通过语音唤醒去开车窗,那是不是以后就可以把车窗的物理按键给取消掉,这就是数据在全链条打通之后的一些价值所在。包括底盘动力性能的优化,也有很多企业在做,我们以后在过行车路线的时候,做到底盘的一些调整,甚至能够通过车和车之间的数据共享,让后续的车在走到某个环节时,能够先去做一个底盘自适应调整。包括自动驾驶训练数据,通过我们采集到的数据做差值、做取样,更好地做虚拟场景设计,加快我们自动驾驶训练。

在生产制造环节数据赋能主要用于提升生产制造效率,包括质量评估体系建设、制造工艺改进,也包括供应链管理。当时写“数据要素x”的时候也跟很多车企做调研,为什么把供应链管理又提出来?是有一个新的需求所在,就是现在越来越多供应链环节的产品变成了软件服务产品,它会存在一些不同版本,以前一个硬件设备有一个FID标识就可以,但是现在不同版本在管理时存在一个零部件固件进行了升级,但是整个集成设备没有升级,或者设备升级的时候某个固件没有升级到对应的版本,都会对未来产品产生一些影响,所以去做供应链管理的时候也需要去做一些基于数据的软件化,或者面向软件去做供应链新管理方式的建设。

在后市场服务,我们的精准营销、售后维保,包括我们在高德上能体验到基于大数据的红绿灯的提醒,这都是后市场服务当中,使用到不同车况、不同驾驶习惯数据,开展的一些精准化营销和面向用户驾驶服务能力上一些升级的体验。

对于跨车企之间或者企业之间,甚至不只是车企,有可能跟路侧、跟建设运营主体之间的数据流通,我们也从三个维度去划分,第一个维度就是生产制造环节,为什么会有GAIA-X?因为是欧盟整个法案在讨论,未来数字牌照、电子护照的工作,GAIA-X提供了新的数据底座,它的工作原理并不是所有的数据都要给到供应商,或者说统一有一个平台才可以去做交易,或者说基于平台再去计算碳排放或者碳足迹,而是有点像每家企业都相当于一个智能化终端,有一个应用软件是大家都愿意去安装的,那就在不同的企业内部都安装这样一个比如碳足迹计算软件,通过这个软件计算碳交易的情况上传到平台,我们取证或者取信它作为企业生产流通或者整个供应链环节所产生的碳的情况,它很多数据进行上传是完全不同的,可能是分布式计算的方法,但首先要明确我们产业链的名录,也明确我们的机制怎么计算碳足迹当量。国际上,现在GAIA-X跟日本的Quranos也做了互认工作,国内也在推动相关的工作,中汽中心也牵头在做碳足迹排放的一些平台,包括后续会有一些分布式的机制,或者跟国际上去做可信数据空间一些对接的机制。

在后市场服务环节包括金融保险,像现在用到新能源汽车的轨迹数据去做生成,去做保险定价都有很多应用场景,包括存证工作也很有价值,之前自动驾驶车出现事故之后,到底是车的问题还是驾驶员主动接入的问题,我们有了存证手段,基于隐私计算,基于分布式平台,或者是取证上传,可以方便于我们后续保险服务,也有利于企业和用户之间责任主体的界定。

最后是产品研发环节,企业之间想把这些数据用出来是非常困难的,我们跟很多车企去谈自动驾驶,大家是不是能有共享数据交易或者数据流通机制,共同来建面向自动驾驶训练场景库。大家会说买我这些数据是可以的,但让我把这些数据给出去是很困难一件事情,因为每一个自动驾驶数据集都相当于自己的生产要素。除此之外我们要讨论怎么样在公共机制下能够让大家愿意把这些数据分享出来,现在既然做的是车路云一体化体系架构,路侧产生感知数据,让路侧数据赋能车端做一些训练,或者做仿真场景设计。如果做直接控制类端到端模型上车路一体化很难,但路侧采到的数据转到车的视角做感知训练,以及用于仿真场景的规则训练还是有价值所在的。

关于数据流通本身存在的困难和挑战,以及适用于智能网联汽车领域要解决的问题。从整体来看,我们认为数据流通还存在政策不完善以及流通技术体系尚不成熟两个大的挑战。比如数据既然是生产要素,要不要对数据进行确权和定价,有了价值更方便流通和交易。但有些学者认为数据本身不具备定价权,因为它本身没有非常明确的归属权问题,我们还没有建立这样的体系,数据不存在交易,只存在流通。不同的发展方向,未来需要政策指引上不断完善。

当前,数据流通仍然存在数据归属权不清晰,接口不规范,数据合规机制不健全等等挑战。希望后续探讨过程当中能够对相关问题予以指引和借鉴。在智能网联汽车领域,希望进一步加快数据相关标准制定和接口制定,推动跨企业之间数据的互联互通,构建兼容的数据协同生态体系,更好地为将来智能网联汽车新产品设计提供必要的支持。

从数据流通技术体系上讲,小片量或者小体量数据流通大家讨论很多了,比如区块链的、核心计算的、隐私计算的、可信执行环境等等非常多,但是真正到了智能汽车领域,它有它的价值或者新的特征所在,比如自动驾驶训练数据是大维度、大尺度的数据,数据体量非常大,现有的隐私计算方法并不一定能够适用我们现在计算模式,我们也不可能把所有的数据都灌到隐私计算可执行的环境当中,围绕智能网联汽车的数据开发,尤其面向自动驾驶场景多模态数据,如何推动形成解决方案,仍然是行业内的空白。

从智能网联汽车数据价值释放角度讲,我们也提出三方面考虑,第一个是数据赋能的广度和深度的问题,我们认为急需构建能够覆盖汽车研产供销服多个环节的技术体系和赋能价值研发体系。

第二个,我们认为企业推动数据流通的意愿是不足的,大家对于数据没有价值的情况下或者收益不足的情况下,怎么考虑让大家有意愿把数据开放共享出来,需要完善归属权权益设定,建立相关可行数据空间体系,构建流通机制,也能够让企业在做数据流通和交易过程当中有获得感,这些获得感并不一定是经济价值,也可能是社会效益的体现。

最后,不同主体之间的数据需求是差异化的,即使面向统一一个应用场景下,我们在设计的时候都存在不同的模型考虑、性能指标的考虑以及数据格式的界定,需要建立相关的统一要素名录,标准化数据模型,支持开展企业间的对接,能推动多主体之间,协同共建数据开放的未来共享体系。

以上是信通院牵头工作的探讨和实践,欢迎大家进行指导,谢谢。