陆志鹏
中国电子信息产业集团有限公司
摘要:数据要素市场的建立遵循传统生产要素市场化配置的一般规律,但是存在标的物不明确、定价和交易机制不健全等难题。通过细分数据要素市场,构建了面向不同标的物的数据要素三级市场体系,并进一步分析了影响数据价值释放的主导因素。通过对市场主体开展成本收益分析,建立了数据要素市场的经济性分析模型,并结合地方实践案例,印证了数据要素三级市场的经济性优势。
关键词: 数据要素市场 ; 数据交易 ; 经济性分析
论文引用格式:
陆志鹏. 数据要素三级市场经济性分析模型研究[J]. 大数据, 2022, 8(4): 85-93.
LU Z P. Research on the economic analytical model of three-tier data factor market[J]. Big Data Research, 2022, 8(4): 85-93.
当前,数字经济蓬勃发展,数据在经济社会中的关键作用已逐渐成为各界的共识。为了充分释放数据要素的价值、发挥数据在经济社会发展中的基础性和支撑性作用,国家相继颁布了一系列宏观指导文件,将数据正式纳入主要生产要素范畴。其中,《关于新时代加快完善社会主义市场经济体制的意见》明确提出“加快培育发展数据要素市场,建立数据资源清单管理机制,完善数据权属界定、开放共享、交易流通等标准和措施,发挥社会数据资源价值”,《要素市场化配置综合改革试点总体方案》提出要“在数据要素市场化配置基础制度建设探索上取得积极进展”。这些重要文件的出台意味着加快培育发展数据要素市场已经成为社会主义市场经济体制下要素市场化改革的重要组成部分。
数据市场建设是数据要素市场化配置的关键步骤,数据交易平台建设是构建数据要素市场的重要基础。2020年,数据交易所(中心)逐步迈入第二轮建设爆发期,据不完全统计,全国各地已陆续建成超过30个大数据交易所(中心)。数据交易所(中心)的运营主体主要是地方合资公司,大多面向政府、企业、金融以及科研机构等用户提供“粗加工”数据、数据产品及服务,其交易模式以撮合为主,主要盈利模式为佣金分成。但由于定位不清、制度不全、技术不强、分配不当、各自为战等问题,半数以上的数据交易平台业务停滞,整体交易活跃度持续低迷、交易规模小、社会主体参与度严重不足。以贵阳大数据交易所(以下简称贵数所)为例,作为全国首个大数据交易所,贵数所的交易额目标逐年降低,从“日交易额100亿元”逐渐降为“全年力争突破亿元”。自2018年起,贵数所已经不再通过官网等渠道对外公布交易额、交易量等动态,2020年交易额更是低于500万元。其他数据交易所(中心)也面临类似的问题,数据交易已成为数据要素市场建设中的主要难题。可见,当前数据交易市场的结构已无法满足各交易主体的权益和安全保护的现实需求。
传统的生产要素(即土地、劳动力、资本、技术)经历了从“资源”到“要素”再到“流通”的过程,经过多轮次配置的历史演进,已经建立了比较完善的市场体系。对传统四大生产要素市场化的一般过程进行总结提炼发现,它们都包含了原始资源标准化“中间态”-终端产品的三级市场结构:土地资源-熟地-房地产/厂房、劳动资源-劳动证书-生产劳动、货币资源-金融产品-生产资金、科技资源-可见成果-产品/服务。其中,作为具有共识基础的交易标的物,要素“中间态”为实现要素的大规模流通奠定了基础。
总结当前数据交易市场发展的经验教训,结合传统四大生产要素市场化的一般规律以及数据要素的特征,本文引入数据要素流通的“中间态”,将数据要素市场划分成三级结构。通过对三级市场的交易主体、交易标的、定价和交易机制等进行深入剖析,建立数据要素三级市场的经济性分析模型,为加快构建高效运转、自主有序、公平普惠的数据要素市场提供有益探索。
随着数字经济的快速发展和技术的日新月异,数据开始作为产品和服务参与交易。一方面,数据具有海量、分散、隐私、敏感等独有特性,这导致其在市场化配置路径设计中必须引入风险可控的标准数据产品形态,才能实现分散海量的数据资源向多样化应用需求的安全、高效流动;另一方面,只有描述复杂度和资产专用性足够低、交易频率比较高的产品才能在数据交易平台上实现大规模流通,否则数据交易将日益“去平台化”,最终只能长期面向低价值的数据产品展开。因此,本文引入“数据元件”,将其作为实现隐私保护和大规模数据流通交易的“中间态”,将数据要素市场依据不同的交易标的物划分为数据资源-数据元件-数据产品三级市场结构。
数据资源市场是将原始数据作为交易标的物的市场,交易供方为数据持有主体,交易需方为数据运营服务中心。数据运营服务中心是承担原始数据收集任务的非营利性机构,可由政府专门成立或指定。数据资源市场作为强管控市场,采用市场收购、协议交换以及政策激励等方式,从政府部门、企业、社会组织、个人等数据持有主体收集数据。在数据资源市场中,数据持有主体享有数据用益权,通过原始数据的交易,数据持有主体将数据用益权转移至数据运营服务中心。
针对数据资源定价,结合数据资源获取的稀缺性、数据质量等诸多因素,数据资源市场采用以成本法为主、收益法为辅的定价方法。
数据元件市场是将数据元件作为交易标的物的市场,交易供方为数据运营服务中心和数据元件开发商,交易需方为基于数据元件开发应用的应用开发商。由于原始数据在价值评估、加工成本分配、隐私保护等方面存在种种问题和风险,其难以直接进入市场交易,尤其是未经加工清洗的原始数据。数据运营服务中心将一级市场收集的原始数据进行清洗治理,加工成数据资源,并引入元件开发商作为模型提供方,联合开展数据元件的加工,形成兼具安全属性和价值属性的标准化数据元件。作为半开放市场,数据元件市场严格授权数据元件开发商持牌经营。数据运营服务中心和数据元件开发商共同享有数据元件(数据初级产品)的财产权益,通过与数据应用开发商进行数据元件交易获取收益,并将数据元件的财产权益转移至数据应用开发商。数据元件市场采用成本法、市场法相结合的定价方法。
数据产品市场是将数据产品作为交易标的物的市场,交易供方是提供数据产品和服务的数据应用开发商,交易需方是政府、组织、企业、个人等终端用户。数据应用开发商基于购买的数据元件形成数据产品和服务,以点对点的方式与终端用户开展交易活动,从而获取收益。数据应用开发商拥有数据产品和服务的财产权益。与数据元件市场不同,数据产品市场为全开放市场,应全面引培数据应用开发商,以数据产品价值为基础,按照市场规律形成交易价格。
培育数据要素市场的根本目的在于全面释放数据价值,激发数据作为第五生产要素对经济社会的放大、叠加、倍增作用。在数据要素三级市场的不同环节中,影响数据价值释放的主导因素不同。
在数据资源市场中,数据运营服务中心通过数据收集和治理形成的数据资源是三级市场体系中数据价值链的起点。收集的数据规模和治理后的数据质量决定了数据价值的基线。一方面,数据规模的扩大(包含数据量和数据维度的增加,以及多样化的数据形态)能够大大提高数据分析结果的精确度,从而提升数据的使用价值。数据运营服务中心通过面向不同数据持有主体的收集系统可以实现多源数据的汇聚融合,充分发挥数据的规模效应。另一方面,数据质量是评价数据价值的基础。数据采集过程中难免出现错误、缺失、冗余等情况,导致原始数据质量参差不齐。数据运营服务中心通过对收集的原始数据进行清洗和治理,提升数据的准确性、完整性,并解决重复性等问题,实现数据质量的提升,为后续数据的增值性开发利用奠定基础。
在数据元件市场中,数据元件包含的信息价值是影响数据要素流通的关键,数据元件的信息价值越高,数据应用开发商购买使用它的意愿越强,数据价值被释放的可能性就越大。数据元件的信息价值与数据质量、数据规模、信息密度密切相关。经过上一阶段的数据收集和清洗治理,数据质量和数据规模均得到有效保障。在此前提下,数据运营服务中心通过引入数据元件开发商,在不泄露原始数据的前提下对数据进行加工、分析、处理与验证,开发形成高信息密度的数据元件,提升数据元件的使用率,推动数据要素价值释放。
终端用户对数据产品和服务的使用最终实现了数据价值的释放。因此,在数据产品市场中,产品和服务的性能是影响该阶段数据要素价值释放的主要因素。数据应用开发商在充分调研市场需求的基础上,开发具有较高场景适配性的数据应用产品,并及时优化、迭代产品性能,不断拓宽产品的使用范围,提升产品的使用频率,从而实现数据要素价值的全面释放。
在合理定义数据要素三级市场内涵、主客体以及交易规则的基础上,为了进一步剖析数据要素三级市场的运作逻辑,本文通过创新构建经济性分析模型,明确市场主体的成本收益模式,为加快推动数据要素市场化、培育数据要素市场繁荣生态奠定扎实的基础。
假设1:基于数据元件研发的产品与基于原始数据研发的产品成本相等,且不影响产品性能服务,消费者支出不变。
假设2:市场中数据供需双方的数量基本保持不变,且同类单位主体以同质化处理。
假设3:同类市场单位主体持有的数据量相等,数据总量与市场主体呈线性正比例关系。
假设4:三级市场交易达到的“安全交易”效果与传统买方-卖方数据市场相同。
假设5:原始数据处理的数据安全合规成本相等,且不低于非原始数据处理的合规成本。
假设6:数据加工处理成本、元件加工成本相等,基于数据元件的产品服务研发成本和基于数据的产品服务研发成本相等。
成本和收益是支撑市场参与主体开展交易活动的必要条件。在数据要素三级市场中,成本和收益主要聚焦在数据采集存储、加工处理以及流通交易等环节的市场参与主体,模式基本相同、具体构成各具特点。此类市场参与主体主要包括数据持有主体、数据运营服务中心、数据元件开发商,以及数据应用开发商。各类市场主体的成本收益模式基本相同,可概括为利润等于收入减去成本:
其中,R表示市场参与主体的利润,Y表示数据业务的总收入,C表示开展数据业务产生的关联成本。对于不同的数据周期、不同的数据处理主体,C的构成不同,但一般涉及数据安全合规成本、加工处理成本等。
3.3.1 数据供方收益
传统数据要素市场中数据供方的收益结构如下:
其中,R1为数据供方出售数据获得的利润, Y1为数据供方出售数据获得的收入,C1为数据供方持有或形成可供出售的数据资源产生的成本。在数据生产、收集、加工处理直到形成可交易的数据资源的过程中,数据供方需要建设采集、存储、加工处理等设施,这产生了直接成本;同时面临着数据交易后数据被数据需方滥用、泄露、转卖以及非法使用的风险,数据供方需要采取相关措施进行风险规避或者承受潜在的损失,这形成了附加成本。因此,C1主要由两部分构成,即采集处理成本Cm和安全风险规避成本或补偿Cr:
3.3.2 数据需方收益
传统数据要素市场中数 据需方的收益结构为:
其中,R2为数据需方开发形成数据应用获得的利润,Y2为数据需方获得数据并形成数据产品获得的收入,C2为购买数据的支出和数据开发使用产生的成本。数据需方购买数据的支出为Y1,加工处理成本为Cp,数据产品服务研发成本为CF,满足监管要求的安全合规成本为Cs,因此,C2可表示为:
3.3.3 市场整体收益
假设市场 上有M个数据供方以及N个数据需方,整个市场的收益结构如下所示。
(1)社会总收入
其中,表示第i个数据供方的收入,表示第j个数据需方的收入。
(2)社会总成本
(3)社会总利润
在数据需方的采购成本等于数据供方的收入,且不产生漏损情况的假设下,社会总利润为:
3.4.1 数据供方收益
数据供方的收益结构如下:
其中,为数据供方出售数据或者授权数据使用获得的利润,为数据供方将数据出售或授权给数据运营服务中心使用获得的收入,为持有或形成可供出售的数据资源的成本。相比于C1,三级数据要素市场的数据供方出售数据的对象是一个可信任的数据中介,能够规避数据安全风险或补偿Cr,那么中就只含采集处理成本Cm。
3.4.2 数据运营服务中心收益
数据运营服务中心的收益结构如下:
其中,为数据运营服务中心的利润,为数据运营服务中心的收入,包含购买数据的支出、数据元件开发的成本(元件开发本质上是数据运营服务中心对获得的数据进行加工、标准化的过程,可以由自身完成,也可以委托第三方元件开发商完成。元件具体开发形式不是三级市场的核心结构,而是产业和生态建设的内容,为了简化模型,本文不做区分,将元件开发成本统一看作。)运营成本满足监管要求的安全合规成本为。可以表示为:
3.4.3 数据需方收益
数据需方的收益结构如下:
其中,为数据需方通过数据元件开发形成数据应用所获得的利润,为数据需方获得的收入,为购买数据的支出和数据开发所产生的成本。购买数据的支出为,数据加工处理成本为,产品服务研发成本为,满足监管要求的安全合规成本为。可以表示为:
3.4.4 市场整体收益
假设市场上有M个数据供方以及N个数据需方,三级市场中,将数据运营服务中心作为单个整体进行考虑。为了满足相同等级保护的要求,每个数据供方需要付出的运营合规成本相等。
社会总收入:
社会总成本:
社会总利润:
3.5.1 理论分析
要证明三级市场结构具有经济性,只需要证明成立。根据上述假定:首先,数据元件研发的产品与基于原始数据研发的产品不影响产品性能服务,消费者支出不变,即,由此可知,只需要证明传统市场的数据加工和安全合规成本比三级市场的高,则不等式成立。
其次,由于数据元件单次加工成本、数据处理成本相等,设其为。在传统数据要素市场中,从数据交易、加工路径上看,可进一步细化为。基于数据元件的产品服务研发成本和基于数据的产品服务研发成本相等,即与相等,则:
再次,由于 ,原始数据处理的数据安全合规成本相等(都为),且不低于非原始数据处理的合规成本,整合即可得到:
如图1所示,只要(M,N)组合在约束线的上方,就能够成立,即表明三级市场具有经济性。
图1 数据要素三级市场的经济性约束线
因此,满足成立的一个充分条件是,存在这样一个组合(M,N),当成立,即若数据供方的数据损失风险维护和补偿成本高于数据运营服务中心的合规成本和运营成本之和,三级市场就具有经济性。
3.5.2 实践案例
根据FreeBuf发布的《2021国内甲方企业安全建设预算调研报告》初步测算, 2021年企业在数据安全和个人隐私方面的维护成本约为20万元。自2021年5月起,中国电子信息产业集团有限公司与德阳市共同推进数据治理工程建设,已引培数据供应主体6个,数据应用开发主体19个,建有数据运营服务中心1个,引入数据元件开发商2家,在德阳市初步构建起数据要素三级市场。分析近一年来市场运行情况,综合计算得到运营和安全合规成本约为600万元/年,企业平均数据加工处理成本为20万元/年,原始数据加工成本与非原始数据加工成本基本相等。可知:
只要(M,N)的组合在约束线上方,即表明,相比传统的点对点市场,三级市场的结构更优。实践也表明(如图2所示),德阳市数据要素三级市场的,基于数据供方-数据运营服务中心(数据元件开发商)-数据需方的市场结构有更好的经济性表现。
图2 德阳市数据要素三级市场的经济性约束线
要充分发挥数据作为第五大生产要素的作用,实现市场化配置是必经之路。由于数据使用的非竞争性和数据价值的差异性与强外部性,数据流通既遵循生产要素市场化配置的一般规律,也呈现出诸多新特征,生搬硬套已有制度难以解决数据流通中的标的物不明确、定价和交易机制不健全等关键问题。本文根据标的物的不同将数据要素市场划分为数据资源市场、数据元件市场和数据产品市场,明确不同市场标的物的定价规则和交易机制,厘清不同环节影响数据价值释放的主导因素,基于主要市场参与主体的成本收益分析,搭建了数据要素三级市场的经济性分析模型,并通过地方实践案例,证明了三级市场的经济性。
随着数字经济发展进入“加速度”时代,安全高效的数据流通、合法合规的数据交易必将成为各数据密集型行业发展的重要支撑。各地方政府纷纷在强化数据归集融合、推动数据安全流通以及培育壮大数据产业等方面寻求新的突破。本文提出的数据要素三级市场经济性分析模型有望为构建数据要素统一市场、促进数据要素市场与其他传统要素市场规则激励相容、全面释放数据要素价值做出积极贡献。
作者简介
陆志鹏(1964-),男,博士,中国电子信息产业集团有限公司教授级高级工程师、副总经理,主要研究方向为经济管理、现代城市治理、数字经济等。
联系我们:
Tel:010-81055448
010-81055490
010-81055534
E-mail:bdr@bjxintong.com.cn
http://www.infocomm-journal.com/bdr
http://www.j-bigdataresearch.com.cn/
转载、合作:010-81055307
大数据期刊
《大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中国科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,以及信息通信领域高质量科技期刊分级目录、计算领域高质量科技期刊分级目录,并多次被评为国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。
关注《大数据》期刊微信公众号,获取更多内容