您现在的位置是:首页 > 置顶轮播图822*450 >

数据要素 划时代的探索

2024-07-08 10:30:23作者:刘晶来源:中国信息化周报

摘要 ...

  5月底的福州,出人意料的清爽和温润。去年 10月25 日正式挂牌成立的国家数据局就是在这样的天气主办了这场众所瞩目的“第七届数字中国建设峰会”。将数据作为生产要素,是中国的首创,全世界都在看,中国如何推动数据成为生产要素,在生产中发挥作用。对中国的数字经济发展,对国家数据局以及众多从业者来说:这将是一场划时代的探索。

  国家数据局一体化工作体系初步形成

  将数据作为生产要素,是中国的首创,全世界都在看,中国如何推动数据成为生产要素,在生产中发挥作用。

  在5月24日到5月25 日举办的第七届数字中国建设峰会上,来自各省市数据局的人在忙着“认亲”,各省数据局、数据交易所、相关企业聚集在“有福之州”,讨论着跨省、跨域、跨国的数据要素发展前景和合作空间。

  5月24日,国家数据局在福州召开全国数据系统座谈会。国家发展改革委党组成员,国家数据局党组书记、局长刘烈宏出席会议。会议指出,全国数据工作会议以来,全国数据工作蹄疾步稳、有序推进,全国一盘棋意识更加牢固,坚持“一条主线”、统筹“三个建设的工作思路更加清晰明确。

  “一条主线”“统筹三个建设”包括:以数据领域市场化配置改革为主线,统筹推进数字中国建设、数字经济建设、数字社会建设。

  自国家数据局成立以来按照国家的部署,初步形成了推进数字中国建设的思路,谋划实施了一批重点工作任务,搭建起培育数据要素市场、发展数字经济的初步框架。

  据国家数据局相关负责人介绍,国家数据工作体系初步成形,国家数据局挂牌之后,各地因地制宜推进改革。

  一是上下联动、横向协同的数据工作体系基本成形。

  二是数据要素市场化配置改革加快破局,以数据要素市场化配置为主线,加强数据类领域基础制度的建设,推进建设数据产权制度,数据要素流通和交易制度,收益分配制度和数据安全治理等数据领域基础性、顶层性设计的制度规范。同时坚持应用牵引、场景牵引,联合相关部门加大公共数据资源的开发利用,17个部门联合发布 《数据要素x”三年行动计划(2024-2026 年)》,持续推进数据供得出、流得动、用得好、保安全。

  三是研究布局全国一体化算力网和数据流通利用的基础设施,推动数据基础设施建设为数据基础制度落地和数据资源的开发利用提供基础载体,加快数据要素价值释放。同时,促进数据科技创新发展,以真实场景的应用牵引区块链、联邦学习、多方安全计算、隐私计算等技术的进步和实体产业的落地实施。加大数据领域新业态的培育。四是积极开展数据领域的国际合作交流,积极参加国际领域数据规则的谈判,优化数据跨境规则,加强数据领域国际标准规范的制定,开展多双边国际经济交流合作。

  省市积极探索新方法新路径

  “数据具有4大属性,就是它的主权属性、人身属性、公共属性和价值属性。当前探讨得比较多的是数据怎么样实现价值,而数据价值的挖掘过程中,不能对抗前三种属性。要理清楚前三种属性,才能顺畅地谈论第四种屈性,才能发挥数据的价值。海南省大数据管理局局长董学耕认为:“《中华人民共和国个人信息保护法》第四十四条指出,个人对其个人信息的处理享有知情权、决定权,有权限制或者拒绝他人对其个人信息进行处理;法律、行政法规另有规定的除外。这个决定权高于《关于构建数据基础制度更好发挥数据要素作用的意见》(亦称“数据二十条”)中所指出的数据处理者的三权,即持有权、使用权和运营权。”

  聚焦数据要素这一新课题与会嘉宾在会场进行了热烈的讨论,“迸发”出智慧火花。从数据要素的法理建设,数据要素的管理办法,到数据价值的挖掘、高质量数据集的形成,乃至促进数据流通、打通数据交易的卡点,在宽松的氛围中,数据要素被多角度审视。

  数据要素和其他要素不同点就在于有关联对象。由于有关联对象,所以有大量的数据是涉私数据,这些涉私数据要想确权,就得把关联对象的决定权体现在使用前,在使用环节就是“一次授权一次使用”,这意味着涉私数据权属要依赖场景和授权,它需要产品化,所以关键点是数据的产品化。

  董学耕表示,海南根据这样的分析,建立健全了数据要素的一套基础制度体系,其中包括“一条例”“两办法”(《省大数据开发应用条例》《省公共信息资源安全使用管理办法》《省公共数据产品开发利用暂行管理办法》),还包括落实“数据二十条”精神出台的《海南省培育数据要素市场三年行动计划(2024-2026)》。此外,海南还制定了数据产品开发利用的暂行管理办法及配套制度体系。

  目前,海南省数据产品超市运营约两年半时间,数据要素市场初具规模。其中包含了超过1000 亿条的政务数据,超过 1000亿条的社会数据,形成了超过1900个数据产品,吸引了1100多家合作伙伴,数据产品交易额达8亿元。海南在制度层面制定了一系列规则,在细则上制定了20 多个数据产品超市的管理实施细则,包括数据供给、开发生产、交易管理、运营服务、监督管理和安全管理全套制度体系。

  数据产品超市实现了数据的归集共享、开发生产、交易流通和安全保障四位一体架构,从数据的交易平台,转化为一个数据开发利用、安全使用和交易流通的一体化平台。

  依托该平台,海南完成了数据产品的确权。“正因为有关联对象的授权和权益的让渡,从原始数据形成数据产品后,数据产品可以'干干净净’地完成数据的确权,进一步完成资产人表,以及后续的资产化利用。”董学耕表示。

  杭州市数据资源管理局副局长齐同军说:“'数据二十条中第 19 条明确,浙江等地率先试点,所以浙江也当仁不让,要为国家试制度。我们首先制定了《杭州市数据流通交易促进条例》,以立法的方式为数据依法流通打下基础,今年5月1日前我们就这个条例正式公开征求意见,集思广益。条例制定的初衷就是促进数据产业发展,所以所有的条款全是促进的,特别是针对政府部门和企业,分别提出要减负。”

  他举例说,如果要利用卫健部门的数据,对卫健部门来说只有安全责任没有任何利益,所以要为政府部门减负,只要经过集体决策不是个人原因导致失误,都可以容错免责。企业减负,是鼓励企业把数据拿出来,虽然有的企业担心,如果把数据分享出来,会被竞争对手利用,但这可以通过协议或者技术方案、流程保障等方式避免。但有的企业对数据并没有所有权,这些企业自己也不能使用数据,如果拿出来分享就涉及合规问题,对这部分企业,我们也应该制定相应的办法,鼓励数据流通。

  杭州市数据资源管理局还推出了《杭州市关于高标准建设“中国数谷”促进数据要素流通的实施意见(征求意见稿)》,被称为“杭州的数据二十条”。“我们对落地杭州的数据集团公司推出了补贴政策,可以获得一次性补贴。”齐同军说,“杭州希望给出最好的政策环境,最好的服务和保障,提供最好的公共数据授权运营。我们也希望能够实现联合公共数据授权运营,比如在今年年底,扩大到能连接100-~200个城市共同实现。”

  数据如何产生价值

  南方电网是较早做出数据产品的企业,南方电网大数据服务有限公司董事长张志亮说,电网电力的数据往往能“映射”社会经济生产运行的一些特征,电网连接很多生产场所、千家百户,具有较高价值。南方电网数据产品如何定价?“依据贵阳大数据交易所做的数据交易产品价格计算器(这个计算器是在发改委价格监测中心的指导下开发的)进行定价。我们的第一个客户就是南方电网,利用这个计算器,得出了南方电网数据产品的价格(这个价格可能是一个区间值),最终南方电网数据产品在我们API上调用的价格是 8~10 元。我们撮合了南方电网与当地的贵州征信公司的交易,以约8元的价格卖给了征信公司。这个案例为解决数据源担心的定价难问题提供了思路,贵阳大数据交易所提供了一个标准的参考定价,由买卖双方沟通后确定最终价格。”贵阳大数据交易所总经理叶玉婷说。

  作为全国第一家数据交易所,贵阳数据交易所在 2022年4月完成投资重组,两年多时间在数据交易中做了有益的创新和实践。“我们希望能够获得由垂直行业提供的高质量数据集,目前我们和中国气象局在进行合作,气象领域的数据,具有两个特点,一是高质量,二是高标准,而且有很多应用场景,比如南方电网就是气象数据产品的用户我们也在撮合南方电网与气象部门合作。”叶玉婷说。高质量的数据,不仅是数据要素发展的必要资源,也是人工智能发展的必要条件。“中国电信在汇聚数据语料库时,要在语料上提供高质量的数据集。我们发布了 625个高质量数据集,什么是高质量的数据?”叶玉婷认为,“高质量的数据首先是标准化的,其次它要有大量的潜在客户。我们首创的数据稀缺地图,就是根据高质量数据集画出来的,希望能精准匹配到场景和用户上。
 

  数据要素集团—央企发力新战场

  在本届数字中国建设峰会上,一个明显的变化是央企在数据要素上积极建设生态,其中尤以中国电信的动作最为快捷,而在整个数据类行业中,三大运营商、金融、能源等央企都具备成为数据要素集团的潜力。

  中国电信集团数据发展中心副主任张鑫表示,中国电信推进数据要素市场化、打造数据基础设施,主要分三个阶段,第一个阶段是从0到10的阶段,以数据登记确权为切入,在海南中国电信打造了全国首个政府加市场双轮驱动的全栈式数据交易平台,推出数据超市,在全国率先探索公众数据运营授权的模式。

  2.0阶段则是依托数据要素关键产品开发经验,联合国家级的大数据重点攻关项目,融合可信空间、数据融通、开发共享等相关的技术。2.0阶段的重点是将各数商的数据、政府公众数据汇聚到中心平台和节点上,以便数据能够发挥倍乘的效应。

  现在进人 3.0阶段。中国去年产生的数据有 32ZB,这么多数据都放在一个平台节点上显然是不可能的。第一步,政府的数据、行业的数据、企业的数据,各家应该有一个中心节点;第二步是用去中心化的方式,将这些节点的数据连通起来,每个连通的节点要有自己的公共数据标识,这些标识应相对统一。这一阶段将是数链智网整合的阶段做整体的升级和布局。

  中国电信的布局动作不断。2023年10月,中国电信联合上海人工智能实验室、国家气象中心等 20 余家单位,在上海成立了中国大模型语料数据联盟,汇集了大量的非结构化数据。

  中国电信通过打造综合的大模型语料库,提高丰富数据产品能力,畅通数据资源循环体系,推动广泛的生态合作等,在数据规模、数据质量方面,中国电信正在向行业领先的目标迈近。

  中国电信集团数据发展中心副主任梁天健说,中国电信希望重点在三个方面开展更加广泛深入地合作,一是数据语料类合作,主要是通过引人外部数据,助力构建中国电信的大模型通用数据集,并探索“数据+平台 +算力”的运营合作模式。二是数据服务类合作,大家共同开拓数据要素流通市场,服务公共数据的运营。三是数据产品类合作引人成熟的产品,也可以联合打造产品,实现在企业运营生产的各个环节提质降本增效。

  据介绍,中国电信重点锚定行业包括教育、卫健、交通、住建、政法、公安、文宣、农业政务等,即将启动千万元级的数据采购。中国电信也在探索与合作伙伴一起做数据代理、数据运营,推动“数据+算力”的套餐化,推广新的商业模式。在数据产品类的合作方面,中国电信希望推动电力、气象、人社、位置、物流、航旅等十个以上行业数据资源的生态合作。

  梁天健表示,在数据服务类合作方面,主要结合中国电信“灵泽”数据要素平台在全国范围内的落地,希望能够引人 30家以上在技术服务应用方面紧密合作的生态伙伴,形成稳定的数据要素全生命周期的支撑和运营的能力,带动上下游合作伙伴共同成长。

  “我们既需要传统的技术服务类企业,也需要能够充分挖掘数据价值,对不同客户场景提供应用服务的合作伙伴,我们更需要数据要素化方面的服务,包括数据资产人表、数据价值的评估、数据合规、数据确权、质量评估等一系列服务,在这些方面我们迫切需要和生态合作伙伴共同探索。”梁天健说。为此,中国电信启动了“聚星”行动,开展合作伙伴的招募。

  据介绍,中国电信计划6月底完成首批数据语料类的引人同时在数据服务类和产品类方面,与合作伙伴进行对接;在8月底完成数据产品类首批合作伙伴的引人,同时创新语料类的商业合作模式;计划 10月与数据服务类的合作伙伴能够开展实质性的合作;推动语料类产品合作形成标杆案例,到今年年底计划在全国评估和推广这些合作案例。




 


(本文不涉密)
责任编辑:王艳

站点信息

  • 运营主体:中国信息化周报
  • 商务合作:赵瑞华 010-88559646
  • 微信公众号:扫描二维码,关注我们