1. 引言
中共中央、国务院于2020年3月发布《关于构建更加完善的要素市场化配置体制机制的意见》,数据跻身社会核心生产要素之列,数据拥有海量价值已然是社会普遍共识。现如今随着云计算与大数据的发展,数据已然成为企业的重要资产组成部分,数据交易也将成为有效推进经济社会发展的重要力量。经过多年的政策推动和资金投入,我国如今的数据产业规模庞大、发展势头强劲。然而近年来,企业间数据纠纷层出不穷,本质上体现企业之间数据权益竞争,表明数据无论是企业资产中还是对外竞争中权重愈加扩大。而企业与个人之间也频发涉及隐私权的纠纷,如特斯拉公司与车主有关行车数据不当收集侵犯个人信息的事件。一方面随着《个人信息保护法》的出台,虽然能更好地保护个人的数据和信息权益,但是另一方面也使得企业数据的收集和开发成本变得更高。以上问题的出现都与目前立法和司法对于数据权属的规定不明有关,因为权属不明及相应法律缺位。在大数据时代,数据处理利用的各环节都无法回避对数据产权的认定,发展交易就得进行适当确权。目前数据交易市场情况不如人意的主要原因在于数据权属不确定及其导致的企业数据权益保护的不足,再加上个人信息保护相关立法的出台使得进行共享或交易的成本越来越高。国家政策方面多次强调推进数据作为生产要素的改革,但是立法层面未涉及数据的法律属性及其归属问题。立法之前需要在理论层面研究企业数据的法律属性、产权归属等基本问题,才能首先明确企业的数据权利义务,才能真正推动数据的开发使用和企业数据的保护。企业能否对特定的匿名化的衍生数据享有确定并完整的权利?如何对其进行保护以保障安全的情况下促进数据的利用?立法应当作何种应对之策?这些问题亟待解决。
2. 企业衍生数据产权确定问题概述
2.1. 企业衍生数据确权相关基本概念
2.1.1. 企业数据的定义及分类
企业数据泛指企业从设立、存续直至终止期间产生的所有数据化记录,包括企业经营相关的信息资料、财务凭证、公司概况、产品信息、研究成果等[1]。通过不同标准可以对企业数据进行不同分类有助于明确界定本文研究的企业衍生数据标准。广义的企业数据包括企业所掌握和控制的所有类型的信息和数据。在讨论企业数据权利时,应当对其进行精准划分。
一般来说,可以将企业数据根据来源主体不同,分为源于人的数据和源于物的数据。其中,源于人的数据是指企业在经营期间所能收集到的由消费者产生的各类数据,如个人通过社交平台产生的注册信息、账号信息、个人产生的文字信息、使用设备而产生的设备信息等。来自个人的数据中个人信息的含量会较高。来自物的信息是指由其他物在使用过程中产生的数据,例如企业生产的设备相关的信息、技术数据等。因此企业数据可以是通过物体的运动、形态变化等信息来源产生的数据,也可以是经过用户授权同意后主动采集到的与个人相关的信息。
根据数据内容产生方式不同,企业数据可以分为原始数据和衍生数据。原始数据是指企业产品使用者产生且未经刻意加工而形成的数据,如消费者在电商平台进行消费或者进行会员注册时提供给平台的个人信息或者购买商品时形成的消费记录、支付记录信息等;企业衍生数据则是通过清洗、加工、整理、编辑这些基础数据而成的衍生数据,如商家对消费者的各种消费记录信息进行汇总分析和推测得出的分析结果。
2.1.2. 企业衍生数据的含义及应用
企业衍生数据是指企业整合自有数据资源,经过分析和加工形成的具有高价值和分析预测能力的数据[2]。企业衍生数据的形式既可以是按照一定算法进行排列组合的数据集合,也可以是加工计算方式具备较高复杂度和体现企业独创性的方式加工而成的数据产品。企业衍生数据作为企业数据资产之一在企业经营中的地位举足轻重。一方面,以衍生数据为主要内容的数据产品能够为企业商业决策提供多方位的数据分析支撑、趋势预测分析及针对性建议。另一方面,企业也可根据所掌握的衍生数据并依托自己的技术研发能力生产出各类数据产品或进行数据交易从而获得盈利。需要注意的是,若原始数据来源为个人信息的衍生数据能够识别到具体个人,那么根据《个人信息保护法》的规定仍属于个人信息。因此,企业的衍生数据产品必须要做到匿名化,才能对其进行交易。
随着互联网 + 经济的迅速发展,因此企业衍生数据的应用面也越来越广。尤其是电商平台行业有其它行业无法比拟的数据收集优势,从而致使电商企业也愈加热衷于在市场营销方面运用衍生数据,如通过收集、处理和分析大量消费者的各种消费相关数据,产生消费者的偏好信息,进而根据这些分析采取有针对性的营销策略。例如,天猫平台的“数据银行”,“数据银行”是天猫平台基于平台上海量消费者的浏览记录、浏览频次、浏览内容、消费相关信息收集和形成的,并以特定算法公式进行深度剖析,整合加工并经过匿名化脱敏处理后形成的一种统计型衍生数据,供入驻平台的商家购买并用于自己网店商品销售分析。除此以外,一些专门的数据分析公司、科技公司和金融证券公司也在致力于开发各类数据产品。由此可见,企业衍生数据产品未来发展潜力无穷,也将有助于数据交易和数字经济进而发展。
2.2. 企业数据法律保护制度有待完善
2.2.1. 企业数据权益保护的立法现状
立法方面,我国没有明确规定数据资产属于何种权利。《民法典》第一编第五章民事权利部分中有提及数据和个人信息,人格权编第六章明确规定了隐私权和个人信息保护,但仅把数据和个人信息视作民事权益,并未建立个人信息权这一概念,只是为个人信息通过人格利益予以保护提供路径,因此对于是否要上升为权利,需要法律以另行确定。在地方立法层面,各省市出台的数据条例较为丰富,目前已有十八个省市通过地方立法颁布了相关数据条例,绝大多数条例明确规定保护企业的数据财产性权益。如《深圳经济特区数据条例》1中首次提出“数据权益”,明确自然人对个人数据依法享有人格权益,自然人、法人和非法人组织对其合法处理数据形成的数据产品和服务可以依法自主使用,享有法律、行政法规及本条例规定的财产权益,同时确定了确立处理个人数据“最小必要”原则。《上海市数据条例》第十二条第二款2也规定了要保护相关主体在数据处理活动中形成的法定的或者约定的财产权益。《浙江省公共数据条例》重点围绕“公共数据”意图搭建一体智能化公共数据平台。由此可见,至少在地方法律层面为企业等主体基于公共数据等原始数据进行数据开发所获得的权益是肯定的。但是总结而言,也仅仅是在权益层面进行确认,而未涉及权利确认。
2.2.2. 企业衍生数据权益纠纷司法保护
司法保护方面,首先,由于立法上缺乏数据权益归属认定的法律,审判机关通常不会对数据财产归属进行直接认定,而是先考查企业掌握的数据产品或数据服务是否可纳入知识产权法保护范畴。其次,在企业数据产品或数据服务无法被认定受知识产权法保护的作品时,法院会转而考察企业是否对数据投入了人力、物力等资源,是否对数据进行过加工处理,进而判断企业是否对相关数据享有权益,赞成竞争法与数据财产性利益的关联并以反不正当竞争法作为主要的事后救济方式。再次,相关数据是否构成企业的核心竞争力,是否为企业开展经营活动的基础,也会影响法院对企业是否享有数据权益的判断。以全国首例数据产品不正当竞争纠纷案淘宝诉美景案3为例,法院认定美景公司所用于获取淘宝公司“生意参谋”衍生数据产品的技术属于非法手段,该行为严重侵犯经营者享有的竞争性财产权益。
无论是竞争法保护还是知识产权保护,所保护法益的侧重点始终是不同。反不正当竞争法的保护更多的是重视对一个企业相较于另一个企业的竞争性优势的侵害;而知识产权中除了商业秘密保护以外,不管是汇编作品还是其他著作权保护,更多的是保护表达的独创性,而不是关注载有信息内容的企业衍生数据本身能带来的价值。
数据衍生产品在未能够满足上述两个司法保护条件时,相关纠纷将不能得到有效解决,即立法上的法律漏洞将影响司法中对某种新型权利的救济,不利于保护相应主体的权益,存在一定的漏洞。因此在承认企业衍生数据的独立价值的情况下,亟需建立和完善新的企业衍生数据权利保护制度。
2.3. 企业衍生数据确权保护的必要性
2.3.1. 企业衍生数据具有独立的保护价值
在价值方面,原始数据通常因较为散乱而难以作为关联分析所使用,而且不经深度加工分析的话很难依据逻辑思维从中直观获取到更有价值的信息,因此其经济价值的实现受到一定限制[3]。而从原始数据到衍生数据的产生意味着经过企业一定财力、人力、技术的投入所产出的衍生数据具有超越原始数据的使用价值,使用主体可以从衍生数据产品中获得更多深层次的关联性信息,从而有利于精准定位市场需求、及时调整商业策略,为企业带来更多利益。衍生数据的生产是有成本的,数据的存储、加工、聚合等不仅需要投入大量资源,而且还需技术和智力成果的支撑。企业基于对依法收集和拥有的基础数据进行加工计算生产更高价值之数据产品,本质上是量向质的转变,实现了从“数据”到“可用数据”的创造性跳跃,应对衍生数据权利予以立法,赋予企业以数据权利。
2.3.2. 确权有利于更好保护企业的数据权益
确权是解决数据权益纠纷的第一步。因为数据权属不明,现有的司法实践采用数据竞争性权益保护模式,仅能在非常有限的范围内和严格的条件下发挥到救济作用,导致法律上企业数据的合理保护不足,不利于数据权益纠纷的解决。我国目前缺乏针对企业数据保护的立法,对于企业衍生数据,现有法律体系仅能够通过商业秘密和著作权法部分实现对财产权利的确权。而司法实践中适用较多的反不正当竞争保护模式对于企业衍生数据的保护又仅限于承认其具有一定的财产权益。从保护的彻底性和全面性来说现有法律制度设置还不能够满足企业解决数据权益纠纷保护自身权利的需要。此外,因为个人信息保护法的施行,使得企业衍生数据的加工、分析以及衍生数据产品的流动、共享、交易都会面临一种成本较高、风险较高的难题。
2.3.3. 确权有利于促进企业数据开发与交易
如果企业数据不确权会使得企业可能没有动力实施数据匿名化工作及后续的产品研发工作。从激励理论的角度看,立法上肯定企业对于匿名化数据的权利,有助于鼓励企业投入人力、资源和技术进行数据产品的开发,推动企业研究开发更多的数据产品,进而促进数字经济的发展[4]。在国家大力发展和促进数据交易的背景下,企业作为最大的参与主体,其提供的数据交易产品的数量及质量是数据交易市场的稳步健康发展的核心。贵阳大数据交易所成立以来实际交易的数据资源与产品远低于预期,加之愈趋严格的网络安全监管和个人信息保护法律法规的出台,企业获取优质原始数据本身的成本倍增。尤其是掌握海量个人数据并具有加工分析能力的互联网巨头就更愿意自己使用而不会去分享、交易。从而导致数据交易市场的交易量少且可交易数据品质量参差不齐,极大地影响了数据交易的发展进而阻碍了数字经济的发展。
3. 企业衍生数据发展及保护模式解析
3.1. 企业衍生数据法律属性的确认
数据的法律属性直接影响以数据作为客体所形成的法律关系以及法律规制模式的确立。因此,在讨论企业衍生数据的法律保护之前,有必要对衍生数据的法律性质进行确定。对于企业衍生数据的法律属性主要有知识产权理论和财产权理论两种观点。
3.1.1. 企业衍生数据的知识产权属性
知识产权理论的观点认为衍生数据的性质属于智力成果。智力成果是指人们通过智力劳动创造的精神财富或精神产品。衍生数据具有智力成果的以下特征:首先,虽然原始数据主要是事实信息,因此只具备记录性,但是对原始数据进行加工、分析、计算、整理,产生全新的、具有更高使用价值的衍生数据,就包含了智力创造劳动。其次,衍生数据与知识产权都具有非物质性,都不具有客观的外在的物理形态,因此衍生数据是非物质化的知识形态的劳动产品,属于智力成果。总结而言,衍生数据的性质属于知识产权赖以建立的权利客体,即智力成果。有学者认为将衍生数据作为独立的客体纳入知识产权保护范围是数据法发展的必然趋势[3]。
3.1.2. 企业衍生数据的财产权属性
财产权一般具有体现一定的经济价值、可与权利人相分离、可以继承和转让以及权利客体可特定的特点。首先,企业衍生数据具有使用价值与交换价值。第一,相较于未经加工分析处理的原始数据,衍生数据的使用价值显著提升,成为精准分析用户需求、供企业业务决策的重要工具;第二,交换价值是以使用价值为基础的,衍生数据可以作为一种交易品在市场上自由流通和转让,并且是以一般等价物来衡量其价值。其次,就与权利人相分离和可转让性来说,企业可以通过数据产品交易或者数据服务合同将数据或者数据产品向买方或接收方转移,因此企业衍生数据也符合财产权的这一特点。最后,从权利客体特定这一方面来讲,在技术上通过权限设置以及逻辑隔离或者物理隔离这种手段都是可以做到确定一定范围的数据,因此财产权的这一特点也符合。所以企业衍生数据能够满足一般财产权的特性,可以作为一种财产权进行保护。
总结而言,因为企业衍生数据的前述特点,表明了企业衍生数据既不是纯粹的传统物权法意义上的客体,也并非全部可以视作一种知识产权,因此必须要在根据数据的特定性质和结合数据开发利用实践的基础上,进行衍生数据财产权利的专门立法,以更好地保护企业的数据权益和规范数据交易市场。
4. 企业衍生数据确权保护制度设计
4.1. 企业衍生数据确权基本思路
本文想探讨的仅是企业对上述原始数据进行加工分析产生的增值数据或者衍生数据的权利归属,这也是企业数据权利保护研究探讨的核心。并且该等衍生数据作为企业数据权利的客体不包含个人信息,即应当要求企业对于其生产和开发的衍生数据产品中包含个人信息因素的部分采取技术手段匿名化。总结而言,本文所述企业衍生数据权的客体是在原始数据上通过分析过滤、提炼整合以及匿名化处理,并投入增值性劳动后形成的数据。
4.1.1. 遵循公平与效率原则
确定企业衍生数据权利并不是为了确权而确权,而是在充分尊重市场规律和数据发展现状以后总结得出的。产权的确定需要遵循公平原则,在企业数据权利确权的语境之下,一方面赋予企业衍生数据的所有权是对于企业为产出相较于原始数据具有更高商业价值的衍生数据而进行投资和劳动行为的肯定,另一方面,出于对个人利益和公共利益保护的考量对该所有权进行一定的限制,正是体现了确权的公平原则。另外,赋予企业对衍生数据的所有权符合效率原则。根据科斯定理,从交易成本最低化的角度考虑,初始权利应当给予以相对较低交易费用解决外部性问题的一方。在以数据作为商品交易时,企业明显相较于个人对衍生数据具有交易成本优势。因为企业相较于个人有相应的技术优势去经过匿名化的手段来挖掘、开发而形成衍生数据产品,给予其相应的财产权利,不需要进行额外的交易谈判。如果将权利赋予个人或政府,真正具有分析、利用数据能力的企业就必须要与个人或者政府进行谈判,造成额外交易成本负担,损害市场运营的效率[4]。而且即使按照所有参与方所有,也会使得后续收益的分配成本增高,从而影响衍生数据的使用效率,不符合市场发展规律。
4.1.2. 遵循平衡与限制原则
赋予企业对衍生数据的所有权时还需要注意相关主体利益的平衡。因企业数据的保护同时也承载“社会经济功能、信息社会功能、公共管理功能以及信息安全功能”[5],所以必须对企业的该权利进行一定的限制,以保护个人信息的安全、社会经济的稳定以及国家和社会重要信息的安全。该所有权并非传统物权法意义上的所有权,企业对该项权利的行使应以按照法律法规的规定履行自己的合规义务,尊重和保护个人、社会和国家利益的基础上享有企业衍生数据的占有(非垄断)、使用(包含许可使用)、收益(交易等)权利。限制原则具体表现为企业在采集原始数据时应完成个人信息主体的合法授权以及后续使用和处理行为的目的和范围限制以及按照国家法律对一些关乎国家核心利益的数据的收集和加工采取特殊的技术措施或者交易限制。因此,必须基于衍生数据社会公益性,防止出现极端保护主义趋势。特别是具有跨境业务的企业在进行共享或交易时,国家利益的维护不容忽视。
4.2. 企业衍生数据权的保障措施
4.2.1. 制定和落实匿名化的统一标准
匿名化是指个人数据过滤后,无法指向性辨识个体,且不能进行技术复原的状态。数据匿名化是隐私保护与数据利用两全的技术方法。为在数据利用中有降低风险防止隐私泄露的需求,才驱动匿名化技术的开发和发展。虽然也会有不同程度的被复原的风险,但是有些情况下也有无法复原的技术的发展。所以说数据匿名化是一种可行的技术。数据匿名化技术的应用不仅能够最大化利用数据资源,同时也可尽可能保障个人隐私信息。现在法律已经规定了匿名化的数据不属于个人信息,认可了其作为非个人数据和信息的流转、交易的可能性。然而因为缺乏统一的匿名化标准,企业的相关数据处理行为还是会面临个人信息相关合规风险,将不利于企业衍生数据产品的交易合规。
但是因为技术原因,匿名化标准存在较大争议,有人认为匿名化是一个相对性概念,因此作为一种标准的确定性存在瑕疵。本文认为,技术本身始终只能作为交易安全实现的工具,虽然采用匿名化技术并不能保证匿名化的数据就绝对不会有任何被重新识别的风险,但是技术本身是可以相对随着技术的发展而提高的,在事前严格规制和事后救济双轨制度下,利用匿名化技术保护个人信息的同时促进企业数据的开发不失为当前一个较好的选择。
因此,必须要尽快出台相关的标准供企业的数据利用和开发以具体操作标准的同时,也为监管部门对企业在个人信息收集、处理方面违规违法问题的认定提供指引。具体而言,在制定相关标准时应关注以下几点:第一,原始数据的区分标准可以根据领域不同或业务场景不同进行界定,具体可分为一般信息和敏感信息;第二,可以设立匿名化技术标准制定和认定机构,为数据的匿名化状态维持进行跟踪服务;第三,在匿名化的数据被恢复的场景下,除了检验数据提供方匿名化的措施的同时还要结合恢复可能性来综合认定是否达到匿名化标准。
4.2.2. 制定交易中隐私风险评估机制
从当前匿名化技术以及大数据发展趋势来看,数据的匿名化是一个相对的概念。即使企业采取了非常严格的匿名化技术,在各种数据产品或者数据库的碰撞之下也是有可能被再次识别出个人的。可能性较低不代表无任何风险,匿名化的数据被重新识别后,其影响是不可逆的。尤其是在数据跨境流动的场景下,对于作为数据处理者的企业来说,对于匿名化和其他相关要求应当更加严格。
具体而言,可以从以下几个方面进行规定。首先,适用场景方面,要根据具体场景对隐私风险进行评估。比如对企业之间通过合作共享、在交易市场公开交易或者因业务需要向境外合作机构或者境外的母公司传输等各种不同的场景设置相应的评估要求以及频次要求。其次,评估主体方面,最好是可以形成一个以政府为支撑的数据交易所或者平台作为中立第三方,基于自己企业所拥有的技术和政府信用,对数据交易中的数据交易品进行交易前的个人信息及隐私泄露风险评估。最后,从评估结果而言,根据不同的风险程度,对数据交易采取不同的措施。比如,按照风险大小进行分类,对风险较高的交易行为应当有更多的限制,例如减小交易对象范围或者对交易对象进行限制。
5. 结语
将数据分配给为创造数据而进行了大量投资的人符合经济发展现实。数据交易发展的需要提示我们要重新思考企业数据法律保护的制度设计。或许对全部类型的数据进行赋权设计存在困难,但是对于一部分已经具备财产权利属性的数据,即本文讨论的企业衍生数据而言,在充分保护个人信息的前提下,赋予企业衍生数据法律上非绝对性与非排他性的财产权保护,是可行且有必要的。因此,应当给予企业对匿名化的衍生数据以有限制的所有权,确定企业对衍生数据的占有、使用、转让和收益等权能。当然,在赋权的同时也应对其客体和权利范围做出严格限制,避免造成数据垄断和个人信息侵害风险。并在此基础上,通过交易制度的平衡企业数据开发利用和个人信息保护之间的关系和完善企业数据权利保护制度,从而促进数据交易的发展。
NOTES
1深圳经济特区数据条例,http://sf.sz.gov.cn/fggzsjcx/content/post_9835429.html。
2国家法律法规数据库上海市数据条例,https://flk.npc.gov.cn/detail2.html。
3杭州市中级人民法院(2018)浙01民终7312号判决书.