1. 问题的提出
2025年,我国数字经济核心产业增加值占GDP比重提高至10.5%以上1,数字产业作为数字技术与实体经济“连接器”作用更加突出。随着大数据、人工智能、物联网等新兴技术的快速发展,衍生数据已经逐渐成为企业最重要的无形资产,在实现精准决策、市场研判和创新赋能方面具有无可替代的作用。
为筑牢新时代数字经济高质量发展的法治基础,2022年12月公布的《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称《数据二十条》)提出要建立数据资源持有权、数据加工使用权、数据产品经营权分置运行的数据产权制度框架2。在上述政策的背景下,数据立法工作也如火如荼开展。2025年6月修订的《中华人民共和国反不正当竞争法》(以下简称《反不正当竞争法》)完善了“数据保护专条”,明确了经营者不得以欺诈、胁迫、避开或者破坏技术管理措施等不正当方式,获取、使用其他经营者合法持有的数据。但该条列举的行为无法囊括不断出现的新型数据不正当竞争方式。此外,为平衡市场主体的数据利益和个人数据保护的需求,国家还先后出台了《中华人民共和国网络安全法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》等多部单行法律。但是,上述法律的多数条款主要聚焦于市场主体从事数据活动应当遵循的法定义务,而针对衍生数据保护尚无明确法律规制,难以满足当前数据流通和交易的实际需求。
国家层面的数据立法暂付阙如,使得各省、市、自治区的地方政府纷纷结合本地区展开数据立法的实践。各地陆续出台数据相关的地方性法规,如《深圳经济特区数据条例》《上海市数据条例》等,为数字经济规范发展提供法律支持。但由于数据权属这个根本性问题未得到国家立法明确,地方立法难以迈过这道“藩篱”,导致衍生数据保护多停留于理论层面,实操性较弱。
鉴于我国在衍生数据保护立法上的滞后性,法院在裁判此类涉及衍生数据纠纷的案件时,不得不在既有的法律框架下进行解释和适用。司法裁判主要依赖于通过《著作权法》《反不正当竞争法》以及合同法等现有法律规范中寻求救济,但是存在较大局限。
首先,《著作权法》对于衍生数据的保护仅限于衍生数据符合作品的构成要件的情形,其中最为严格的要求即是必须具备最低限度的“独创性”,强调作者对于内容的独立构思和个性化选择,但衍生数据往往由既定的加工方法、流程与算法模型驱动产生,而非人类有意识的对数据内容的进行直接的智力创造,难以满足“独创性”要求。相较于一般作品,衍生数据构成汇编作品的,也可以受到《著作权法》保护。但是,汇编作品保护的是作品抽象意义的整体表达,即编排设计与汇编方法,而非保护作为内容的衍生数据本身。
其次,也有援引商业秘密保护衍生数据的裁判,但商业数据保护路径本质上在限制数据的流通,与《数据二十条》中所倡导的促进数据流通共享的主旨相悖,还可能导致数据垄断,不利于数据产业的长远发展。
再次,由于缺乏衍生数据权属立法,司法实践转而将重点放在衍生数据利用行为上,因此《反不正当竞争法》第2条一般条款成为寻求衍生数据保护和法院审理数据纠纷的首选。在微梦公司诉简亦迅公司案3中,简亦迅公司未经授权调用微博服务器向用户端传输数据API,并通过iData API网站对外售卖微博后台数据。法院认为,微梦公司依法享有管理、使用微博数据并获取经济利益的权益,简亦迅公司的行为有违公平、诚信和商业道德,扰乱了数据市场正常秩序,严重损害了微梦公司合法权益,法院依《反不正当竞争法》第2条规定作出判决。在司法判决中,法院将衍生数据解释为一种竞争利益,对竞争者未经授权抓取、利用数据的行为认定为损害经营者“合法权益”、违反诚实公平或商业道德的行为。但是,一般条款具有低门槛、宽范围和开放性特质,缺乏明确标准和适用规则,依赖于法官的自由心证,将衍生数据纠纷纳入其中,很容易使一般条款适用范围不当扩张,加剧了合法边界的不确定性。
最后,合同法保护强调以数据交易主体之间的合同为中心,更关注主体之间形成的法律关系,在相对性法律关系中重新配置主体之间的权利义务[1]。当双方当事人之间存在合同时,自然可以依据合同解决纠纷。但是,合同规范的是相对人的权利义务,无法适用于存在第三人的侵害衍生数据的情况,且并非所有情形下当事人之间都存在合同,因此难以为衍生数据纠纷提供周延保护。
鉴于此,有必要通过衍生数据财产权规范衍生数据的使用和交易秩序,统筹衍生数据的保护与数据的流通使用。
2. 衍生数据的概念与判断规则
(一) 衍生数据的概念
从纯粹技术角度理解“数据”,指的是在计算机进行输入、处理和输出操作时所依赖的、承载信息的介质统称。在底层逻辑上即是以二进制的0和1作为基本数值单位进行表达的客观形式[2]。而在立法层面上,我国《数据安全法》对“数据”的定义,即任何以电子或者其他方式对信息的记录。从以上对数据的定义来看,揭示了数据与信息之间的关系,即数据是信息的载体和表现形式,信息是数据所呈现的语义内容和价值内涵,二者共同构成数据价值实现的基础。
“衍”字由“水”和“行”字组合而成,表示水流顺河道汇入大海的运行过程。“生”解释为诞生、生长,表示事物从无到有、从弱到强的成长过程。据此可以将“衍生”一词定义为事物在运行发展过程中的积极质变。根据数据是否经过加工处理,可将数据分为原始数据和衍生数据。原始数据是数据收集者基于自身业务生成的原生数据或者收集的原始个人数据和原始公开数据。原始数据生成或收集的合法性是数据处理者主张数据权益的基础。衍生数据是相较于原始数据而言的,由于原始个人数据具有可识别性的特征,不经过“脱敏”过程处理成衍生数据,易与个人隐私权产生冲突。故而,本文所称的衍生数据是指数据处理者在合法收集、存储海量的原始数据的基础上,通过数据挖掘和算法技术进行深度开发,并经过脱敏化处理后形成的有商业价值的结构化数据集[3]。
(二) 衍生数据的判断规则
1) 原始数据来源合法
“合法来源”关注企业取得原始数据的行为是否合法,要求数据的收集过程不违反任何法律规定。合法来源作为确定数据权益的前提,在《数据二十条》和各地方性数据条例中均有指出,即数据处理者对依法收集和处理的衍生数据产品和服务享有财产权益。合法来源原则也贯穿于一系列的数据案件裁判之中。如在谷米公司诉元光公司案4中,法院认为元光公司通过非法爬虫方式抓取谷米公司合法运营的商业数据的行为,扰乱了行业秩序,属于不正当竞争,其原始数据的非法性也直接导致衍生数据丧失合规基础。
虽然司法审判中把数据来源合法作为数据处理者享有数据利益的前提,学界对此也基本形成共识,如唐建国指出衍生数据的加工处理不能超过原始数据的授权范围和安全使用要求[4]。然而也有部分学者持反对态度,如申卫星提出数据处理者即使不享有原始数据的使用权,但其违法获取和加工原始数据的行为主要影响其责任承担,而不影响衍生数据的产权归属[5]。但此种观点与我国现行的法律法规相悖。《个人信息保护法》《数据安全法》和《数据二十条》均指出数据处理活动不得侵害他人合法权益,要求全流程合规,那么其前提就是需要确保数据来源合法,若原始数据系通过窃取、非法爬取等非法方式获取,那么数据处理者对衍生数据享有的财产权利也会因“源头违法”丧失合法性基础。
2) 数据发生实质性改变
企业衍生数据实质性改变的判断标准主要包括三个方面:一是数据形式变化,企业衍生数据不再是单纯的数据记录,而以标准化、层次化、结构化的组织架构和储存方式呈现,能够以建模分析、可视化技术等方式进行更为直观的表达,将海量的抽象原始数据转化为更好理解、解释和利用的全新形式。二是数据内容变化,企业衍生数据通过分析、挖掘和整合,揭示了原始数据中隐含但未直接呈现的规律,且依据该规律不可逆向还原出原始数据。例如淘宝生意参谋从用户购买记录、收藏记录中提炼衍生出用户偏好模型、消费趋势等,但商家在使用过程中无法据此还原出个体消费者的购物清单。三是数据功能变化,企业衍生数据依托对大规模原始数据深度转化,可直接用于构建预测模型、实现风险预警与智能决策等不同的应用场景,既可以直接为企业运营优化、风险管控、战略规划及业务创新提供精准、高效的数据支撑,也可以用于数据交易和服务,成为实现数据驱动提升核心竞争力的重要支撑。
3) 数据价值的显著提升
商业价值是衍生数据判断的核心要素,数据价值的显著提升是衍生数据区别于原始数据的最显著特征。原始数据仅具备基础信息识别价值,是低信息密度、高冗余的生产要素原料。而衍生数据经过深度处理,实现了从“计算价值”到“经济价值”的转化,成为具备独立商业效用的数据资产,其价值的显著提升主要表现在使用价值和流通价值两个维度。使用价值是衍生数据的内在价值,体现为其对企业运营发展的支撑作用,其核心表现为决策科学合理、运营质量提升和经营风险的防控,同时还可以助力挖掘用户需求、精准创新服务,实现企业管理从经验驱动向数据驱动的转型。流通价值是衍生数据的外在价值,体现为其在市场交易中转化的经济价值。数据处理者可将衍生数据作为特殊商品,通过市场流通交易实现数据价值的变现,既可开辟新的盈利增长点,也能为其他主体提供更优质的数据服务,推动数据要素在市场中的合理流动与高效配置。
3. 衍生数据财产权保护的证成
(一) 衍生数据是适格的财产权客体
1) 衍生数据符合财产权客体要求
基于对财产权客体的本质理解,财产权通说理论认为,法定财产应当稀缺性、可控制性和可转让性,衍生数据即满足上述三种要求[6]。首先,虽然社会生产生活不断产生数据,数据被无限复制和使用也不会产生损耗。但是,衍生数据的稀缺性并非指数据本身的数量稀缺,而是指高质量或者适配特定场景的衍生数据在市场中的供给不足而形成的相对稀缺状态。其次,借助载体或者储存介质,以及一系列技术加密、访问授权、防火墙防护等技术手段和管理制度,数据处理者可以对衍生数据的产生、存储、使用、流转进行全面的控制。这种可控制性不仅体现了对衍生数据的实际支配能力,更为数据处理者享有并行使财产权提供了现实基础。再次,衍生数据经过深度加工与价值整合,早已脱离原始数据零散、低价值的初始状态,在内容上也已剥离可识别特定自然人的个人信息,不会隐私权等人格权益发生直接冲突,具备独立的财产价值与流通基础,能够通过许可使用、交易转让、市场化流通等方式实现价值转化,符合法定财产可转让的要求。
综上所述,稀缺性奠定了衍生数据的价值基础,可控制性确立了财产权的归属与支配可能,可转让性则赋予衍生数据市场化流通的功能,三者共同构成了衍生数据财产权客体适格性的重要依据,也为构建衍生数据财产权提供了坚实支撑。
2) 衍生数据成为财产权客体是经济发展要求
财产权的发展史表明,财产权并非一套封闭静止的规则体系,财产权客体的扩充始终随着生产力与生产技术的发展而动态演进。通过对财产权历史脉络的考察可以发现,财产权客体呈现出持续扩张的开放性特征,不断将社会生活中涌现的新型利益形态纳入其保护范畴,这构成了法律适应社会发展的核心机制。
在罗马法中,财产权的客体主要被理解为具有物理实体的“有体物”[7]。然而,随着商品经济的繁荣与科学技术的进步,单纯的有体物已无法涵盖全部的财产形式。近代财产权已经将客体扩展至股票、债券等抽象权利凭证,标志着法律对无形经济利益的承认。现代财产权的包容性则进一步增强,以智力成果作品和商业秘密为代表的无形财产纳入到财产权的客体中。
置身于数字经济时代,由数据驱动创新创造的模式已成为全球经济增长的核心引擎。衍生数据既包含了智力投入,又具有显著的商业价值,无疑是这个时代最具代表性的新型资产,其保护问题已成为无法回避的时代课题[8]。因此,将衍生数据作为全新财产权客体纳入到现代财产权法律框架之内,是数字时代演进下所必然迈出的一步。
(二) 衍生数据财产权的法理证成
1) 劳动财产权理论
劳动财产权理论强调了劳动者享有将劳动增值产物财产权的正当性基础。根据洛克的劳动财产权理论,土地及一切低等动物、自然产出物为人类共有,自然人对自己的人身、身体劳动拥有绝对所有权。当自然人在自然公有之物之上掺入劳动使其脱离自然状态时,该事物正当地成为该自然人的私有财产[9]。在洛克看来,劳动是财产权产生的正当性基础,自然仅为人类提供了原料,个人通过劳动改变原料的自然状态,产生了更高的价值,其价值增值来源于个人的劳动投入。因此,就劳动产生的有价值物而言,应当归属于劳动者所有。同时,洛克还指出劳动者享有财产权的前提是为公众留下足够且良好的资源,以此确保公有资源的丰富。
在数据处理活动中,原始数据在产生之初处于零散、无序、低价值的自然状态,并不具备独立的财产价值。而数据处理者通过深度加工劳动,改变了原始数据的自然形态,剥离了其中可能涉及的人格权益,赋予了其更高的价值属性。因此,数据处理者在数据处理活动中付出的劳动应得到重视,确立衍生数据财产权具有保护劳动成果的正当性。
此外,衍生数据财产权只保护衍生数据,作为原料的原始数据仍属于公有领域,其他主体可以自行采集与合理加工利用,给其他主体留下了足够的继续创造空间,不会违背劳动财产权获得的前提。因此,劳动财产权理论为衍生数据财产权的确立提供了必要的法理依据,也使数据处理者获权具有劳动赋权上的正当性。
2) 激励主义理论
激励理论认为,唯有在产权与收益得到保障的情况下,市场主体才有充足的投资与创新动力,进而主动提升管理水平和效率[10]。德姆塞茨明确指出,产权的核心功能在于实现“外部性内部化”,能够激励市场主体在利用资源的过程中内化外部性,进而实现更优的资源配置效率。“外部性”是指经济行为对第三方产生的、未通过市场交易补偿的成本或收益,其产生的根源是产权模糊,导致行为主体无需为自身行为的全部影响承担责任或获取全部收益。产权明晰则可将该“外部性”纳入行为主体自身的成本与收益核算以实现“内部化”[11]。产权是经济学概念,财产权是产权在法律上的权利化表达,二者是经济实质与法律形式的对应关系。在衍生数据的保护上,衍生数据的生成需要数据处理者投入大量成本和劳动,若无明确的财产权保护,恶意爬取、搭便车等行为会产生严重负外部性,抑制数据的生产意愿。反之,确立财产权保护能够提高数据处理者生产、使用和交易衍生数据的积极性,从而增加社会优质数据与服务供给,发挥出数据赋能经济的强大作用。
(三) 衍生数据财产权的性质争议与方案选择
1) 衍生数据财产权的性质争议
对于衍生数据财产权的性质,学界存在三种代表性学说。一是类所有权说,该学说主要参考有体物所有权来构造衍生数据财产权。除了少数学者主张直接通过所有权保护数据或者构建保护力度更强的网络平台占有权外[12],多数学者更支持借鉴所有权模式构建一种排他性较弱的数据财产权[13]。二是知识产权说,该学说依据衍生数据与知识产权客体在无形性、非竞争性、稀缺性上的契合,主张衍生数据财产权应属知识产权范畴[14]。三是新型财产权说,该学说正确认识到了衍生数据财产权与物的所有权、知识产权在权利效力与保护方法上的本质区别,指出应构建独立的数据新型财产权[15]。
2) 衍生数据的新型财产权方案的确认
类所有权说与知识产权说对于企业衍生数据财产权的构造都是以传统财产权作为理论起点的,思考局限于传统财产权的经验或者进行适应性改造。虽然这种理论借鉴可以减少认知障碍,但是将一般的传统财产权经验硬套在特殊的衍生数据上,容易造成权利边界模糊,背离数据财产权立法的初衷。
具体而言,物权(所有权)是传统民法保护民事权利的主要方式,主要遵循“有体物”财产的保护逻辑,将无体的衍生数据纳入物权保护破坏了物权法的理论根基。从权利客体看,衍生数据具有无形性,与传统物权法中的有体物存在本质的不同,决定了二者不能适用同一套财产权方案。从权利效果来看,物权具备绝对支配性与绝对排他性,重点在于维持权利人对物的事实占有与排他控制。然而,衍生数据所具有的非竞争性使得同一份衍生数据可以被多个主体同时使用而不会产生价值损耗,甚至可能在流通中产生增值和创新[16]。如果强行套用物权的绝对排他性,会极大限制数据的流动、共享和再利用。
以传统知识产权保护衍生数据,也不是恰当的选择。一方面,传统知识产权包括著作权、专利权和商标权,客体限于具有“独创性”的知识产品,保护门槛过高,难以覆盖多数衍生数据。若强行适用知识产权制度,绝大多数衍生数据将因无法满足“独创性”标准而被排除在保护范围之外。另一方面,知识产权具有公开性,必须将知识产品向社会公示,使社会公众知悉,权利人才能取得知识产权。知识产权制度兼顾私人创新激励与公共知识传播,双重目标决定了公开义务的必要性。而衍生数据财产权的核心目标是激励市场主体开展数据价值挖掘,维护数据处理者的合法权益,而非强制数据公开。其利益导向更侧重保护私人劳动成果和完善市场激励机制,无需以无视商业利益选择为代价强制公开数据。衍生数据的公开与否主要取决于企业自身的经营决策,不能将传统知识产权“以公开换保护”的逻辑直接套用至数据领域。
综上所述,衍生数据财产权应属于新型财产权,与传统物权、知识产权并列。衍生数据新型财产权需要结合衍生数据的基本属性和我国数据交易和流通的实际专门构造。
4. 衍生数据财产权的具体架构
衍生数据财产权是指数据处理者对其衍生数据享有的合法持有、许可他人使用以及进行处分的财产权利。具体而言包括了衍生数据持有权、衍生数据许可权和衍生数据处分权三项子权利。与此同时,为贯彻利益平衡理念,也有必要对财产权的内容加以妥善的限制。具体而言,衍生数据的财产权架构应当包括权利内容和权利限制这两个基本范畴。
(一) 衍生数据财产权的内容
1) 衍生数据持有权
衍生数据持有权,是指数据处理者对其合法加工形成的衍生数据依法享有的事实控制、自主使用和安全保障的财产权利。在事实控制层面,数据处理者可以对衍生数据进行技术管理,当其他主体未经授权许可,擅自获取、复制、使用衍生数据时,数据处理者可依法主张侵权救济,排除其他主体对其持有权的妨害。在自主使用层面,数据处理者有权根据自身生产经营和研发创新等合法需求,自主决定衍生数据的使用方式和使用范围。在安全保障层面,数据处理者需依法履行数据安全保护义务,采取必要的技术与管理措施,避免衍生数据逆向还原导致原始个人数据泄漏。
2) 衍生数据许可权
衍生数据许可权是指数据处理者对依法持有的衍生数据,授权许可其他主体在约定范围和期限内使用并获取相应对价的财产权利。在不违反法律和行政法规强制性规定的前提下,数据处理者有权自主决定衍生数据的许可对象、许可内容、许可期限、许可地域及对价标准,而不受其他主体的干预。若被许可方对衍生数据的使用超出合同约定的范围,那么数据处理者有权主动介入制止并要求其承担违约责任。同时,针对无权使用衍生数据的第三人,也可以依据衍生数据持有权要求其停止使用、删除数据备份等,保障衍生数据权利的完整性。
3) 衍生数据处分权
衍生数据处分权,是数据处理者对衍生数据进行依法转让、质押、抛弃或在破产时进行折价、拍卖、变卖,从而使衍生数据上的权利发生变更或者消灭,并享有全部处分收益的财产权利。衍生数据的处分可以分为两种形式,即事实上的处分和法律上的处分。衍生数据事实上的处分,是指数据处理者通过对衍生数据内容进行根本上的修改或删除等事实行为,从而引发的衍生数据财产权的变动或消灭。而法律上的处分则是指数据处理者通过交易、赠与和放弃声明等法律行为,使衍生数据财产权发生变动或消灭。在处分行为生效后,除非合同另有约定,原权利人立即丧失对该衍生数据的持有、许可和再处分的权利,不得再对已处分的衍生数据进行控制和许可授权,从而保障受让方获得完整的衍生数据财产权。
(二) 衍生数据财产权的限制
1) 衍生数据的合理使用
合理使用是衍生数据财产权最基础的限制机制,其核心要义在于,在特定条件下,非权利人可不经权利人许可,自主使用衍生数据而不构成侵权。合理使用本质上是通过牺牲权利人的部分排他性权益,换取数据资源的流通共享与社会公共福利的提升,应当包括以下两类:
第一,政府强制许可使用。当面临涉及国家安全和公共利益的紧急情况时,政府部门可以不经权利人的许可,直接获取和使用衍生数据。例如在疫情突然爆发时,政府部门可以直接调取通信运营商的位置数据等来查询感染者的行程信息和分析疫情传播趋势。此种紧急情况的公益性和强制性最强,政府使用衍生数据不仅无需许可。不过,政府强制许可使用也应参考《民法典》中“征收、征用”的规定,待紧急情况消失后给予权利人公平、合理的补偿5。
第二,非商业性合理使用。个人、学校或者科研机构等主体为科学研究、课堂教学、私人使用等非营利目的获取和使用衍生数据,并且未造成衍生数据的大规模泄漏,即符合合理使用范畴。但若是大量采集整理衍生数据并用于对外经营,则超出了合理使用的范围,构成对衍生数据持有权的侵害,应当承担相应的侵权责任。
2) 衍生数据的保护期限
权利保护期限,是指法律为各类权利设定的法定存续与受保护的时间范围,在法定期限内权利受法律强制力的保障,而期限届满后权利消灭,权利客体或将进入公有领域[17]。知识产权则受到权利保护期限的严格制约,如发明专利、外观设计专利和实用新型专利的权利保护期限分别是20年、15年和10年。知识产权之所以设定权利保护期限,核心在于平衡私权激励与公共利益,知识产品若允许永久垄断,将严重阻碍知识传播与技术创新。同样地,为了平衡数据开发激励与数据的流通共享,有必要设定衍生数据财产权的保护期限。为在不妨害衍生数据财产权激励功能的同时实现数据价值的最优化,权利的保护期限应长于数据处理者收回数据投资的时间,但短于衍生数据市场价值的存续期[18]。具体而言,可以参考欧盟对数据库特殊权利的立法,自衍生数据完成时授予数据处理者15年保护期限,同时,考虑到衍生数据动态变化的特性,保护期限应当随衍生数据的实质性变化而重新计算。在保护期限届满后,除法律另有规定的,衍生数据即进入公共领域,企业不再享有排他性的财产权保护,任何主体均无需企业许可和支付费用即可自由获取和使用企业衍生数据。
5. 结语
衍生数据的保护问题是司法实践的难点,衍生数据确权是解决争议与解放数据生产力的必要前提。目前学界对衍生数据财产权的设计多依赖传统财产权模式,未能充分考虑衍生数据与物权和知识产权客体与保护要求的区别,背离了衍生数据财产权设置的初衷。唯有通过立法明确衍生数据的财产权性质、内容与权利限制,才能破除数据流通壁垒,激发数据要素的核心价值。
NOTES
12026年政府工作报告解读[R]. (2026-3-5)中国政府网, https://www.gov.cn/zhuanti/2026qglh/2026zfgzbgjd/index.htm.
2中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见[J]. 中华人民共和国国务院公报, 2023(1): 28-33.
3广东省高级人民法院(2022)粤民终4541号民事判决书。
4广东省深圳市中级人民法院(2017)粤03民初822号民事判决书。
5《中华人民共和国民法典》第117条:“为了公共利益的需要,依照法律规定的权限和程序征收、征用不动产或者动产的,应当给予公平、合理的补偿。”