1. 引言
数据作为要素融入并赋能生产、分配、流通、消费各经济环节,成为人类社会前所未有的新兴资源,提升着经济效率、优化着经济结构、驱动着经济创新发展[1]。十九届四中全会后,党和国家发布一系列政策文件对充分发挥数据要素价值作出重要部署。2021年,中共中央、国务院印发的《知识产权强国建设纲要(2021~2035年)》和国务院印发的《“十四五”国家知识产权保护和运用规划》(以下简称《规划》)均提出,要“研究构建数据知识产权保护规则”,其中《规划》还专门部署了数据知识产权保护工程,以促进数据要素创新开发利用。2022年底,中共中央、国务院联合印发《关于构建数据基础制度 更好发挥数据要素作用的意见》,提出“研究数据产权登记新方式”。2025年3月国务院政府工作报告进一步指出要“加快完善数据基础制度”。以此为契机,本文拟通过规范分析方法对各试点省(市)规则的适用情况进行分析,首先,以17个试点省(市)颁布的数据知识产权登记管理规则为样本,运用文本分析方法解构数据知识产权登记制度的基本架构;其次,基于法教义学解释框架与实质主义价值导向检视现有制度中登记主体范围、登记客体界定、登记效力等核心条款;最后,立足数据要素市场化改革的制度需求,从规范再造维度对登记主体、登记客体、审查形式等规则提出优化建议,为将来中央层面数据知识产权专门立法提供兼具理论自洽性与实践可行性的借鉴。
2. 数据知识产权登记的制度现状
截至2025年3月,各试点省(市)均已颁布了数据知识产权登记管理规则。从结构上看,数据知识产权登记制度的基础架构大同小异,大致包括总则、登记申请、登记审查、登记程序、登记效力、监督管理六个部分。从内容看,受限于学界对数据知识产权相关的基础理论尚未形成共识,现有规则主要集中于数据知识产权登记的操作流程,包括登记主体资质、申请材料清单、形式审查标准等程序性环节,而对权利内涵的实质性界定相对单薄,故本文仅对17个省市登记规则中的核心条款进行横向比较,具体分析如下:
(一) 登记主体
就登记主体的规定来看,实践中存在两种类型:一是北京市、天津市、江苏省规定的数据持有者和数据处理者都作为登记主体的类型;二是海南省、安徽省等省(市)规定的仅数据处理者可以作为登记主体,其中深圳市、河南省、湖北省等省(市)还列举了数据处理者的类型,大致包括对进行数据收集、存储、使用、加工、传输、提供、公开等行为的自然人、法人或者非法人组织。可见,当前数据知识产权的登记主体十分广泛。
(二) 登记客体
就登记客体的规定来看,登记客体的要求大致包括依法依规获取+经过一定规则或者算法处理+具有实用价值或者商业价值+非公开性。但是在具体细节上各省(市)规定存在差异。在对“处理”的要求上,安徽省未要求智力成果属性;上海市规定“经过实质性加工和创新性劳动”;大多数试点省(市)要求具有智力成果属性。在价值选择上,有的试点省(市)会侧重具有实用价值,有的则侧重具有商业价值。就数据是否公开问题,北京市、天津市、山东省、湖北省明确规定登记客体的非公开性,而其他地区未作出特别规定,即视为登记客体可以具有公开性。
(三) 登记机构
就登记机构的规定看,大多数省(市)都规定由省(市)市场监督管理局(知识产权局)负责管理、统筹全省数据知识产权登记工作,由知识产权保护中心负责数据知识产权登记;深圳市指定标准技术研究院负责登记;海南省仅规定知识产权局负责统筹全省数据知识产权登记未明确具体登记机构;上海市、湖南省由知识产权局直接审查。
(四) 审查形式
就审查形式的规定看,实践中存在三种路径:一种是“形式审查 + 实质审查”模式,例如山东省规定的“初审形式审查 + 复审实质审查”模式、湖南省规定的“形式审查 + 明显实质性缺陷审查”;第二种是“实质审查 + 形式审查”模式,例如安徽省、深圳市等省(市)要求先由第三方服务机构进行实质性审查并出具报告,再由登记机构对该报告进行形式审查;第三种是仅形式审查模式,即仅由登记机构对材料的完备性和完整性进行审查。
(五) 登记效力
就登记效力的规定看,北京市、山东省、陕西省规定登记证书为权利凭证;湖北明确指出登记证书的对抗效力;江苏省规定有相反证据可以推翻登记证书;天津市、浙江省规定等省(市)规定登记证书为持有相应数据的初步证明/凭证广东省和上海市未规定登记证书的效力。可见,在现阶段,数据知识产权登记并没有赋权效力。
深入比较各省(市)数据知识产权登记规则后发现,各试点地方在登记主体、登记客体、登记机构、审查形式、登记效力等方面尚未形成制度共识。因此,有必要在前期试点基础上,推广成功经验,并对既有经验进行反思,完善数据知识产权登记制度。
3. 数据知识产权登记制度的法理检视
数据知识产权登记作为数字经济时代的新型制度工具,其构建必然伴随试错与调适。对于已经出现的问题及时反思,才能形成行之有效的经验。目前,数据知识产权立法层级还仅限于规范性文件,制定思路更倾向于促进数据要素创新开发的现实需求,相关规则与法律上对权利的界定相去甚远,缺乏最基本的法律评价以及对权利内容和法律效力的界定,同时其缺乏权利应有的可对抗、可请求等基本要素以及基于权利行使可产生的法律效果等内容[2]。数据知识产权若要发展成完备的法律制度,还必须与法律制度中的权利主体、权利客体、授权方式、授权效力等制度相衔接。因此,本文重点关注处于萌芽阶段的数据知识产权登记制度的登记主体、登记客体、审查形式、登记效力规定,对上述制度构建问题快速响应,避免制度固化。
(一) 登记主体泛化削弱制度公信力
数据知识产权登记主体的范围界定,是构建数据知识产权登记制度的核心问题。传统知识产权对权利主体资格的要求因知识产权类型不同而有所差异,但均体现了对创造性劳动的重视。创新价值体现在知识产权政策制定和立法活动之中,如专利法保护新技术发明、著作权法保护新作品创作,即通过私人专有权利的赋予以激励人们不断进行新的智力创造活动[3]。数据知识产权权利主体的界定也需与知识产权法律体系的整体逻辑一致。当前,北京市、江苏省等省(市)的试点规则将登记主体扩展至“数据持有者”,深圳市、河南省等省(市)则将“数据处理者”的范围延伸至原始数据采集者、存储者、流通中介等,与其要求确保对可产生价值的数据集合使用场景投入智力劳动龃龉——数据采集、存储、传输等基础性操作仅构成基础劳动投入,与具有创造性特质的智力劳动存在本质差异。对采集者、存储者、流通中介等主体赋予数据知识产权登记主体资格,实际上混淆了劳动投入者与智力贡献者,对数据采集等基础劳动行为直接赋予知识产权,不符合知识产权制度促进知识增量生产的本质功能。
(二) 登记客体实质要件缺乏统一判断基准
纵观现有数据知识产权登记规则,登记客体的构成要件可以概括为“依法依规 + 一定规则或者算法处理 + 实用价值或者商业价值 + 公开性”。以上四个要件分别体现了对登记客体的合法性、创新性、价值性、公开性要求。但各试点省(市)就以上要件及具体内容并未形成共识,具体分析如下:
1. 合法性要件
依法依规获取数据是构建统一可信数据知识产权登记体系的前提。目前,各试点省(市)都通过规定不予登记的情形保障数据的合法性和合规性。在实体上,数据权属存在争议,隐瞒事实或者弄虚作假,危害国家利益、危害个人隐私、违背公序良俗、损害公共利益等是各试点地方普遍认可的不予登记的情形。但对于是否要求数据具有合法性来源尚未形成一致观点。从程序上看,未对数据进行数据存证或公证、重复登记两种情形是各试点地方普遍认可的不予登记的情形。但各试点地方也存在差异,例如陕西省、江苏省等省(市)未规定重复登记构成不予登记的情形,大部分试点省(市)未规定申请登记材料提供不完整、不规范,且未在指定期限内补正构成不予登记的情形。
2. 创新性要件
权利客体的创新性要件作为知识产权制度区别于其他财产权制度的本质特征,其认定标准直接决定法权边界。为了表明处理者已对数据付出了智力劳动,而不是简单的数据收集,各试点省(市)都规定数据必须“经过一定规则或者算法处理”。但是数据的生命周期管理涵盖了多源异构数据采集、结构化与非结构化数据治理、分布式计算框架与机器学习算法实现,以及多模态应用场景建模与价值挖掘等多维度协同优化,涉及采集、清洗、标注、脱敏、特征提取等多项技术动作,数据成果的创新性难以界定和表现。实践中,“经一定规则或者算法处理”缺乏具体解释,各试点省(市)在具体操作过程中,对登记客体体现的创新性要件采取了不同的认定标准。理论中,对该要件的具体标准亦莫衷一是,存在衍生数据说、衍生性财产利益说、智力劳动说、算法处理说、数据标准化或结构化说等观点,还有观点认为将“智力成果属性”作为构成要件不妥当,主张采纳实质投入说。若数据知识产权登记制度无法明确创新性要件的具体判断标准以确定其独特的保护对象,将丧失其独立存在的制度价值。
3. 价值性要件
根据民事权利是否以财产利益为内容,民事权利可以分为人身权和财产权[4]。知识产权兼具人身权和财产权两种属性。知识产权的人身属性源于智力成果与创造者人格的固有联系;其财产权属性则源自知识产品的经济价值转化能力:知识产品可在物质形态上转化为具备使用价值的商品在交换关系中获得以货币衡量的交易对价或者在资本维度形成无形资产估值,通过产业化应用进入社会再生产循环实现经济价值。各试点省(市)都对数据的价值性有所要求,但是在价值选择上存在差异。目前学界对价值性要件的选择,存在本质相同说、实用价值说、商业价值说三种观点。本文认为,尽管知识产权人最终的目的是获取商业价值,实用价值和商业价值在实践中不可避免会发生交互,但两者存在本质区别。实用价值更多地强调数据作为生产函数的技术乘数效应,而商业价值则侧重于数据作为生产要素在市场上的交易和收益,数据知识产权登记客体在价值性要件上应在两者之中择一适用。
4. 公开性要件
对于公开性要件,学界观点较为一致,都认为不应要求登记客体具有公开性。若数据知识产权登记要求“非公开性”,则意味着数据知识产权的保护路径与商业秘密趋同。若将其与商业秘密保护相区别,则需要阐明未公开性具体需要达到何种程度,若“非公开性”与商业秘密的秘密性等同,则数据知识产权与商业秘密的功能重叠[5]。另外,数据垄断的根源在于排他性权利的滥用,而非数据是否公开。即使数据处于非公开状态,若缺乏对权利行使的限制,仍可能导致垄断;反之,公开数据若通过合理制度设计,亦可避免数据垄断风险。
(三) 登记证书效力不足抑制制度效用
法律所创造的规则对不同种类的行为产生隐含的费用,因此这些规则的后果可当作这些隐含费用的反映加以分析[6]。只有当登记收益大于合规成本时,才能激发主体申请数据知识产权登记的积极性,充分发挥数据价值。登记证书推定效力和公信力的缺失,意味着在发生权属纠纷时,登记主体仍需另行举证证明权利归属,而无法通过举证责任倒置减轻证明责任,导致对登记主体形成合规成本沉没;对于在市场上进行交易的第三人而言,因信赖登记证书内容与登记名义人交易的,无法取得善意的实体法效果,第三人在交易前也不得不额外承担权利真实性核查成本。若对数据知识产权登记是否具备更强的公信力、对数据知识产权转让的法律效力,以及交易中对第三方的保护问题无法作出回应,将阻碍数据知识产权人与交易各方形成正常的商业预期,影响数据知识产权制度的功能发挥。因此,数据知识产权登记的价值不应局限于证权的表层功能。在数据知识产权理论和实践经验成熟后,立法有必要确认登记的赋权功能,并在此基础上选择相应的效力规则,强化登记证书法律效力。
4. 数据知识产权登记制度的规范重构
运行初期的探索阶段的问题可以通过渐进式的改革加以修正,因此,需要在保护数据知识产权和促进数据交易流通理念指导下,将知识产权登记主体范围限定为数据处理者、统一登记客体构成要件、以第三方审查机构介入加强登记审查的有效性、采取登记对抗主义模式加强登记证书的法律效力。
(一) 登记主体:数据处理者的适格性证成
各地对数据知识产权登记规定广泛的主体范围,其目的在于吸引更多主体入场,降低制度落地阻力,促进数据要素市场繁荣。但主体范围过宽,导致市场资源被错误地配置到低质量或创新性不足的数据上,阻碍数据产业的健康发展。
首先,数据持有者不宜成为数据知识产权登记主体。数据持有只是对一种事实状态的描述,因此数据持有者对数据知识产权并不享有排他性权利[7]。数据知识产权制度的核心在于保护数据的智力成果,对数据的“智力成果属性”没有做出实质贡献者不宜作为权益享有主体。尽管有观点认为如同在自然界中发现的图案可以申请商标一样,对数据资源的收集与持有同样可以形成知识产权[8]。然而,这种转化并非自动的,对于商标而言,其显著性或可识别性是获得商标权的关键。即使某个图案或符号是从自然界中发现的,申请者也需要通过设计、构思等智力劳动赋予其独特的含义,使其与特定的商品或服务建立、联系,并具有显著特征。因此,对于数据知识产权而言,也只有按照一定规则或算法对数据付出智力劳动的人才能成为登记主体。若数据持有者对数据按照一定算法规则进行了加工,形成了具有智力成果属性的数据成果,那么就完成了从持有者到处理者角色的过渡,便可能成为数据知识产权登记主体。
其次,不是所有的数据处理者都可以成为登记主体。在处理数据的过程中,涉及数据收集、整合、处理等多个环节的多元主体,大致可以分为下列五种类型:A. 初始数据采集者(形成未处理的数据);B. 数据预处理者(产出可用数据集);C. 数据汇集者(产出结构化或关联分析的数据资源);D. 挖掘分析者(产出AI算法或智能工具);E. 智能工具的使用者(分析场景数据,产出知识或智慧行动)。在这一过程中,A、B和C是数据的生产者,而D和E则是知识的生产者[9]。在这一链条中,尽管各主体均付出了劳动,但知识产权的取得是基于智力创造劳动,仅对数据进行简单的收集、存储、传输、流通、公开等处理行为的简单搬运者不宜成为登记主体。
最后,数据价值是多方主体协同创造的结果,数据的价值源于数字劳动者的劳动,因此数据收集者、储存者、分析者等主体尽管无法受到知识产权的保护,也应保证数字劳动者凭借数字劳动贡献公平合理地获得报酬,才能激发数字主体的活力和创造力。按照“谁投入、谁贡献、谁受益”的原则,对于数据的产生进行了投入、作出了贡献的主体应当对该数据享有一定的合法权益,其边界有待界定但不妨碍其权益应当受到保护[10]。在按贡献参与收入分配时,应覆盖数字劳动者、企业及数据来源者等多元主体,通过量化劳动复杂度、技术投入与数据边际贡献,合理分配收益,确保各方权益平衡与激励相容。
(二) 登记客体:合法性、创新性与价值的整合
1. 合法性要件
对于是否需要合法性要件,有观点认为基于“客观中性”原则,数据知识产权登记时无须设置来源合法性要求,登记机关无须审查也无法审查每条数据的来源合法性[11]。在数据海量的情况下,此种观点有一定合理性。但是,这不仅违反了《数据安全法》要求的数据收集必须“合法、正当”的规定,也会导致数据市场出现“劣币驱逐良币”现象,只有在坚守数据安全底线的前提下充分获取在先权利人的知情同意与使用许可,才能真正实现公开性数据集合的知识产权保护机制的有序运行[12]。因此,合法性要件必须保留。
首先,数据必须具有合法性来源。数据上财产价值的自由流动应当以数据上公共利益和人格利益的充分保障为前提。任何受保护的数据在处理前,都应获得数据所有者或在先权益人的明确许可,确保数据的来源合法且经过授权,这是数据处理的基本前提。数据来源包括自行产生、协议获得、公开收集、公共数据授权等取得方式[13],但无论哪一种方式,数据的收集和获取必须严格遵守《数据安全法》《个人信息保护法》《网络安全法》等法律,确保个人信息、国家秘密等属于法定优先利益受到严格保护。
其次,处理数据的过程合法。应确保数据处理的全生命周期都合法,包括但不限于对敏感数据进行去标识化处理,确保去标识化后的数据无法直接或通过与其他信息结合来识别特定的个人,定期对去标识化后的数据进行监控和审查,确保不会损害国家利益、社会公共利益以及他人合法权益。
2. 创新性要件
数据之所以可以成为知识产权保护的客体,是因为具有智力成果属性。前述衍生数据说仅强调了其与原始数据的区别,实际上并未指出创新性要件的具体判断标准。衍生性财产利益说、智力劳动说、实质投入说都模糊了数据知识产权与数据产权的界限,即数据产权的保护对象是数据本身,其功能主要在于解决数据资源的权属划分与流通合法性,明确“数据归谁所有、谁可用、如何交易”;而数据知识产权来源于智力创造的创新性,其保护对象应是数据创新成果,其功能在于确认哪些数据成果应受保护,并明确权益边界,平衡数据利用与创新保护的关系。数据产权制度与数据知识产权制度有不同的功能面向,上述观点未能充分理解知识产权保护创新成果的本质属性,导致非创新性数据被过度保护。而算法处理说虽然强调了算法在产生数据创新结果方面的重要作用,但忽视了算法本身已受到专利法保护的事实。
数据的智力成果属性应体现在数据的结构化和标准化之中。数据是符号的集合,是表达客观事物未经加工的原始素材[14]。数据来源于多个渠道,在没有经过系统处理前,不免包含着错误数据、重复数据、无关数据等噪音数据,原始数据的结构往往杂乱无序,需要通过算法对原始数据进行深度过滤、分析、整合,筛选出有价值的数据并形成数据图表、分析预测等[15]。在这一过程中,处理者需根据数据的特性和具体需求,设计算法的计算逻辑,涉及复杂的数学运算、矩阵操作、循环迭代优化算法模型,需要高强度的智力投入和技术创新精神。通过算法加工的过程,将数据按照名称、所属行业、应用场景、结构规模、更新频次、等固定下来,使其变得更加有序、一致和可比,数据的“智力成果属性”得以外化表现。数据的结构化或标准化说既弥补了衍生性价值说、智力劳动说、实质投入说忽视数据创新性,盲目扩大登记客体的局限性,又厘清了算法保护与数据创新成果保护的界限,强化了数据知识产权制度的独立性。
3. 价值性要件
数据知识产权登记应选择实用价值。
首先,在数据知识产权登记中,要求具备实用价值是为了确保数据能够在实际应用中发挥作用,从而保护数据处理者的权益和激发数据产业的创新活力。而商业价值则更多地由市场机制来决定,不宜作为数据知识产权登记的必备要件。
其次,实用价值可以通过具体应用场景进行客观判断。无论数据是用于科学研究、商业决策还是公共服务,只要能够在某个特定领域或场景中发挥作用,就可认为这些数据具备实用价值。这种判断方法既符合数据知识产权的实际情况,又能够灵活应对不同领域和数据类型的需求。相比之下,商业价值的判断更加复杂且主观,商业价值则受到市场波动、技术变革、法律法规等多种外部条件的影响,难以在数据知识产权登记时进行准确审查。
4. 公开性要件
登记客体应当具有可公开性,同时对公开的数据不应要求达到规模性。
一方面,非公开性并不能有效的限定数据知识产权登记范围并影响其发展。首先,目前登记机关只采取形式审查下,实际上是很难判断登记的数据集是否“非公开性”[16];其次,若将登记保护范围限定于非公开数据,相当于默认“公开即放弃权益”,迫使数据处理者为维持权利而限制开放,导致“保护”与“利用”的对立。最后,数据知识产权的登记保护,根据知识价值论是基于对数据知识产权人的智力劳动的认可,而数据是否已经公开不是需要考虑的因素。
另一方面,对于公开的数据集合而言,有观点认为只有达到实质规模的数据被登记,此种观点值得商榷。现阶段,数据知识产权登记应以激励创新和权益明晰为指导,不宜机械设定“规模性数据集合”门槛。数据知识产权登记旨在解决数据流通中的权属公示与交易信任问题,若要求“规模性集合”,将迫使单一数据所有者只能依赖合同约定维权,无法通过登记形成公开、透明的交易市场,背离“数据二十条”提出的“促进数据要素市场化配置”的目标。另外,单一数据并非没有处理者的智力劳动。数据作为信息的载体,单一数据也可能涵盖复杂的信息量,或是经过复杂的处理过程取得[17]。若单一数据体现了“智力成果属性”,仍应受保护,规模性仅是判断投入的参考因素之一,而非刚性标准。
(三) 效力强化:登记对抗主义的逻辑证成与规则设计
在充分把握数据的特有属性和产权制度的客观规律的基础上,数据知识产权登记应采取登记对抗主义模式。
首先,登记对抗主义模式契合数据的本质属性。不同于完全无形的智力知识创造,数据可以存储在实体介质中固定;也不同于不可再生的土地资源,数据具有非竞争性和非排他性,数据的价值在使用过程中释放,数据资源总量也基于人类劳动而增加[18]。登记对抗主义模式允许数据在未经登记的情况下在当事人之间自由流动和使用,并且不会削减数据本身的价值,符合数据的本质属性。同时,登记对抗主义模式也为当事人提供了保护机制,即在数据知识产权发生变动时,通过登记来明确权利归属和对抗善意第三人的效力,从而保障数据知识产权的合法使用和流转。其次,登记对抗主义模式与社会现实相适应。实践中,网络蓬勃发展以来,用户自愿贡献信息、网络平台撮合信息、搜索引擎提供链接和网络企业之间跨界流量互享等现象就广泛存在[19]。其本质是默示的“对抗主义”——用户未明确反对即视为允许平台使用数据,与登记对抗主义模式的理念不谋而合。这种模式强调效率和自治,与登记生效主义“不登记则无效”的刚性规则冲突。若强制要求登记生效,会否定实践中广泛存在的合理数据利用模式,破坏数字生态中形成的默示共识。
确定应采取登记对抗主义模式后,其制度效能的释放还有赖于权利推定效力与登记公信力的双重构建。具体而言,登记证书所记载的主体应依法被推定为真实权利人,在权属争议中实行举证责任倒置规则,即由异议方承担证明登记错误的举证责任,将举证成本配置给风险防范成本较低的一方,以降低权利人的维权成本,强化登记制度的法律效力;第三人在尽到合理注意义务后因信赖登记证书记载所为的法律行为,其信赖利益也可对抗真实权利人的追索。通过完善数据知识产权基础性的登记效力规范构造体系,不仅有效解决了数据知识产权权属变动的公示难题,更通过降低交易成本、增强权利流动性,形成了“登记促流转、流转促创新”的良性循环,为数据要素市场化配置提供了坚实的制度保障,实现了鼓励登记行为、保护交易安全、促进数据开发利用的多元价值。
5. 结语
当前数据知识产权登记虽处于区域性试点阶段,但其制度框架已初步显现出基础性效能和规范性形态。数据知识产权登记是数据知识产权价值实现的第一环节,对于明确数据初始权益归属,推动数字经济的发展有着重要意义。事物发展初期,无疑总会存在一定局限性,还需要持续进化完善这也意味着数据知识产权的保护与应用还有很长的路,除登记主体、登记客体构成要件、登记机构、登记审查形式、登记证书效力的完善之外,数据要素收益分配、司法裁判规则构建、数据知识产权跨境互认等问题,有待继续探索和发展。