摘要: 数据抓取行为的规制对于维护市场公平竞争、保护企业和用户权益以及促进大数据发展都有着重要意义。但是,适用《反不正当竞争法》规制不正当的数据抓取行为时,出现了一些难以避免的问题,本文剖析了《反不正当竞争法》在规制数据抓取行为时面临的困境,一方面,互联网领域竞争关系的判定存在争议,这给法律适用带来了不确定性;另一方面,互联网专条的局限性导致法律适用向一般条款逃逸,影响了法律的稳定性和可预测性。据此,在明确数据流通优先兼顾数据保护的规制目标下提出制度上的优化建议,包括摒弃以竞争关系的判定为前提、明确一般条款的适用边界与衔接等,以期对不正当数据抓取行为做出有效规制,维护互联网领域正当有序的竞争秩序,促进互联网行业的健康发展。
Abstract: The regulation of data scraping behaviors is of great significance in maintaining fair market competition, protecting the rights and interests of enterprises and users, and promoting the development of big data. However, when applying the Anti-Unfair Competition Law to regulate unfair data scraping behaviors, some inevitable issues have emerged. This paper analyzes the dilemmas faced by this law in regulating data scraping behaviors. On the one hand, the judgment of competitive relationships in the internet sector is controversial, bringing uncertainty to the application of the law. On the other hand, the limitations of the Internet-specific provisions lead to the escape of law application towards general clauses, affecting the stability and predictability of the law. Therefore, with the regulatory objective of prioritizing data circulation while taking into account data protection, this paper proposes institutional optimization suggestions, including abandoning the premise of judging competitive relationships and clarifying the applicable boundaries and connections of general clauses. These suggestions aim to effectively regulate unfair data scraping behaviors, maintain a legitimate and orderly competitive order in the internet sector, and promote the healthy development of the internet industry.
1. 引言
本文将数据抓取行为中的数据定义为:在互联网领域产生的,以网络为载体或者媒介,具有可流通的属性,对其进行分析可以对人或事物的属性、特征、偏好等进行了解的电子信息,以及由此产生的能够形成其他商业价值的电子信息,如电子身份信息、用户评价、浏览记录等。数据抓取又称为数据爬取,刑法学中则称之为网络爬虫行为。目前并没有对数据抓取行为做明确定义,有的学者以其主要行为方式将其定义为,利用爬虫程序进行的相关数据的高效收集和存储行为[1]。也有学者对利用不同方式的数据抓取行为分别分析,避免统一下定义[2]。传统模式下,数据控制方首先需要吸引大量的用户群体,通过他们注册时登记的信息、平时浏览信息、交易记录或者用户发布的信息等收集整合获得数据集合。而随着互联网技术的发展,类似网络爬虫等可以高速浏览并下载的技术应运而生,数据抓取方不必再通过前述漫长的流程便可以利用其从数据控制方抓取数据。综上,本文中所称数据抓取行为,是指数据收集阶段,经营者利用网络爬虫等相关技术手段,从其他经营者经营的网页、网站等空间大规模复制目标对象数据的行为[3]。但是,不当的数据抓取行为可能侵犯的权益很多,本文关注的重点是不正当竞争类行为,其他侵犯著作权或者人格权行为不在本文讨论中。
我国立法上有关数据抓取的法律法规,广泛分布于民法典、竞争法、著作权法等多个法律部门。由于数据赋权的困难,以及能够满足独创性要求的数据范围过小等问题,使得竞争法的规制路径更加契合数据抓取的特点。但是竞争法规制路径同样存在不足之处,竞争法在司法实践中适用,法院主要依据一般性条款和互联网专条进行裁判。一般性条款存在判断标准模糊,自由裁量的空间过大等问题;互联网专条也存在着与数据抓取的行为特点差距过大,实用效果差等问题。本文则主要通过对上述问题的探讨,以期找到一条规制企业之间不正当的数据抓取行为的正确路径。
2. 数据抓取行为规制的必要性及目标
2.1. 数据抓取行为规制的必要性
数据抓取作为一项能够促进数据流通的技术,也具备着技术两面性的特点,数据抓取并非直接是一种侵权行为,数据流通的特殊意义赋予了该行为一定的正当性,即在自由流通的环境下,用其所长,创造数据更高的使用价值。数据处于公共领域,作为一项公共资源,它能够被所有人所收集和利用,这是数据所具有的开放性和公共性。同时,通过对碎片化数据的整合,延展数据的覆盖面,能够提升数据的利用程度和利用效率。数据的社会化利用离不开数据流通,任何人对开放的、碎片化的数据均不应享有权利[4]。目前而言,数据的自由流通已被国际所公认。但是不当数据抓取所具备的危害性,使其具有规制的必要性。数据抓取的危害性主要表现在以下三个方面。
一是侵害数据控制者的权益。数据作为市场竞争的关键要素,数据控制者通常会投入大量的人力、物力和时间成本,从初期的收集、整理,到后续的加工、存储,最终形成自己所独有的、具有高度经济价值的数据资源,这一系列的投入主要为巩固和提升其在市场竞争中的优势地位。而不当的数据抓取行为,不仅会导致数据的泄露问题,直接侵害数据控制者的经济利益,也会对网站、平台的正常运营产生影响,干扰用户在网站、平台上的使用,从而间接地影响相关利益。
二是侵犯数据来源者的权益。数据控制者所掌握的相当一部分的数据来源于普通用户,这部分数据往往又涉及用户个人的隐私或个人信息。用户通过授权允许网站或平台采集和处理其个人信息,然而,数据抓取行为并未获用户明确同意,这就可能侵犯用户的个人信息或隐私权。
三是破坏数据自由流通秩序。数据的良好流通需要一个健康的环境,那就是数据流通技术的进步,无论是数据分享还是数据抓取技术的进步会使得数据的效益提高,从而促使社会的进步,同时社会进步又需要更多、更好的技术,新的需求会促进良性的竞争,由此形成完美的闭环。但不当的数据抓取行为,属于不劳而获的情况,会严重扰乱社会公平秩序,并且在利益的驱使下,甚至会出现泛滥的情况,影响整个社会的发展。
2.2. 数据流通优先兼顾数据保护的规制目标
在我国,关于数据抓取行为的规制目标仍存在争议,在以往的司法实践中以数据保护优先为主要的规制目标,在这一目标指引下法院也倾向于认定数据抓取行为构成不正当竞争,但这也引发了一些争议,数据保护优先的策略意味着对数据流动和使用的严格限制,这无疑会阻碍数据的正常流通和利用,数据的价值在于其流动性和共享性,限制数据的流通会削弱其价值;同时,企业为满足数据保护的要求也需要投入更多的资源来确保抓取行为的安全性和合规性,增加企业的运营负担,尤其对中小企业而言,将会面临更大的挑战。不仅如此,在数字经济时代,数据的流动是推进技术进步和产业升级的关键因素,数据保护优先的目标可能会抑制数字经济的活力,导致数字经济发展受阻。
针对这一争议,我国学者提出了数据流通优先兼顾数据保护的规制目标,学者殷继国从从理论依据、现实意义和实践探索三个角度阐释了该目标的科学性、合理性,他认为,数据的流通属性和促进数据流通的现实需求决定了我国应确定数据流通优先兼顾数据保护的目标[5]。反不正当竞争法作为经济法的重要组成部分,承担着经济秩序维护和经济发展促进两种不同的功能,在竞争秩序维护方面,反不正当竞争法应当对所维护的私秩序保持适度的谦抑性,避免对私秩序造成不当干预,而根据数据保护优先的裁判思路,轻易认定数据抓取行为构成不正当竞争行为,背离了谦抑性的原则,容易导致数据的本质流通属性被压制。在数据抓取行为规制中,确立数据流通优先兼顾数据保护的规制目标是基于当前数字经济发展的现实需求和数据的本质特性提出的,虽然我国的数据政策并未明确提出这一规制目标,但政策内容已经倾向于强化数据流通,《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》中即弱化了数据所有权的概念,强调要以促进数据合规高效流通使用、赋能实体经济为主线,明确要求建立一套针对公共数据、企业数据和个人信息数据的确权和授权机制体系。《中华人民共和国数据安全法》第1条也明确将“促进数据开发利用”作为立法目的之一。总之,在我国现实背景下,促进数据流通仍然是经济发展的核心任务,在探讨对数据抓取行为的规制时,首先要明确数据优先兼顾数据保护的规制目标。
3. 《反不正当竞争法》对数据抓取行为的规制困境
3.1. 互联网领域竞争关系的判定存在争议
传统意义上的竞争关系范围较小,一般特指同业竞争者之间的竞争关系。随着互联网经济的发展,市场主体的经营模式和竞争目标都发生了很大的变化,跨领域、跨行业成为主要特征,流量成为互联网企业的核心竞争力。在虚拟的网络空间中,即使双方的业务范围相距甚远,也会形成网络流量此消彼长的对应关系[6]。因此,互联网经济与传统的市场经济存在差异,其主导的竞争模式转变为跨界竞争,竞争范围扩展至整个网络市场,导致传统竞争关系的界定在互联网市场中难以直接适用。
《反不正当竞争法》对于竞争关系并没有明确规定,在学界已经有很多学者表示,互联网不正当竞争行为的判定不应再以竞争关系的存在为前提。但通过对数据抓取不正当竞争案件的梳理可知,司法实践中,竞争关系仍是法官的必要考量因素之一。究其原因,是以前的行业界限清晰,从竞争关系入手分析是一条便捷的途径,这也形成了司法裁判的定式,对竞争关系的认定根深蒂固。具体到数据抓取不正当竞争纠纷中,由于数据抓取的技术性强,隐蔽性高,法院在对双方竞争关系进行准确界定时会更加困难,只能不断对竞争关系进行扩充。
3.2. 互联网专条的局限性导致法律向一般条款逃逸
《反不正当竞争法》第12条作为新增加的“互联网专条”,在传统法律很难规范网络不正当竞争的情况下,它能够对规范数据方面的不正当竞争起到指导作用,从制度上弥补了传统法律的缺憾。该条采用“概括性概括 + 详细列举 + 兜底性”的立法方法。但是,在数字时代下,不可能把新出现的不正当竞争行为全部列举出来。反不正当竞争法中列举条款的主要功能是确立权利边界,以便于执法和司法实践中判断行为是否属于不正当竞争。但对于互联网领域的数据资源,由于数据具有开放性、共享性,且数据本身的价值具有不确定性,使得列举条款难以有效规制数据资源的不正当竞争行为。列举的具体类型对于数据的收集和利用行为而言,很难同时满足这三个要求,因此并不能合理解释其包含数据这种不正当竞争行为。“互联网专条”本该体现的互联网新型不正当竞争行为的本质要件并没有全面体现,列举条款对其无法合理、合理地解释、适用,“互联网专条”的缺陷在于首先在没有明确数据权益属性的情况下,难以判断哪些行为属于不正当竞争行为;其次对于以技术手段获取、加工、处理和利用他人数据资源的行为,难以根据其技术手段进行准确界定[7]。为了解决这种问题,《反不正当竞争法》第2条的适用灵活等特点而被学理学界作为一般条款进行司法适用。一般条款作为《反不正当竞争法》中的一项原则条款,由于其没有具体规定,因此在实际操作中可以得到更多的灵活性和更多的运用。但是,在法律适用上,又存在着对一般条款的界定不清、判断标准不清等问题,从而造成了在司法实务中的误用。一般情况下,依据其他的法规,将这种不正当的竞争行为确定为非法不当行为,随后,双方以不正当的竞争为理由,向对方提出起诉,而法庭在受理案件前,也经常会确定这种抓取的行为是非法的,最后,只需要简单地运用一般条款来确定这种不正当的事实即可。在“新浪诉脉脉数据抓取纠纷案”1的裁判判决中,法院认为,脉脉擅自获取了用户关键数据,从个人隐私的角度来看,这种获取数据的做法属于侵权,并不符合对关联用户权益的保障。但是,由于现行的《反不正当竞争法》并没有对侵权责任作出相应的规定,因此,司法机关对于该条款的适用也缺乏足够的证据,从而导致了法律适用向一般条款“逃逸”。
4. 数据抓取不正当竞争行为法律规制的完善建议
4.1. 摒弃以竞争关系的判定为前提
司法实践中,法院往往以双方存在竞争关系作为认定不正当竞争的前提,这种审判思路是不合理的。法院在坚持这种认定逻辑时,往往不断扩展竞争关系的边界,使得竞争关系成为一种形式,逐渐被虚化。实际上,双方存在竞争关系不代表行为不正当,双方不存在竞争关系也不代表行为正当,在具体判定时,应当综合考虑涉案数据的价值、抓取数据的方式和造成的损失等因素。因此,在认定新型不正当竞争行为时,应当转变思路,摒弃对竞争关系的判定。在传统经济模式下,竞争关系具有相对性,在认定不正当竞争时通常采用“行为–法益”模式,即规制违法行为,保护合法利益。在互联网双边市场经营模式下,竞争关系的相对性逐渐淡化,在认定不正当竞争时通常采用“行为正当”模式,即认定不正当竞争的关键是行为具有不正当性。对于后进入市场的经营者来说,竞争对手具有不确定性,只有行为发生后,竞争对手才被短暂确定,而这种确定也会因为竞争的动态性发生变化[8]。这种情况下,竞争关系不应再是认定不正当竞争的前提,竞争行为是面对整个互联网市场实施的。
具体到数据抓取不正当竞争案件中,可以通过“百度诉奇虎案”2予以释明。百度公司和奇虎公司都是互联网企业,分别经营搜索引擎和安全软件,在互联网行业发展的早期,软件的功能较为单一,百度公司和奇虎公司并不存在争夺用户的问题,所以二者不存在竞争关系;但随着互联网经济的发展,竞争关系不再具有相对性,此时二者之间存在竞争关系,且这种竞争关系是在奇虎公司的数据抓取行为发生后才被确定的。
当前,理论界和实务界依然有观点坚持竞争关系是认定不正当竞争的前提,是因为传统经济下“规制违法行为,保护合法利益”的思维已经先入为主,从而忽视了在互联网经济下,竞争已经无处不在。实际上,《反不正当竞争法》一般条款的重点正是行为及其构成元素。在对竞争进行定性时,应当回归行为本身,考量“损人利己的可能性”,即数据抓取行为有可能削弱他人的经营收益,而数据抓取者能通过此行为获取现实或潜在的经营利益。传统的认定思路不符合《反不正当竞争法》的立法宗旨,限制了法律的使用范围,不利于规制新型不正当竞争行为[9]。因此,应当顺应时代的变化,更新理论研究,革新审判思路,逐渐摒弃对竞争关系的判定。
4.2. 明确一般条款的适用边界与衔接
就国际实践而言,各国对一般条款过度适用等问题的处理方法各不相同,但总体共对其适用的严格限制。比如,德国的《反不正当竞争法》在第一条通用条款之外,还设有详细的“附件”黑名单,用以具体化界定通用条款的应用场景。在司法实践中,首先会参照黑名单中的规定,对违反法律规定或犯罪行为采取相应措施;其次会依据一般条款,结合具体案情、执法与行政机构的权责范围,灵活地对违法行为采取必要的处理措施。日本还专门制定了一部单行法,对不正当竞争进行了严格的规制,防止一般性条款的滥用,这一点对我国当前法律适用缺失有极大的借鉴作用[10]。针对一般条款存在过度适用的问题,笔者将从保持谦抑性的内部规范、如何与其他条款的协调适用的外部规范、进行充分说理论证的方法对其的适用边界与衔接进行确定与合理限制。
4.2.1. 保持内在谦抑性
理论界与司法实践都忽略了《反不正当竞争法》内在的谦抑性,造成一般条款的过度适用。一般条款具有开放性和抽象性,使得竞争行为符合具体条款所禁止的行为,也一定会满足被一般条款规制的情形,因此,必须维持内在谦抑性,才能避免过度干预市场。数据行业在许多方面与传统行业不同,需要采取审慎的方法来保障技术创新、商业模式创新和数据行业市场参与者的行动自由。有必要引入“谦抑介入”的概念,保持一般条款的内在谦抑性。实现内在谦抑性的方法包括明确市场优先原则和运用比例原则。市场优先原则要求只有在市场失灵时,才能进行不正当竞争行为的认定,以确保市场上的公平竞争。这强调当市场出现功能失效时,理想的做法是调整市场机制本身以恢复公平竞争,而非直接通过外部干预来抑制竞争。实施干预时,需确保其与市场失灵的严重程度相匹配,且在无法断定某一特定领域是否存在市场失灵时,应优先假定市场机制未发生失灵。同时,干预手段也应与市场竞争环境的变化相适应,以确保干预手段可以有效地抑制竞争,避免出现市场失灵。比例原则则从经济、社会、文化、环境等多个角度全面衡量竞争的效果,确定不正当竞争的界限,从而作出更加理性的判断。
4.2.2. 明确“穷尽规则”原则
“穷尽规则”原则是指仅在其他具体条款没有明确规定时,一般条款才有适用的余地。一般条款是所有不正当竞争行为高度抽象提炼而成的概括性法律原则,只有行为不符合具体条款的构成要件,才能考虑是否有悖于自由竞争立法的初衷,运用一般条款予以裁决。数据不正当竞争案件的处理方式包括两种情况:一是符合特定条款规定的类型化情形,这种情况下应根据条款类型化规定进行判决;二是需要判断数据竞争行为是否可以适用一般条款进行规制。在评估一般条款适用性时,需严格审慎,明确行为性质与危害后果,比对具体条款与一般条款的契合度,并平衡创新与保护的关系。具体来说,需注意以下几点:首先,如果被诉行为符合互联网专门法规中列举的类型,应该优先适用相应的条款。其次,在充分论证后发现该数据行为不符合专门法规类型的范围时,可以考虑该行为是否符合互联网专门法规“兜底条款”的条件,尝试使用兜底性条款。最后当现有具体条款无法有效规制时,且行为确实具有不正当性并造成实质性损害时,方可考虑适用一般条款。
4.2.3. 进行充分说理论证
成文的法律会逐渐落后于经济的发展,适用一般条款对案件进行认定是具有必然性的。德国法学家赫费曾说过,正义实现的最基本的条件就是禁止任意性。法官引用一般条款对数据不正当获取行为进行认定时,必须进行充分、详细的说理论证,包括为什么适用,如何适用以及适用时考量因素有哪些。在对数据竞争行为进行判定时,法官应当结合数据特征和互联网发展规律,考虑到案件的具体情况,评判应基于数据的相关价值、数据竞争的特点和其他相关因素。法官如果援引行业规则作为评价商业道德的标准时,应当对行业标准进行审查,确保其不与法律法规相违背,在进行审查过程中,主要考虑行业规则与法律法规的目的是否一致,要严格防止引用不适当的行业规则或惯例来扰乱市场竞争秩序。与此同时,补充适用一般条款的考量因素。首先,需关注“损害其他经营者的合法权益”的评估,在此,应注意经营者的合法经营模式应受到《反不正当竞争法》保护,避免受到恶意干扰、破坏或妨碍;此外,在法律和商业道德允许的范围内,经营者投入的各种资源,如用户、流量、数据、公司声誉和产品声誉等,均应受到法律保护。其次,在评估数据抓取行为是否扰乱市场竞争秩序时,应全面考虑其对市场竞争秩序的潜在影响,一是要维护公平的市场竞争秩序利益,包括消费者的合法权益、数据抓取行为当事人的利益,以及其他同行业或相关领域的经营者利益,这些利益的平衡与保护是市场竞争秩序得以稳健运行的基础;二是强调尊重他人合法权益,数据抓取行为不应侵犯他人的知识产权、商业秘密或数据权益等合法权益;三是要特别关注消费者权益,在互联网语境下,消费者的利益主要体现在知情权、隐私权和选择权等方面,数据抓取行为不得侵害消费者的这些基本权利,而应致力于提升消费者的信任度和满意度,推动形成健康、有序的市场竞争环境。
5. 结论
运用反不正当竞争法规制数据爬取及后续利用问题已经成为司法共识,对传统规制思路进行系统性反思的基础上,在认定数据爬取这类新型不正当竞争行为时,应当转变思路,摒弃对竞争关系的判定,回归行为本身,注重实质要素的考量。此外,在具体条款的适用上,以保持谦抑性的内部规范协调外部规范的衔接适用,通过充分的说理对其的适用边界与衔接进行确定与合理限制。然而,本文也存在一些不足之处,例如,虽然初步探讨了一般条款的适用边界与衔接,但具体如何操作和实施,还需要进一步的研究和实践探索。因此,在未来的研究中,仍需深化对不正当数据抓取行为的识别标准和方法,加强对一般条款适用性的研究和探索,以更全面地应对数据抓取行为带来的挑战。
NOTES
1参见(2015)海民(知)初字第12602号民事判决书。
2参见(2012)一中民初字第5718号民事判决书。