人工智能深度学习中的著作权侵权认定
Identification of Copyright Infringement in Deep Learning of Artificial Intelligence
摘要: 人工智能技术的发展引发了新的法律问题。作为一种全新的著作创作模式,人工智能深度学习所造成的侵权较之于一般著作权侵权更为复杂。人工智能深度学习的产出品具有独创性,传统著作权侵权中所适用的“实质性相似 + 接触”原则,不能充分回应人工智能深度学习的侵权问题。主要原因一是在于人工智能独特的数据获取方式满足“接触”这一要件;二是由于写作型人工智能在深度学习中具有特殊构造,认定“实质性相似”的三种方法均难以用于认定输出作品与源作品之间存在的关系。对此,在当前的技术水平下,可以考虑利用合理抗辩来平衡著作权原权利人与人工智能创造者之间的法益。这就要求:一是明确“合理使用”标准,二是延展“法定许可”标准,三是要对前述两类标准合理选择适用。
Abstract: The development of artificial intelligence technology has caused new legal problems. As a new mode of copyright creation, the infringement caused by the deep learning of artificial intelligence is more complex than the general copyright infringement. The products of AI deep learning are original. The principle of “substantial similarity + contact” applied in traditional copyright infringement can not fully respond to the infringement of AI deep learning. The first reason is that the unique data acquisition method of artificial intelligence meets the requirement of “contact”; Secondly, due to the special structure of writing AI in deep learning, the three methods of identifying “substantial similarity” are difficult to identify the relationship between output works and source works. In this re-gard, under the current technical level, we can consider using reasonable defense to balance the legal interests between the original copyright owner and the creator of artificial intelligence. This requires: firstly, to clarify the “reasonable use” standard; secondly, to extend the “legal license” standard; and thirdly, to reasonably select and apply the above two types of standards.
文章引用:王佳璇. 人工智能深度学习中的著作权侵权认定[J]. 法学, 2022, 10(4): 713-722. https://doi.org/10.12677/OJLS.2022.104091

1. 问题的提出

人工智能深度学习是通过深度学习技术利用统计、数学、信息论、控制论和其他科学知识,以程序设计自动优化计算机程序,提高工作绩效,并最终促进人工智能的整体发展的智能化活动 [1]。然而,深度学习的飞速发展,也同样衍生出一系列的法律问题亟待规制。比如,一般而言,人工智能深度学习包含输入阶段、分析优化阶段和输出阶段。在输入阶段,相对于人类花费大量的时间对信息进行筛选,人工智能借由“爬虫”技术,能够在未经原著作权人同意的情况下,在几分钟内获取上百篇符合自己需求的作品,并对作品进行利用加工。这在提高效率及生产力的同时,也严重降低了原权利人对作品的控制力。在作品的著作权保护未过期的前提下,人工智能擅自抓取他人作品,利用数据需要拆解、重组作品,可能涉及到侵犯他人的复制权,这个阶段便会存在侵权行为 [2]。

人工智能深度学习是一种全新的著作创作模式,由于专家学者对人工智能的深度开发,人工智能在深度学习过程中涉及的行为更为复杂,甚至存在模糊地带,并无相应的准则对之加以规范。不可避免地,较之于其他侵权行为,其所涉及到的著作权侵权问题的行为构成更为复杂、所涉专业性更强、侵权原因与范围更为广泛。也即,人工智能深度学习严重威胁原著作权人的利益,削弱了著作权制度效果,其发展需求难以匹配当前著作权既有法规范,这对当前著作权保护制度带来了挑战。一方面,人工智能深度学习和创作后的“混合文本内容”涉及到原始作品中大数据的整合,这使得人工智能侵犯他人版权的过程难以调节:人工智能深度学习后创建的作品包含大量原始作品,原始作品的内容被分发到AI创作的其他作品中。因此,更难证明混合字符的内容本质上与源作品相似。另一方面,很难证明AI创作软件的用户的侵权责任是一个主观的缺陷,若以与主观缺陷的程度相关的“赔偿损失”不足来弥补源作品的版权损失,则需要通过更高的权利成本保护降低和失衡。此外,“黑匣子”的存在,也使得人工智能的数据操作处理和内部状态未知,这同样为侵权行为的认定在技术上增加了难度。

结合上述,人工智能深度学习中所涉著作权侵权问题,一来较为新颖且不容忽视,具有分析阐明的必要性;二来与技术关联密切,具有疑难、复杂性。对此,为充分回应人工智能深度学习对著作权保护制度带来的挑战,本文拟就人工智能深度学习中所涉著作权侵权问题予以分析。具体而言,考虑到产出品是侵权行为认定的主要对象,将首先对人工智能深度学习的产出品性质作出专门认定;其次立基于传统著作权侵权认定原则,一来论证传统著作权侵权认定原则(“接触”与“实质性相似”)是否可以充分应对人工智能深度学习这一新情况,二来考虑合法来源抗辩制度能否以及如何成为人工智能深度学习中著作权侵权认定的有益路径。

2. 人工智能深度学习产出作品的性质认定

要对人工智能深度学习中的侵权行为进行认定,需结合其生成品是否具有独创性以及深度学习产生作品后是否侵犯原权利人的著作权利益来综合认定。如果其生成品没有在原作品上增加新的价值,即没有独创性,不符合版权法含义内的作品概念,则该人工智能深度学习就是一般侵权行为,现有的著作权法就能对该行为进行规制。相反,如果生成品具有独创性,则有必要探讨在新的情况下,如何通过生成品价值范畴的框限来认定其性质。

(一) 产出作品的独创性

在没有人工智能时,人们可以通过对数据的剖析来发掘知识的价值,但这与人工智能深度研究中对作品的分析不同。人对作品的分析是接触、阅读和理解作品的过程,作品的增值价值是人的感应、分析和综合智力输出。但从本身的分析而言,该过程体现的是人类利用现有知识,改进、创新,从而获得新的知识,实现原始价值和增值价值的双重满足 [3]。以文献的学术分析为例,在阅读和分析文献的过程中,即使没有知识输出(知识增值),也增加了自我知识的积累。这种知识的积累构成了对原始价值的主观需求,成为了支付给作者费用的基本动机。

然而,在人工智能深度学习的情况下,人工智能分析是执行给定算法的结果。人工智能可以区分不同算法的信息摄取,具有简单的分析收集信息的能力,从工作中不断挖掘出新的价值。也即,人工智能根据创作的目的,通过学习、模仿并创作所产生的数据的价值具有独创性。

(二) 产出作品的价值范畴

在人工智能的“深层学习”中,“深度学习”中的“知识增长”是“挖掘新价值”的过程,虽然超越了原始价值,但其仍为“使用原始价值”的产物。因而,这里需要讨论分析的为“增长价值”与“原始价值”之间的关系。如果“深度学习”中的“增长价值”不会侵犯权利人的权利,那么权利人试图分享数据价值也就缺乏合理性基础。如果“增长价值”侵犯权利人的权利,则权利人可以要求对人工智能深度学习后的产生品既得利益者分享收益,具体可以从以下两个维度加以理解。

第一,作品的价值是以复制为基础的,但可以通过对作品的演绎、信息网络的传播、改编等来实现。从复制到信息网络传播,权利界限似乎已发生了变化,但权利内涵的方向是相同的,即无论通过有形载体复制还是无形媒介的信息网络传播,都是读者对作品使用价值的实现,因此,作品的价值核心在于其内涵 [4]。从侵权的角度出发,在法律禁止的范围内,合理使用、法定许可的制度,都是将作者对作品的控制排除,是对侵权行为的抗辩,信息网络传播的权利本质上是传统通信环境下再现权的延伸,二者的共同性在于原始作品的呈现 [5]。在逻辑上,在版权法的背景下,“复制”或“信息网络传播”的内涵不应包括所有接触行为。如果与作品的联系不是为了呈现的目的,这种联系和使用不对市场中的作品的原始价值产生负面影响,那么原则上不应包含在版权所有者的信息网络传播权的范围内。

第二,人工智能分析所引起的独创性本质上是基于作品,当然人工智能分析的独创性也不能看作是作品的首次价值的市场需要。两者的独立性,应该定义为包含通过人工智能的深度学习分析作品的行为直接表现的信息网络传播权以外的内容。但是,人工智能对作品的分析行为是否被纳入到版权法上的演绎权中,成为了新的争论点。考虑到版权法上的思想表现二分法的规定,作品的内容属于自由使用的共有部分,著作权保护的是作品中独创性部分。演绎是将作品的内容基本上不改变而对作品的艺术表现形式的再创作,例如文字作品改编成漫画,或者将一个个独立文字作品编辑成作品文集。如果复制权是作品内容和表现的直接表现的话,演绎的权利是作品表现形式的间接表现,也几乎不改变作品的内容。从作品的原初价值角度来看,所扮演的作品与原作品的关系基本上是相同的作品内容的不同表现形式,改编、翻译、演绎都没有创造出实质性的新内容。也就是说,演绎作品由于其表现上的独创性,获得了完整、独立的著作权,但由于内容上的一致性,演绎行为一定要获得作者的授权。换言之,作者演绎的权利是对作品的相同内容以怎样的表现形式出现在公众的基础上的法律控制。即演绎性行为并不脱离作品的原价值范畴。

如前所述,人工智能深度学习后生成的作品与源作品之间虽然具有一定的独立性,但是其始终与源数据在演绎性权利或者其他著作权性权利上与源作品存在牵连,有可能会对原作品的市场产生法律上的侵害。

3. 传统著作权侵权认定原则在人工智能深度学习中的适用

著作权侵权的认定原则为“实质性相似 + 接触–合理抗辩”,1因此,判断人工智能深度学习版权侵权的确立需要满足三个要求:一是侵权人已经接触或可能与版权作品接触,存在剽窃的客观可能性;二是侵权人的作品与版权作品基本相似;三是不存在合理抗辩。人工智能作为新时期科技革命的代表,深度学习技术已经进入人们的生活,其在深度学习过程中,通过对他人作品的解码,学习和操练,输出自己的作品,该作品的表达规律反映的是人工智能对原始作品构成要素的选择和安排,在具有独创性的前提下,也可能侵犯他人版权的风险。传统上,判定作品是否侵权的原则是“实质性相似 + 接触”,那么,在人工智能深度学习技术的特殊构造上,直接应用传统“实体相似性 + 接触”的标准是否同样适用于人工智能呢?

(一) 侵权认定的基础:满足“接触”要求

版权保护的是作者思想的外在化形式,但不保护思想、程序、方法、系统、概念、原则和公共信息,除原权利人外,其他人可以基于相似的思想或公共信息(例如写作)进行独立的表达。接触是指版权侵权作品的作者有合理的机会,或者聆听或了解了受版权法保护的原告作品。关于接触要求的证据,一些学者认为,可以使用直接证据来证明联系,例如被告阅读、听报告、购买过原告文章的证据。也可以通过间接证据来证明,例如在被告文章发表之前原告通过分发、展示、表演、放映、广播等方式披露过自己的作品。对于公众可以自己调查和查看的某些作品,涉嫌侵权的作品的作者通常可以有机会,并且可以与受原告版权法保护的作品接触。同时,可以假设即使被告自己的能力不足以发表文章,或者即使该任务是在很短的时间内已推定被告难以完成的,就可以认定被告侵权。关于举证责任的分配,原告证明被告已经联系了原告的版权作品,如果被告提出相反的积极诉求,举证责任就应当由被告承担。

在外国版权法的司法实践中,“接触”是事实的证据。换言之,在怀疑侵犯版权之前,受版权保护的作品是公开的。支持该客观事实的条件为,涉嫌侵权的作品内容显然与以前的作品相似,足以排除独立产生后者的可能性。中国著作权司法实践中的“接触”之一是该作品已经出版。《最高人民法院关于<适用于著作权民事审判的各种事项>》第九条规定,“公开”是指权利人直接或在权利人的允许下披露的信息。例如,在琼瑶案2中,法院裁定电视连续剧“电视连续剧《梅花烙》”的公开播放可以达到释放剧本《梅花烙》内容的效果,并符合侵犯版权的接触要求。AI作品与受版权保护的作品之间的关联性表明,受版权保护的作品具有客观事实,该事实在涉嫌侵犯版权之前已被披露,并且AI响应源作品的影响以产生混合作品的底层文本内容。因此,使用该软件进行混合的作者可以提供对源作品的“合理状态”访问。也即,人工智能创作前期需要学习大量的已有作品,必然要满足“接触”的要求,侵权的关键仍然是判断人工智能创作的新作品是否与现有的作品实质上相似。

(二) 侵权认定的关键:“实质性相似”的认定与方法局限

“实质相似性”作为一个明确的语词,最早出现在20世纪初的美国 [6]。在我国,没有关于版权的“实质性相似”的法律规定,适用版权侵权判决的重要方法通常由法院裁定 [7]。一般来说,我国法官经常将“实质性相似”作为是否侵权的一个重要的标准,在司法实践中对其进行了具体的定义 [8]。比如在李鹏与石钟山案中,法院判定“实质性相似”是指在后作品与在先作品在表达上存在实质性相同或近似,使读者产生相同或近似的欣赏体验。3而成都市中级人民法院在杭州余杭某摩擦材料有限公司诉宁国某汽车零部件股份有限公司侵犯著作财产权纠纷上诉案中,法官在判决书中认为,“实质性相似”关键是要从普通消费者,加以普通的关注度,在看过两个作品后,是不是能明显感觉到这两部作品之间的差异,其立足点是消费者知觉和感官。4由上述案例可以看出,我国司法实践中关于“实质性相似”的标准并不一致,但有一点可以明确,要确定两个作品之间的内容是否构成侵权,首先必须确定可以用作相似性比较作品的内容。所以,在著作权重复认定是否存在侵权中,实质性相似的判定,则成为必须要探讨的内容。

具体而言,判定作品的实质性相似的方法主要有三种,分别是“抽象分离法”、“整体感观法”、“内外部试验法”。三种方法均为认定侵权行为的判断途径,但“抽象分离法”一般不宜适用于人工智能深度学习过程中的侵权判断;“整体感观法”与“内外部试验法”在侵权行为判断中的运用也存在一定的不确定性。

第一,抽象分离法。抽象分离法是在1930年尼克斯案中由汉德提出来的,随后适用于第二巡回上诉法院对阿尔泰案的侵权判决。它是指通过抽象的方式将作品分为思想和表达两部分,对作品中未受保护的思想部分进行过滤,比较两个作品中的表达是否构成实质相似性,如果存在,则确定违法行为。抽象分离法最显著的特点是消除作品中不受版权保护的思想,只对表达方式进行比较。该方法的优点是体现了版权法只保护原文的基本原则,但其缺点也很明显,因为在实践中思维、非原始表达和原始表达难以区分。正如前面所提到的,人工智能创造是通过分析现有作品的各种要素来总结工作创造的规律。这里的规律不是一种模糊的风格,而是具体创作元素的搭配。因此,在理论上,人工智能的创作过程确实使用了著作权人作品的原始表达方式 [9]。例如,人工智能程序DeepBach(人工智能作曲)计算巴赫作品中不同创作元素之间的联合概率分布,并基于概率函数创建与巴赫作品非常相似的音乐作品,这种行为可以被认为是对巴赫音乐作品中原始表达式的搜索和使用。然而,人工智能侵权客体的特殊性和人工智能创作本身的随机性,使我们难以在实践中运用抽象的分离方法来实现人工智能的侵权行为。一方面,人工智能的侵权对象往往是版权人的作品集合或多个著作权人的作品集合,人工智能的作品几乎不可能与单一作品的独特性高度类似,法院也很难断定整个作品组合的原始表达方式与人工智能作品的原始表达方式之间存在实质性相似。另一方面,人工智能深度学习到的“规律”并不固定,即使采用相同的数据样本和计算机算法,运用不同的样本大小和采样方法,也会使人工智能程序产生完全不同的数学模型,最终产生完全不同的结果。因此,在实践中,不可能将人工智能创作中的具体规律与著作权人相结合 [10]。

第二,整体观感法。美国在1970年罗斯案中建立了整体观感法,即指整个作品的思想和表现来判断两个作品之间是否存在实质性相似。该方法并不明确区分作品中的思想和表达,而是强调作品的完整性,避免了分离难度,使法官更容易判断侵权作品是否与版权作品相似。人工智能的侵权对象通常不是单一的作品,而是作品的集合,尽管不可能精确地表示Deepbach作品的特定作品与音乐元素的作品相似,但是观众可以表明Deepbach的作品与巴赫作品的作品高度相似。当然,使用整体感观法来确定人工智能的版权侵权问题也有一定的缺陷。这是因为:其一,每个法官的总体感受不同,存在很大的不确定性。部分观点认为,应该通过“普通观察者”的经验所需的总体外观和感觉来认定 [11]。另一部分观点认为,整体感知方法应以“目标(专业)受众”为主体。原因是,虽然这是整体的判断,但一定的专业观众可以更好地区分这类作品与其他原著的共同特征,然后法院可以参考以作品为对象的读者来判定这两部作品实质上是相似的。总之,运用整个感知方法来判断人工智能作品的侵权行为时,判断主体的选择仍存在争议。第二,观察者的整体感受无法量化,整体感观法不能很好地确定两部作品的相似性程度。通过对侵权作品与权利人作品的比较,评审员产生了一种模糊的整体感觉,无法准确地描述这两部作品的相似之处,它是一个抽象的概念,给司法裁判中侵权行为的认定带来了困难。无论整体感觉是否相似,亦或相似度有多少才能构成侵权,尚缺乏可量化的认定标准。因此,整体感观法在侵权行为判断中的运用也存在一定的不确定性。即便与抽象分离法相比,整体感知法更适合于人工智能创作中的侵权识别,但也存在明显的缺陷。

第三,内外部测试法。1977年,有人建议由这一领域的专家确定外部测试,包括作品类型、适用材料、作品主题,而内部测试则由普通读者确定这两部作品的表达方式是否实质上相似,法院通过将外部测试和内部测试相结合来确定侵权行为是否成立。实际上,内外检验方法是上述抽象的分离方法与整体感知方法的结合,既包含了这一领域专家的意见,又有普通读者代表的意见,综合前两种的判断优势 [12]。在哥伦比亚广播公司(CBS)诉美国广播公司(ABC)一案中,法院使用内部和外部测试来检测被告的《我是名人》是否构成对原告《幸存者》电视节目模板的剽窃。尽管如此,在内部测试方法和外部测试方法中仍然存在三个缺陷。首先,从美国的司法实践经验可以看出,不同法院对内外部检验法的理解存在偏差,容易导致不同的司法标准 [13]。其次,内部测试结果与外部测试结果之间可能存在矛盾。由于专家和普通观察者的知识背景与探测视角不同,内部测试和外部测试的结果可能是矛盾的。例如,普通观察者可以看到两种印度风格的图腾柱很容易得出大致相似的结论,对图腾柱进行深入研究的雕刻家很容易看到两个图腾柱之间的细微差别。此时,法官必须选择自己的意见作为判断这两个图腾柱是否相似的依据再次,内外测试方法还不能弥补抽象分离法和整体外观法的不足。例如,当分析人工智能程序DeepBach的工作是否与巴赫的作曲基本相似时,外部测试专家很难从DeepBach的工作中提取和分离巴赫组合的原始表达式。在内部测试中,普通观察者不能明确DeepBach作曲和巴赫的作曲相似度,而使用内部和外部的测试方法使人工智能作品的版权侵权同样具有不确定性。总的来说,虽然国内外的测试方法都具有抽象分离法和整体外观感法的优点,但人工智能作品的版权侵权也存在缺陷。

4. 著作权侵权抗辩制度在人工智能深度学习中的适用

人工智能正在以“读者”的身份快速消耗人类作品,并从中挖掘数据的价值。基于上述分析,适用传统的侵权认定方式存在缺陷。著作权法上业已存在法定许可和合理使用两种合理侵权抗辩制度,法定许可与合理使用均不需经过原权利人的同意,但是两者的区分在于是否需要向原权利人支付相应的报酬。那么,人工智能深度学习的分析行为到底应该通过法定许可来予以规制还是通过合理使用来予以规制?

(一) 明确“合理使用”标准

著作权的核心是利益平衡精神,那么合理使用制度正是这一平衡的体现者和实现者。合理使用是一项法律行为,即他人为了便于学术研究、文艺批评或基于其他正当理由,可适度地引用或复制他人的著作。我国著作权合理使用的制度体系由《著作权法》中的穷尽式列举与 《著作权法实施条例》中的两个一般判定要件构成。如果判断是否能形成合理使用,必须要“不得影响作品正确使用”,不可与作品本身的可期待利益之中形成冲突。同时必须满足“不得不合理地损害著作权人的合法利益”,这便要求要考虑到在事实上,任何使用他人作品的行为都会给著作权人带来某种程度的损害。换言之,必须要以不合理为界限,考虑到行为的程序,以及坚持比例原则。而在人工智能深度学习领域中,合理使用也必须严格的加以明确,具体包括如下几点:

首先,如果作品用于科学研究,只要人工智能训练者从事有关人工智能技术的学校课堂教育或有关人工智能技术的科学研究,并未用作他用,就可以满足合理使用的条件。

其次,在个人学习的背景下需要进行详细讨论。如以讲师指导的学习和使用出版作品进行创作但不出版,就满足法律要求的“个人学习”目的。从表面上讲,训练者这样做是为了让人工智能深度学习创新方法,而不是训练者自己的学习和创造,不符合法律要求。但是,人工智能深度学习中的创建具有其自身的特点和复杂性,对此应该从两个方面进行理解:一方面,人类实际上参与了人工智能的学习过程。首先,必须预先设计人工神经网络系统,以使人工智能具有学习能力,其中包括设计者对学习人工智能,创建人工智能和理解数据的思考过程。人类不再以传统的直接方式学习,人工智能取代了人类的直接学习。另一方面,人工智能深度学习中的被动性质要求人类协助数据输入并开始学习。因此,训练者实际上参与了人工智能的学习过程,严格来讲,人工智能不是完全独立的学习。也即,AI学习和生成实际上是AI设计师的学习和生成。由此观之,这不仅与版权制度的初衷相抵触,而且导致社会和文化的衰落,甚至威胁着版权制度 [14]。同时,人工智能深度学习产生是人类学习人工智能技术的过程。因为AI设计师可以开发人工智能来创建人工智能,为此,人类必须经历学习和学习人工智能技术。在学习人工智能技能的过程中,需要训练人工智能以使用源作品数据来判断绩效。也即,在人工智能技术的整个研发过程中,深度学习人工智能的产生是人类学习的人工智能产生技术的一部分。换句话说,是设计师和训练者自己的学习。

人工智能深度学习技术的目标是使用数据来训练人工智能。因此,对于人工智能的深度学习和研究创新,人工智能训练者使用的作品应当认定为属于“个人学习研究”的目的。但是,以上两种情况还必须满足“使用他人出版的作品”和“非商业用途”的要求。换言之,用于人工智能培训的数据必须由其他人发布,并且创建人工智能深度学习最终目的不能成为用于商业应用。中国的著作权法并未明确规定合理使用是否应为非商业性使用,但在学术和司法实践中,非商业性使用被视为判断合理使用的标准之一。但是,在美国则将某作品构成“转换使用”与否来判断其是否为合理使用。新作品获得的转换率越高,则对其他判断因素如商业使用的合理使用就越不重要。例如,以美国的Google数字图书为例,法院裁定,复制Google对书籍和资料的使用具有很高的变革性,构成合理使用的9.5%。

第三,如果人工智能深度学习最终是为了达到商业用途的目的,则不符合转换使用的构成要求。随着时代的不断发展,著作权法越来越暴露出一些不适合时代发展的问题,即当前的权利限制框架被认为是不适当的,制约了产业的创新。对此,一些学者认为人工智能的创造的目的和内容是转换性的,所以人工智能的创造属于转换性的使用,但这并不符合事实和法律原则。理由之一是,司法实践中,我国法院使用这种转换的方式是将其列入合理的使用,对介绍、评论某项文章或解释某一问题时做的适当参考。即将原来的文章观点作为新作品表达的基础或论点,而不是重复原有文章的中心思想。但是,在人工智能中使用其他作品不引入评述作品、解释问题,而是有必要了解作品的内容以及如何创建与之相关的作品,并使用中文转换来解释在人工智能中使用其他作品。另一个理由是,在理论上,人工智能的内容和目的没有改变。一方面,人工智能不是根据以往的作品改写的,而是对原有作品的特点进行了研究,从而可以掌握创造性的方法,并根据用户的需要进行与原作品不同的创作。因此,人工智能的创作是一种全新的创作,而不是转换创作。另一方面,人工智能不是建立在先前作品的基础上,而是研究原始作品的特征,从而使得它能够根据自己的需要学习并总结,从而写出与原始作品不同的作品。因此,人工智能的产生不是转换的作品,而是全新的作品。人工智能的目的是复制原权利人的作品进行学习,先进行复制工作,再进行研究工作。这不是人类复制和研究行为之间的区别,它也不能反映转换。由于人工智能可以在利用他人的文章过程中促进人工智能深度学习,从整体上看发展人工智能深度学习技术具有公益性。换言之,人工智能深度学习最终是为了达到商业用途目的的情况并不符合合理使用的构成要件。

(二) 延展“法定许可”标准

法定许可是一些国家的版权法中常用的侵权抗辩标准。它基于法律的直接规定,未经版权所有者的许可,以某些方式使用他人的出版作品的,必须支付使用费,并尊重版权所有者的其他个人和财产权利。作为一项权限制制度,著作权法定许可意味着使用者能够在满足法定条件的基础上,无需获得权利人的同意即可以特定方式使用作品。

通过对人工智能深度学习创建中的利益冲突的分析,将他人作品数据用于人工智能深度学习的行为完全包含在合法使用中,研发公司和训练者就可以在不支付任何许可和任何费用的情况下,对人工智能进行训练和创作,从而获得巨大的商业利益。但是,原始权利的所有者无法获得财产的任何回报,这肯定会损害人类的创造热情,并且不利于立法目的和保护版权的目的。在申请公司和研发训练者时,需要获得原数据所有者的许可才能使用该作品数据。这样一来,可能就无法根据自己的利益对劳动权利持有人进行授权,研发公司和培训人员也无法获得足够数量的授权工作,这不能保证训练的效果,还在一定程度上会阻碍了人工智能创造技术的发展。

正是由于法定许可本身的特殊性质,导致法定许可经常适用范围过窄,缺乏相应的保障机制,特别是著作权人缺乏相应的知情权,以及支付报酬的机制相对滞后。所以,为了平衡双方的利益,中国必须在立法层面进行创新,并且出于商业目的,将他人作品数据的创建和使用纳入绝对的法定许可系统中,以进行深度学习的侵权规制。也就是说,训练者可以使用原作品数据来训练人工智能,以学习如何在未经版权所有者许可的情况下进行创作。同时,如果版权所有者不能提前排除对作品的使用,则必须将作品的使用支付给版权所有者。具体而言,包括以下三点:

第一,建立法定许可的通知制度,因为法定许可的使用权人可以不经过著作权的同意就使用他的作品,且人工智能深度学习的使用人本身经常是大的公司或者集体,处于强势地位,著作权人很难了解到自己的作品是不是被适用。因此,通过建立通知制度,可以有效维护著作权人的利益和报酬。

第二,完善许可报酬支付制度。制作权在创作的过程中,付出了大量的时间和报酬,而且如果在发现使用者利用人工智能进行了深度学习时,很难在短时间内要到自己的报酬,对此,可以从立法层面予以规制,设立一个专有时间,即在著作权人主张权利的一段时间内,使用权人必须要征求著作权人的同意方可继续使用其作品,否则其使用行为本身违法。

第三,设计专门的系统。一方面,通过系统的设计,可以避免版权所有者阻止训练者使用原作品数据的权利,以确保训练者可以使用足够的原作品数据来训练人工智能。另一方面,该系统还可以有效地保证尊重和保护作品版权所有者的权利,并确保权利人可以通过补偿收入获得经济补偿 [6]。但是,仅依靠法定许可标准无法完全解决使用人工智能创建深度学习时遇到的困难和问题。这是因为,一方面,在人工智能深度学习创作中使用的源数据与过去传统作品的使用相比具有很大的不同,源作品通常处于分散状态,权利人很难主张该人工智能是否侵犯了其著作权。另一方面,在现实中,权利者数量之多、分布的分散,加大了完成支付的难度,从而损失了权利者的经济报酬。另外,研发公司和训练者数量也很多,作品权利者也不能及时把握作品被使用的情况,不能及时发现非法行为,使维权变得困难。

(三) 选择适用“合理使用”与“法定许可”

第一,人工智能深度学习后的产成品用于盈利目的,应当认定为法定许可。如果人工智能深度学习后产生的作品是用于商业目的或者其他营利目的,则不符合合理使用的转换性使用,应当纳入法定许可制度中,允许人工智能使用数据,但是应当向原权利人支付费用。无论是已发布过作品还是未发布作品的被调查者,对于人工智能借鉴已有的作品深度学习的行为后产出的作品,如果作品是用于盈利目的,均倾向性认为应当向原权利人支付费用。

第二,人工智能深度学习后的产成品用于非盈利目的,应当认定为合理使用。基于人工智能深度学习的特性,对其深度学习中侵权认定应当区分对待,如果将人工智能使用他人数据深度学习的行为完全纳入到合理使用范围,必将不利于人类作者的创作激情;同理,如果将人工智能使用他人数据深度学习的行为纳入到法定许可,要求人工智能向原权利人支付费用,不仅会增加使用者的成本,还达不到促进人工智能技术进步的效果。因此,为了平衡原权利人与人工智能产业发展之间的利益,应该对合理使用和法定许可两种抗辩选择性使用。如果人工智能深度学习后产生的作品是用于内部使用或者公益使用等非盈利性目的,那么就应该纳入合理使用的范围,认定为合理使用;如果人工智能深度学习后产生的作品是用于商业目的或者其他营利目的,应当纳入法定许可制度,允许人工智能使用数据,但是应当向原权利人支付费用。

第三,合理使用与法定许可的转换使用。为防止一些人前期利用非盈利的手段而逃避向著作权原权利人支付费用或者因为特殊环境的需要,需要进行盈利性使用等原因导致作品的用途改变。也就是说,应当允许合理使用和法定许可之间可以转化。例如人工智能深度学习后创作的作品开始是用于非盈利性使用,但是后期因为环境的变化或者特殊需要进行营利目的的使用,此时应当由合理使用转换为法定许可,应当向原权利人支付费用;若用该作品进行盈利性使用后再进行内部使用或者非盈利使用,此时商家已经完成了盈利性收入,因此,转换为合理使用,对后期的部分不用在支付费用。这样的规定不但可以适应不断变换的社会,也会有利于人工智能产业和原权利人之间的利益平衡,维护社会的稳定。

5. 结语

通过上述分析,本文得出的结论如下:第一,人工智能深度学产出作品具有独创性,从作品价值范畴角度考量,生成品与源作品存在牵连,可能对源作品产生法律意义上的侵害。第二,传统的著作权侵权认定原则中,人工智能深度学习过程满足“接触”要件。于是,在界定侵权与否的标准上,“实质性相似”标准成为判定关键,但“实质性相似”标准的认定方法存在不足,不能充分认定生成品与源作品之间存在“实质性相似”。第三,由于传统著作权侵权认定原则捉襟见肘,必须考虑著作权侵权抗辩制度的适用,一来要明确“合理使用”标准,二来要延展“法定许可”标准,二者的选择适用要根据具体情况来具体确定。

近年来,随着人工智能深度学习适用领域的不断拓展,人工智能深度学习所呈现出的学习能力强、覆盖范围广泛、适应性好、可驱动性强等优势不断显现,在科技水平发展日新月异的当下,其所带来的科学意义与社会意义不容小觑。但也应注意到,新兴科技发展会对传统社会带来的结构性影响,具体到本文,即探讨深度学习过程中所涉及著作权侵权问题应当如何调整。未来,包括人工智能深度学习在内的科学技术在不断发展的前提下,我们既要肯定其带来的价值,更要注重其衍生而来的知识产权问题,毕竟,落脚到法律层面,科技的应用必须考虑权利人与人工智能创造者之间的法益平衡。

NOTES

1刘俊谦与中国科学院海洋研究所、郑守仪、莱州市万利达石业有限公司、烟台环境艺术管理办公室著作权权属、侵权纠纷案,山东省高级人民法院(2012)鲁民三终字第33号民事判决书。

2北京市高级人民法院民事判决书(2015)高民(知)终字第1039号。

3北京市第二中级人法院民事判决书(2008)二中民终字第02232号。

4成都市中级人民法院民事判决书(2010)成民终字第3703号。

参考文献

[1] 史忠植. 人工智能[M]. 北京: 机械工业出版社, 2016.
[2] 郑成思. 信息、知识产权与中国知识产权战略若干问题[J]. 环球法律评论, 2006, 28(3): 304-317.
[3] 李菊丹. “人工智能创作物”著作权保护探析[J]. 中国版权, 2017(6): 25-29.
[4] 薄燕娜. 论著作人格权述[J]. 河北法学, 2000(5): 109-111.
[5] 吴汉东. 人工智能时代的制度安排与法律规制[J] . 法律科学(西北政法大学学报), 2017, 35(5): 128-136.
[6] Lape, L.G. (1994) The Meta-physics of the Law: Bring Substantial Similarity down to the Earth. Dickinson Law Review, 98, 181-207.
[7] 何怀文. 中国著作权法判例综述与规范解释[M]. 北京: 北京大学出版社, 2016.
[8] 吴汉东. 试论“实质性相似+接触”的侵权认定规则[J]. 法学, 2015(8): 63-72.
[9] 吴汉东, 张平, 张晓津. 人工智能对知识产权法律保护的挑战[J]. 中国法律评论, 2018(2): 1-24.
[10] 黄小洵. 作品相似侵权判定研究[D]: [博士学位论文]. 重庆: 西南政法大学, 2015.
[11] Samuelson, P. (2013) A Fresh Look at Tests for Nonliteral Copyright Infringement. Northwestern University Law Review, 107, 1821-1850.
[12] 李明德. 美国知识产权法[M]. 北京: 法律出版社2011: 210.
[13] Leval, P.N. (1990) Toward a Fair Use Standard. Harvard Law Review, 103, 1105-1136.
https://doi.org/10.2307/1341457
[14] 刘友华, 魏远山. 人工智能深度学习中的著作权侵权问题及其解决[J]. 华东政法大学学报, 2019, 22(2): 68-79.