1. 引言
3月15日凌晨,OpenAI公司再次发布了ChatGPT的最新版——GPT-4。且相较于4个月前上线的GPT-3.5版本,GPT-4在功能方面实现了全面提升,且作为一个多模态预训练大模型,其能够接受图像输入,并能够用语言描述、解释分析图像内容。ChatGPT一经发布,5天时间内就有了100万用户,两个月后,ChatGPT的月活跃用户数已达1亿,这使其成为史上用户数增长最快的消费者应用。相比之下,TikTok用了9个月实现了1亿的月活跃用户数,而Instagram则用了两年半突破一亿用户。美国科技公司OpenAI旗下智能聊天工具ChatGPT在全球范围内掀起了一阵“人工智能”热潮 [1] 。在中国,科技公司也相继布局这一领域,例如百度公司也推出同类产品“文心一言”,科大讯飞的“星火”以及阿里巴巴公司的“通义千问”等模型。
以ChatGPT为代表的AIGC (即AI generated content,人工智能生成内容)在通过程序创造新内容方面实现新突破。ChatGPT底层是一款通用的自然语言生成模型,通过互联网海量的语料库训练,对语言文本进行概率建模来预测下一段输出内容的概率,从而实现根据用户输入的文字内容生成对应文字回答的功能。然而,随着ChatGPT“创作”日益增多,人们开始担忧ChatGPT模型著作权侵权问题,本文将从ChatGPT生成内容可版权性、能否适用著作权保护及归属出发,结合国内外的既有案例实践,对ChatGPT模型著作权侵权及法律规制进行探讨。
2. ChatGPT生成内容是否属于著作权保护作品
2.1. 生成内容的“可版权性”
AIGC正在颠覆现有的内容生产模式,在已有的内容生产方式中,由专业化团队主导的PGC与由用户生产内容的UGC分别受产能和质量所限,难以满足迅速增长的内容需求,亟须新的生产方式带来内容变革。AIGC突破了人工限制,通过AI技术带来更加丰富多样的内容。根据我国著作权法规定,著作权人包括作者和其他依照著作权法享有著作权的自然人、法人或者社会组织等。但是AI不是人,不符合我国著作权法规定的版权主体要求,其生成内容是否受著作权法保护,以及权利归属还需要明确。
我国《著作权法实施条例》第2条规定,著作权法所保护的“作品”是指“文学、艺术和科学领域内具有独创性并能以某种有形形式复制的智力成果”。因此当我们对人工智能生成物的版权问题进行研究时,最重要的就是对其独创性的判断。从文义上看,独创性的判断包含了“独”和“创”两个构成要素,前者表明作品是作者独立完成,并非对他人作品的剽窃与抄袭;后者表明作品应当具备一定的“创造性” [2] 。
1) “独”之构成要件
“独”要求生成内容从外在形式上与现有作品存在实质性差异。ChatGPT通过概率统计分析,在内容输出的时候,并非只是对其搜集到的信息进行转述,而是会对素材重新整合形成一份新的回答。不论是对人工创作内容还是对人工智能生成内容进行评价,对“独”的判断都应以创作成果整体而非句子的具体组成部分为基础。由于ChatGPT语料库的庞大体量和依靠概率统计分析的内容生成方式,其生成内容与现有作品重复的可能性应当微乎其微。因此,对于ChatGPT创作内容应当与对人类作品持同一认定尺度,ChatGPT创作内容在思想或者内涵层面是否与现有作品相似,不是“独立创作”所要考虑的内容,只要其在作品的表达方式上不抄袭他人成果,即可视为具有独创性。
但也有学者认为,ChatGPT在进行内容输出的时候,仅是对大数据予以整合,表面看来存在“创造性”,但其只是对学习素材的重新组合,这个过程相当于抄袭,因此生成内容无法具有“独立创作”的构成要件 [3] 。此类观点单纯认为人工智能生成内容在表达层面接触过现有作品,就对其“独创性”予以否认,实际上是未将表达性接触与思想性接触有效地区分开来,是片面的 [4] 。因为人类作者在进行创作之前,也会阅读大量的文献和资料,这是在进行创作之前必不可少的环节。随着科技的进步,人工智能的“思维”将和人类“思维”越发近似,不能仅凭人工智能并非人类,就将其与人类学习创作过程相同的人工智能生成成果认定为不具有“独创性”。
2) “创”之构成要件
“创”应为“最低限度的创造性”,而非“额头出汗型的创造性”,要求创作成果能够体现创作者在一定程度上的个性判断与选择。早期的英美法系版权发展史上,基于洛克的劳动财产和公平理论产生了一种“创造性”的判断标准——“额头出汗型的创造性。” [5] 基于此标准,无论作者在创作过程中,是否涉及抄袭与复制,只要付出了自己的劳动,即可受到版权法的保护,这显然不是版权法的立法意图。有学者认为,人工智能创作内容是基于同一算法生成的,因此其不具有“创造性” [6] ,例如ChatGPT《使用条款》第3条(b)款即强调了在特殊情形下输出内容的相似性:由于机器学习的性质,输出内容在不同用户之间可能不是唯一的,ChatGPT可能为OpenAI或第三方产生相同或类似的输出。但实际上,ChatGPT并非根据统计结果输出最有可能输出的内容,而是按照概率随机输出,因此当用户对其输入相同的内容时,ChatGPT每次输出的回答并不一定相同。此外,ChatGPT会根据用户输入内容而不断地进行调整和自我学习,使得每一次输出的内容都有所不同。对于人工智能生成成果的“创造性”的判断应当采用“最低限度的创造性”,需要看人工智能生成成果是否符合某种人类作品的表达形式,倘若经过深度学习的人工智能生成物可以满足“最低限度的创造性”,即可认定其具有创造性。
2.2. 生成成果能否被给予版权保护
1) 域外立法参考
2019年国际保护知识产权协会(International Association for the Protection of Intellectual Property, AIPPI)发布《人工智能生成物的版权问题决议》 [7] ,认为人工智能生成物在其生成过程中有人类干预,且该生成物符合受保护作品应满足的其他条件情况下,能够获得保护,而生成过程无人类干预的人工智能生成物则无法获得版权保护。今年3月,美国版权局发布的美国法规第202部分明确表示,AI自动生成的作品,不受版权法保护。在长达三页的说明文件中,美国版权局表示,与“全人工完成创作”不同的是,人工智能生成物源自于平台的训练数据,其在生成过程中是由人工智能自动完成,并且平台的训练数据是人类在先创作的作品,因此不受版权法保护,但并未否认辅助生成的内容构成作品。
英国的《版权、外观设计和专利法(1988年)》中 [4] ,规定了计算机生成的文学、戏剧和音乐等作品纳入版权保护范围并规定了其版权归属,根据英国法律,完全由AI生成的作品,可能获得版权。但是在这种情况下,立法者将这种作品的保护期缩短为50年,而由人类作者创作的作品的保护期为70年。《欧盟人工智能知识产权立法报告(2020年)》中 [4] ,也规定了“当人工智能协助人们进行创作时,仍可适用传统的版权保护手段。”
2) 实践标准探索
2018年底,美国密苏里大学人工智能学者泰勒博士提交了一幅由人工智能创作的图片《天堂入口》(A Recent Entrance to Paradise) [8] ,泰勒将该品作者填写为“创意机器”向美国版权局申请版权登记,被美国版权局以主体身份不合格为由驳回。2020年泰勒再次提出申请,美国版权局基于“人类思维和内容创造性呈现之间的联系是赋予版权保护的前提”这一基本原则,拒绝了对图片《天堂入口》(A Recent Entrance to Paradise)的版权登记。原因是美国版权局认为作品应当有人类作者创作,申请人没有提供证据证明自然人对该作品有足够的创造性投入。
2023年2月21日,美国版权局在漫画作品《黎明的查莉娅》(Zarya of the Dawn)中认为 [9] ,Kashtanova是作品文本的作者,同时也是作品书面和视觉元素的选择、协调和排列的作者,Kashtanova的作者身份受版权保护。然而,作品中由Midjourney技术生成的图像并非人类创作,因此版权局撤销原有的版权证明,并根据原作者的申请重新颁发相应的版权证明。美国版权局认为用户利用Midjourney这一AI绘图工具生成的漫画内容不构成版权作品,因为在图像生成过程是由Midjourney自动随机形成。Kashtanova在申请书中称,其对漫画的部分图画亦应享有版权,原因在于图画虽然最初由AI生成,但Kashtanova对此用PS进行了加工处理。而版权局并未支持其主张,认为虽然AI生成内容被人工编辑、修改后,含有该类素材的新作品可以受版权保护,但前提是该新作品具有充分的独创性,而Kashtanova对图画的修改远未达到该标准。这意味着,人类在AI生成内容基础上进行的创作,同样需满足法律规定的作品独创性标准,否则最终产出的内容即使符合“由人类创作”的要求,亦难以构成作品。
在我国的司法实践“菲林诉百度案”中 [10] ,法院明确表示涉案分析报告系由“威科先行数据库”的可视化功能自动生成,软件开发者并未根据需求输入关键词检索,而使用者只是向“威科先行数据库”输入关键词来检索,由此产生的分析报告也未因此产生体现使用者思想、感情的独创性表达。因此,软件开发者和使用者均不应成为该分析报告的作者。另外,法院认为作品应当是自然人创作而成,本案中的分析报告是由系统自动生成的,即便其具有独创性,也不应该认定为著作权法意义上的作品 [11] 。2019年深圳南山法院在“腾讯诉盈讯案”中 [12] ,则认定由“Dreamwriter软件”辅助创作的财经文章构成《著作权法》上的作品。后续很多观点则认为,我国在司法实践中对于AI生成内容是否构成作品存在观点分歧。但其背后的逻辑却并不矛盾,AI生成内容只有证明存在自然人的独创性贡献才会被认定为作品。不同的判决结果归因于两个案件涉及的AI模型在运行机制方面存在本质区别。AI模型软件“辅助创作”与“自动生成”的差别,实际从根本上决定了用户对于生成内容是否存在创作贡献,也即决定了AI生成内容能否构成作品 [13] 。实际上,虽然世界知识产权组织(WIPO)对于AI生成内容的作品属性尚无明确认定结论,但在2020年5月29日发布的《经修订的关于知识产权政策和人工智能问题的议题文件》中表明 [14] ,“人工智能生成”与“人工智能自动创作”是可以互替使用的术语,系指在没有人类干预的情况下由人工智能生成产出,要与“人工智能辅助完成的”产出加以区分,后者需要大量人类干预和引导。
3. ChatGPT生成内容的著作权归属
3.1. 当前归属的现实困境
随着ChatGPT应用,一些出版物、论文开始将ChatGPT列为合著者、非第一作者,但随后《科学》《自然》在内的大量权威期刊,都要求不能将ChatGPT列为作者。ChatGPT等大模型已经生成了很多形式上具有独创性的作品,如果法律不对这些作品的著作权人予以确认,那么这些作品就会成为无主作品,这无疑会为作品的使用带来麻烦。当这些由人工智能模型生成的作品具有经济价值时,更容易引发纠纷。目前在实践中通常采取的做法是:著作权的归属由所有人和使用者事先、事后协议确定,按照当事人意思自治的市场法治原则来确定 [15] 。倘若用户使用AI来进行辅助创作,则其应当享有相关权利。例如从ChatGPT类产品的用户协议来看,多数公司会在用户协议中将人工智能生成物的相关权利归属于用户。OpenAI公司用户协议规定:ChatGPT输出内容的相关权利归属于用户。Midjourney在用户协议也约定,“用户在不违反现行法律要求时,对于使用服务生成的内容享有所有权。”但也有例外规定,比如Stable Diffusion Online的用户协议规定,生成内容可归属共有领域,任何人都可使用,无需事先授权。当前理论界主要存在四种版权所有权分配的可能性:分配给人工智能本身,分配给软件开发者,分配给软件使用者,分配给软件开发者与使用者共享。
1) 人工智能
包括我国在内许多国家的著作权法立法与司法实践中,均坚持只有人类可以作为著作权人的观点,包括自然人和通过拟制获得著作权人主体地位的法人。例如,美国版权局要求被登记的作品须由人类创作,并且明确将在没有自然人作者的创作投入时,由机器自动或者随机等机械过程生成的成果排除在可登记范围之外。“黑猴自拍案”中,美国法院认定动物的自拍照不构成作品的判决即反映这一立场。我国法院在菲林案中虽认可威科先行库生成的大数据报告具有独创性,但同时考虑到著作权法上的作品应由自然人创作构思而成,现阶段人工智能并不具备法律主体资格,所以没有必要将人工智能作为私权主体赋予其著作权人的法律地位。由此,无论是在中国或美国,ChatGPT创作内容的权利都无法归属于人工智能本身。
2) 软件开发者
在DreamWriter案中,法院认定涉案文章的创作流程主要经历数据服务、触发和写作、智能校验和智能分发四个环节 [16] ,开发者深入参与到内容生成过程中,其主创团队相关人员的具有个性化特征的选择与安排体现在数据类型的输入与数据格式的处理、触发条件的设定、文章框架模板的选择和语料的设定、智能校验算法模型的训练等多个环节之中,进而法院提出软件开发者构成人工智能生成内容著作权人的观点。但菲林案中的法院则持相反观点,法院认定该分析报告既不是软件开发者根据创作需求运用关键词检索的成果,也未输出软件开发者的思想、感情的独创性表达,不认可人工智能生成内容著作权归属于软件开发者。持同样观点的学者亦指出,软件开发者在对人工智能进行开发、训练过程中投入大量且高质量的智力成果,但是该成果仅体现在软件开发过程而非内容生成过程之中,软件开发者并没有实际参与到输出内容的创作中。
3) 软件使用者
部分学者指出,人工智能内容生成软件的使用者对生成作品的创作过程作出了主要贡献,在特定情形下会参与设置模型参数并提供相关数据,这会对人工智能生成内容提供很大的改变,甚至在一定程度上影响算法。因此,人工智能生成内容的著作权归属于软件使用者成为主流观点之一。但该理论的关键是,软件使用者对于生成内容的重要贡献是否是独创性,从而才能评判软件使用者能否成为生成内容著作权人 [17] 。如果使用者能够在数据输入、算法模型训练等方面体现自身的个性选择,且因而致使人工智能生成内容呈现出特定的表现形式,则可以将其视为人工智能生成内容的作者。但是,使用者的创作对于人工智能生成内容独创性的重要作用明显无法进行客观量化。
4) 软件开发者与使用者共享
鉴于人工智能内容生成过程的复杂性,部分学者提出采取由软件开发者和软件使用者联合共有的归属模式,将人工智能生成内容认定为共有作品,在难以区分各主体贡献值时,考虑授予软件开发者和软件使用者以联合作者权。但反对者认为,传统著作权法理论中的共同作品要求由多方作者合作完成,每个作者参与合作时知情并有意思联络,但是软件开发者和软件使用者并没有直接接触,不存在合作或者合意。但该质疑能够得到合理解释,显然OpenAI对用户后续使用ChatGPT生成作品存在意思表示,而对于用户而言,其实施内容输入的行为并获得预期回复,亦对生成该作品存在意思表示。虽然上述意思表示存在于不同的时间和空间,但可以被视为存在高度概括的合意,从而使得用户和OpenAI成为ChatGPT生成内容的共同作者。
3.2. 生成内容的著作权归属探索
1) 人工智能生成物归属使用者
笔者认为可以将ChatGPT生成内容的著作权归属于“使用者”。基于我国《著作权法》制度设计的本质在于激励功能,作为使用者的自然人可因著作财产权与人身权的激励,更加积极的创作及保护自身的作品。而且,人工智能使用者在取得软件使用权时是付出了经济成本的,在输入关键词检索时,也提供了人工智能学习的信息和数据,在人工智能生成物输出后,也会对生成物进行删减、排序等调整,最终产生作品。因此,人工智能使用者在生成作品的独创性起到了决定性作用,将使用者认定为著作权法意义上的作者更加合理。
2) 创建生成物二分保护机制
从著作权制度视角看,可以探索对人工智能“辅助创作”和“自动生成”的内容进行二分保护。人工智能进行创作的过程,实际上是人类主体运用人工智能作为创作工具不断进行输入基本数据与信息,对生成内容进行筛选与调整,最后得到符合自己预期的结果。伴随ChatGPT类产品技术的持续发展完善,人机协作范式可能会成为内容创作领域的常态化实践。
虽然从目前国内外案例来看,ChatGPT类产品输出的内容本身很难被直接认定为作品,但并不意味着人工智能生成物在整体上无法受到版权法保护。一方面,使用ChatGPT等大模型生成的内容,经过人类作者的调整,如果能够整体上体现其独创性的重要贡献,那么整体上便可以构成版权法上的作品;另一方面,版权法也可只保护上述作品中人类创作的部分,并且这些部分不影响人工智能生成物本身的法律属性判断。
3) 设置人工智能生成物强制署名制度
国际上大多数国家遵循版权自动保护原则,即版权的获得与保护不以任何形式要件为前提,通过对人工智能生成物进行署名,能够更加清晰的确定其归属。例如采取水印等方式对人工智能生成物进行署名,以方便自动识别对象的权利状态。一方面,强制署名制度可以明晰人工智能创作物的权利人,使其在传播过程中更加明确作品来源以及自己是否面临侵权问题。另一方面,它也可以在面临侵权纠纷时,成为保护权利人的有效证据。
4. 结论
ChatGPT的出现标志着弱人工智能时代向强人工智能时代的过渡,传统版权规则的科学性与合理性在这一历程中被不断挑战且重新审视。事实证明,传统版权框架下的作品“可版权性”规则以及版权归属上的部分观点,已经无法满足现阶段生成式AI的应用需求。目前,AIGC正越来越多地适用于数字内容领域的创意性生成工作——在文学、绘画、影视等领域释放技术带来的新价值。在人机协作新范式之下,也需要我们不断思考所面临的版权新问题。对于人工智能引起的法律问题,既要保持开放变通的心态予以保护,又要采取合理措施对其予以规制。因此,探讨人工智能的相关问题,既有利于人工智能未来的发展方向,也有利于版权及相关法律制度在人工智能时代迸发新的活力、不断适应社会发展。