1. 提出问题
生成式人工智能技术,是指具有文本、图片、音频、视频等内容生成能力的模型及相关技术。自2022年OpenAI发布Chat GPT以来,国内也开启了大模型训练热潮,Deepseek的一夜爆火、豆包、百度的文心一言,华为的盘古以及阿里巴巴的通义千问等,除了基础通用型大模型的训练外,许多针对特定行业和特定应用场景而开发的垂直小模型也如雨后春笋般拔地而起,源源不断流入市场,例如专门应用于政法领域的、专门适用于金融行业的、还有专门针对医疗行业的等,这些行业具有专业性强,专业知识集中等特点,应用场景比较明确。人工智能技术的飞速发展,极大加快了科学技术和社会生产生活的变革速度,给人们的生活带来极大的便利性,以人工智能为代表的第四次工业革命的发展,被认为是“人类对自身局限挑战的最高阶段,将推动大脑和其他身体机能整合式扩展”[1]。尽管人工智能生成的内容(Artificial Intelligence Generated Content,简称AIGC)输出篇幅大、生成效率高、表达更规范,但生成式人工智能的爆炸式增长,给社会治理带来了新的挑战,在未来的实践中将难以回避著作权侵权风险,甚至将引发海量著作权侵权诉讼,对此有必要予以重点关注,一方面要鼓励新技术的发展,另一方面又要稳定社会秩序,促进社会治理,保护公民的合法权益不受侵犯,如何平衡好创新发展与安全监管之间的关系成为当下亟待解决的问题。
2. 人工智能生成物侵权案件现状
1) 数量突增。国新办在2024年就国家层面知识产权案件上诉审理机制运行举行发布会总结到,目前受理案件技术前沿日益扩展,新类型纠纷不断涌现。从法庭受理的涉及战略性新兴产业案件数字来看,2021年这类案件占法庭案件四分之一左右,2023年已增长到将近三分之一,而且涉及人工智能、大数据、基因技术等新领域新业态的新型纠纷也在不断涌现。
2) “全国首例”不断增多。2024年4月23日,北京互联网法院一审开庭宣判全国首例AI生成声音人格权侵权案,明确认定在具备可识别性的前提下,自然人声音权益的保护范围可及于AI生成的声音1。2023年末,北京互联网法院审结了“AI文生图”著作权侵权国内第一案——李某与刘某作品署名权和信息网络传播权纠纷案,首次明确了利用人工智能生成图片“作品”的属性,并提出人工智能生成内容是否构成作品需个案判断的观点2。几个月后,2024年2月,广州互联网法院审结了一例号称“AIGC平台著作权侵权全球第一案”的案子(以下简称“奥特曼案”)3,该案判决被告经营的网站生成的图片与奥特曼形象构成实质性相似,被告AIGC平台构成侵权,引起各方争议讨论,该平台并非模型的训练者,其是否应该承担该侵权责任?许多新型知识产权侵权问题的出现,对于现有法律规范提出了新的挑战,具体来说,在输入端存在着AI训练数据对人类作品的侵权风险,例如“奥特曼案”。在输出端存在着AI生成物对人类作品的侵权现实,例如“AI文生图案”,人工智能生成的内容是否属于“作品”,是否受著作权保护等问题成为社会治理不可忽视的问题。
3) 头部企业共识渐成,纷纷强化安全投入。作为创新主体的头部企业是人工智能研究的大本营,也是重磅论文的主要发源地,从国际上看,OpenAI、Meta、DeepMind、微软等AI巨头近年来相继加大了在AI安全技术和监管措施方面的投入。国内的百度、科大讯飞、阿里、华为、智谱等加大在安全研究上的布局和投资。这说明国内外的主流厂商逐渐认识到安全研究的重要,大模型能力增长迫切需要安全研究快速跟进,这已成为业界共识。
3. 案例的比较研究及社会影响
1) 案例一:2019年4月北京互联网法院审结一起“威科先行案”,该案中北京互联网法院将使用者输入关键词等部分纳入了创作的全过程,法院认为虽然威科先行生成的分析报告具有独创性,但具备独创性并非构成文字作品的充分条件,根据法律规定,文字作品应由自然人创作完成。在创作过程中,由于威科先行自动生成的内容仅有关键词的输入,未能传递自然人的思想和情感,因此,即使威科先行库“创作”的分析报告具有独创性,该分析报告仍不是著作权法意义上的“作品”。
2) 案例二:案例一的同年12月,深圳市南山区人民法院审结了一个类似案件,原告使用“Dreamwriter”生成的内容则被认定为“作品”,理由是原告的团队在使用软件创作过程中对关键词的选择、判断及技巧使用属于智力活动,是一种创作行为,而人工智能不能成为著作权法上的权利人,法院认定由Dreamwriter生成的内容属于“作品”,且由使用人享有著作权。案例一和案例二中法院都肯定了人的社会主体地位,坚持了只有自然人才能成为文字作品的作者这一原则。两个案件的区别就在于生成的过程略有区别,和Dreamwriter相比威科先行生成的分析报告仅有较简单的数据输入和关键词输入,对于使用软件的过程确实没有Dreamwriter案件中投入的精力和时间多,而且北京互联网法院也说明,威科先行生成分析报告的差异仅是因为输入数据的不同而导致的,并非使用人的选择和判断。两个相似案件得出不同的结论,让我们对于人工智能生成的内容是否享有著作权存在未知的不确定性。
3) 案例三:2023年11月,北京互联网法院审结首例“AI文生图”著作权案,首次明确了利用人工智能生成图片“作品”的属性,并提出人工智能生成内容是否构成作品需个案判断的观点,这一观点也是对前两个案例呈现的矛盾结果提供了有力解释,即具体案例具体分析,AI生成的内容是否构成作品应该进行个案判断。本案中原告使用“Stable Diffusion”生成的图片被他人转载使用且私自去除图片水印。在这个案例中,结合使用人对提示词多次不断调整、选择提示词、安排提示词的顺序、设置相关参数等,法院认定其投入了一定的智力活动,属于智力成果,然后再认定该图片是否具有独创性,法院查明了解到原告对画面元素、布局构图等进行了一定设计,体现了原告的安排和选择,最后认定该图片属于“作品”,由使用人享有著作权。该案的审结,对生成式AI引发的诸多著作权难题进行了有意义的探索,并提出合理的解决方案。这在全球范围内具有创新性,对于未来的司法实践和学术研究具有重要的参考价值。
Table 1. Elements of three typical cases
表1. 三个典型案例的要素梳理
|
威科先行案 (2019年4月) 北京互联网法院 |
Dreamwrite案 (2019年12月) 深圳市南山区人民法院 |
Stable Diffusion “AI文生图”案 (2023年11月) 北京互联网法案 |
是否具有独创性 |
是 |
是 |
是 |
是否构成作品 |
否(非自然人创作完成) |
是 |
是 |
创作过程是否包含自然人的提示词、关键词输入等部分 |
是(但关键词的输入未传递自然人的思想和情感) |
是(此过程属于智力活动,是一种创作行为,其自动运行的过程体现了原告个性化的选择、判断及技巧) |
是 |
谁享有利益 |
软件使用人享有相关利益 |
著作权人(软件使用人) |
著作权人(软件使用人) |
请求赔偿数额——
实际判决数额 |
10,030——1560 |
19,000+——1500 |
未知——500 |
是否受著作权保护 |
否 |
是 |
是 |
4. 人工智能生成物的可版权性问题
1) 对人工智能生成物应当给予著作权保护。从表1中我们可以看到,2019年至今,从威科先行到Dreamwrite再到Stable Diffusion,随着人工智能“智力”的不断提高,对人工智能生成的内容进行法律规制已势在必行,且迫在眉睫。一方面,对于AI生成物的内容给予知识产权保护可以解决当下社会治理中的诸多现实纠纷,另外一方面,对AI生成内容进行保护并不侵害传统作品的权益,反而避免了因AI生成物免费而挤压传统付费作品发展空间的风险。因为如果质量相似的两个内容,人们更愿意使用免费的,从而使付费作品的发展空间受到挤压,甚至退出市场。
2) AIGC被认定为“作品”的标准有待明确。创作过程中对提示词、关键词的选择、安排和技巧的投入等可以被认为是人的智力活动,是人工智能生成内容是否被判定为“作品”的关键之一。至少应当能从操作过程中看出使用者具有创作的意图或者基本的构思[2]。但是该评判方法仍然缺乏统一明确的客观评判标准,具有一定的主观性,期待在不久的将来会有更客观和更规范的评判标准来统一AI生成物被认定为作品的问题。
3) 使用者更适合享有著作权。关于人工智能生成物的著作权归属,学者们各抒己见,有人认为如果没有所有者(投资者)海量资金和资源的投入,研发者很难展开研发,因此著作权应该赋予人工智能的所有者(投资者) [3],但是这带来的后果是个体或者实体持有垄断权并阻止任何其他人从某些作品中赚钱,且否定了使用人的个性化选择。因此从权利主体来看,个人认为把使用者认定为作者具有一定的合理性,更符合当前AI行业的发展现状。上述三个案例中AI生成物无论是否定性为“作品”,其利益享有者都是使用人,法院始终坚持人的社会主体地位,坚持著作权法只保护“自然人的创作”这一观点。因为只有坚持人的主体性,将著作权法的激励重点回归到对人的激励方面,才能在迅猛发展的生成式人工智能时代为人类的思想和创造保留生长的土壤[4]。而人工智能模型不具备自由意志,不是法律上的主体,不能成为我国著作权法上的“作者”。
4) 赔偿数额适当合理。从损害赔偿的数额来看,表1中的三个案例,法院判决被告的赔偿数额均较低,基本上是在法律规定的最低限额上判决,甚至在“AI文生图案”中,诉讼费也是双方共同承担,因此当前司法实践中裁定较为保守的赔偿金额是比较合理的。原因在于,人工智能创作内容的经济价值尚处于模糊地带,既难以精确衡量权利人的实际损失,也无法准确估算侵权人的非法所得或合理的权利使用费。在此情境下,法院倾向于避免裁定过高的赔偿额,以免引发不公。此外,考虑到人工智能创作相较于传统创作模式,其背后创作者的智力投入虽具价值但相对有限,法院在确定赔偿时,可能综合考量了创作者智力贡献的价值、侵权行为的性质、使用方式以及侵权后果的严重性等多重因素。另一方面,现阶段司法判决的核心价值更侧重于权利的确认。对于人工智能作品的创作者而言,其可能更多关注的是权利本身的确认,而非单纯的经济赔偿,因为实际经济损失可能并不显著。诉讼的激励更多来源于对权利归属的明确,而非金钱补偿。对于法院而言,判决的主要目的亦在于确立裁判标准,促进社会对这一新兴法律问题的共识形成,其对于权利归属的确认作用,相较于单纯的损失填补,具有更为深远的意义。例如上文提到的北京互联网法院审结的全国首例“AI文生图”著作权案,原告本身就是一名律师,其表示放弃被告500元的赔偿,并表示无论是胜诉还是败诉并不重要,更希望法院能够对使用AI生成图片的创作是否构成作品,是否具备独创性给出明确的判断标准。
5. 人工智能生成物侵权的责任承担和避险措施
欧盟的《人工智能法案》(Artificial Intelligence Act)于2024年3月13日由欧洲议会表决通过,5月21日,欧盟理事会正式批准该法案,这是全球范围内首个专门关于人工智能监管框架的公法规制法案,给全球人工智能的立法和监管提供了参考价值。该法案整体上体现了欧盟对人工智能的发展态度,既对人工智能的发展形成了保障安全、严厉监管的刚性规制模式。与此不同,美国则形成了激励创新、审慎监管的柔性规制模式[5]。当前,中国也面临着如何平衡发展与安全之间的问题。目前我国尚未有一部国家层面的人工智能法对行业进行规制,但是该领域的行业规范一直在随着科技的发展进步不断更新。在《互联网信息服务算法推荐管理规定》《互联网信息服务深度合成管理规定》之后,2023年国家网信办等七部门联合发布了《生成式人工智能服务管理暂行办法》(以下简称《暂行办法》),这是我国第一部关于生成式人工智能的部门规章,表明我国对生成式人工智能产品应用和产业发展所涉法律问题的充分关注。《暂行办法》积极回应了社会关切,统筹发展与安全,鼓励生成式人工智能创新应用,强化风险治理,突出分级分类监管、以“模型”为核心,强调个人信息保护、知识产权保护,明确生成式人工智能服务提供者的内容安全主体责任。从《暂行办法》规定来看,目前我国是倾向于鼓励人工智能的创新发展,同时也重视对人工智能的安全监管。《暂行办法》第七条规定“生成式人工智能服务提供者(以下称提供者)应当依法开展预训练、优化训练等训练数据处理活动,遵守以下规定:……(二) 涉及知识产权的,不得侵害他人依法享有的知识产权……”。第十二条:提供者应当按照《互联网信息服务深度合成管理规定》对图片、视频等生成内容进行标识。第十五条:提供者应当建立健全投诉、举报机制,设置便捷的投诉、举报入口,公布处理流程和反馈时限,及时受理、处理公众投诉举报并反馈处理结果。《暂行办法》为AIGC著作权侵权责任的承担提供了规范指引,但其受到效力位阶的限制,相关规定不够细化,在“全球AIGC平台侵权首例判决”作出后,相关学理讨论更加激烈。
2024年2月,“AIGC平台著作权侵权全球第一案”(奥特曼案)引发社会热议。奥特曼是全球知名的动漫形象,其作为艺术作品在国内外具有广泛的影响力和知名度。原告上海某文化发展有限公司(以下简称“原告”)通过许可的形式获得了奥特曼系列作品在中国国内的著作权授权并享有维权权利。被告AI公司(化名)是一家提供人工智能服务的平台,其运营Tab (化名)网站,具有AI生成绘画功能。原告发现,当要求Tab网站生成奥特曼相关图片时,Tab生成的奥特曼形象与其享有著作权的奥特曼形象构成实质性近似。原告认为被告未经授权,擅自利用原告享有权利的作品训练其大模型并生成实质性相似的图片,且通过销售会员充值及“算力”等增值服务的行为侵害其对奥特曼作品享有的复制权、改编权和信息网络传播权。原告起诉要求被告停止侵害行为并赔偿经济损失及为制止侵权而支出的合理费用。
1) 平台服务提供者可能构成侵权
在人工智能生成物问题上,其中一个很难绕过去的问题是,究竟是认定生成式人工智能服务的提供者侵权,还是第三方服务商侵权?有学者指出,人工智能生成的过程涉及用户与人工智能之间的来回互动,是交互式的,传统的侵权检验标准难以适用[6]。当生成内容的最终来源是生成式人工智能服务提供者时,传统直接侵权与间接侵权的分析框架难以适用于侵权责任主体的分析,应构建以注意义务为中心的归责模式[7]。在“奥特曼案”中,被告辩称AI绘画服务系由第三方服务商提供,被告提供了与第三方服务商签订的《订单协议》,并附有被告在第三方服务商云服务后台调用接口信息、常用接口信息及AI绘画基础版提交请求页面截图、第三方服务商云平台用户协议截图等加以佐证。所谓的调用接口实际上就是API云端调用模型服务,被告并不实际训练或优化模型,技术服务系由第三方直接提供。根据《暂行办法》第二十二条第二款规定,生成式人工智能服务提供者,是指利用生成式人工智能技术提供生成式人工智能服务(包括通过提供可编程接口等方式提供生成式人工智能服务)的组织、个人。最终法院认为,被告虽然是从第三方购买云端调用大模型技术提供服务,但仍属于平台服务的提供者,侵犯了原告享有的著作权,应当承担停止侵权的责任。承担侵权责任的主要原因在于:欠缺投诉举报机制、欠缺潜在风险提示、欠缺显著标识。这是首例判决AI对人类作品构成侵权的案件,对侵权主体和侵权责任的界定具有重要意义。
2) 服务平台的避险措施
AIGC平台运营者合法合规经营需要注意避免潜在的侵权风险,首先,采取措施避免侵权行为,其次,采取措施表明没有侵权的主观恶意,最后,发生纠纷后,及时采取措施处理已经投入训练的侵权数据。虽然大模型企业的产品是通过接入第三方提供的接口实现的,但是企业仍然可以采取一些技术措施来防范潜在的版权侵权问题,比如,第一,做好尽职调查:在选择第三方接口提供商时,企业应该进行充分的尽职调查,确保这些提供商训练的大模型尽可能的合规,以避免使用可能侵权的数据内容。第二,完善合同条款:AIGC平台可以与第三方接口提供商的合同中明确双方的权利义务,合同内容应明确加入数据合规、知识产权、保密、责任分配等相应条款,要求对方保证提供的内容不侵犯任何第三方的合法权益,并承担相应的法律责任。第三,建立用户举报系统:AIGC平台可以建立一个用户举报系统,允许用户报告他们认为可能侵权的内容,平台应该认真对待这些举报,并迅速采取行动来调查和处理这些内容。这条对应适用“避风港原则”,也是投入成本最小和最容易实施的一条措施。第四,技术更新和内容过滤:平台可以不断更新自己的技术,以适应版权法规的变化和技术的发展,使用内容过滤技术来检测和阻止可能侵权的内容,这可以通过使用人工智能技术,如图像识别和文本分析,来自动检测和移除可能侵权的内容。最后,就是对AIGC添加可识别标识:对人工智能生成物进行标识,对于防范人工智能被滥用导致的公共安全风险有着极其重要的意义[8],一方面用以区分人工智能生成的作品和人类作品,另一方面便于溯源生成信息,方便追溯侵权主体和侵权责任。尽管这些措施不能完全消除版权侵权的风险,但它们可以帮助企业降低风险,并在发生侵权事件时更好地保护自己。
3) 合理使用规则不适用输入端
关于目前训练大模型时输入数据的行为是否能够适用合理使用规则,学界众说纷纭,有人在考察日本著作权法有关合理使用规则及其在生成式人工智能使用训练数据的适用性后,认为我国著作权法应当为生成式人工智能使用作品进行数据训练设置一般性合理使用条款[9]。也有人认为不能适用合理使用规则,因为根据《中华人民共和国著作权法》(简称《著作权法》)第二十四条明确列举合理使用的十二种具体情形,以及兜底条款规定了“法律、行政法规规定的其他情形”,在这里人工智能训练数据的使用未能自然地归入法律明文规定的十二种合理使用范畴之内,且当前法律体系及行政法规均未明确认定此类行为构成合理使用。而《暂行办法》既不属于法律,也不是行政法规,因此也难以适用兜底条款进行解释。进一步地,即便从立法论的维度深入剖析,将人工智能“创作”成果视为合理使用的尝试亦遭遇重重挑战,因为合理使用规则的适用前提是“不得影响该作品的正常使用,也不得不合理地损害著作权人的合法权益”。显然,当AIGC显著依赖并利用了已有作品中的原创性元素,与原作品构成实质性相似时,这无疑会侵蚀著作权人作品的市场潜力空间。据此,从解释学的角度出发,同样难以将此类行为合理地纳入合理使用的范畴之内。因此,从解释论的立场也难以适用合理使用的论点。综上,我们可以得出,训练大模型时输入数据的行为不能适用合理使用,有待法律进一步明确使用规则。
6. 结语
《国务院2023年度立法工作计划中》明确将《人工智能法》列入立法规划。我国正处于人工智能应用的迅速扩张时期,有必要及时正视相关问题,以《暂行办法》为起点,在著作权法律制度中对“人工智能作者”的身份进行回应,为人工智能技术的发展提供更多的著作权应对方案[10]。从现有的判决中我们可以窥见,给予生成式人工智能以著作权保护是时代趋势,也是现实的必要,使用人通过在生成过程中对提示词的选择、判断以及设计等智力的投入使AIGC构成著作权法上的“作品”,而使用人成为当然的著作权人,但目前对生成内容是否构成作品的认定,应该进行个案判断。此外,其中关涉的诸多问题还有待法律进一步明确,例如目前法律上的合理使用规则难以覆盖到人工智能的运作过程,在大模型训练数据的输入端,如何在不损害他人知识产权的情况下,找到一条合规合法的路径以便企业合理地使用数据进行大模型训练,为人工智能在我国的健康发展提供良好的发展环境。在AIGC平台输出端,可以通过做好尽职调查、完善合同条款、建立用户举报系统、技术更新和内容过滤、添加标识等措施,降低自己的侵权风险。法律规制人工智能,又成就人工智能。同样地,人工智能也将不断推动法律制度的完善和发展。在这循环的演绎推理中,将会充满无数的相关案例以及新的法律法规,既要保障大模型产业的发展,也要让权利得到应有的保护,提升中国人工智能产业在国际中的竞争力。
NOTES
1参见北京互联网法院(2023)京0491民初12142号民事判决书。
2参见北京互联网法院(2023)京0491民初11279号民事判决书。
3参见广州互联网法院(2024)粤0192民初113号民事判决书。