1. 生成式人工智能发展过程及现状研究
2022年,人工智能的新热点无疑是“生成式人工智能”。生成式人工智能(Generative Artificial Intelligence)是近年来快速发展的领域之一,它能够模拟人类创造力,生成具有一定艺术性或创新性的作品的人工智能系统。与过去的“分析式人工智能”(Analytical Artificial Intelligence)不同,生成式人工智能利用深度合成技术,通过各种机器学习方法从数据中学习物体的组成部分,从而生成全新的原创内容(如文本、图像、视频等)。这些内容由训练数据生成,不是训练数据的简单复制,也不是对原始数据的打乱重组 [1] 。其中,ChatGPT是一种基于生成式人工智能技术的对话模型,可以自动生成逼真的对话内容。
2023年3月15日凌晨,OpenAI发布了大型多模态模型GPT-4,在此之前,大型ChatGPT模型GPT-3.5曾在两个月内在互联网上吸引1亿用户,GPT-4的出现更是短时间,火爆全球。首先,GPT-4可以处理屏幕上夹杂着图像、图表和文档等图形的信息,并将其呈现为文本,而不是只专注于处理用户输入的文本信息。其次,GPT-4可以阅读、分析或生成长达25,000字的文本,远远超过GPT-3.5的3000字限制。与GPT-3.5相比,GPT-4能够更好地处理复杂和微妙的情景1。在人们为GPT-4的超强能力惊叹不已的同时,对人工智能未来的发展及其对人类的威胁的担忧也与日俱增。
2. ChatGPT运行原理与侵犯著作权行为
ChatGPT是一种基于生成式人工智能技术的语言模型。它是由OpenAI开发的一种新型神经网络模型,旨在生成高质量、连贯的自然语言文本。ChatGPT的核心理念是通过自我身份的对话和生成,使其能够更好地理解和响应用户的问题和指令。与传统的对话模型相比,ChatGPT具有更强大的语境记忆和上下文理解能力。它能够在对话中保持一致的主题和逻辑,并生成连贯的回复。ChatGPT采用了预训练和微调两阶段的训练方式2。在预训练阶段,它使用了大规模的互联网文本数据进行学习,通过模仿人类的语言使用模式来建立起先验知识。在微调阶段,ChatGPT使用特定领域的对话数据进行进一步的训练,以适应特定领域的需求。
在训练和利用生成式人工智能的过程中,有两个主要环节可能会引起侵犯著作权的行为。首先,训练生成式人工智能需要使用大量数据,而这些数据中可能包含受他人著作权保护的作品。如果生成式人工智能在未经著作权持有者许可的情况下使用这些数据,就可能侵权。其次,在人工智能生成内容的过程中,生成的结果也可能侵犯他人著作权。如果生成的结果使用了受著作权保护的作品或作品的片段,或者构成了对作品的解释,同样也会涉及侵权 [2] 。
总之,ChatGPT作为一种生成式人工智能模型,在对话和聊天场景中展现出强大的生成能力和语言理解能力。然而,随着其应用领域的扩大和使用范围的增加,相关的著作权侵权问题也逐渐浮现。为了更好地保护知识产权并维护创作利益,我们需要进一步研究和探索生成式人工智能著作权的问题。
3. 生成式人工智能的主体资格认定问题
随着生成式人工智能的普及,人工智能已经从辅助走向创造,挑战着人类创造主体的独特性。在人工智能时代,生成式人工智能能够在没有人类干预的情况下自行生成创造性内容,因此成为“创造”的真正动力。要想对其生成的内容进行著作权保护,需要思考的第一个问题是,生成式人工智能能否成为著作权法意义上的法律主体。鉴于现有的著作权制度规范及其基础理论体系,赋予人工智能法律主体地位缺乏法律基础,也不符合当今的价值取向。
3.1. 在现有制度规范下主体资格的否定
《中华人民共和国著作权法》(以下简称《著作权法》)第9条规定,著作权人是“作者”和“依照本法享有著作权的其他自然人、法人或者非法人组织”。即使再加上《著作权法》第2条对著作权主体范围的限制,我国实体法中的著作权主体只能是自然人或由自然人组成的法定组织3。从世界范围来看,作者的自然人属性也是普遍共识。《伯尔尼保护文学和艺术作品公约》(以下简称《伯尔尼公约》)第6条之二规定了只有自然人才能享有的作者精神权利,这意味着《伯尔尼公约》中隐含着关于作者自然人属性的规定。由此可知,既有的制度遵循“人类中心主义”的基本理念,以个人作者为原则,以群体拟人作者为例外。著作权始终建立在以自然人为创作主体的基础之上,人被认为是独特的创作主体 [3] 。无论是作者概念还是权利归属,著作权保护也都以人类作者的存在为前提。在普通法背景下,澳大利亚法院明确指出,在原创文学作品的情况下,有必要确定寻求保护的具体作品以及这些作品的人类作者 [4] 。在大陆法系的代表国家德国,《版权法》第7条规定,版权主体必须是赋予作品独创性的人 [5] 。虽然生成式人工智能已经具备了较强的自主学习能力和高度智能化特征,但其本质上并不是自然人,因此不具有成为著作权法规定的权利主体的资格。
3.2. 基于现实价值对人工智能生成主体资格的否定
鉴于生成性人工智能的广泛应用,是否有必要将这类非人形态的人工智能制定为一种独立的法律主体类型,从而将其纳入人工智能时代的著作权体系?欧盟提议为人工智能确立“电子人格”的法律地位,将其作为一种新型法律主体4。沙特阿拉伯授予智能机器人“索菲亚”公民身份 [6] 。然而,从法理和现实价值角度来看,一方面,生成式人工智能不具有人格属性,虽然民法承认法人作为一种非人形态的法律主体的存在,但人工智能的生成性与法人的人格属性存在本质区别。无论是生成式人工智能整体,还是其系统中的算法模块单元,都没有独立意识,更不存在像法人一般拥有集体意志,其所谓的选择和判断,无非是依靠人的指令和预先构建的算法模型,按照特定的算法模型自主运行的结果 [7] 。
另一方面,作为计算机程序开发者创造的客体,生成式人工智能应当严格遵循民本理念中的“人–物”二分法 [8] 。生成式人工智能是由人类开发和设计,如果仅因为生成式人工智能具有“创造”行为的能力就将其规定为法律主体,这将违背主体与客体不可互换的基本理念,导致人与客体的混淆 [9] 。
4. 生成式人工智能创作内容的法律属性
生成式人工智能不符合著作权主体的条件,但这并不意味着其创造性内容肯定不构成作品,不能获得保护。主体和客体应该是两个平行的问题,各自遵循独立的评估因素和判断标准。如果生成式人工智能不具备主体资格,就会将大量貌似作品的创意内容释放到公有领域,这不仅会使公有领域泛滥成灾,也会导致著作权制度作为一种激励机制无法满足创意者的预期收益。更具体地说,生成式人工智能创意内容著作权保护问题必须建立在相关创意内容是否具有著作权的分析基础之上。
4.1. 生成式人工智能创作内容的可著作权性
《著作权法》第3条,将作品定义为“文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果”,并提出了作品的形式要素,包括“特定领域”和“以一定形式表现”,以及“独创性”的实质要素5。人工智能创作内容属于文学艺术范畴,可以通过文字、图像、视频等形式被人类感知和欣赏。一般来说,相关的创作内容与作品的形式要素相呼应。因此,人工智能生成创作内容的可保护性问题主要集中在作品的“独创性”这一实质性要素上 [10] 。
以ChatGPT为例,得益于神经网络技术的随机性,ChatGPT能够自主评估交流对象的真实需求,并根据对话指令的上下文逻辑和用户的即时反馈生成不同的文本内容。因此,生成式人工智能所生成的内容具有相当大的选择和判断空间,所生成的不同内容具有高度的随机性和自主性 [11] 。由于其运行机制,生成式人工智能再现了人类作者的创作过程,并最终创造出类人类的创造性智力成果,完全符合实质性因素 [12] 。
4.2. 生成式人工智能创作内容的著作权归属
关于生成式人工智能内容的著作权归属,理论界和实务界主要提出以下四种解决方案:一是“开发者”,即著作权归属于创建生成式人工智能程序的算法开发者 [13] ;二是“数据提供者”,即数据提供者可以获得该内容的著作权 [14] 。第三,“使用者”,即最终用户对相关创意内容享有著作权 [15] 。第四,“投资者”。生成式人工智能作为大公司或研究团队推出的创新产品或服务,应由相关组织集团拥有 [16] 。
根据著作权制度的基本原则,著作权应属于对作品做出重大贡献的人 [17] 。通过分析生成式人工智能的技术原理,由于其创造的内容是由用户访问系统并输入指令触发的,因此用户为机器创造作品采取了必要的步骤。如果没有用户的干预,机器的创作活动根本不会发生。虽然人工智能生成式内容创作具有很强的自主性,但输出内容的题材类型仍然受限于用户下达的指令范围,语料的表现特征和风格也受用户的直接控制。因此,就创作内容而言,用户对最终创作内容的生成具有重要影响。在实践中,许多智能软件应用程序都鼓励用户享有著作权。根据Open AI发布的“共享与发布政策”文件,ChatGPT要求“发布的内容必须署有用户的个人姓名或公司名称”,并建议在合理的位置注明“在生成文本内容时,作者已根据自己的喜好对表达进行了审核、编辑和修改,并对内容的发布负责。” [18] 。
但在制定面向用户的著作权归属规则时,我们绝不能忽视生成式人工智能可能涉及的其他利益。人工智能生成内容的著作权分配应遵循协议优先的原则,允许人工智能生成物相关主体通过一般使用条款、代理协议、合作协议等方式,事先约定著作权分配及其他权益分配相关事宜 [19] 。
5. 著作权保护的立法建议与监管对策
5.1. 适应生成式人工智能的著作权法立法建议
随着生成式人工智能的迅速发展,著作权法需要相应的调整和更新,以适应新兴技术对著作权产生的影响。
1) 确定生成式人工智能创作的著作权归属:由于生成式人工智能的创作涉及多个参与者,包括程序员、训练数据提供者和模型架构设计者等,需要明确法律规定创作著作权的主体。建议在著作权法中设立专门的规定,确保公正和合理的著作权归属。
2) 强调生成式人工智能的创作过程:生成式人工智能创作的独特性在于其创作过程中融入了多种输入信息和算法逻辑。建议将生成式人工智能创作过程纳入著作权法的保护范畴,以确保对整个创作过程的合法保护。
3) 加强著作权登记制度:为了更好地维护生成式人工智能作品的著作权,建议完善著作权登记制度,强调对生成式人工智能作品进行登记的重要性。登记程序应该简化,并且对生成式人工智能作品的著作权保护应该给予更多的法律效力。
4) 设立生成式人工智能著作权侵权责任规则:生成式人工智能创作的著作权侵权案例可能涉及复杂的法律问题。为了更好地保护权利人的权益,建议在著作权法中设立针对生成式人工智能著作权侵权的责任规则,并制定相应的救济措施。
5) 加强技术监管与合作:生成式人工智能创作涉及技术层面的难题和挑战。建议政府、学术机构和产业界加强合作,共同研究和制定相应的技术监管措施,以保障生成式人工智能创作的合法性和伦理性。
5.2. 人工智能著作权监管的对策
首先,在著作权归属问题上,可以探索建立专门的人工智能著作权机构,对人工智能生成的作品进行著作权注册和归属确认。这样一方面可以明确作品的著作权归属,另一方面也可以为生成式人工智能提供合法的著作权保护。
其次,在著作权侵权问题上,监管机构可以借助人工智能技术,建立自动化的侵权检测系统。该系统可以对已有的著作权数据库进行比对,快速发现人工智能生成作品中存在的侵权行为,并对侵权者进行追责和制裁。
最后,在人工智能著作权保护中,平衡创作者的权益与技术的发展也是重要的考虑因素。监管机构需要在保护原创作品的前提下,鼓励和支持人工智能技术的发展和创新。可以通过对技术公司提供相应的奖励和激励机制,促进其对著作权保护的积极参与和支持。
6. 结论
人工智能技术的广泛运用带来了著作权侵权的新形式和新挑战。生成式人工智能的使用可能会涉及到他人的著作权,因此需要建立起一套有效的侵权认定和补偿机制。同时,要加强对生成式人工智能的监管,确保其创作与使用不侵犯他人的著作权。平衡人工智能技术与著作权保护的关键在于制定合理的法律与监管措施。在立法过程中,应该充分考虑到生成式人工智能的特点和需求,确保法律的适用性和可操作性。同时,需要加强相关部门的监管力度,建立起有效的监管机制,以保护著作权人的合法权益。
本研究还存在一些不足之处,有待进一步完善和深入研究。本研究主要以ChatGPT为例进行分析,对其他生成式人工智能系统的著作权问题探讨相对较少。未来的研究可以从更多的生成式人工智能系统中选取代表性进行研究,以获得更全面的结论。尽管本研究对著作权法的立法与监管改进提出了一些建议,但这些建议仅仅是基于现有研究和理论的思考,并未经过实际实施和验证。未来的研究可以通过实证研究方法,对这些立法和监管建议进行实际操作的评估,以验证其可行性和有效性。
基金项目
燕山大学大学生创新创业训练计划项目。
NOTES
1Madhavi Gaur. GPT-4, a new generation of AI language model announced by OpenAI [EB/OL]. https://currentaffairs.adda247.com/gpt-4-a-new-generation-of-ai-language-model-announced-by-openai/, 2023-9-6.
2Haomiao Huang. The generative AI revolution has begun-how did we get here? [EB/OL]. https://arstechnica.com/gadgets/2023/01/the-generative-ai-revolution-has-begun-how-did-we-get-here/, 2023-10-3.
3《中华人民共和国著作权法》第二条,“中国公民、法人或者非法人组织的作品,不论是否发表,依照本法享有著作权。外国人、无国籍人的作品根据其作者所属国或者经常居住地国同中国签订的协议或者共同参加的国际条约享有的著作权,受本法保护。外国人、无国籍人的作品首先在中国境内出版的,依照本法享有著作权。未与中国签订协议或者共同参加国际条约的国家的作者以及无国籍人的作品首次在中国参加的国际条约的成员国出版的,或者在成员国和非成员国同时出版的,受本法保护。”
第九条,“著作权人包括:(一) 作者;(二) 其他依照本法享有著作权的自然人、法人或者非法人组织。”
4欧洲议会法律事务委员会提交的《关于机器人民事法律规则的研究报告》建议引入“电子人格”概念,以解决无人驾驶交通事故的责任分配问题,该建议被学者视为赋予机器人或AI法律主体的某种尝试。See European Civil Law Rules in Robotics (Study). http://www.europarl.europa.eu/doceo/document/A-8-2017-0005-EN.html?redirect, 2019.3.21.
5《中华人民共和国著作权法》第三条,“本法所称的作品,是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果,包括:(一) 文字作品;(二) 口述作品;(三) 音乐、戏剧、曲艺、舞蹈、杂技艺术作品;(四) 美术、建筑作品;(五) 摄影作品;(六) 视听作品;(七) 工程设计图、产品设计图、地图、示意图等图形作品和模型作品;(八) 计算机软件;(九) 符合作品特征的其他智力成果。”