1. 人工智能生成内容现状分析
人工智能生成内容(AI-Generated Content,以下简称AIGC)是指人类借助人工智能技术生成的文字、图片、视频、代码等。随着生成对抗网络(GANs)等深度学习技术的进步,AI的学习能力显著增强,进入了快速成长的新阶段。目前,AI的生成能力已成为该领域发展的核心,展现出巨大的行业应用前景。基于庞大的数据资源和复杂的计算模型,AI生成技术已经具备了创造性内容的生产能力;它能够在人类发现和定义问题能力的指导下,以超越人类的速度和精确度协助解决问题。此外,AIGC在外观上与常规作品极为相似,通过广泛的数据集训练,AI生成技术能够创作出小说、图像、音乐、视频等,甚至能够产出学术论文等科学文献。这表明,AI生成技术的出现已经对智慧成果的创造和传播的传统模式产生了深远的影响。然而,AI生成技术在为社会带来利益的同时,也引发了一系列问题。尽管AI生成的内容在外观上具有作品的特征,但其是否满足作品独创性的标准仍有待进一步探讨。因此,深入探究AIGC所依托的AI技术原理变得尤为重要[1]。
生成式人工智能技术,是指具有文本、图片、音频、视频等内容生成能力的模型及相关技术。1例如,当用户利用Stable Diffusion (简称SD)时,仅需通过关键词来描述其对图像的期望,SD便能够自主地生成相应的图像。同样,用户在与ChatGPT2交互时,只需通过文字描述其需求,ChatGPT就能自动产出文本。在这一过程中,用户无法控制或预测生成的具体内容,且每次生成的内容均是独一无二的。SD还具备基于现有图像进行再创作的功能,用户可以上传自己的草图,SD将在该基础上进行深入的加工,生成的图像虽然与原草图有显著差异,但仍然保留了原草图的核心元素。SD所依赖的文本–图像神经网络数据库为LAION 5B3,而ChatGPT则是基于核心算法RLHF4运行。两者均是开发者通过大量的训练和操作累积构建的,并且在训练过程中使用了海量的人类创作文本和图像作为学习材料。这些人工智能程序都建立在人工神经网络这一基本原理之上。人工神经网络由众多简单的处理单元构成,这些单元通过复杂的网络连接相互协作,它模仿了人脑或生物神经网络的某些基本特性。依托于庞大的数据集,人工神经网络能够表达复杂的逻辑关系并进行自我学习。基于人工神经网络原理,人工智能程序具有两个共同的特点:首先,无论是开发者还是用户,都无法预先设定或预测AIGC的具体细节,因为这些程序依赖的神经网络数据库是通过大规模的自动学习和试错构建的复杂系统,而不是人为编辑的数据库,因此排除了人为意志对程序运行的控制和预测;其次,人工智能通过学习过程吸收了人类的偏好,因为其数据库构建过程中受到了大量人类作品中包含的群体偏好的影响,使得AIGC在外观上与人类作品相似。基于AIGC的基本属性,其在运作时可能会触及他人合法拥有的知识产权,但他人难以在最终生成的内容中直接辨识出这些元素,这在司法实践中可能导致关于侵权行为举证责任的争议。此外,在基于图像生成新图像的人工智能程序中,用户输入的图像是其个人创作的草图,而人工智能在此基础上进行二次创作,最终生成的内容将同时包含用户原创的部分和人工智能创造的具有创新外观的部分。
2. AIGC的著作权评价
(一) 人工智能无法成为作者
我国《著作权法》第一条“为保护文学、艺术和科学作品作者的著作权,以及与著作权有关的权益,鼓励有益于社会主义精神文明、物质文明建设的作品的创作和传播,促进社会主义文化和科学事业的发展与繁荣,根据宪法,制定本法”,表明,著作权法采用的激励论,而被激励的主体必然是人类,而不可能是人工智能。且《著作权法》第2条也表明公民、法人和非法人组织是著作权主体。从国际规定情况来看,《伯尔尼公约》中并未给出“作者身份”的定义,但各缔约国仍达成共识,即“作者身份”和“作者”应解释为创作此类作品的人。美国最高法院也指出,主张侵权的作者必须证明思想的智力生产的存在,这意味着在创作过程中必须有目的或意图,而人工智能程序不可能具有创造意图,因为思想是人类独有的。并且,在《伯尔尼公约》中约定了著作权保护作者死后的权利继承也暗含了作者只能是人类的表达。因此,在传统著作权法规定中,尽管各国立法不尽相同,但仍然就“创作作品的人是作者”一点达成了共识[2]。
因此,从这个角度来看,人工智能不具有《著作权法》意义上的作者身份,其生成内容也就无法构成作品。
(二) 对创作工具说的否定
不少学者认为,人工智能虽然不具有作者身份,但是可以将人工智能作为人类辅助工具,人类借助人工智能生成的内容构成作品。但是,人工智能作为工具与人类利用的普通工具是有着本质差别的5[2] [3]。例如,使用者使用人工智能生成的图片与使用智能手机拍摄的照片看似都是使用所谓的“工具”进行创作,但二者之间具有本质的不同。创作,是人类自由意志的直接表达,是指直接产生文学、艺术和科学作品的智力活动(著作权法实施条例第3条第1款),是作者能够依据其自由意志,直接决定作品的表达内容,不会超出其预设[4]。使用者使用智能手机进行拍摄,可以根据其对于构图的理解,选取特定的角度,调整必要的焦距、光圈等,但拍摄活动仍然由摄影师所主导,照片拍摄的内容,也是直接反应了摄影师的意志。换言之,摄影师脑海中构思的照片内容,基本会还原在照片之中,不会超出摄影师的预设。而反观AI生成的图片,使用者即便不断地调整其输入的参数,使生成照片不断地去接近其脑海中的构思,但是参数的输入,本质上是AI内置算法触发的前提条件,生成何种图片,仍是由算法决定的,而不是由使用者决定的,使用者只不过是从诸多照片中挑选一张而已。换言之,使用者输入参数,只是触发AI算法运行的开关,具体生成的内容,并非人类自由意志的表达,而是算法运行的结果。使用者只能根据其自由意志决定输入的参数,无法决定AI生成的内容,使用者所做的,充其量去选择一张自己喜欢的图片罢了。用一个更通俗的比喻,用智能手机拍摄照片,就好比人类用中性笔作画,而人类用AI自动生成图片,就好比人类用“神笔马良的笔”来作画,作画者不是马良,而是马良的笔。因此,将“人工智能”视为创作工具来认定AIGC的作品属性是不可行的[5]。
(三) AIGC的独创性分析
《中华人民共和国著作权法》将作品定义为:文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果。作品的构成要件包括“属于智力成果”“表达相对完整”“具有独创性”等要素。笔者认为人工智能自动生成的内容难以符合第三个要件,即独创性是作品的必备构成要件[6]。现实中,AIGC与人类作品在表现形式上高度相似,为著作权法上对作品的认定规则带来了挑战。不少观点据此主张,可以将表现形式作为可版权性判断的充分条件,认定AIGC只要在外观上具备独创性即可构成作品。然而,仅从客观层面认定忽略了创作过程等内在因素在可版权性判断中的重要意义。在作品构成门槛较低的版权法系国家,已存在将创作意图作为作品构成要件,这值得我们借鉴和思考。笔者认为,在判断作品独创性时,应坚持主客观相结合的原则。客观上,独创性需要具备人类可感知的表现形式;主观上,独创性的判断涉及对作品的创意、精神的内容和个性等诸多因素的综合考量,因而存在一定程度的主观性,其中创作主体的创作意图是判断独创性标准的重要主观要素[7]。
一方面,我国作品的独创性特征应当包括创作意图要素。创作意图是作品形成的核心,它体现了作者将内心智慧具象化的过程。在大多数情况下,作品的独创性可以通过其明显的表达特征来判断,无需深入了解创作过程。但这并不意味着创作过程和创作意图与作品是否受著作权保护无关。随着人工智能技术的介入,我们以往通过作品的表达性特征来判断作者意图的方式已不再适用。在当今媒体融合和新型传播模式下,受众很难仅凭作品的外观来准确判断其来源。因此,在判断作品的构成时,不能仅仅依赖结果,还需要考虑作品与作者之间的关联,这对于法律意义上作品的认定至关重要。对于AIGC是否构成作品,同样需要综合考虑创作意图等内在过程性因素。
另一方面,人工智能无法实施形成作品的创作行为。创作活动是作者形成受著作权法保护作品的关键行为,这要求作者作为民事主体,具有进行创作的主观意图[6]。与人类作者不同,人工智能尽管技术进步显著,但在缺乏创作意图的情况下,AIGC不能构成著作权法意义上的作品。人工智能的发展可以分为弱人工智能和强人工智能,目前大多数人工智能属于弱人工智能,其深度学习算法尚未达到人类水平的高级智能,无法实现自我意识和价值判断[8]。
(四) 对其他保护路径的批判性分析
当前学界存在将AIGC视为类电作品或数据库进行保护的观点,这些观点值得深入探讨[9]。首先,关于类电作品保护路径,有学者主张将AIGC类比为《著作权法》第三条规定的“电影作品和以类似摄制电影的方法创作的作品”。但是类电作品的保护前提是作者对画面选择和编排的创造性劳动,而AIGC的生成过程缺乏人类主导的创造性选择。即便是在用户输入提示词的情况下,最终内容的表达形式仍由算法自主决定,因此不符合类电作品要求的“摄制”这一人类创作行为要件。其次是关于数据库保护路径,有观点认为AIGC可依据《著作权法》对数据库的保护规定获得权利。事实上,这种观点忽视了数据库独创性判断的核心标准——内容选择或编排上的智力创作。AIGC的生成过程是算法对海量数据的概率性组合,其中既没有人类对内容的选择性编排,也没有体现数据库要求的系统性和条理性智力投入。因此,将AIGC纳入数据库保护范畴缺乏法律依据,也不符合著作权法鼓励创新的立法目的。
最后,还有学者提出通过邻接权保护AIGC的观点[10] [11]。这种观点同样面临理论上的障碍。邻接权保护的是传播者的投资和劳动,而非创作行为。我国《著作权法》规定的邻接权主体(如表演者、录音制作者等)的权利基础均以人类参与为前提。将AI生成活动类比为人类表演或录制活动,实质上是模糊了机器运作与人类创作的界限,可能导致邻接权体系的逻辑混乱。
3. AIGC版权赋予的不可行性
(一) 技术特性的法律障碍
在审视人工智能的演进历程时,可以发现其具有显著的发展性、复杂性和不稳定性。生成式人工智能(Generative AI)主要展示出以下几个显著特点:首先,生成式AI实现了从执行特定任务到处理开放性任务的转变。早期的机器学习模型主要被设计来完成特定的、定义明确的任务,如根据图像中的对象来对图像进行分类,或根据文本的情感倾向将其归类为正面或负面。然而,现代的生成式AI模型在两个关键方面改变了这一模式。一方面,它们从判别型模型转变为生成型模型。传统的判别型模型,例如图像分类器,通常只输出简单的标签,而生成型模型则能够创造更为复杂的内容,如根据“猫”的概念生成多样的猫的图像。这些模型不再局限于识别或分类信息,而是能够创造全新的、丰富的输出。另一方面,它们从任务特定模型转变为通用模型。过去,不同的任务需要不同的定制模型,例如,一个模型专门用于情感分析,另一个用于自动摘要生成。然而,生成式AI可以利用单一的通用模型来处理多种不同的任务,例如在大型预训练语言模型上进行微调,以适应各种不同的应用场景。其次,生成式AI的应用范围不仅限于文本到文本或文本到图像的转换,其在多个领域的扩展应用都取得了重大进展。例如,自动生成与图像内容相匹配的描述性文字、模仿特定风格和艺术家的作品以及将文本转换为听起来自然的语音或将语音内容转录为文字等等,展示了生成式AI在解决复杂科学问题上的强大能力,反映了其快速发展的趋势。再次,训练流程的发展,即预训练和微调,是生成式AI发展的重要方面。在生成式AI的背景下,机器学习模型的训练流程经历了显著的变化,这些变化不仅改变了模型的构建方式,也对其功能和应用领域产生了深远的影响。最后,生成式人工智能的规模巨大。在当前生成式AI的发展中,模型规模的显著增长已成为推动技术进步的主要动力。这种规模扩大不仅体现在数量级的增加,更重要的是在模型能力和应用范围上实现了质的飞跃。虽然许多今天使用的技术起源于上世纪80年代,但近年来它们通过技术革新实现了显著的扩展和优化,这一变革不仅提升了模型性能,还拓宽了技术应用的可能性,有助于优化资源使用并提升经济效益。以上几个特征,可以看出生成式人工智能发展迅速,人工智能在生成内容过程中存在一系列复杂性操作,其利用算法规则进行生成的过程具有不可预测性和未知性,即便数次输入的内容相同,出现的结果也大有不同;另外,生成式人工智能还在不断的发展与变革之中,他在为人类服务的过程中会产生怎样的技术发展变化还处于一个未知状态,人类目前对其发展还未有一个整体的认识。基于此,技术的发展有助于定义的稳定性,技术的发展有助于定义具体标准,人工智能自身的发展特性决定了赋予其生成内容版权会出现诸多的难题,如技术挑战等。
(二) 强人工智能时代的理论前瞻
虽然当前人工智能仍处于弱人工智能阶段,但学界对强人工智能可能带来的法律挑战已有深入讨论。即使未来出现具有自我意识的强人工智能,其生成内容的可版权性仍面临着理论障碍[12]。首先,从本体论角度来看,著作权法上的作品在某种程度上是作者人格的延伸。即使强人工智能能够模拟人类意识,其“人格”也无法等同于自然人的道德主体地位。目前大陆法系国家普遍坚持“创作人原则”,将作者资格严格限定于人类,这一原则不会因技术进步而轻易改变。其次,从制度功能角度来看,著作权法的功能之一就是激励更多的人创作符合人类需求的作品,即使强人工智能具备“自我意识”,其“创作动机”也与人类受法律激励的创作行为存在本质上的差异[13]。美国版权局《版权登记指南》曾明确指出,只有“人类创作”才能获得版权保护。最后,从实践层面来看,承认强人工智能的作者资格将导致权利归属、保护期限等制度设计的系统性困境。如果赋予AI作者身份,那么其“死后”五十年的保护期从何时起算?权利继承如何实现?这些问题也从另一方面证明了著作权法的人类中心主义特征具有不可替代性。因此,即使技术发展到强人工智能阶段,AIGC的版权保护仍然面临难以逾越的理论和制度障碍。
4. 总结
AIGC因其生成内容的不受干扰性和外观上体现出的作品独创性特征,引发了众多的著作权保护问题探讨。本文通过对现有保护路径的系统性批判和对未来技术的前瞻分析,认为,人工智能生成内容无法构成作品,不受著作权法保护。一方面,AIGC不符合我国《著作权法》对作品的定义。无论是将AI视为作者、创作工具,还是尝试通过类电作品、数据库或邻接权路径提供保护,均与著作权法的基本理论和制度框架存在不可调和的矛盾;另一方面,从法政策学视角,对AIGC的著作权进行否定性评价,既符合我国《著作权法》的立法精神和目的,也适应人工智能技术的发展趋势。著作权法应当坚持鼓励人类创作的根本宗旨,而非保护机器生成物。最后,面对技术革新,法律应当保持必要的稳定性。大陆法系传统下,法律概念的弹性解释有其边界,不能因新技术出现而轻易改变既有规则。对于AIGC保护可能带来的产业利益失衡问题,应当通过《反不正当竞争法》《合同法》等其他法律机制解决,而非削足适履地扩张著作权保护范围。未来研究应当关注如何构建与AI技术发展相适应的新型权利保护体系,在促进技术创新与维护法律安定性之间寻求平衡。
NOTES
1《生成式人工智能服务管理暂行办法》第22条第一款“生成式人工智能技术,是指具有文本、图片、音频、视频等内容生成能力的模型及相关技术”。
2ChatGPT:(全名:Chat Generative Pre-trained Transformer),是OpenAI研发的一款聊天机器人程序,于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够基于在预训练阶段所见的模式和统计规律,来生成回答,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写论文、邮件、脚本、文案、翻译、代码等任务。
3LAION 5B:是一个包含58.5亿高质量图像–文本对的开源数据集,其中包含探索和训练工具,可为DALL-E架构提供支持,并为广大社区推进多模态语言–视觉模型研究。
4RLHF:(Reinforcement Learning from Human Feedback)是一种结合了强化学习和人类反馈的机器学习方法。这种方法通过将人类的反馈纳入训练过程,为机器提供了一种自然的、人性化的互动学习过程。具体来说,RLHF的作用是通过强化学习与人类反馈相结合,人类的偏好被用作奖励信号,以指导模型的训练,从而增强模型对人类意图的理解和满足程度。在生成模型中,RLHF还可以让生成的图像与文本提示得到充分对齐。
5王迁教授在[2]《三论人工智能生成的内容在著作权中的定位》指出:“创作工具”的含义与“劳动者只是作为会说话的工具”及“人工智能是为人服务的工具”中的“工具”不同,是人根据自由意志将有关表达性要素的决定付诸实施时所借助的消极手段。由于生成式人工智能实质性地决定构成作品的表达性要素,因此其与照相机和常规图像处理软件等创作工具存在本质区别。