人工智能绘画生成图像的可著作权性分析
Analysis of Artificial Intelligence Painting Image’s Copyrightability
摘要: 人工智能绘画生成图像的可著作权性一直存在较大争议。为了尽可能地减少法学与具体技术之间的隔阂,选取了当前第四阶段的绘画人工智能进行技术解读。深度学习模型的本质是对比余弦相似度匹配图像数据与文本数据。扩撒模型的本质是基于扩散方程的三维形态计算算法。以技术解读的结论为基础,通过比较绘画人工智能与获得公民资格的人工智能、法人,否定了绘画人工智能的主体资格,进而确定绘画人工智能在图像生成中的角色定位应当是工具。在此基础上进一步讨论,人工智能绘画生成图像是否“具有独创性”、“属于人类智力成果”、“表现思想或情感”,皆可获得肯定的答案。在肯定人工智能绘画生成图像可著作权性的同时,提出了应坚持内容决定主义来具体判断图像是否是著作权意义上的作品。
Abstract: The copyright of artificial intelligence painting image has always been controversial. In order to reduce the gap between law and specific technology as much as possible, the current fourth stage of painting artificial intelligence is selected for technical interpretation. The essence of a deep learning model is to compare cosine similarity to match image data with text data. The essence of diffusion model is a three-dimensional shape calculation algorithm based on diffusion equation. Based on the conclusion of technical interpretation, by comparing the painting artificial intelligence with the artificial intelligence and corporation who obtained citizenship, the subject qualification of painting artificial intelligence is denied, and the role positioning of painting artificial intelligence in image generation should be a tool. Based on this further discussion, whether the image generated by artificial intelligence painting is “original”, “belongs to the achievement of human intelligence”, “expression of thought or emotion”, can get a positive answer. While affirming the copyright of the image generated by artificial intelligence painting, it is proposed that we should adhere to the content determinism to judge whether the image is a work in the sense of copyright.
文章引用:孙嘉蔚. 人工智能绘画生成图像的可著作权性分析[J]. 法学, 2024, 12(12): 7038-7045. https://doi.org/10.12677/ojls.2024.12121000

1. 问题的提出

1.1. 研究主体的选择

1.1.1. 为什么选择人工智能绘画生成图像

目前学界在此类问题的研究中,大多采取较宏观的视角,研究对象为“人工智能生内容”这一较大的范围。但不同的人工智能生成软件之间存在着较大的差异,目前市面上生成属于文学、艺术、科学领域内内容的人工智能主要是Text-to-Text、Text-to-Image、Text-to-Video三种模式。

之所以要选择具体的一种人工智能的理由主要有两点:一方面,不同模式的人工智能生成内容与人工智能使用者之间联系的紧密程度是存在差距的,人工智能所起到的作用也会有所不同。例如,目前用户较多的Text-to-Text人工智能ChatGPT是采用对话机器人的产品形态提供服务。ChatGPT的人工智能除了生全新的文字,也常被用于检索与整合的用途,在此用途中人工智能扮演的是一个检索软件的角色。而目前热门的人工智能绘画软件,例如Midjourney、Stable Diffusion、Dall-e2都是需要使用者详细描述需要生成的画面或者辅之以草图去生成图像的。就人工智能绘画生成图像过程存在Image-to-Image、Image+Text-to-Image的情况而言,使用者并不只是一个提要求、问问题的角色而是一个绘制草图或者半成品图像的作者,所以Text-to-Text与X-to-Image人工智能使用者与作品的联系紧密程度存在巨大差异。另外一方面,选择具体的一种人工智能才可以进行技术分析,以避免在给人工智能进行角色定位时,被“深度学习”“神经网络”“创造”等带有类比色彩的词模糊了人工智能真正的运作的原理。通过技术分析也可以在进一步讨论人工智能绘画生成图像的可著作权性时,更加有理有据地回答一些焦点问题,尽可能地去减少法学与具体技术之间的隔阂。

至于为什么选择人工智能绘画作为研究对象,原因有二:一是人工智能绘画是建立在Text-to-Text模式语言模型的基础上的,对人工智能绘画问题进行分析也可以涵盖一些人工智能生成文字的问题。二是Text-to-Video模式的人工智能目前推广度、技术成熟度不如Text-to-Image模式的人工智能,大部分人工智能生成视频还在技术上升期,没有形成稳定的产品。

1.1.2. 选择的是何种人工智能绘画生成的图像

绘画人工智能至今的发展阶段大致可以分为四个阶段,不同阶段的绘画人工智能差异较大,本文讨论的绘画人工智能处于哪一阶段也是需要明确的。需要说明的是,由于一些技术有同步发展,所以相邻两个阶段的时间会有所重合。第一个阶段是视觉效果和图像处理时期(2012~2015),这个阶段主要使用基于规则的方法和基于图像处理技术的方法对图像进行生成和转换。第二个阶段是基于深度学习的初始尝试时期(2015年~2017年),在这个阶段人们使用神经网络算法训练计算机识别并学习某一特定风格的艺术,并将其应用于新的图像上。这个阶段出现了一些代表性的模型,如DeepDream和NeuralStyle。第三个阶段是基于生成对抗网络的阶段(2015年~至今),这个阶段的技术突破是生成对抗网络(GANs),它可以同时使用两个神经网络——一个生成网络和一个判别网络——来生成高质量图像。在这个阶段出现了很多知名GANs模型,如pix2pix、CycleGAN、StyleGAN等。第四个阶段是Diffusion Models模型阶段(2021年~至今),Diffusion Models模型属于基于概率的生成模型,其主要特点是使用随机扩散过程来逐步生成图像。Diffusion Models模型的最大优点是能够生成高质量且多样化的图像,此外还具有更好的可控性和可解释性。相较于GANs模型具有更好的性能和可控性。而本文所讨论的人工智能绘画就是第四个阶段,虽然其仍处于弱人工智能阶段,但不同于以往的人工智能绘画,其具有弱人工智能时代下较强的智能能力。本文所讨论的第四阶段的人工智能绘画是在文字与图像关联方面具有深度学习能力的,即能够独立判断、收集并逐步学习新的数据,最终实现预定义算法的独立性,解决图像生成方面的新问题、生成新内容,并不在受单一风格的限制。在绘画人工智能生成最终图像的过程中,也不再需要数据和算法规则上的支持。

1.2. 人工智能绘画带来的法律问题

人工智能绘画在艺术和创意领域的应用热议不断,这种技术引发的著作权、道德和商业问题也备受关注。2023年2月21日,美国版权局给艺术家克里斯.卡什塔诺娃(Kris Kashtanova)发送了信函,取消了卡什塔诺娃使用人工智能驱动的Midjourney图像生成器的漫画书《黎明的查莉娅(Zarya of the Dawn)》的版权保护。信函称“我们的结论是,卡什塔诺娃是作品文本的作者,也是作品文字和视觉元素的选择、协调和编排的作者。该作者身份受版权保护。然而,作品中由Midjourney技术生成的图像并不是人类作者的产物”[1]。而在2022年9月,《黎明的查莉娅》已获得了版权登记,当时该作品获得版权保护还被认为是美国版权局对使用潜在扩散技术创作的艺术作品进行登记的肯定。

此次美国版权局对人工智能绘画软件生成的图像取消版权保护所引发的关于AI绘制作品的著作权争议还在持续。现阶段关于这个问题的观点各异,也暴露出了当前著作权法与人工智能开展艺术创作之间的紧张关系,人工智能绘画生成图像的可著作权性是关键问题。

2. 人工智能绘画的技术解读

如上文所述,在讨论可著作权性之前,需要尽可能以法学研究为目的地对人工智能绘画进行技术解读。

整体而言,AI绘画的核心技术能力是将人类创作的图像用高维数学向量表示。当向量能够合理地代表其所表示的内容时,所有创作图像都可以转换为该空间中的向量。将可获得的图像转化成向量后,在此空间中无法表示的向量即尚未被创造出的内容。通过反向转化已知图像的向量,AI可以“创造”出尚未创造的图像。可以明确的是,AI在“创造”新的图像时,并不是直接摘取人类创作的图像,而是使用了翻译了人类创作图像的向量。而这种翻译而成的数学向量与原作品之间是什么关系是值得思考的。

具体而言,AI图片生成器的结构因技术不同而异。考虑目前最新技术和使用情况,在技术解读时可以聚焦于最近热门的Stable Diffusion和DALL-E 2。具体而言,Stable Diffusion主要由三个部分组成:语言模型、扩散模型和解码器。语言模型将输入的文本提示转换为可以被扩散模型所解读的表达形式。扩散模型是一个时间条件下的使用全卷积网络进行语义分割的算法,可以将噪音图像逐步处理为完全嘈杂的图像。解码器将网络输出的图像编码放大到完整图像大小。解码器与扩散的训练分开是为了获得最佳图像表示。DALL-E 2包含三个子模块:基于CLIP模型的编码模块、先验模块和解码器模块。编码模块目标是将文本和图像编码为相应的特征空间,先验模块实现文本编码到图像编码的转换,解码器通过解码图像编码生成目标图像。从上述模型我们可以看出,目前市场上可赋之实际使用的拥有最新人工智能绘画技术且热度较高的人工智能绘画软件即使模型有一些出入,但核心技术是有一些共同之处的:一是语言模型都是openAI提出的CLIP,二是,都是通过扩散模型去生成图像的。

其中,CLIP模型,即对比性语言–图像预训练模型,一种先进的深度学习模型。AI所谓的“学习”就是通过CLIP模型来实现的。模型训练是通过文本编辑器将文本处理成数据,通过图像处理器将对应的图像处理成数据,进而组成向量,进行余弦相似度计算并进行对比,其中表格中对角线的向量就为正样本。通过这样的对比训练,CLIP就可以匹配图像和文本,也就是所谓的理解语言和图像之间的关系。所以,就其本质而言,这种深度学习模型是在对比余弦相似度进而将相似度最高的图像数据与文本数据匹配。

Diffusion模型依赖于一个二次扩散方程,该方程可以用来描述固体中物质的扩散。在计算机图形学中,该方程则被用作对三维物体的外表面形态进行计算。该算法先对三维对象进行网格化,将它拆分成若干个小方块,即体素。然后将每个体素与它周围的其它体素相连,用边作为连通关系的构成要素。算法主要针对体素之间的互相扩散进行建模计算,通过对这些扩散过程的分析,得到三维物体表面的信息。计算中,将不断调整每个体素的颜色和透明度,以使得整体表面趋向于平滑,并且能够准确地反映它的各种特性,比如焦点、阴影、以及表面反射情况等等。总的来说,Diffusion模型是一个基于扩散方程的三维形态计算算法,它对于AI绘画程序来说,是绘制逼真、有质感的三维模型的关键技术之一。

3. 工智能绘画生成图像能否受著作权保护之讨论

3.1. 主体问题

人工智能绘画的主体问题是在讨论人工智能绘画生成图像的可著作权性时,首先需要确定答案的问题。之所以主体问题是第一个需要回答的问题,是因为目前学界就人工智能生成内容是否可以享有著作权有较大的争议,大体上可以分为否定说肯和定说,而无论是否定说与肯定说之间,还是两种学说各自的内部,都在主体问题上存在争议。可见人工智能的主体问题是可著作权性讨论的焦点。

一方面,持否定说的学者给出的理由可以大概划分为两类:一是,通过否定人工智能的主体资格来否定人工智能生成物的可著作权性。二是,以“不具有独创性”、“不属于人类智力成果”、“不能表达思想或感情”等不满足著作权四要件中的理由去否定可著作权性。而否定说与肯定说在是否满足著作权四要件的纷争中,两者所讨论的主体存在不一致的情况。否定说往往默认人工智能做为创作的主体。在判断人工智能绘画生成图像是否符合上述要件必须明确主体问题,即“是‘谁’”的问题:体现的是谁的思想、表达的是谁的情感?是谁的智力成果?是“谁”作为人工智能生成内容的创作者?如果用“人工智能”作为“是‘谁’问题”的答案,或者说默认人工智能的主体地位。那正如上述的否定观点所述,以目前的技术水平来看,思考人工智能生成物是否满足著作权意义上作品的要件,答案往往是否定的。但如果将人工智能视作一种技术手段,换而言之,也就是将人工智能作为一种创作的工具,把“人工智能程序编写者”或者“人工智能使用者”等自然人作为“是‘谁’问题”的答案,那么,再考虑人工智能绘画生成图像是否满足著作权意义上作品的要件,则很大程度上可以获得肯定的答案。

另外一方面,肯定说支持者的观点也有一定的差异,在人工智能扮演何种角色的问题上存在较大的出入。第一类观点是肯定人工智能的主体资格,这其中也可以细分为两种不同的态度。一种思路是直接大胆地去肯定人工智能与自然人一样可以获得主体资格。另一种思路是,可以在这一问题上将人工智能类比著作权上的法人,从而使人工智能生成内容满足著作权意义上作品的要件。第二类观点倾向于回避人工智能生成物是否属于人类的智力成果,换而言之,不讨论作品如何产生,采用内容决定主义,考察人工智能生成内容客观上是否满足著作权意义上的作品。这种思路认为,关于作品创作是否是“自然人”这一问题,归根结底是为了明确权利归属,因此,不应混淆权利客体的属性和权利归属之间在法律技术上的区别,这将破坏法律的基本逻辑[2]。著作权一方面是财产性权利,一方面也是人格性权利。采用内容决定主义可以较为客观地评价内容财产意义上是否具有价值,能否被赋予财产性权利,但采用内容决定主义难以衡量内容背后的人格精神,便使得人格性权利的产生站不住脚跟。所以,在讨论人工智能绘画生成图像的可著作权性时,正面回答人工智能绘画生成图像是否属于人类的智力成果、创作者是否是自然人等这类问题是必要的。倘若不能明确主体,除了会使肯定说站不住脚跟以外也不利于进一步对人工智能生成图像进行权利归属安排。

可见,讨论人工智能绘画生成图像的可著作权性,避不开先讨论人工智能绘画生成图像的主体问题。

3.1.1. 人工智能主体资格的否定

如前文所述,人工智能是否为人工智能绘画生成图像的创作者是关乎图像是否符合著作权要件的关键问题。所以在讨论人工智能绘画的主体问题时,首先需要确定人工智能是否具有主体资格。

首先,肯定绘画人工智能主体资格的一种思路是直接大胆地去肯定人工智能与自然人一样可以获得主体资格。这种观点在国内或许难以被接受,但是在一些赋予人工智能公民身份的国家,似乎是顺理成章地,例如Sophia在2018年获得沙特阿拉伯公民身份,作为沙特阿拉伯的公民,Sophia当然与其他公民一样,对自己生成的内容享有著作权。但是笔者认为绘画人工智能不宜与自然人相提并论,或者说绘画人工智能并不宜在著作权上与公民享有同样的地位。暂且不论Sophia被赋予公民身份是否合理,Sophia之所以能被赋予公民身份,是因为她能够模仿人类,拥有人类的特性如语言、情感表达等。而绘画人工智能作为一种弱人工智能,是在语言理解与图像处理这个有限的范围内具有深度学习的能力并不具有自己的情感,也不能体会到人类的情感,更不是为了模仿人类而被创造。所以,绘画人工智能在外观上以及被创造的目的上就与Sophia大不相同,不宜效仿索菲亚被赋予公民身份进而获得主体资格。

肯定绘画人工智能主体资格的另一种思路是将人工智能类比著作权上的法人,从而使人工智能生成内容满足著作权意义上作品的要件。法人的意志能力归属于自然人意志能力的总和,因此,可以运用法律拟制将法人拟制为“作者”[3]。然而法人本质上是多个自然人的团体,法人的意志是自然人意志的直接体现。而人工智能的本质是自然人创造出来的综合算法,虽然能反映程序编写者的意志或是使用者的意志,但是是通过模型训练先匹配语言与图像再呈现图像去间接体现自然人的意志。此外,法人之所以被赋予主体资格在于法人拥有独立的意志精神,并且拥有独立的财产。绘画人工智能通过对比余弦相似度近将相似度最高的图像数据与文本数据匹配来进行语言图像预训练,再通过扩散方程的三维形态计算方法来生成图像,显然是在牢笼里跳舞,没有办法突破规则和计算方式。所谓“创作”也是依据余弦相似度与扩散方程,谈不上有独立的意志精神。再而,用于生成文学、艺术、科学领域内内容的人工智能往往没有独立的财产,这意味着没有办法像法人一样承担责任。所以,虽然法人在著作权上是非自然人主体,但是其与人工智能存在本质上的差距。著作权法上的法人制度并不能作为人工智能获得主体资格的突破口。

3.1.2. 人工智能角色定位

笔者认为,在人工智能生绘画成图像这个过程中,人工智能的角色并不是创造者。首先,我们需要定义“创作者”的概念。创作者是指在艺术创作过程中有意识地进行思考、选择、表达和组合的人[4]。换句话说,创作者是那些能够主动进行创造性活动的个体。基于这个定义,结合前述的技术解读,我们可以很容易地理解为什么人工智能不能被视为创作者,因为它缺乏我们所谓的“意识”。在艺术学界,也有许多人支持上述观点。例如,著名的艺术史学家查尔斯·詹森认为,创作包括概念和执行两个方面,而人工智能只能执行,缺乏独立的思维能力和情感倾向。因此,他认为人工智能只能作为一种工具,协助人类艺术家完成更高级别的创作[5]。尽管人工智能可以在绘画创作过程中产生非常出色的结果,但这些结果都是由人工智能程序依据所编写代码所使用的算法进行计算得出的。人工智能没有自己的意识和思考能力,因此,虽然人工智能在美术作品创作过程中扮演着非常重要的角色,但它并不是创作者。

在讨论绘画人工智能的角色定位时,我们可以将其与传统计算机绘画软件进行比较。之所以如此比较是因为传统计算机绘画软件无疑在美术作品创造的过程中是扮演着工具的作用,倘若绘画人工智能与传统计算机绘画软件的作用是一致的,那么绘画人工智能的作用便与传统计算机绘画软件相同,即扮演了工具的角色。首先,它们都致力于将传统的艺术手段融入到数字技术中。传统的绘画过程需要手工调配颜料、选取画笔和调整画面视角等,而使用电脑绘画则能够通过软件快速完成这些过程,并且更加精细和高效,例如可以使用图层来控制各个图元的位置和样式,可以通过复制和平移来增加重复效果等。通过将人工智能技术应用到数字绘画中,可以进一步降低人工绘画的门槛,并且带来更加广泛和多样化的艺术体验。其次,在传统计算机绘画软件中,用户使用计算机输入设备如鼠标或触摸笔控制画笔进行绘制,计算机则根据用户的指令生成相应的矢量或位图图像,最终呈现在显示器上。而对于人工智能绘画工具,其原理基于深度学习、神经网络和自动编码等技术,利用大数据训练出图像生成模型,在输入艺术家指定的主题、风格和效果等条件后,自动生成创意图像和艺术品。人工智能作为工具进行绘画与使用普通绘画软件在原理上有一些共同之处,都涉及到计算机图形学和数字图像处理的技术。所以,绘画人工智能与传统计算机绘画软件的作用是一致的,绘画人工智能的作用与传统计算机绘画软件都在美术作品创作中扮演了工具的角色。

3.2. 四要件分析——与否定说之商榷

在结合我国著作权法的规定和学术理论总结的基础上,人工智能生成的内容符合以下四个要件才可以被视作具有著作权保护意义的作品:一是具有独创性;二是属于人类智力成果;三是涉及文学、艺术或科学;四是能够以一定形式表现思想或情感。在前文明确了人工智能不具有主体资格,在人工智能绘画生成图像过程中扮演工具角色的基础上,再来分析人工智能绘画生成图像的可著作权性便更加明了。目前学界就“属于文学、艺术、科学领域内”以及“能以一定形式表现”的要件判断上都一致持肯定态度。所以需要进一步讨论的要件是“具有独创性”、“属于人类智力成果”、“表现思想或情感”。

首先,人工智能生成内容被质疑不属于智力成果,所以不能以著作权法保护。否定说认为智力成果要件是认定人工智能生成物构成著作权法意义上作品与否的重要标准。从人类是否实际参与作品的创作过程来看,多数人工智能生成物不构成作品[6]。然而,人工智能绘画生成图像从无到有的过程,并不是只有人工智能在参与。一方面,绘画人工智能的诞生就是人工智能编创造者的智力成果。另一方面,绘画人工智能是通过理解绘画人工智能使用者的语言或图像,再通过扩散方程算法来形成图像。绘画人工智能的使用者,并不是只需要摁“开始”键的角色,原始的文字输入以及图像输入,也能体现人工智能绘画生成图像是使用者的智力成果。

再而,与“人工智能绘画生成图像,是否符合‘人类智力成果’”同理,人工智能绘画生成图像也能表达思想或情感。否定说认为在整体运行过程中,人工智能本质上是在执行既定的流程和方法,并没有体现出像人类一样的思想或者情感的表达[7]。这显然是在讨论“人工智能绘画生成图像是否能表达人工智能的思想或情感?”根据前述技术分析,绘画人工智能作为一种弱人工智能,仅是在语言与图像关联理解以及图像生成方面具有学习能力,并不具备情感或思想上的能力,当然没有思想或情感,更提不上将其表达出来。但是,我们需要考虑的不是人工智能绘画生成图像是否能体现工具的思想或情感,而是要考虑是否能体现自然人的思想或情感。而绘画人工智能使用者的思想和情感可以通过文字以及图像输入进绘画人工智能程序,通过人工智能程序的翻译将其体现出来。

最后,也有的学者以人工智能生成作品的过程不符合独创性要求为由否定人工智能生成内容不可纳入著作权保护范畴。这种观点认为对于人工智能生成的内容而言,即便在表现形式上与人类创作的作品几无差别,如机器人生成的人像素描和财经报道等,由于是应用算法、规则和模板的结果,其生成过程没有给人工智能留下发挥其“聪明才智”的空间,不具有个性特征,该内容并不符合独创性的要求,不能构成作品[8]。值得注意的是,本文所讨论的绘画人工智能并不是只是通过计算去生成图像,是根据算法选择最优策略,根据最优策略扩散去产生结果。绘画人工智能作为一种弱人工智能能力确实是有限的,其深度学习的能力也仅限于理解文字与图像。但在这个领域人工智能是具有深度学习的能力,基于前文总体的技术解读,人工智能生成的是该领域从未有过的向量,换而言之,就人工智能生成图像的内容上来看,其能创造出这一领域没有被创造出来的图像。此外,根据WIPO的规定,作品的独创性是还需要满足“作品是作者自己的创作,没有从其他作品中抄袭”。由于绘画人工智能需要进行模型训练,否定说认为绘画人工智能并不是独立创作,创作是基于海量人类绘画作品。根据前文的技术解读,我们可以明确的是,绘画人工智能是将人类创作的图像翻译成高维数学向量再进行学习。一方面,这种翻译并不是将中文翻译成英文的翻译。这种所谓的翻译是用数学语言去最详尽地描述原作品图像,内容的转换完全是打破作品类型壁垒的,是将图像变成高维数学向量的重制。根据著作权法上的“思想表达二分法”,即不保护思想,只保护表达。当用文字去描述绘画作品的画面,即使描述地再详尽也是不会侵犯该绘画作品的著作权的,因为描述绘画作品的文字与该绘画作品的表达完全是不同的。所以人工智能使用高维数学向量,并不是使用原作品本身,而是使用与原作品并不相同的表达,并不会侵犯原作品的著作权。另外一方面,人工智能对海量人类创作绘画作品的学习,并不是摘取作品的内容,而是通过对比余弦相似度推演出新的文字与新的图像的匹配程度。所以人工智能绘画生成图像一是可以满足创造性的创作高度要求,二是可以满足独立创作作品的要求,是可以做到满足独创性要求的。

综合前述可见,人工智能绘画生成图像的可著作权性是肯定的。

3.3. 人工智能生成图像可著作权性的判断标准

肯定人工智能生成图像的可著作权性并不等于认可通过人工智能生成的图像都是受著作权法保护的。换而言之,图像是否由人工智能生成并不是判断图像是否具有版权的绝对依据。虽然目前高水平的绘画人工智能可以生成惟妙惟肖、能传达情感、表达思想的绘画作品,但即使是目前技术水平较高的绘画人工智能也会产出粗糙且不富有创造性的作品。举例来说,如果我们对人工智能输入“一个简单的圆”,那么绘画人工智能也可能给你一个毫无创造性可言的标准圆形。绘画人工智能作为人类创作图像的一种工具,只能起到工具的作用,并不能依靠判断工具的先进程度或所谓的好坏去判断图像是否满足著作权的要件。

著作权法的主要目的是保护创作者的知识产权,促进文化和科学的发展。为了达成这个目标,著作权法通常会保护原创作品,即由创作者根据自己的想法、体验和观念所做出来的独创性作品。但是,创作者在创作过程中使用的思路、方法、技巧等并不是独立的知识产权保护对象,而是属于通用的技术和经验性知识,所以在著作权保护范围之外。此外,如果著作权法也保护创作过程本身,那么将会对其他人的自由创造和创新造成限制,不利于知识和文化的共享和传播。因此,著作权保护原创作品,而不保护创作过程本身,也符合知识产权保护和知识共享的平衡原则。也就是说,著作权保护的是作品本身在表达形式上的独创性,而不是创作者的创作过程。因此,因为一个作品是否具备可著作权性主要是与作品的表达形式和内容相关,而不是与创作过程相关。无论创作者采取哪种方式进行创作,最终只要作品符合著作权法的规定,在表达方式上具备足够的独创性和原创性,都可以享有著作权保护。而创作者使用的创作过程、软件工具、技术方法等并不影响作品的本质特征和著作权保护的适用条件,因此在判断作品的可著作权性时通常只需要考虑作品本身,而不需要涉及到创作者的创作过程。

坚持内容决定主义来判断人工智能生成图像可著作权性比较契合著作权法只保护作品本身而不保护创作过程的特点。内容决定主义是一种著作权学说,旨在解决创造性作品中的著作权保护问题。其渊源可以追溯到18世纪后期的德国,由康德等人提出,并逐渐成为法学界广泛认可的一种著作权保护范式[9]。内容决定主义的内在逻辑是:创新和创造来自于思想、观点、表达方式和风格的原创性,而不是某种技术实现或操作过程本身。因此,只要具有足够的原创价值和创造性,就可以被视为独立的著作物并受到著作权保护,与其实现方式无关。在数字时代复杂的著作权问题中,使用内容决定主义可以将注意力从技术细节和实现方式中转移到表达出的思想和原创性上。在处理计算机程序或人工智能生成图像的著作权问题时,内容决定主义提供了一个可行的理论框架,作品中如果可以展现初始输入内容的创意和灵感,则应当享有著作权保护。

4. 结论

第四阶段的绘画人工智能是基于CLIP模型和Diffusion模型的弱人工智能。深度学习模型的本质是对比余弦相似度匹配图像数据与文本数据。而Diffusion模型的本质是基于扩散方程的三维形态计算算法。一方面,赋予绘画人工智能公民资格是无稽之谈,另外一方面,绘画人工智能也无法类比法人获得主体资格。基于对其的技术分析,人工智能没有自己的意识和思考能力,更类似于传统计算机绘画软件的作用,在生成图像中扮演工具的角色。在上述结论之下,人工智能绘画生成图像符合著作权四要件,具有可著作权性。此外,肯定人工智能生成图像的可著作权性并不等于人工智能生成的图像一定是著作权意义上的作品。要坚持内容决定主义,具体图像具体分析来判断其是否能赋予著作权。

本文的研究对象局限于第四阶段的绘画人工智能,虽然绘画人工智能是建立在文字生成人工智能语言模型基础上的,但是对于解决文字生成人工智能、视频生成人工智能等其他人工智能生成内容带来的问题无法给予直接的参考。但期冀能给解决其他人工智能生成内容的可著作权性问题提供一些思路。此外,虽然目前人工智能技术大体还是仍处于弱人工智能阶段,但随着技术的发展,有望步入强人工智能阶段。而本文所讨论的内容都是在弱人工智能阶段的大前提下,并不能适用于强人工智能阶段。法律研究相较于技术发展不可避免地存在滞后性,仍需要不断地去更新。

参考文献

[1] 中国保护知识产权网. 罗先群: 人工智能生成的漫画插图在美国失去版权保护[EB/OL].
http://www.xaippc.com/html/hwwq/815.html
, 2023-05-22.
[2] 乔丽春. “独立创作”作为“独创性”内涵的证伪[J]. 知识产权, 2011(7): 35-38.
[3] 邾立军, 田熔榕. 论人工智能生成内容的著作权问题探究[C]//上海市法学会. 《上海法学研究》集刊2022年第5卷——2022世界人工智能大会法治论坛文集. 上海: 上海对外经贸大学法学院, 2022: 9.
[4] Arriagada, L. (2020) CG-Art: Demystifying the Anthropocentric Bias of Artistic Creativity. Connection Science, 32, 398-405.
[5] Jencks, C. (2009) What Is Postmodernism? In: Jencks, C., Ed., The Language of Post-Modern Architecture, Wiley-Academy, 493.
[6] 何培育, 蒋启蒙. 人工智能生成物的著作权保护路径探析——兼评人工智能生成物著作权第一案[J]. 重庆邮电大学学报(社会科学版), 2020, 32(4): 27-35.
[7] 刘伟, 赵路. 对人工智能若干伦理问题的思考[J]. 科学与社会, 2018, 8(1): 40-48.
[8] 王迁. 论人工智能生成的内容在著作权法中的定性[J]. 法律科学(西北政法大学学报), 2017, 35(5): 148-155.
[9] 朱艺浩. 人工智能生成内容之定性的知识产权法哲学证成[J]. 网络法律评论, 2016, 20(2): 39-55.