1. 研究背景与研究问题
2022年11月30日,OpenAI推出对话式人工智能ChatGPT,其表现出了令人惊艳的语言理解、语言生成和知识推理能力,仅用时2个月就拥有1亿活跃用户,成为科技历史上增长最快的“现象级”应用。以ChatGPT为典型的生成式AI (Artificial Intelligence,人工智能),正处于由前沿技术探索向商业化落地的转型阶段,通过与传统社会生活范式的不断交融,创造出人类与人工智能交互的新环境。生成式AI是指基于算法、模型、规则生成文本、图片、声音、视频、代码等内容的技术[1],与人工智能发展历史上的几次热潮相比,最大的不同在于,不仅仅停留在研究人员的实验室中或者只被少数人所熟知,而是已经进入到了商业应用阶段[2]。而其产物即生成式人工智能生成物(AI Generated Content,简称“AIGC”)已经遍布在各行各业。根据专业机构报告显示,2023年中国AIGC市场规模可达到170亿元,更是预测到2025年,中国AIGC市场规模预计将达到260亿元,预计到2027年中国AIGC产业规模超600亿元,2030年市场规模超万亿元1。生成式AI引入电商行业已经具有势不可挡的趋势,且愈演愈烈,国内外电商行业都已经开始了积极的探索,海外电商中,亚马逊2023年推出了七项生成式AI功能,囊括了生成商品文案、生成主图背景、智能客服、商品评价分析以及消费者的购物助手等多方面,一站式服务卖家与买家,近期更是与德勤中国联合发布《生成式AI赋能零售电商行业白皮书》,详细探讨生成式AI在零售电商行业中的应用场景、解决方案、应用案例及实施路线图2,谷歌、微软、Shopify、Lazada、eBay等上线了系列AI工具或功能。国内电商平台也不甘落后,阿里推出了千牛copilot、万相实验室和淘宝问问,除此之外,京东、华为、百度、小红书都各有布局,电商与AI的相拥也推动了众多新兴科技企业投入生成式AI研发的蓝海中。
在生成式AI与电商打的一片火热之中危机亦在潜伏,因为电商行业线上化程度高,高度依赖文字、图片和视频的表现能力,内容的质量直接决定了价值的创造,这意味着AIGC能在其中实现价值最大化,同时AIGC带来的风险也会最大程度冲击电商行业。AIGC是基于AI大模型的产物,模型从本质上来说是一个函数,要想找到函数准确的表达式,只靠逻辑是难以推导的,这个函数其实是被训练出来的[3]。简而言之,无法保证AI的决策以及AI的生成内容是绝对准确的或者绝对可靠的,可以说它是无限逼近的,但无法在逻辑推导上保证绝对正确。生成式AI带来的技术革新使得新兴电商模式区别于传统电商模式,将带来众多风险挑战,笔者将从生成式AI于电商领域的应用出发剖析其中的著作权风险。
2. 生成式AI在电商行业的应用场景
生成式AI的技术能力,包括文本生成、图像生成、语音生成、视频生成、代码生成以及3D模型生成。接下来将以销售环节:售前、售中和售后三个节点为关键,列举生成式AI工具在电商行业的应用。
2.1. 售前:产品研发与文图生成
在销售之前,主要进行产品研发和营销工作。产品研发,可以利用相关AI工具进行新品创意设计以及辅助进行设计优化,例如在服装行业,AI工具能够快速抓取全球流行趋势,根据某地区的布料、颜色以及款式的流行程度制作出最具吸引力的服装。基于某种艺术风格,构建该风格的图像库,挖掘图像特征,进而实现该风格的图像拼接并将生成结果用于文化创意产品设计[4]。
营销工作包括了商品文案生成和图片生成,文案是商品是生命力,关键词是用户能否通过搜索功能搜索到商品的决定因素。传统的做法有对标爆款同种商品或者同商品多个链接换关键词试流量,而现在借助AI工具从海量爆款商品关键词中自动生成最具有竞争力标题3。在服装类目,通常多采用“小单快返”的模式,即小批量生产多种样式的服装投入市场,快速获取市场反馈,面对如此海量的图片需求,还和以往一样找模特、拍照、修图,无疑会消耗大量的时间和成本。现在使用AI工具,上传产品图与模特图,就可以得到模特身穿产品的展示图4。比如商家想测试不同的颜色和花纹,不需要再制作样品再拍摄,只需要用AI工具生成处理。
2.2. 售中:虚拟数字人主播与智能导购
销售是关键环节,随着技术的发展,虚拟数字人主播开始成为了众多直播间的选择。根据专业机构报告显示,2030年我国虚拟数字人整体市场规模人民币2703亿5,虚拟数字人两大重要应用领域:B端和C端,B端主要是企业的数字员工或者品牌官;C端是消费应用端,比如哔哩哔哩、抖音、虎牙等,而最受市场关注也最能体现其商业价值的是电商直播、虚拟偶像、品牌营销等应用场景[5]。虚拟人主播的应用逻辑的基点在于人工智能AI算法的演进使得虚拟数字主播拥有了类人的形象、语言系统、动作系统、诉求回应系统[6],其优点在于可以24小时直播讲解产品满足不同时段进入直播间的消费者,节约时间、降低用人成本还能为消费者带来新奇的感受。
在线下购物时,消费者通常需要相应产品的导购提供专业的购买意见。国内已有科技公司基于百度公司研发的文心大模型开发了AI智能导购助手,在相关社区和自己的导购APP内上线,近期内测阶段APP内AI智能导购助手的日均访问量已达到了3000次以上,参与内测用户的次日留存率平均提升10%以上6。该AI导购助手理解并分析用户以自然语言提出的购物需求,在海量知识库中筛选生成出最匹配的结果,以产品推荐理由、产品图片、优惠链接和购物攻略的组合形式,整体推送给用户。
2.3. 售后:智能客服与商品评价分析与应答
智能客服是参与了售中与售后,鉴于售中时发挥的作用与智能导购助手类似,即对产品的基础性能信息了解,故将其对售后的处理最为重点归类到售后环节。淘宝推出了“阿里小蜜”,京东推出了“小咚”,亚马逊推出了Chatbot等智能客服,快速响应消费者问题解决问题的同时减少等待时间。智能客服的技术逻辑是多轮任务型对话系统[7]。
商品评价关系到商品的市场价值,对售后评价进行分析的AI工具应用极大地提升了数据处理和客户反馈管理的效率和质量。将消费者的评论进行分析,不仅包括提取关键词更包含了情感分析,将评价分为正面评价、负面评价和中性分析,对情感分类后的文本进行语义网络分析,绘制语义网络图,可视化评论主题与评论对象之间的语义关系。根据消费者评论的内容和情绪,自动生成文字回复,个性化及智能化互动能够提升客户满意度,增强品牌忠诚度,并及时处理潜在的负面影响。
3. 生成式AI的著作权风险
3.1. 对独创性认定标准的挑战
目前AIGC在法律界最受关注点之一——是否具有著作权?2019年12月腾讯诉盈讯科技著作权侵权一案中7,法院从涉案文章的外在表现形式与生成过程进行分析,认为写作机器人Dreamwriter只是写作助手,认定该文章属于作品,但著作权人并不是Dreamwriter,而是原告主持创作的法人作品[8]。2023年,北京互联网法院对李某某诉刘某某侵害作品著作权、信息网络传播权纠纷一案作出判决8,原告李某某对其使用开源软件Stable Diffusion通过输入提示词的方式生成的涉案图片,这件案件引起了学者们的广泛讨论[9] [10]。在独创性争议论理中,法院认为原告在模型的选择、提示词和反向提示词的输入、相关生成参数三个方面凝结了智力劳动,故涉案图片具有独创性。然而,在杭州互联网法院审理的游戏算法“捏脸”案中9,原告通过平台的“游戏捏脸系统”制作产生了游戏人物形象,被告在售卖的产品中使用了这一形象,注意该形象表现形式并不是单一画面,而是代表该形象的数据字符串,该游戏人物形象不同于以往的手工创造,而是人机交互的形式,对于该游戏人物形象是否作为作品,法院回复独创性争议,认为原告是在已有的系统自带人物形象上进行修改,这种修改中取舍余地有限,审美过于雷同,相似性太过,最后的劳动成果和最初形象差别细微,对于该形象的五官和脸型的修改没有达到独创性要求。
AIGC是否具有著作权?法院在司法实践中已表明了立场,目前看来,司法实践体现以下两点:第一秉持面向未来的司法理念,在总体上承认AIGC的可版权性;第二,重视个案分析,强调AIGC必须体现“人”的个性化表达,总而言之,只有哪些生成过程足够复杂,体现“足够”人类精力的AIGC,才能称之为“作品”[11]。
问题随之而来,怎样才算体现“足够”的人类精力呢?根据著作权法规定,作品是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果。AIGC的独创性认定的标准亦是百家争鸣,即使目前司法实践还是在践行“最低独创性标准”,但是目前的生成式AI发展越来越复杂,出现的问题亦愈加繁复。对于电商从业者而言,维护自身商品的著作权有一个重要前提,那就是具有著作权,使用生成式AI工具制作的商品图片、视频一旦不被认定为作品,无疑对维权造成困难。
3.2. 对他人合法著作权的挑战
2024年2月全球首例AIGC平台侵权案件在广东互联网法院作出判决10,原告上海新创华文化发展有限公司是“奥特曼”系列作品的著作权人的独占式授权的权利人,发现某AI公司经营的Tab网站(化名)提供AI生成绘画的服务,原告发现该网站可生成具有奥特曼形象的图片侵犯其著作权,最后法院判决被告的行为侵犯了原告对涉案奥特曼作品享有的复制权和改编权。该案是人工智能生成阶段的著作权侵权问题,通常也被称作生成物著作权侵权问题[12]。该案应当给所有提供生成式AI服务的电商平台敲响警钟,法院承认AIGC的著作权并保护的行为是值得电商行业的生成式AI服务提供者为之高兴的,承认AIGC的商业价值有利于推动AIGC产业进步与相关经济的发展,但是生成式AI服务提供者并非一劳永逸了,训练数据集或者语料库出现侵权图片导致最后的生成物侵犯他人的著作权需要承担相应法律责任。
目前电商行业生成式AI服务提供者主要包括两类,一类是大型电商平台,另一类是专业生成式AI平台服务者。基于大模型的生成式AI 在训练阶段的数据来源中,大量数据来自于受著作权法保护作品的挖掘,考虑到我国目前著作权法的合理使用条款仍采用法定主义,类似的文本挖掘行为等很难构成合理使用,如果开发者没有获得作者的授权,那么该行为将可能导致作者著作权侵权[1]。2023年7月发布《生成式人工智能服务管理办法》11第二章第七条第二款对生成式AI服务者的知识产权义务做出规定,涉及知识产权的,不得侵害他人依法享有的知识产权。
在具体的应用领域中,虚拟数字人中,其数字人形象基本有三类,一有自创形象,比如虚拟歌手洛天依12,二有真人形象,比如与撒贝宁如出一辙的AI虚拟主持人“小撒撒”,三是虚拟共生具有交互能力的虚拟数字人,比如中国首个原创虚拟数字大学生——清华大学的华智冰13。在电商直播领域中,虚拟数字人的应用最常见的问题是未经著作权和肖像权人允许使用他人的形象和肖像,对于真人该类问题是传统领域的侵权问题,此处重点讨论原创形象的侵权问题。原创形象大多数根植于与“萌”文化交集的二次元文化,纵观各大平台的虚拟偶像,外形涉及大多模仿少女风、中国风,原创性不足[5]。米哈游诉伊秀公司侵害作品信息网络传播权一案中14,原告米哈游公司认为被告伊秀公司擅自使用了自己美术作品NOva的形象,被告认为权利作品系二次元日系风格人物漫画,类似者线上线下比比皆是,而法院认为该作品以线条、色彩及其组合呈现出富有美感的形象和艺术效果,体现个性化表达,构成作品。基于此电商从业者使用虚拟数字人主播时,更应当注意生成的主播形象避免侵犯他人合法的著作权。
在图片生成领域,生成式AI工具将属于他人著作权的图片抓取后融合,2023年11月29日,微博用户“正版青团子”联合三名画手起诉小红书15,其旗下的AI绘画产品“Trik”作出的作品与四位小红书平台用户的原创产品重合度极高,这种行为被称为“炼丹”,这种大量原创作品拼凑出的新“原创”也被不支持AI绘画的人们称为“尸块”。在图片生成过程中,尽管AI工具使用者并没有抄袭的主观意愿,但是由于该AI工具本身语料库的问题使得最后的成品为侵权作品,如果只是单纯是侵权,那应该是生成式AI的开发者承担责任,但是如果使用者拿着侵权图片制作宣传产品图或者印刷在商品上已经获取了一定数额的利益,那么此时的责任如何进行区分呢?这些都需要我们进一步探索,在电商行业,每一个环节都牵涉着无数利益,如果没有一个明确的规范必致乱象丛生。
4. 生成式AI的著作权风险防范探索
4.1. 电商平台作为著作权风险防范的主体
电商平台担当著作权风险防范主体的原因有以下三点:一是电商平台是能够从中获益,由获益者承担责任符合公平原则;二是电商平台承担责任更加符合效率原则,在网络知识产权领域,侵权主体分散且匿名,平台作为多边群体连接者,占据着电商产业的优势地位;三是平台作为市场组织者决定了其负有知识产权法律责任[13]。电商平台与平台内经营者超越了平等的民事主体关系,电商平台拥有了影响、支配平台内经营者的权力[14]。值得注意的是,尤其是大型电商平台还具有一重身份,生成式AI服务商,那么其既是运动员又是裁判,如何让电商平台对电商行业的著作权风险进行防范的同时规制自身行为成为巨大考验。
电商平台首先要明确界定著作权保护的义务,关于电商行业AIGC的可版权问题,法院作出判决都需要大量的论证,法学界都没有定论,故电商平台很难做到客观又正确的判定,电商平台也不应当在该类问题上承担中立的裁判角色,其应承担合理的“第三方义务”,需要相应的法律法规和规范性文件对此进行细化和明确 ;其次,应担负对AIGC进行标识的义务,根据《生成式人工智能服务管理暂行办法》的规定,服务提供者应当对图片、视频等生成内容进行标识,抖音、哔哩哔哩、微博等主流媒体都对疑似AI生成内容进行标识,方便用户识别真实图片和虚假图片以减少谣言生成和不法犯罪发生,而淘宝、拼多多、京东等电商平台并没有这样的标识,尤其是体量小的店铺,更是滥用过度AI图片的重灾区,抛开这些图片是否涉嫌诈骗和欺骗消费者,用户看到AI生成的产品图后是否愿意购买该产品应当由用户自己决定,而不是由平台在其中浑水摸鱼,目前主流用户中存在对AI态度友好型、中立型以及抵制型,但是无论是什么类型的消费者都应当有消费自由权。再次,对电商平台的私权利进行规制和引导,对电商从业者而言,大型电商平台或者其合作方的生成式AI工具的使用是否存在隐性强迫,例如捆绑式运用,强迫下载或者店铺流量引导式使用,对消费者而言,在提供AI导购服务时是否存在算法歧视、暗广推荐等等都需要建立合理的制约机制。
4.2. 规范生成式AI服务提供者的行为
对于生成式AI服务提供者的规制应当在总体上采取包容审慎的治理态度,既要着眼于其在当前已经造成的著作权风险并进行合理规制,又要考虑其在将来可能造成的知识产权风险进行提前预防,从而减少新兴技术对社会发展造成的负面冲击[15]。同时建立敏捷治理的监管工具箱,试行推动监管沙盒,细化数据合规免责制度,给新兴技术发展留下试错空间[16]。
建立起事先,事中和事后规范机制:在事先,要求生成式AI服务提供者建立起数据风险评估机制,对可能会存在的风险及其处理机制进行必要的公示,方便监管部门监督或者企业自查,生成式AI在训练阶段获取到他人的数据应提前获取他人的许可,尤其是平台自己研发的AI更有可能收集本平台的用户作品,更应以醒目的方式获取用户的授权;在事中,在应用运行阶段获取到的涉及用户的作品数据,或者在使用人机交互的过程中获取的作品数据,均需将这一情形事前告知并取得当事主体的单独同意;在事后,如果有他人发现某用户的生成物具有侵害其著作权的嫌疑时,有关的开发者应当提供必要的申诉机制。
5. 结论
电商平台在生成式AI的背景下出现了很多需要应对的事物,既是机遇也是挑战,其中著作权风险还只是其在知识产权领域的一个分支,从小问题入手窥探整体面貌,对于其防范应当秉持发展与治理并重的观念,不能一味在技术上突飞猛进而忽视其中的法律风险,也不能因为治理而阻碍新兴技术的发展。首先AIGC的版权性本身就是一个旷日持久的法学界观点之争,实践也是具体案件具体分析,所以在该问题上最好的解决方法就是行之而观后效,传统的能解决就解决,新兴的看司法实践怎么说;其次是AIGC侵权,平台承担主要责任,服务商规范自身,未来几年关于此类诉讼会呈现爆发式增长。同时本文还有以下不足之处,关于著作权风险没有列举全面,著作权风险防范探索部分没有提出足够充分全面的可行性建议,不够具体等等,还需要进一步研究。
致 谢
感谢在文章撰写过程中我的朋友和家人的帮助以及导师的指导。
NOTES
1参见量子位智库:《中国AIGC产业全景报告》,第7页,发现报告网,https://www.fxbaogao.com/report?id=4005208,2023年3月。
2参见亚马逊云科技和德勤中国:《生成式AI赋能零售电商行业白皮书》,发现报告网,https ://www.fxbaogao.com/report?id=4547103,2024年10月17日。
3参见关键词工具:Sif关键词:https://www.sif.com/。
4参见ZMO平台:http://www.zmoai.cn/。
5参见量子位:《虚拟数字人深度产业报告(2021)》,第4页,2021年9月18日。
6参见百度AI:《文心大模型打造“金牌销售”,AI智能导购助手帮用户“买到心坎”》,2024年5月27日,https://mp.weixin.qq.com/s/qv5Ah_bmW6WV9xHj6lBr_g,最后访问时间:2024年10月26日。
7参见广东省深圳市南山区人民法院民事判决书(2019)粤0305民初14010号。
8参见北京互联网法院民事判决书(2023)京0491民初11279号。
9参加杭州互联网法院(2019)浙0192民初4122号民事判决书。
10参见广州互联网法院民事判决书(2024)粤0192民初113号。
11参见国家互联网信息办公室令第15号。
12洛天依(Luo Tianyi),基于语音合成软件VOCALOID系列制作的中文虚拟歌手,2012年7月12日出生,现隶属于上海禾念信息科技有限公司。
13参见勒川:您好,虚拟人,中关村在线,2022年6月。
14参见(2020)粤0192民初46388号。
15参见微博用户“正版青团子”的微博详情页面:https://weibo.com/3524085114/4973464421140588。