1. 引言
人工智能与各领域深度融合并加速发展,呈现出新的特征,如跨界融合、深度学习、自主操控、人机协同、群智开放等等 [1] 。慕课作为人才培养中重要的一环,要把握人工智能时代发展大势和机遇,积极推进慕课与虚拟数字人技术结合,是人工智能技术在慕课上的一次新探索,响应了国家对教学的内容传播手段及展现方式上的创新需求,以期推动未来慕课课程在制作理念、学习方式等方面创新和重构 [2] 。
2. 虚拟数字人技术
虚拟数字人技术,是运用语音、文字实时驱动虚拟形象的口唇动作和面部表情的一种技术,在制作和内容的动态呈现着丰富的应用场景,提供了一种更加自然的交互方式 [3] 。
虚拟数字人技术包含了采集人像、采集语音、识别语音、理解语义以及AI合成等多种技术,通过语音库和虚拟人像建模技术定制虚拟化在线教育教员,可实现文本内容一键生成音频视频,进而实现慕课课程建设维护的快速化和自动化生成。
虚拟数字人现共有三类,Avatar型、内容生成型和交互对话型。这三种类型对应三种不同的技术路径 [4] 。
2.1. Avatar型
Avatar型数字人实现流程为“真人动作–动作捕捉–数字人驱动”。由于以真人表演作为原型,需要真人声音,只是通过算法换成另外一张脸,不属于严格意义上的虚拟数字人。
2.2. 内容生成型
内容生成型数字人的实现流程是“文本→语音→视觉”。文本合成语音使用TTS语音合成技术,驱动生成数字人脸的表情和肢体动作等等。主要采取离线合成的方式,实时要求不高,技术难度适中。
2.3. 交互对话型
交互对话型数字人技术难度最高,是结合语言处理、语音识别及视觉合成技术,其实现流程是“用户语音输入→对话机器人识别→应答文本→语音→视觉”。用户的语音识别文本后传给对话机器人,经过对话机器人的应答文本,语音合成后通过语音驱动技术合成视觉效果。
三种类型数字人的比较如表1所示。

Table 1. Comparison of three types of digital people
表1. 三种类型数字人比较
3. 虚拟数字人技术应用于慕课中的优势
虚拟录播和智能辅导是运用行业领先的人工智能技术数字化克隆,应是虚拟数字人未来在慕课中重要技术之一。虚拟人形象AI合成技术对真人信息进行提取,精确重构了面部模型,高度在虚拟世界中还原真人。与传统的慕课建设相比,虚拟数字人驱动改革与创新后具有以下优势:
1) 制作运行成本降低,可根据在线课程等制作过程中定制录播形象,实现一键换装,只需输入文本,就可进行音视频的快速合成播报。软硬件一体化技术的成熟发展推动建模、驱动、渲染、剪辑和合成等流程实现自动化和智能化。
2) 可实现24小时实时不间断录播,不受时间地点人为等因素的影响限制,可解决在慕课建设中拍摄难的问题,保证了课程制作的高效性,大幅提升内容制作效率。
3) 大大提高了录制准确率,编辑人员只需输入文本,文本内容可直接转换为虚拟教员录播课程或直播课程。
4) 虚拟教员的形象和声音制作以课程真实教员为原型,以采集真实教员数据确保虚拟教员表情生动自然,口型精准度高,合成声音音质清晰、自然流畅,播报专业感比真人更强。
5) 简化了课程的后期制作工序,满足一次采集和多种生成的需求,便捷高效地生成海量的可复用的播报内容。
6) 建立以学习者为中心的新型学习环境,通过虚拟教员为学员提供相对标准化、智能化的服务,实现7 × 24小时在线,显著提高课后辅导效率。虚拟教员可以扮演客服、助手等功能性角色,根据学生的学习特征(如学习习惯、认知水平等),为每一名在线学习的学员提供精细且实效的个性化教育服务。
7) 慕课建设方法新颖,响应了国家对内容传播手段和方式创新的需求,抢占了人工智能时代人才培养的战略创新点。
4. 虚拟数字人技术应用于慕课中的难题
我国在2020年《虚拟数字人推进计划》等多项利好政策的推动下,虚拟数字人有良好的发展前景。调研机构数据显示,我国虚拟数字人行业整体市场规模有望持续增长,并有望在2030年达到2703亿元。但是,虚拟数字人应用于慕课变革与创新存在不少难题 [5] 。
4.1. 关键核心技术尚存难点
一是“数字人”和“数智人”差距很大。目前,国内的大多数数字人主要依靠数字人的基础设定,情商和智商的技术仍在探索中,尚停留在逼真外壳阶段。二是数字人高精度动作捕捉成本高,后期开发的过程比较漫长,如果应用于慕课,前期投入存在高经费和长时间的难处。比如,在2019年美国的科幻电影《阿丽塔:战斗天使》中,虚拟人渲染过程使用3万台电脑,80名技术人员累计高达4.32亿小时才得以完成。
4.2. 实用性研发和应用较为薄弱
国内产业尚处于前期培育,对虚拟人实用性能研发不足,智能虚拟人培育成长缓慢。智能虚拟人目前尚处于探索中,需在前期进行大量数据包的录入,然后通过AI学习、训练。
4.3. 使用场景存在泄密风险
虚拟数字人在使用中可能会出现数据秩序的“灰色地带”,存在“换脸”和“道德”风险,其形象IP的权利归属尚处法律空白,存在隐私泄露等潜在风险。虚拟数字人技术目前需要在互联网上进行数据录入和后期培育,未来运用到慕课中,应保证数据安全。同时,监管应明确责任归属,从源头理清并落实责任主体。
4.4. 人才短缺现象明显
要实现虚拟数字人技术的慕课化,除了面临技术门槛高、周期长、成本高的问题,还存在相关人才的稀缺现象,专业从事图形研究的程序员多任职于顶尖研究机构、大学和一些游戏公司。虚拟数字人的高技术门槛,使慕课制作应解决相关领域的软硬件工程师、技术美术人才(如特效设计师、三维角色绑定师、动画师等)短缺的问题。
5. 助力虚拟数字人技术在慕课中的应用措施
5.1. 打造慕课智能化研发平台
目前,虚拟数字人未实现规模化的主要原因是虚拟数字人制作技术互联网化、门槛高、周期长。因此,一要完善对人工智能、大数据挖掘等相关课程的建设支撑,提供综合应用展示,为慕课的课程教学提供服务。依托现有实验条件,筹划建设虚拟数字人技术实验室,开展相关技术的科学研究,鼓励教员参与该技术的运用。实验室条件建设、大数据建设、课程建设等都要适应智能化需求这个目标聚焦 [6] 。二要着力提升实用型技术的开发,如人像驱动、语音交互、智能对话、智能推荐等,搭建数据共享的智能化虚拟数字人训练平台,以期实现低成本快速定制数字人,完善数据库信息,降低数字人技术在慕课中的应用难度系数。
5.2. 拓展慕课应用场景
一是解决在线教育资源结构性紧缺,实现名师在虚拟世界与学员交流。二是改善学习方式。虚拟数字人可建立以学员为中心的信心学习环境,实时跟踪学员学习数据,当学员的学习特征不明显或效果不明显时,通过知识推理和即时反馈,提供应对建议,提供个性化服务,使学员由线上孤军奋战的学习向主动合作的学习转变。三是融合智能辅导。使用智能在线回答和智能客服,实现以学员为中心的高效智能答疑解惑服务,解决慕课课程的教员非24小时在线答疑情况,降低人员维护成本。
5.3. 出台虚拟数字人管理保障制度
在引入虚拟数字人技术的同时,明确该技术的研发方向,同步出台技术标准、使用标准、版权保护、数据安全等管理制度,明确慕课平台的监管责任,高度重视可能出现的安全风险,预防与约束引导为主,前瞻性地出台相应行业规范,确保虚拟人技术应用安全、可靠及可控发展。此外,通过建设项目、科研基金等方式给予试点专项项目投入,积极向上级机关争取政策支持,在条件建设、制度保障等方面给予支持,推进虚拟数字人技术落实落地。
5.4. 加大相关技术人才的培养力度
遵循装备发展、人才先行的思路。一要加强内部人工智能人才储备及梯队建设。立足于自身培养,探索以实现问题为导向的技术人才复合培养模式,同时通过从地方引入相关技术人才,引进试点建设单位,为虚拟数字人技术领域提供充分的人才支撑。二要培养技术人员持续提升能力,基于人工智能、建模渲染以及相关技术服务作为技术创新,提升数字人表情捕捉以及精准还原。三要注重人才技术更新能力,不断丰富应用场景,加大对实用型服务型虚拟数字人的开发力度,使之更好服务慕课。
6. 结束语
慕课平台引入虚拟数字人技术,是虚拟数字人技术的技术架构、功能设计与实现效果的一次探索。这一创新应用希望在未来能够为慕课系统的智能化建设发展提供帮助。