1. AIGC和Sora爆火:带来无限可能
在数字化时代的浪潮中,人工智能技术正在以前所未有的速度发展,而AIGC (Artificial Intelligence Generated Content)正是这一浪潮中的一颗亮眼的星星。AIGC,全称是“人工智能生成内容”,它不仅代表着技术名词,更是意味着一种全新的内容生成方式和思维模式的转变。AIGC作为“优化对话的语言模型”的代名词,其背后的技术基础是云计算、海量数据库以及先进的人工智能算法。这些技术的融合,使得AIGC能够超越传统搜索引擎的简单信息检索功能,而是具备了生成具有逻辑的和关联性的智能内容的能力。这种能力,让AIGC在短短两个月内就吸引了超过1亿的用户,成为了人工智能领域的新宠[1]。AIGC实现这种智能内容生成主要得益于其背后的三大核心技术:大数据技术、大模型以及大算力,譬如,大数据技术为AIGC提供了海量的数据资源,这些数据资源是AIGC进行学习和训练的基础。大模型则是AIGC的核心,它通过对大量数据的分析和处理,构建出了一个复杂的神经网络模型,这个模型可以理解人类的语言,识别出语言中的模式和规律,并据此生成新的内容。对于大算力来说,它则是保证AIGC能够高效运行的秘诀,保障AIGC能够在很短的时间内对海量数据进行处理,并且可以即时产生新内容[2]。
Sora的诞生无疑标志着人工通用智能技术路线从理论探讨向实践应用的实质性迈进,其在世界模拟能力上的成功实现具有深远的战略意义。从生成式AI的发展脉络来看,从ChatGPT的“惊艳亮相”到Sora对“理解世界”的勇敢尝试,技术的变革与传播革命、认知革命紧密交织,呈现出一体化的鲜明特征。
Sora的诞生无疑为AGI (人工智能生成内容)领域的发展注入了强劲的动力,不仅显著加速了其技术进步的进程,更重要的是,它所展现出的能力远远超越了传统意义上从文本到视频的简单转换。Sora的出现标志着大模型在理解和模拟真实世界方面取得了里程碑式的突破。通过先进的自主学习机制,Sora能够深入理解和模仿物理世界的复杂性和多样性。这种智能涌现能力不仅体现在对物体形状、运动规律的精准捕捉上,更在于它能够理解并模拟物理世界中的交互关系、因果关系以及动态变化。这种深度理解和模拟能力为重建物理世界提供了新的视角和可能性。Sora的技术突破不仅在于其高度的智能化水平,更在于它为人类提供了一种全新的思考和探索方式。通过Sora,我们可以更加深入地理解物理世界的本质和规律,探索其潜在的奥秘和可能性[3]。
2. 备受关注:带来内容共创
在当今日益发展的技术背景下,发挥人的能动性,将智慧的内容生产技术与专业能力相结合,对于提升个人综合素养和竞争能力是关键。
2.1. 影视造梦:成为导演与艺术家的“超级神助攻”
对影视从业者而言,像AIGC这样的智能化内容生产技术,不但可以提高工作效率,而且可以从不同层次上促进电影生产的创新。在影片制作中,AIGC可以有效地代替数据采集、整理、重复工作,充分发挥制片工作者的创意与想象空间。与此同时,通过与AIGC等工具的深入交谈,影视从业人员可以利用更加系统性的视角和思考方法,来串联分析一个复杂的问题群,并在此基础上,持续地调整提问的方法和逻辑,寻找出多样化的答案。它不但拓展了制片人的视野与思考空间,而且让他们从一个更整体的视角去思考问题,进而提升影片的制作品质与效率。尤其是,Sora的发布,意味着人工智能的计算能力有了质的飞跃,其技术复杂性大大提高,推动了包括文生文(T2T)、文生音频(T2M)、文生图(T2I)、文生视频(T2V)在内的多模态内容生成技术的完善[4]。而文生影像技术则是将影像、声音等复杂的影像与声音结合在一起,并在影像与声音的基础上,提出了一种新的时空维度,也就是影像的连续性与动态性。这就需要在保证每个画面都具有高质量的同时,又要保证画面间的逻辑连贯以及视觉上的流畅过渡,这就大大增加了信息处理的复杂性和强度。在实际操作中,由于要同时处理多个相邻帧,还可能包含音频轨迹,因此其复杂度和容量要远远超过图像。因此,视频生成需要较高的算法,尤其是对于高分辨率、长时长的视频内容,其计算能力与存储能力都有着巨大的需求。同时,由于其具有多模式媒体、多重叙事结构、多重情绪层次、光影效应等特点,对其智能理解与生成能力提出了巨大挑战[5]。
2.2. 社交破圈:AIGC开启“创意平权”的全民创作时代
目前的社交习惯使得人们更倾向于专注一分钟以内的短视频,这使得文生视频的优势很好地发挥出来,能够快速根据指令产出视频。在知识经济时代,人工智能正在深刻地影响和改变着整个内容产业的产业链。人工智能是一种革命性的新型生产力,它既是自主创新的主体,又是生产的强劲动能,对人的创新能力具有重要的促进作用。事实上,这一放大作用其实是一种有效的创新增能方式,AI工具可以为创作者提供头脑风暴、框架建议、知识检索等多种辅助作用,让创作者从繁杂的生产流程中解脱出来,让他们更加关注创新的深度与广度。在此背景下,“人”与“智”的协同创新已成为“知识经济”时代的主流。内容产业要提高生产效率,就必须在“人智协同”的基础上,打造新的人力资源。而“协同创新模式”的提出,就是要建立一种能够促使人工智能(AI)和人类创造者进行更深层次的协作的创新体系,抛弃传统的主客体二元对立的思维方式,建立主体间性的、人的智慧交互的创新生产关系[6]。主体间性强调的是主体间的平等交往与协同推进,它突破了各自独立生存的个人边界,激励着多元主体在沟通与合作中共同推进相互关系演化。在这种模式下,人工智能和人之间的交往方式将从传统的“主人–工具”关系转变为“多主体”,文生视频的出现为机器与人提供了前所未有的内容共创机会。在这种模式下,发布者凭借其丰富的创意和深刻的洞察力,为作品注入了独特的智慧与灵魂。而机器则以其精准的数据分析和高效的算法处理,为内容提供了严格的规范和标准化的流程。理性与感性的交织使得作品不仅逻辑严密,同时也富有情感共鸣。这种机器与人的协同创作,不仅提升了作品的制作效率,更使得作品在保持专业水准的同时,具备了更高的可看性和吸引力。这种全新的内容共创模式,无疑为视频制作领域带来了创新性的变革。
3. 真实和虚拟存在距离:跌入“恐怖谷”
随着Sora等文生视频技术的兴起,智能内容经济时代已经到来,创意的发展呈现出共生演化的趋势。人类智能与人工智能之间的互动、互助、互构不仅推动了创意生产模式和审美理念的转变,而且在这一过程中,人类的直觉和经验得到了AI算法的增强,两者相互催化,催生了更多的创新创意。硅基智能,特别是通过视频大模型展现的快速算法,不仅加速了创意的实现过程,更直接贡献于创意本身的生成,引导着创意表达形式及审美准则的演变[7]。如何更好地实现人机交互,是近百年来学术界与设计者共同努力的方向。近几年,伴随着“ChatGPT”、“文心一言”等非真人交谈机器人的问世,引发了一股新的人机交互浪潮,凸显了人类在人机交互过程中,对具有高度拟人特性的机器人提出了迫切要求。ChatGPT因其高情商的回答而受到网民们的称赞,对人工智能在情绪表达上的深刻理解感到惊叹,并感叹“人工智能在某种程度上已经超越了人。”知乎,豆瓣,微博等多个社交平台都出现了类似于“聊天机器人”的互动经历,比如模仿父母,朋友,伙伴等。ChatGPT的会话顺畅、跨程序、跨通道的自动生成,使人们第一次感觉到,机器的语言呈现越来越像人了,并且在知识交流与内容生产上,表现出了超越人类的能力[8]。
3.1. 拟真度陷阱与受众的心理疏离
人工智能技术的发展,可以将更多的可能性引入到研究中,从而减少人脑的工作负荷,从而更好地作出最优的选择。在人工智能的帮助下,人的认知能力被发挥到了极限。新科技的出现,使人成为自己的理性动力,从而使人更有能力战胜事物。而高智慧的工具,则会让人的工具理性,变得更加强大。伴随着工具的高级、智能的发展,人的创造属性、工具理性与自治能力也在不断地显现与释放。这一主体性的解放与展示,使人们在面对纷繁复杂的、具有挑战性的世界时,得到了从未有过的经验。这一高层次的经验,既能满足人自身的需要,又能唤醒人的“自我神化”意识,让人感到无比的满足感与自豪感[9]。
ChatGPT的兴起又一次引起了科技界的关注,它所展示出来的丰富的知识量以及出色的文字处理能力,将“机器自主”这一概念从理论变成了现实。这一技术的飞速发展,给了所有人一记响亮的耳光,让所有人都意识到,我们已经走进了人工智能的“恐怖谷”。“恐怖谷”理论,由日本学者森政弘在1969年提出,描述了人类对机器人反应的一种特殊心理现象。当机器人的外观和行为越来越接近人类时,人类对其的好感度会迅速上升;然而,一旦这种相似度到达某一临界点,人类的好感度会突然暴跌至恐惧和排斥的区间。英国人类学家利奇也曾警告,科学赋予我们掌控命运的力量,但这也让我们在面对未知时感到惶恐[10]。虽然像ChatGPT这样的人工智能工具在交互方面可以很好地模仿人的行为,但是他们永远不能完全代替真人。当人工智能的拟人程度与人相近时,会出现“恐怖谷”效应,表现出害怕、厌恶等心理。这样的情感,并非只是因为担心人工智能的可替代性,而是因为它威胁到了人的主体性与文化价值[11]。在文生视频中,尽管技术日新月异,但受众在观看时仍会遭遇“恐怖谷”效应的困扰。这种效应源自于智能生成的人物形象,其外观与真实人类相似度极高,但细微之处的差异和不完美却让人产生强烈的不适感。此外,智能场景的设计也常常出现不协调的现象,如光影效果不自然、物体运动轨迹不符合物理规律等,这些都会破坏观众的沉浸感,使他们在观看过程中容易出戏。这种“恐怖谷”效应不仅影响了观众的观影体验,也反映了当前智能技术在视频制作领域仍需不断完善和提升的现实。
3.2. 技术迭代与审美进化后的接纳新周期
然而,森政弘的“恐怖谷”理论也提出了一个有趣的观点:在经历低谷后,人类情感可能会重新回升。这意味着,只要我们能找到与AI和谐共存的方式,就能跨越这个“恐怖谷”,重新回到对技术的积极态度[12]。为了实现这一目标,我们需要以人技共生共进的视角看待AI“恐怖谷”。这意味着在AI技术快速发展的同时,我们也需要关注人类自身的情感和价值观。通过理解和接受AI的存在,我们可以找到与AI和谐共存的方式,避免陷入过度的焦虑和恐慌。正如凯利所言,生命的非稳态和失衡本身也是一种平衡。因此,面对AI“恐怖谷”,我们不应该过分担忧,而是应该将其视为一个重新思考自我和世界的契机。
4. 科技祛魅:短视频同质化存在
在科技的浪潮中,机器拟人化的现象愈发显著,而人类的生活则逐渐趋向机器化。随着机器不断涉足并取代人类的工作领域,一旦机器实现完全自治,人类的工作可能会被全面接管。尤其是当知识存储与搜索工具如ChatGPT等达到一个崭新的高度时,人类或许只需简单查询,便能获得所需的全部信息。然而,这种便捷也带来了潜在的风险:缺乏主动的练习与培养,人类的学习能力可能会迅速退化。在这种情境下,人类可能会变得越来越依赖机器,甚至变得不愿意主动思考,就像寄生虫一样,等待着机器运作后掉落的果实。人们不再根据自身的需求和情境来调整机器的程序,而是开始自觉地适应机器运作的节律。更为严重的是,人类可能会逐渐发现算法比自己更了解自己,认为算法永远是对的。在这种对实用性和效率的追求下,人类开始听命于算法,被算法驯化,生活变得机械化。回想钟表刚刚问世时,人类不再依赖自己的感觉来安排作息时间,而是开始按照时钟的指示,过上了有规律的生活。然而,当人类的生活完全被机器和算法主导时,我们可能会面临大脑萎缩、心智降低,甚至失去思考能力的风险。人类的自主性在这种情境下可能会彻底丧失,我们的造物特性逐渐消失,工具理性逐渐取得霸权。
在AI的发展趋势下,这种主体性被压制、逐渐消失的科幻片般的未来构想,虽然看似遥远,但随着人类技术的幂律分布式发展,库兹韦尔所说的“奇点”到来似乎不再是一个虚幻的概念。生物链顶端的地位似乎不可能被共享,而人类主体性正是我们主宰这个世界的关键能力。主体性的消退无疑预示着人类地位的降级,未来世界的主宰者可能不再是人类,而是我们亲手创造的生命体。这种可能性的存在让一些学者和思想家感到深深的忧虑。明斯基曾悲观地预测:“如果我们够幸运,或许它们会把我们当宠物养。”这种担忧并非空穴来风,因为技术的负面效应已经开始在人类社会中悄然显现。尽管目前人类表面上对技术的态度仍以积极为主,但主体性被压制和失控的预测已经开始在人们心中引发对技术的负面厌恶情绪[13]。然而,与此同时,我们也必须正视技术发展中存在的问题。以Sora为例,作为一款能够生成具有多个角色和复杂场景的视频的技术,它在捕捉生活细节方面仍存在明显的不足。视频画面中的隐喻和共情能力、异质文化下的习俗与语言应用能力,以及非语言符号的信息读取能力等问题,都是Sora等生成式AI在理解人类生活生产行动时的盲点。更为关键的是,Sora在生成视频时,对逻辑性与连贯性的理解还不够深入。首先,在时间顺序方面,生成的视频中的事件往往没有按照合理的时间顺序发生,这使得观众难以跟随故事的进展。在因果关系方面,视频中的事件缺乏清晰的因果关系,角色的行为和事件的后果之间似乎没有合理的联系。再次,在逻辑流程方面,视频的情节和对话可能缺乏内在的逻辑性,这使得角色的决策和行为难以理解。最后,Sora在生成视频时,场景转换可能过于突兀,使得观众难以理解场景之间的联系[14]。Sora作为一款基于人工智能技术的内容生成工具,其素材多源自经典的影视剧桥段,这在某种程度上限制了其产出的多样性和创新性,使得内容容易陷入固有的模式。然而,在这场人机协助的创作过程中,虽然机器的高效性能够显著提升内容产出的速度和效率,但人类操作媒介的智慧和创造力依旧是不可或缺的。人类的审美、情感和经验,能够赋予内容独特的灵魂和深度,使其超越简单的模仿和复制,展现出真正的艺术价值。因此,在享受机器带来的便捷和高效的同时,我们更应肯定人类操作媒介的智慧和创造力。
5. 科技祛魅:机器操作者更值得关注
在探讨AIGC (人工智能生成内容)与电影业对智能变革的适应与超越时,我们首先需要深刻认识到,这一变革的核心在于对人类主体性的深入把握与尊重。这种把握与尊重不仅是我们平衡人类与人工智能在技术应用中关系的关键,更是我们理解并引导这一变革方向的基石。在技术进步的浪潮中,我们必须明确,人工智能——包括AIGC在内的各种智能内容生产技术——本质上是基于特定目的和技术逻辑开发的技术工具。它们是人类智能逻辑的一种模仿和延续,而非对人类本身的替代。至少在当前阶段,人工智能手段尚不足以完全取代人类智能的存在。相反,它们更多地是作为人类智能的延伸,为解决复杂问题、创造新价值提供新的可能性[2]。
以AIGC为代表的智能内容生产技术所抛出的问题,实际上是对人类智能的挑战与拓展。人类所具备的独特性情、温度、同理心、理性意识及创造性观念,是人工智能所无法完全复制和替代的。这种不可替代性不仅在于人类情感的丰富性和复杂性,更在于人类能够运用这些情感和认知对人工智能技术的演变程度和趋势进行干预和判断。因此,在思考人工智能的风险和伦理问题时,我们或许应更多地从人类自身的内在问题出发,探索如何更好地利用和发展这些技术。ChatGPT作为硅基生命与碳基生命间交流的技术工具,为我们展示了一条新的思考路径。它提醒我们,在思考人工智能与人的关系时,可以从主体性的重塑出发。这意味着我们需要重新审视和定义人类在技术世界中的位置和作用,以及我们如何与这些技术工具共同发展和进步。技术的发展始终是为了提高人类主体的工作效率和工作质量,而ChatGPT等智能工具则擅长处理具有稳定关系模式的工作,为人类从事更具创造性和挑战性的工作提供了可能[15]。然而,技术发展的同时也伴随着风险和挑战。以Sora为例,作为人类创新带来的技术成果,它既代表着人类智慧的结晶,也蕴含着潜在的风险。因此,在享受技术带来的便利和效益的同时,我们也需要保持警惕和审慎。这包括保护技术创新的同时,审视其发生的环境和目的,确保其不会脱离技术发展的安全边界,将人类的安全与福祉置于技术的最优先级考虑[16]。在这一过程中,适度信任成为确保人工智能健康发展的有效途径。适度信任意味着我们既要对技术保持信心,相信它能够为我们带来积极的变革和进步;同时也要对技术的脆弱性和信任脆弱性保持清醒的认识,避免盲目乐观和过度依赖。这种适度信任不仅有助于Sora等技术在脆弱的环境中成长和发展,也有助于我们规避技术发展可能带来的风险和挑战。此外,我们还需要意识到,技术的发展是一个不断演进和变化的过程。在这个过程中,我们需要不断地学习和适应新的技术和环境,以确保我们能够充分利用这些技术为人类社会的发展和进步做出贡献。同时,我们也需要不断地反思和审视我们的行为和价值观,确保我们始终保持对技术的正确态度和使用方式[17]。
6. 将科技转变为宣传的端口
从国际交流的视角来看,Sora是一种新兴的、以科技为中心的跨文化沟通媒体,这一现象的产生,标志着国际交流将由静止不动的“跨文化”向“转文化”的动态转变[18]。目前,Sora在国际传播途径上高度契合“第三知识分子”和“Z世代”年轻人的价值观取向,为中国提升国际形象,提供了一个新的契机[19]。当下,我国在文生视频领域处于加速超越状态,由于语言的普遍性,英语天生具有海量数据和海量模型的先天优势。但是,在未来,影像与虚拟科技的进步,会让世界各国人民之间,不再有语言的隔阂。未来“数字沟通”的视野,将从一种单一的通讯方式,转变为影像、影像、甚至是意识的通讯方式,尽可能地恢复“人”和“人”之间的心灵交流。从本质上说,新闻行为更接近于人类的意识沟通[20]。从这个角度来说,Sora技术能在新闻传媒业态本质即“意义传递、意识传播和精神交往”的实践中另辟蹊径。也正是在这样的逻辑下,中国这个东方文明的代表,由于受到语言和技术等方面的制约,无法塑造出一种符合其文明特征的全球性媒体意象,中国传统文化中的诸多优良核心并没有被有效地发挥出来。Sora的出现,可以借由文生视频的端口,让更多中国经典的影视剧片段被引用、被看见。与此同时,文化差异常导致具有中华文明特色的独特文化现象在全球范围内的传播受限,甚至在跨文化交流中产生误解[21]。然而,随着文生视频等新型视觉传播形式的兴起,这一难题得到了新的解决路径。文生视频以其直观、生动的视觉语言,能够跨越语言的障碍,从多个维度、多个角度展现中华文明的魅力。这不仅有助于在全球范围内有效传递中华文化的精髓,还能缩小因文化差异而产生的认识偏差,进一步推动中华文化的全球化传播和跨文化交流。这种新型视觉传播形式无疑是顺应全球化潮流的重要力量[22]。
7. 总结
智能化产品的崛起,无疑为人类世界带来了无尽的惊喜与震撼。它们展示了人类创造力的无限可能,让我们对未来充满期待。然而,与此同时,我们也感受到了深深的忧虑,担心机器过度发展,甚至威胁到人类的生存。但我们必须明白,在这场人机共舞的舞台上,人类并非被动者。科技为我们带来的喜悦,有时像是为生活加上了一层亮丽的滤镜,但滤镜背后也有现实的挑战。Sora等智能化产品为短视频领域带来了高效和便利,注入活力,让短视频内容创作变得更加丰富多彩。然而,我们也需要关注技术的不成熟之处,比如其可能带来的观感不适、内容固有化等问题。只有正视这些挑战,我们才能更好地利用科技,实现人机共创、传播共赢的美好愿景。