1. 引言
在数字化时代,人工智能技术飞速发展,广泛融入各个领域。叙事生成作为人工智能与人类交互的关键部分,备受关注。它不仅拓展了机器写作的边界,还在多个领域发挥重要作用。在可解释的人工智能领域,良好的叙事能力有助于人类理解机器的决策过程;在电脑游戏中,动态生成的故事或情节为玩家带来定制化体验;在教育领域,基于探究的学习模式能依据学习者需求生成相应的教学情境。此外,叙事生成涉及人工智能的核心研究议题,如常识性推理和经验共享,是评估智能系统理解能力的重要手段。
然而,人工智能叙事生成面临诸多挑战,语篇连贯性问题尤为突出。生成的故事常出现逻辑不连贯、信息组织混乱等情况,影响用户体验和信息接收。主位结构作为语言学中的重要理论,为解决这些问题提供了新视角和思路。主位结构是语篇分析的基础,语篇中小句的主位和述位会随讲话者传递信息的不同而变化,产生不同的主位推进模式。语篇的信息连贯与其主位推进模式紧密相关,分析小句的主位结构和主位推进模式,是了解语篇语义结构和信息连贯的重要途径。
本研究将系统功能语言学中的主位结构理论及主位推进模式理论应用于人工智能叙事生成研究,以DeepSeek生成的虚拟叙事故事为分析对象,深入探讨人工智能在自主创作叙事文本时主位结构的运用特点及其效果。DeepSeek采用混合注意力机制,在中文语境理解方面优势明显,能更好地捕捉汉语的主述位结构特征。其训练语料库包含大量中文经典文学作品,在文化主位传承上具有先天优势。本研究期望为人工智能叙事生成的理论和实践提供新见解和改进方向,助力构建更连贯、吸引人的虚拟故事,提升人机交互的质量和体验。
2. 人工智能叙事生成中的主位结构的研究综述
2.1. 总述
主述位理论及其衍生的主位推进模式是系统功能语言学的重要理论,对语言的动态结构和语篇连贯性研究产生了深远影响。该理论最早由布拉格学派的马泰修斯提出,旨在探索语言交际中的信息流动规律。韩礼德继承并发展了这一理论,将其纳入系统功能语法框架,强调主位作为信息的起点,述位传递新信息的功能差异。
主位推进模式由捷克语言学家丹内施[1]提出,描述了语篇中主位和述位的动态变化规律。丹内施最初提出简单直线型、超主位型和平行型三种模式,后续学者在此基础上进一步细化分类。朱永生结合汉语语篇特点,将主位推进模式归纳为放射型、聚合型、阶梯型和交叉型四类[2]。研究发现,主位推进模式在不同语篇体裁中表现各异,如阐述性语篇多采用延续型模式,叙述性语篇则以主位同一模式为主。此外,主位推进模式在教学实践、翻译研究、跨学科应用等方面也取得了显著成果,为语篇分析提供了有力的工具。
2.2. 国际研究现状
国际上,人工智能自主产出的语篇成为学术界的研究热点。众多研究者从不同角度对人工智能叙事生成进行了探索。
国际学界对人工智能叙事生成的研究呈现多学科交叉态势。Clerwall (2023)通过对比GPT-4与人类作家的新闻文本,发现AI在事实性信息整合方面更具效率,但情感主位表达存在机械化倾向[3]。Peng等(2023)提出的“故事塑形”理论,强调通过事件表征网络增强叙事的因果连贯性,为深度神经网络与语言学理论的结合提供了范例[4]。值得注意的是,Lund和Wang (2023)针对ChatGPT的伦理反思揭示了当前研究对文化主位适配性的忽视[5]。尽管取得了这些成果,但将主位结构理论应用于人工智能叙事生成的研究在国际上仍处于初级阶段。
2.3. 国内研究现状
国内对人工智能生成语篇的研究起步较晚,但发展迅速。付松聚[6]发现,机器创作的新闻存在数据堆砌和过时的问题;高常[7]强调了人工智能写作在新闻传媒界的颠覆性影响;韩伟[8]比较人工智能平台与人类诗人的作品时,指出人工智能生成的诗歌在连贯性和通畅性上存在不足;方师师和唐巧盈[9]对ChatGPT生成的错误内容进行了类型学分析,揭示了多种错误类别。
国内学者在主位推进模式的本土化应用方面成果显著。范莉(2022)通过分析汉语新闻语料,发现放射型推进模式在事件报道中占比高达52%,表明汉语叙事更注重核心主位的连续性[10]。朱海琳等(2024)针对人工智能生成文本的研究指出,阶梯型推进模式的缺失是导致AI叙事逻辑断裂的重要原因[11]。然而,现有研究对生成式AI动态主位衔接机制的探讨仍显不足,尤其是对阶梯型和聚合型模式的协同作用缺乏系统性分析。
2.4. 研究空白
综合国内外研究现状,既有研究存在两大局限。其一,研究对象集中于GPT系列模型,对国产AI模型的特性缺乏针对性分析。其二,未探讨过人工智能技术在叙事生成领域的应用。本研究选择DeepSeek作为实验对象,既填补了国产AI模型研究的空白,同时主位结构也为人工智能构建连贯、引人入胜的虚拟故事提供了新的研究视角。
3. 系统功能语言学主位结构理论
3.1. 主位述位结构的基本概念
主位是小句的第一个成分,是信息的出发点,小句中除主位以外的剩余部分称为述位。主位通常包含说话双方已知的信息,为后续话语设定背景;述位则一般包含说话人想要传达的新信息,对于受话人来说是未知的。
3.2. 多重主位划分
基于主位成分的复杂程度,韩礼德将主位分成3种类型:单项主位、复项主位、句项主位。
1) 单项主位:由单个成分构成,一般为名词或名词词组、副词词组或介词短语。
2) 复项主位:由两个或两个以上成分构成。根据韩礼德提出的概念功能、人际功能和语篇功能,构成复项主位的成分可分为语篇主位、人际主位和主题主位。这三种主位在小句中出现的顺序通常为:语篇主位、人际主位、主题主位。当语篇主位和人际主位出现在主题主位之前时,它们与主题主位共同构成小句的主位,即为复项主位;当语篇主位和人际主位出现在主题主位之后时,则归为述位。构成复项主位的方式通常有:语篇主位 + 主题主位、人际主位 + 主题主位、语篇主位 + 人际主位 + 主题主位。
3) 句项主位:由一个小句构成,通常出现在从属结构中。在从属结构中,如果主句位于从句之前,该句子的主位由主句的主位充当;如果从句位于主句之前,该句子的主位则由从句充当,即句项主位。
3.3. 主位推进模式分类体系
主位结构的划分是在句子层面进行的,当一组有意义的句子构成一个连贯的语篇时,小句的主、述位之间会发生某种联系和变化,推动着语篇的有序发展,这种联系和变化被称为主位推进。
本研究采用朱永生(1995) [2]提出的四类主位推进模式:
1) 放射型:多个小句共享同一主位,述位内容逐步扩展。该模式通过主位重复强化核心线索,常见于叙事性语篇。
2) 聚合型:不同主位指向同一述位,形成多维阐释。该模式能够从多角度深化主题,多用于说明性语篇。
3) 阶梯型:前句述位成为后句主位,实现逻辑递进。该模式通过信息链式传递构建多层叙事,增强语篇连贯性。
4) 交叉型:主位与述位交替推进,产生视角转换效应。该模式通过信息交错增加叙事复杂度,多用于悬疑类文本。
4. 研究设计
4.1. 研究问题
本研究旨在解决以下三个核心问题:
1) 人工智能叙事生成中主位结构的特点和规律是什么?
2) 现有的人工智能软件在利用主位结构进行叙事生成时存在哪些问题?
3) 如何利用主位结构提升人工智能生成故事的连贯性和吸引力?
4.2. 研究方法与语料
本研究构建深度适配系统功能语言学分析的专项语料库,基于DeepSeek V3生成中文虚拟叙事文本,涵盖科幻、爱情、冒险三大主题的多个子类。通过控制故事长度、角色配置及情节复杂度梯度,确保样本结构可比性。研究基于Halliday主位分类标准进行人工标注,结合朱永生推进模式分析框架解析语篇连贯机制,系统性探索AI叙事生成的语言学规律,为揭示其内在机制提供数据支撑。
4.2.1. 数据生成平台选择
本研究选用DeepSeek V3作为叙事生成平台,主要基于其三重技术优势:
1) 语境理解深度:采用混合注意力机制,在中文主位识别准确率达83.2%,较ChatGPT提升15.6%。
2) 文化适配能力:训练语料库包含《三体》等42部中文经典文学作品,文化主位传承强度指数达0.78 (满分1)。
3) 参数控制精度:支持主位标记权重(0~1梯度调节)、叙事视角(第一/三人称切换)等18项生成参数微调。
4.2.2. 语料构成与参数控制
通过分层抽样构建专项语料库,具体构成见表1。
Table 1. Composition and parameter control of the virtual narrative corpus
表1. 虚拟叙事语料库的构成与参数控制
主题 |
子类型 |
角色
数量 |
情节
复杂度 |
生成
数量 |
字数范围 |
核心指令要素 |
科幻 |
星际殖民危机 |
4~5 |
高 |
5 |
300左右 |
多文明博弈/生态崩溃/2次技术伦理反转 |
科幻 |
人工智能觉醒 |
3~4 |
中 |
5 |
300左右 |
人机关系重构/情感认知冲突/1次阵营倒戈 |
科幻 |
时空悖论事件 |
2~3 |
高 |
5 |
300左右 |
因果链崩塌/历史修正机制/3重平行宇宙交织 |
爱情 |
跨物种禁忌之恋 |
2~3 |
中 |
5 |
300左右 |
基因改造人恋爱/社会伦理压力/记忆篡改危机 |
爱情 |
时空交错情缘 |
3~4 |
高 |
5 |
300左右 |
百年时空重叠/身份认知迷失/宿命论破解 |
爱情 |
权谋背景下的救赎 |
4~5 |
高 |
5 |
300左右 |
王朝阴谋中的爱情/双重人格设定/3次信任背叛 |
冒险 |
古文明遗迹解密 |
3~4 |
高 |
5 |
300左右 |
超古代科技激活/文明轮回规律/2次团队叛变 |
冒险 |
量子空间生存竞赛 |
4~6 |
高 |
5 |
300左右 |
维度折叠竞赛/物理法则扭曲/4重空间嵌套 |
冒险 |
魔法基因觉醒之战 |
2~3 |
中 |
5 |
300左右 |
变异魔法能力/血统诅咒破除/1次世界观重构 |
本研究通过语料库统计,对主位结构和主位推进模式的出现频率、分布情况等进行量化分析;运用功能语法分析,深入探讨主位结构在语篇中的功能和意义,全面深入地剖析主位结构在人工智能叙事生成中的应用。
5. 人工智能虚拟叙事的主位结构及主位推进模式分析
5.1. 定量特征统计
在本研究中,我们对DeepSeek生成的45篇短篇虚拟故事进行了深入分析,共统计到2156个小句,平均每篇约48个小句。这一数据为后续的主位结构和主位推进模式分析提供了坚实的基础。
在主位结构分布中(见表2),单项主位占比最高(66.4%),体现AI偏好简洁叙事逻辑的特征。如“量子物理学家程夜”作为独立主位,直接锚定核心人物与事件,降低认知负荷。复项主位占比29.3%,其中“语篇 + 主题”组合最常见(14.8%),通过时空框架增强文本连贯性,如“当破解九宫格机关时”为后续机械师发现青铜齿轮纪年设定情境背景。人际主位与主题主位组合占9.9%,多用于人物对话增强情感张力,如“你们编写制约代码却违背准则”通过引语主位凸显道德冲突。三者复合结构仅占4.6%,虽能同步传递背景、情感与事件(如“暴雨夜中‘你必须阻止数据湮灭!’程夜握紧解码器”),但复杂度制约其使用频率。句项主位虽最低(4.3%),却在关键情节起枢纽作用,如“破解亥姆霍兹共振原理时”作为前置条件主位,突出“白露发现青铜编钟调制地核波”的核心动作。数据显示,AI通过高频单项主位确保叙事焦点集中,复项主位强化语境构建,但在复合结构与句项主位的运用上仍显保守,这与其算法优先保障基础叙事完整性的生成策略相契合。
在主位推进模式分析中(见表3),放射型占比最高(47.5%),体现AI通过重复核心主位强化叙事线索的特征,如某故事持续以“程夜”为主位展开时间穿越情节,确保主线清晰。聚合型次之(26.3%),通过多主位聚焦同一述位实现主题深化,如对“玉璧”分别从物理形态和文化内涵多维度阐释。阶梯型占18.3%,通过“述位→主位”转换构建递进逻辑,典型案例中“骨笛”由述位转为新主位,推动情节向文明密码揭秘发展。交叉型最少(7.9%),主位与述位交替形成信息交错,如“沈星野”与“磁暴数据”交替推进,制造悬念冲突。数据显示AI擅长放射型结构确保叙事稳定性,但交叉型应用不足以限制情节复杂度,这与其算法注重局部连贯性而弱于处理多线索交织的特性密切相关。
Table 2. Statistics on distribution of thematic structures in AI-generated narratives
表2. 人工智能叙事主位结构分布统计
主位类型 |
|
出现次数 |
占比 |
例证(来源故事编号) |
单项主位 |
|
1432 |
66.4% |
“量子物理学家程夜在实验室观测到「历史锚点」具象化”(故事11) |
复项主位 |
|
632 |
29.3% |
|
|
-语篇主位 + 主题主位 |
318 |
14.8% |
“当破解九宫格机关时,机械师阿凯发现每个青铜齿轮都刻着不同纪年”(故事33) |
|
-人际主位 + 主题主位 |
214 |
9.9% |
“‘你们将道德准则编写成制约代码,却允许自己每天违背这些准则。’”(故事1) |
|
-语篇主位 + 人际主位 + 主题主位 |
100 |
4.6% |
“‘启动端粒荧光标记!’我按住她暴走的左手,基因剪刀却在切割BRCA1基因时触发炼金反应”(故事42) |
句项主位 |
|
92 |
4.3% |
“破解反重力祭坛的亥姆霍兹共振原理时,白露发现墓主人用青铜编钟调制地核振动波”(故事7) |
Table 3. Statistics on distribution of thematic progression patterns in AI-generated narratives
表3. 人工智能叙事主位推进模式分布统计
推进模式 |
出现次数 |
占比 |
例证(来源故事编号) |
放射型 |
1024 |
47.5% |
多个小句以同一主位展开:“程夜腕表停在祖母咽气时刻。林真手持的锚点生成器正涌出1932年的雪。”(故事11) |
聚合型 |
568 |
26.3% |
不同主位指向同一述位:“青铜神树顶端悬浮着刻有十二万九千六百道年轮的玉璧。玉璧是《淮南子》记载的宇宙重生周期。”(故事6) |
阶梯型 |
394 |
18.3% |
前句述位成为后句主位:“声波锁解除时的次声频段,与楼兰古城出土的骨笛完全吻合。骨笛的振动频率揭示了文明重启的密码。”(故事32) |
交叉型 |
170 |
7.9% |
主位与述位交替推进:“沈星野启动声波矩阵试图重返地表。第二叛变者用磁暴抹除了所有数据。”(故事7) |
5.2. 异常结构
在分析AI生成的虚拟故事过程中,发现了一些异常结构,这些结构影响了故事的质量和可读性,具体见表4。
AI叙事在异常结构上呈现三大特征:首先,逻辑连贯性不足,过度依赖关键词复现(如“青铜神树”)却忽视过渡衔接,如某故事中“悬浮祭坛与血红蛋白铁原子”的并置缺乏关联解释,相较于政府外宣文本严密的逻辑推进存在明显差距。其次,代词指代模糊,复项主位中“它”等代词易产生歧义(如“女娲的纳米机械群……它……”中的指代错位),而政府文本为保障信息准确性会规避此类风险。第三,复杂句式处理生硬,如“破解声波锁次声频段”类长主位结构造成认知负荷,反映出AI在信息密度与可读性间的失衡,而政府文本会根据受众理解能力优化句式复杂度。这些特征表明,AI叙事生成需在逻辑衔接、指代明晰和句式适切性方面加强训练,以缩小与人类专业文本生成质量的差距。
Table 4. Anomaly types and optimization strategies in AI-generated narratives
表4. 人工智能叙事生成中的异常结构类型及改进建议
异常类型 |
出现次数 |
例证(来源故事编号) |
异常原因 |
改进建议 |
主位
悬空 |
12 |
“当反重力场启动,悬浮的不仅是祭坛,还有我们体内血红蛋白的铁原子。”(故事 33) |
主位(反重力场)未明确承接前文,导致逻辑跳跃。 |
增加过渡句,如“随着反重力场启动,祭坛开始悬浮,连带人体内的铁原子也失去重力束缚。” |
多重主位
冲突 |
8 |
“医疗AI‘女娲’的纳米机械群在血管中排列成笛卡尔坐标系,它通过代谢算法证明…”(故事 4) |
“医疗AI‘女娲’”(主题主位)与“它”(代词主位)指向同一对象但未连贯衔接。 |
统一主位代词,如改为“女娲的纳米机械群…,该AI通过代谢算法…” |
人际主位
冗余 |
6 |
“‘信息遮蔽才是真正的病毒。’’女娲’的纳米机械群…”(故事 4) |
直接引语(人际主位)后未合理过渡到主题主位,导致叙述断裂。 |
添加衔接词,如“女娲反驳道:’信息遮蔽才是真正的病毒。’与此同时,它的纳米机械群…” |
语篇主位与
主题主位割裂 |
5 |
“在量子实验室的穹顶下,
神经架构师陆离凝视着全息屏上的异常数据流。”(故事 1) |
语篇主位(量子实验室)与
主题主位(陆离)缺乏逻辑
关联。 |
明确因果关系,如“置身于量子实验室的穹顶下,神经架构师陆离因全息屏的异常数据流陷入沉思。” |
句项主位
歧义 |
4 |
“破解声波锁解除时的次声频段,与楼兰古城出土的骨笛完全吻合。”(故事 32) |
主位(破解声波锁解除时的次声频段)过于复杂,导致语义重心模糊。 |
拆分主位,如“当声波锁解除时,次声频段被释放。这一频率与楼兰古城的骨笛完全吻合。” |
6. 结语
6.1. 研究结论
本研究基于系统功能语言学的主位结构理论,对DeepSeek生成的45篇中文虚拟叙事文本进行定量分析与功能语法解析,揭示人工智能叙事生成的主位结构特征及其语篇连贯性表现:
1) 人工智能叙事生成中主位结构的特点
AI叙事文本呈现“高主位明确性,低推进逻辑性”的特征。定量统计显示,单项主位占比66.4%,表明AI擅长通过核心人物(如“量子物理学家程夜”)或关键事件快速聚焦信息,降低认知负荷。推进模式以放射型(47.5%)和聚合型(26.3%)为主,通过主位重复或述位多角度阐释强化叙事线索。然而,阶梯型(18.3%)和交叉型(7.9%)应用不足,反映复杂逻辑递进与多线程叙事的缺陷。文化主位(如“青铜神树”)的高频出现及复项主位组合(语篇主位 + 主题主位)的使用,显示其对中文经典文学语料的模仿特性。
2) 现存问题与成因
AI在主位运用中存在三重局限:逻辑断层(主位悬空与代词指代模糊)、复杂句式处理生硬(长句主位引发信息过载)、推进模式单一化。这些问题源于算法对长程依赖关系的处理能力薄弱,难以动态调控多主位过渡,且缺乏复杂句式结构的学习机制。例如“反重力场”突然出现未承前文,以及“破解声波锁解除时的次声频段”这类冗长主位破坏叙事流畅性。
3) 优化路径
提升策略可从三维度展开:语篇结构优化方面,增强语境感知模块以避免主位悬空,引入交叉型与阶梯型推进训练强化逻辑递进;人机协作方面,通过后处理优化代词指代统一性,拆分复杂主位为连贯短句;动态控制方面,建立主位复杂度调节机制,在高张力情节采用交叉型推进构建悬念,背景描述时运用聚合型模式深化主题。这些改进将有效提升AI叙事的层次感与吸引力。
6.2. 应用价值与展望
本研究为AI叙事生成提供了理论与实践的双重贡献:
1) 理论层面:首次将主位结构理论系统应用于国产AI模型(DeepSeek)的叙事分析,揭示了中文语境下AI语言生成的独特性,为跨语言对比研究奠定基础;
2) 实践层面:提出的优化方案可直接应用于AI叙事工具的迭代开发。例如,通过增加“主位标记权重”参数,开发者可控制生成文本的复杂度;结合动态句式拆分算法,能够显著提升长文本的可读性。
人工智能叙事生成通过灵活运用主位结构与推进模式,已能实现复杂时空设定与多维角色的初步融合。然而,其“高主位明确性”与“低推进逻辑性”的矛盾,揭示了当前技术对人性化叙事的探索仍处于初级阶段。通过语言学理论与工程实践的结合,未来AI或可突破现有局限,在逻辑严谨性与艺术表现力之间找到平衡,最终实现真正意义上的“人性化”叙事。