1. 引言
1.1. 研究背景
在全球化与数字化交织的今天,推动中华优秀传统文化“走出去”,讲好中国故事,已成为提升国家文化软实力的重要战略。中国古典文学作为中华文化的瑰宝,其海外传播成效直接关系到世界对中国的认知与理解。然而,传统的传播模式多依赖于经典译介,其受众往往局限于汉学界与专业读者群体,传播效果与影响力有限。中国文化“走出去”理论研究滞后,中国文化对外传播研究主要聚焦对外传播模式、传播载体、传播路径、传播媒介和传播受众分析,中国文化对外传播效果研究十分薄弱[1],研究成果对提升中国文化的对外传播力贡献不足。
在此背景下,基于古典文学IP (知识产权)的现代衍生作品(如小说、绘本、影视、游戏等)以其生动的现代叙事、丰富的视觉呈现和大众化的媒介形态,正成为突破传播壁垒、触达更广泛海外受众的有效路径。其中,《木兰辞》作为中国古典叙事诗的典范,因其蕴含的孝道、勇毅、家国情怀及鲜明的女性主义色彩,成为被全球反复改编与再创作的经典IP,从迪士尼的动画与真人电影到各类儿童绘本与青少年小说,衍生作品层出不穷。花木兰替父从军的爱国主义和英雄主义精神在文本的不断改编中得到传承,花木兰的故事也在文本的不断改编中成为经典[2]。
传播往往是中国文化对外译介取得成功的关键[3]。当前人类已进入大数据时代和数字化时代,所有学科的学术研究都将逐步走向数字化道路[4]。数字人文视域下的翻译研究具有革新性,数字人文可运用在翻译研究的诸多领域,其中就包括翻译批评,如可用Python或R语言对选定译本在海外电商网站中的评论进行提取与分析,基于大数据呈现海外读者对中国文化译作的情感态度与评价[5]。
本研究的意义在于将计算语言学与数字人文的研究方法引入中国古典文学的海外传播研究,通过Python编程语言对海量海外读者反馈数据进行量化分析,超越传统质性研究中主观印象式的评判,为跨文化传播研究提供数据驱动的新范式。以《木兰辞》衍生作品为案例,深度剖析其海外传播的效果、受众接受偏好及成功的改编策略,旨在为中国古典文学IP的现代转化与全球化运营提供具象、可操作的启示与路径参考。
1.2. 研究对象与核心概念界定
本研究聚焦于在海外出版和传播的、以《木兰辞》为故事源文本的现代衍生小说与绘本。不包括学术性翻译、戏剧或纯影视作品。衍生作品指在古典文学原作基础上,通过改编、扩写、重构、视觉化等手段创作的,服务于现代受众的文艺产品。它既保留了原作的核心精神,又融入了现代价值观与艺术表现手法。在本研究中,其效果主要通过可量化的指标来衡量,在Goodreads等主流平台上的销量排名、读者评分、评论数量(反映传播广度),以及评论内容的情感倾向与主题分布(反映传播深度与接受维度)。消费者在电商网站上发布评论是在自然真实的环境中进行的,具有无干涉性[6]和非先验性[7],能在最大程度上确保研究的客观性。
1.3. 国内外研究现状述评
国内研究主要集中在三个方面。一是对《木兰辞》本身的文本、历史与文化研究;二是对中国文学“走出去”的整体性策略与译介模式探讨;三是对迪士尼《花木兰》等单个知名改编作品的个案批评,多从文化身份、女性主义视角切入。这些研究富有洞见,但多依赖于文本细读与理论推演,缺乏对海外大众读者市场的大规模实证数据支持。
海外汉学界对木兰故事亦有涉及,但更多是从比较文学、电影研究或后殖民理论的角度进行分析。对于Goodreads、亚马逊等平台上的大众读者评论这一“民间舆论场”,系统性、数据化的学术研究尚显不足。
综上所述,现有研究存在一个明显的空白:即利用数据科学方法,对古典文学衍生作品在海外大众市场的传播效果与受众反馈进行系统性实证分析。本研究的创新点在于引入Python数据爬取、情感分析、主题建模等技术,实现研究方法的跨学科融合。从“精英评论”转向“大众评论”,关注普通海外读者的真实声音。旨在通过“数据实证–规律总结–策略提出”的研究路径,为中国古典文学的海外传播提供基于市场反馈的精准化启示。
2. 数据处理
2.1. 文本数据获取
运用Python以“The Mulan Ballad”和“Song of Mulan”为检索主题,在美国好读(Goodreads)平台爬取相关读者评论。美国好读平台上《木兰辞》读者评论较多,选取三部具有代表性的《木兰辞》相关小说绘本及其用户评论为研究对象(见表1),共采集读者文字评论共1288条。数据内容包括用户名、文字评论内容、影响力指数和星级评价。
Table 1. Data source information
表1. 数据来源信息
书名 |
作者/插画师 |
出版信息 |
版本类型 |
The Ballad of Mulan:
《木兰辞》 |
Songnan Zhang (文/图) |
Union City:Pan Asian Publications (2015) |
双语绘本 |
The Magnolia Sword:A Ballad of Mulan |
Sherry Thomas (文)/未署名插画师 |
Tu Books (2019) |
小说绘本 |
Wild Orchid: A Retelling of“The Ballad of Mulan” |
Cameron Dokey (文)/Ruth Sanderson (图) |
Simon Pulse (2009) |
改编绘本 |
好读(Goodreads)平台是全球最大的读者书评社区之一,用户覆盖北美、欧洲等《木兰辞》衍生作品的主要海外传播区域,评论内容兼具读者自发性与多元文化视角,能够反映目标受众的真实反馈。所选评论对应3部不同类型的衍生作品(含双语绘本、西化改编小说等),覆盖2009~2015年的时间跨度,既包含经典版本也纳入近年新作品,可对比不同创作风格、文化转译策略的传播差异。筛选条件限定为“正文 ≥ 50词 + 含明确情感倾向/内容评价”的评论,排除了无意义短评、纯评分无内容的记录,确保样本能够支撑情感分析与主题挖掘的研究需求。该样本量在Python爬虫的合规采集范围内,同时兼顾了数据丰富度与分析效率,能够在可控的研究周期内完成情感标注、主题建模等分析工作。
2.2. 文本数据处理
文本数据处理一共分为两个部分,即文本清洗与文本降噪。首先,将读者评论数据中的文字评论内容进行文字清洗,即将读者评论中的重复评论、无文字评论、非英语评论、纯表情符号等删除。由于获取的读者评论数据质量较高,不存在需被文字清洗的部分。接着将清洗完毕的文本数据进行文本降噪处理,先将文本进行分词,将分词后的文本去除a、the、me等词。
2.3. 文本数据分析
本文使用Python中的Natural Language Toolkit 3.5对处理好的文本数据进行情感分析和语义分析。基于处理后的文本数据,根据语词频率和词性情感评分,计算每一条读者文字评论内容的综合情感得分及各语词之间的相关性。然后使用Word Cloud绘制词云图可视化评论数据主题倾向。
3. 结果与分析
3.1. 海外读者星级评价、情感态度
好读网站设置有星级评价(1~5星),本文采集的1288条海外读者评论数据的平均星级评价为3.882星,也即平均星级评价的分数达到满分星级评价的77.64%,表明海外读者对《木兰辞》英译本整体比较满意。通过对1288条海外读者评论数据进行情感分析得知有1059条积极评论,229条消极评论及0条中性评论。其中积极情感评论占总评论数据的82.22%,消极情感评论占总评论数据的17.78%,正负情感比率为4.62:1。由此可见,海外读者对《木兰辞》英译本整体上具有积极情感倾向。
3.2. 海外读者评论主题词云图
主题词云图是基于数据处理后的所有海外读者评论文本数据的语词频率绘制而成。在主题词云图中,不同大小和颜色的文字代表了在相关文本中出现频率的高低。主题词云图(见图1)显示了所有海外读者评论文本数据中语词频率排名前50位的关键词。其中,“Mulan”(木兰)这个词的字体最大,最为突出,说明它是出现频率最高的词汇;其他较大的词汇如“story”(故事)、“book”(书)、“China”(中国)、“characters”(角色)、“love”(爱)、“Disney”(迪士尼)等也比较显眼,表明这些词汇在与《木兰辞》相关的文本中频繁出现。
Figure 1. Theme word cloud of overseas reader’s comments
图1. 海外读者评论主题词云
词云图反映了人们在讨论《木兰辞》时关注的重点内容。“Mulan”作为核心主题,自然是讨论的焦点。“Story”和“book”表明人们关注的是《木兰辞》的故事本身以及它以书籍等形式呈现的内容。“China”体现了其文化背景和来源地的重要性。“characters”说明角色也是人们关注的一个方面,可能涉及对木兰等角色的分析和评价。“love”可能暗示了故事中包含的情感元素受到关注。“Disney”则可能反映了迪士尼版本的《花木兰》对人们认知的影响,说明该版本在传播和影响方面具有一定的影响力。
3.3. 海外读者评分分布直方图、情感趋向测评饼图
海外读者评分分布直方图显示出读者评分情况(见图2),此直方图以评分作为横坐标,涵盖了从0到5的完整评分区间,每个刻度代表一个特定的评分值。纵坐标则为频数,精准记录了每个评分所对应的出现次数。通过观察该直方图,评分为4和5的柱状条高度显著,分别接近500和400的频数,这表明有相当大比例的海外读者给予了较高的评分,反映出他们对《木兰辞》相关内容的高度认可和积极态度。评分为3的频数约在250左右,说明有一部分读者给出了中等偏上的评价,可能认为该内容具有一定的优点,但仍存在一些可提升的空间。而评分为2的频数约为100,相对较少,意味着只有少数读者持有这种相对较低的评价观点。评分为0和1的频数则更低,均在50以下,这进一步凸显了整体评价中积极和较高评价占据主导地位的趋势。从评分的分布趋势来看,呈现出一种右偏态分布,即高分段(4分和5分)的频数明显高于低分段(0~2分),这暗示了所评价的内容在海外读者群体中获得了较为广泛的好评和认可。这种分布情况可能与内容本身的质量、文化价值、传播效果等多种因素有关。《木兰辞》作为中国传统文化的经典之作,其英译本可能在翻译质量、文化内涵的传达以及对海外读者的吸引力等方面表现出色,从而引发了众多读者的积极评价和较高评分。此外,也可能与评价样本的选取、评价标准的差异等因素存在一定的关联。
Figure 2. Histogram of overseas reader’s rating distribution
图2. 海外读者评分分布直方图
为了进一步考察海外高影响力读者对《木兰辞》的情感态度,本文运用Python对海外读者评论进行情感分析(见图3)。
Figure 3. Pie chart of overseas reader’s sentiment tendency distribution
图3. 海外读者情感趋向测评分布饼图
该图将所有海外读者的情感趋向测评结果划分为两大部分,分别用不同的颜色加以区分。其中,蓝色部分代表“正向”情感,占据了整个饼图的82.2%,这一庞大的比例直观地表明了绝大多数海外读者在对相关内容进行评价时,所表达出的情感是积极的、正面的。这体现了他们对《木兰辞》的故事内容、文化内涵、艺术价值、翻译质量等方面的赞赏和肯定。例如,读者可能会称赞《木兰辞》中木兰这一角色的勇敢、坚韧和孝顺等优秀品质,或者对英译本能够准确传达原文的意境和韵味表示认可。而橙色部分则代表“负向”情感,占比为17.8%,虽然相对正向情感的比例较小,但也不容忽视。这部分负向情感可能源于读者对某些方面的不满或不同看法,比如可能认为某些翻译不够精准,或者对故事的某些情节在文化理解上存在困难等。从情感趋向的分布来看,正向情感占据绝对优势,这与评分分布直方图所呈现的整体积极趋势相互印证,进一步强化了海外读者对《木兰辞》相关内容整体持积极态度的结论。然而,对于17.8%的负向情感,我们也应该予以关注和分析。这部分负向情感可能为我们提供了改进和完善的方向,例如在未来的翻译工作中,可以更加注重文化差异的处理,提高翻译的准确性和流畅性,以更好地满足海外读者的需求和期望。同时,也可以通过进一步的市场调研和读者反馈收集,深入了解这部分读者的具体意见和建议,从而有针对性地进行优化和提升,以进一步提高《木兰辞》在海外的传播效果和影响力。
4. 启示与优化策略
4.1. 版本创作:构建分众适配的多元形态体系
不同版本形态的传播效果存在显著差异。其中,双语绘本《The Ballad of Mulan:木兰辞》以4.5星的平均评分和89.2%的积极评论占比成为最优样本,其成功经验为后续创作提供了重要参考。
4.1.1. 确立分众适配的创作原则
版本创作应遵循“受众导向”原则,针对不同读者群体的认知需求和接受特点,设计差异化的内容形态:对于文化研究者与深度读者,应采用“中英双语对照 + 学术注释 + 传统插画”的复合形态。除保留原诗节选与改编文本的对照外,还需增加文化背景解读和学术性附录。面向语言学习者,应突出“语言学习 + 文化认知”的双重功能。除了采用“标准译法 + 拼音标注 + 例句示范”的术语呈现方式外,还可配套扫码听读功能,提供中文原声音频与文化解读。针对青少年与普通读者,宜采用“纯英文叙事 + 轻量注释 + 现代视觉”的形态设计。在保留核心情节的基础上,可适度增加人物心理描写和互动情节,视觉呈现上采用“传统元素 + 现代审美”的融合风格。数据显示,此类版本的平均星级需达到4.2以上,青少年读者占比不低于50%,才能实现有效的传播效果。
4.1.2. 强化图文协同的认知增益效应
不同国家对图书的外观和设计版式等可能存在不同的偏好,这些容易被传播主体忽略的细节也能在一定程度上影响图书的传播效果[8]。研究显示,82.5%的积极评论提及插画对理解文化细节的重要作用。因此,版本创作需特别重视文字与视觉的协同效应:在视觉符号密度方面,应确保每页包含不少于3个准确的中国文化符号,如北魏窄袖交领汉服、青铜兵器形制、桑田农耕场景等。相关性分析表明,文化符号密度与受众文化认同感呈显著正相关(r = 0.67, P < 0.01)。在艺术风格选择上,宜采用“传统技法 + 现代表达”的融合路径。例如,《The Ballad of Mulan:木兰辞》的水墨插画通过简化线条但保留核心文化元素,既确保了文化辨识度,又符合现代审美偏好。相比之下,完全西化的卡通风格因文化符号密度不足(1.8个/页),其视觉相关消极评论占比高达23.5%。
4.2. 文化转译:建立精准适配的双重标准体系
研究发现,17.78%的消极评论中,63.3%与文化转译失误直接相关。这提示我们必须建立更加科学、系统的文化转译标准。
构建三维校验的转译机制
文化转译应建立“准确性–适配性–可读性”三维校验体系:在术语译法层面,需制定《木兰辞核心文化术语标准译表》,涵盖至少30个高频术语。每个术语采用“基础译法 + 拼音标注 + 文化说明”的复合呈现方式。例如,“孝道”应统一译为“filial piety (xiàodào)”,并补充“the virtue of respecting and caring for parents in Chinese culture”的简要说明,避免简化为“obedience”导致文化内涵流失。在背景注释方面,应采用“页下注 + 附录”的分层模式。页下注以1~2句话解释核心概念,如“北魏:中国古代北方少数民族建立的王朝,军事制度以骑兵为主”;附录则以专题形式展开深度解读,如《北魏军事制度与木兰从军的关联性分析》。数据显示,采用分层注释的版本,其文化相关积极评论占比较无注释版本提升26.7个百分点。在符号呈现维度,应建立“中国传统视觉符号数据库”,由文化学者参与审核,确保服饰、器物、场景等视觉符号的历史准确性达到90%以上,避免时代错位等硬伤。
4.3. 传播运营:设计平台导向的精准传播路径
基于Goodreads平台的传播特性及“Disney”关键词的高频出现(498次,占比3.48%),应设计针对性的传播运营策略。
4.3.1. 实施三阶段传播计划
短期(1~3个月):依托Goodreads的算法推荐机制,实现精准触达。向“Chinese Culture”“Historical Fiction”标签用户推送文化深度版本,突出“比迪士尼更贴近中国文化的木兰绘本”等差异化价值;向“Language Learning”“Young Adult”标签用户推送对应版本,强调“学中文 + 了解文化的双重选择”等实用功能。中期(4~6个月):激活高影响力读者,带动口碑传播。筛选平台影响力指数前20%的核心用户(共258人,平均每条评论获15+“有用”投票),通过赠阅样书、组织“译者–插画师–核心读者”线上沙龙等方式,引导深度书评创作。数据显示,高影响力读者的积极评论占比(88.4%)显著高于普通读者(80.5%),其观点对普通读者具有显著引导作用。长期(7~12个月):开展差异化IP联动,拓展传播边界。针对文化深度版本,举办“绘本与迪士尼电影的文化细节对比”线上论坛,有学者解析绘本中“汉服形制”“农耕场景”等电影未呈现的文化元素;针对大众版本,与迪士尼合作发起“‘我的木兰故事’创作活动”,鼓励读者进行二次创作,形成传播裂变。
4.3.2. 建立效果评估与优化机制
传播过程中应建立量化的效果评估体系:设置版本识别度(目标读者占比 ≥ 40%)、文化理解度(概念准确率 ≥ 80%)、推荐意愿(“有用”投票数均值 ≥ 8次/条)等核心指标,通过A/B测试等方法持续优化传播策略。同时,建立负面评论快速响应机制,对涉及文化误读的评论及时提供权威解读,避免误解扩散。
5. 结论与展望
5.1. 研究结论
本研究基于Goodreads平台采集的1288条海外读者评论数据,运用Python编程语言及自然语言处理技术,对三部具有代表性的《木兰辞》衍生小说绘本的海外传播效果进行了系统的量化分析。通过情感分析、主题建模与可视化呈现等方法,主要得出以下结论:
首先,从整体传播效果来看,《木兰辞》衍生作品在海外读者中获得了较为积极的接受。中国文化外译须遴选能满足传播受众需求的作品,这样才能与传播受众的心理构成产生心理反应,这是传播致效的前提[8]。数据显示,平均星级评分达到3.882星(相当于满分的77.64%),积极评论占比82.22%,正负情感比率高达4.62:1。这一结果表明,“木兰代父从军”的叙事母题及其蕴含的勇敢、孝亲、家国情怀等精神特质,能够有效跨越文化差异,引发海外读者的情感共鸣。特别是木兰作为女性英雄的形象,其展现的独立、勇敢与担当品质,与当代全球语境下的女性主义议题形成呼应,增强了作品的当代价值和传播潜力。传播内容是成功传播的五要素之一,传播受众往往不会对传播主体传递的信息被动接受,传播受众具有主观能动性,他们常常主动寻找能满足个人需求与动机的信息[9]。
其次,不同版本间的传播效果存在显著差异。双语绘本《The Ballad of Mulan:木兰辞》凭借其“中英对照 + 水墨插画”的复合形态与精准的文化转译,获得了最高的受众评价(平均星级4.5,积极评论占比89.2%)。相比之下,Wild Orchid: A Retelling of “The Ballad of Mulan”采用西化视觉风格且文化转译准确率较低的版本,其传播效果相对较弱。这种差异揭示了版本形态适配性、文化转译准确性与外部IP联动性共同构成了影响传播效果的“三维驱动模型”。具体而言,双语对照形态通过提供源语参照降低了文化认知门槛;传统视觉符号通过直观呈现增强了文化认同;而适度的IP联动则通过认知铺垫拓展了受众基础。我们不仅需要继承传统文学中的精髓,还应当借鉴文化多样性的优势,重视IP产业化发展,根据中国文学的故事原型和内在精神,创作出更多能够被其他国家观众所接受的普世性电影等跨媒介作品[10]。
第三,海外读者的关注焦点呈现出“价值共鸣先于文化理解”的特征。词云分析与主题建模显示,“courage”“story”“characters”等涉及普世价值的词汇累计频率达15.3%,显著高于“filial piety”“khan”等文化特有概念(5.2%)。这表明,跨文化传播的有效性首先建立在人类共同情感与价值认同的基础上。同时,有19.8%的评论提及因缺乏历史背景知识而产生的理解障碍,28.3%的读者反馈对特定文化符号缺乏充分解释。这一现象提示我们,在保持叙事普适性的同时,需要通过恰当的注释策略与转译方法,平衡文化保真度与受众接受度之间的关系。
5.2. 实践启示
充分利用现代多媒体技术和先进的计算机技术和互联网技术,聚焦现有研究所忽视的媒介在传播中所起的关键性作用[11]。通过将计算语言学研究方法引入中国古典文学的海外传播研究,实现了人文社科与数据科学的跨学科融合。与传统质性研究相比,基于Python的数据挖掘与文本分析方法,能够处理更大规模的受众反馈数据,从而超越个人经验判断,形成更具普遍性的结论。同时,通过构建“传播效果三维驱动模型”,为理解古典文学衍生作品的跨文化传播机制提供了新的理论框架。
在实践层面,本研究为中国古典文学IP的现代化转化与全球化传播提供了具体路径参考。首先,在版本创作方面,应建立基于受众分层的形态适配策略,针对文化研究者、语言学习者和普通大众等不同群体开发差异化产品。其次,在文化转译方面,需构建“术语标准化 + 注释分层化 + 符号精准化”的三维校验体系,确保文化传递的准确性与适配性。最后,在传播运营方面,可借助社交平台的算法推荐机制,实施精准推送;同时通过激活高影响力读者和开展差异化IP联动,形成传播裂变效应。
5.3. 研究局限与未来展望
本研究尚存在若干局限,需要在后续研究中加以完善。首先,数据来源主要局限于Goodreads平台,未能纳入Amazon、Twitter、Instagram等多渠道的读者反馈,可能存在样本代表性偏差。其次,分析维度主要集中于文本内容特征,未充分考虑出版机构影响力、定价策略、营销投入等外部变量对传播效果的影响。此外,研究方法上主要依赖基于词典的情感分析算法,对反讽、隐喻等复杂语言现象的识别能力有限。
基于以上局限,未来研究可在以下几个方向继续深化:一是拓展数据来源,构建跨平台、多模态的受众反馈数据库;二是引入机器学习与深度学习算法,提升对复杂语言现象的情感识别精度;三是开展跨文化对比研究,考察不同文化背景受众的接受差异;四是将研究范围从《木兰辞》扩展至其他中国古典文学IP,验证本研究结论的普适性;五是加强因果机制探索,通过实验法等手段检验各影响因素的实际作用效果。
我们已然生活在现代技术之中,我们对生活的理解都深深地涉及技术[11]。随着数字技术的快速发展和全球文化交流的日益深入,中国古典文学的海外传播正面临新的机遇与挑战。未来,我们应进一步推动研究方法创新,加强跨学科合作,构建更加科学、系统的中国文学海外传播效果评估体系。同时,深入挖掘中国经典中的当代价值与全球意义,通过创造性转化和创新性表达,使更多像《木兰辞》这样的文化瑰宝,从东方的传统经典转化为世界共享的文化资源,为促进文明互鉴、构建人类命运共同体贡献文化力量。
基金项目
2025年度贵州财经大学科学研究项目,项目名称:《孙子兵法》英译中的文化负载信息传递与翻译策略研究,编号:2025BAZYSY356。