基于Python情感分析的《丰乳肥臀》英译海外接受研究
Research on the Overseas Reception of the English Translation of Big Breasts and Wide Hips Based on Python Sentiment Analysis
摘要: 本文基于Amazon与Goodreads平台的海外读者评论数据,运用Python情感分析技术,对莫言小说《丰乳肥臀》英译本Big Breasts and Wide Hips的跨文化接受状况进行实证研究。通过TextBlob情感分析、主题词云与语义网络图等方法,对293条有效评论进行量化与质性分析。研究表明:其一,译本获得整体积极接受,积极评论占比73.72%,情感极性均值为0.1181;其二,读者关注聚焦于三大主题维度:莫言的作者身份与叙事特征、小说的历史与性别主题及其文化阐释、以及由文化距离导致的阅读体验分歧;其三,阅读体验与评价倾向,揭示出文化背景与阅读预期差异导致的情感分歧。研究表明,该英译本的成功得益于其文学价值与译笔,但其海外接受仍呈现出共识与分歧并存的多元图景,为中国文学“走出去”的复杂机制提供了典型案例。
Abstract: This paper, based on overseas reader review data from Amazon and Goodreads platforms, conducts an empirical study on the cross-cultural reception of Mo Yan’s novel Big Breasts and Wide Hips through Python sentiment analysis technology. Using methods such as TextBlob sentiment analysis, topic word clouds, and semantic network diagrams, this study performs quantitative and qualitative analysis on 293 valid reviews. The research findings indicate: first, the translation has achieved overall positive reception, with positive reviews accounting for 73.72% and an average sentiment polarity of 0.1181; second, readers focus on three major thematic dimensions: Mo Yan’s authorial identity and narrative characteristics, the novel’s historical and gender themes and their cultural interpretations, and reading experience divergences caused by cultural distance; third, reading experiences and evaluative tendencies reveal emotional divergences resulting from differences in cultural background and reading expectations. The research demonstrates that the success of this English translation benefits from its literary value and translation quality, but its overseas reception still presents a pluralistic landscape of both consensus and divergence, providing a typical case study for the complex mechanisms of Chinese literature “going global”.
文章引用:王银佳. 基于Python情感分析的《丰乳肥臀》英译海外接受研究[J]. 现代语言学, 2025, 13(10): 155-163. https://doi.org/10.12677/ml.2025.13101039

1. 引言

中国文学的海外接受研究是翻译学领域的重点议题。自2012年莫言荣获诺贝尔文学奖以来,其作品的对外传播与接受效应已成为考察中国文学“走出去”成效的重要窗口。然而,现有研究多聚焦于其译作的策略选择与文本对比的微观层面,基于真实读者反馈、尤其是大数据规模的接受研究仍较为匮乏。数字人文方法的兴起,特别是自然语言处理技术的发展,为通过分析海量网络评论突破上述局限提供了新的路径。

本文依托Python技术生态,对Amazon与Goodreads平台的读者评论进行情感量化与主题挖掘,试图构建一种宏观数据支撑与微观文本阐释相结合的研究框架,以弥补传统接受研究在样本规模与解读深度上的二元对立。以此为方法基础,本研究以莫言代表作《丰乳肥臀》的英译本为个案,综合运用TextBlob情感分析、词云与语义网络可视化、以及深度文本细读,致力于实现三个研究目标:其一,量化评估英语读者对译本的总体情感态度;其二,识别并呈现读者讨论的核心主题集群;其三,阐释跨文化接受中的分歧及其深层动因。本研究旨在为莫言作品的国际接受提供数据驱动的实证参考,并为中国文学外译效果评估探索一种融合计算与阐释的新范式。

2. 《丰乳肥臀》英译研究现状

莫言是中国当代最具国际影响力的作家之一,其作品以魔幻现实主义风格见长,深刻描绘中国乡土社会的变迁与人性的复杂面貌。2012年,他因“将魔幻现实主义与民间故事、历史与当代社会融合在一起”的独特风格获得诺贝尔文学奖,成为首位获此殊荣的中国籍作家。《丰乳肥臀》作为莫言的代表作之一,初版于1995年,是一部横跨半个多世纪的家族史诗。小说通过上官鲁氏及其子女的命运起伏,展现了中国近现代社会的剧烈变迁,以其大胆的叙事结构与浓郁的乡土意象成为中国当代文学的经典之作。莫言曾言:“你可以不看我所有的作品,但你如果要了解我,应该看我的《丰乳肥臀》。”[1]该作品的英译由著名汉学家葛浩文(Howard Goldblatt)承担,葛浩文以其深厚的汉语功底和对中国文化的理解,成功将莫言独特的文学世界带入英语读者的视野。2004年,其英译本Big Breasts and Wide Hips由美国Arcade Publishing首次出版,随后又由Penguin等多家出版社再版发行,逐步进入英美读者视野,并在海外文坛引发一定关注。根据WorldCat数据,截至2025年,该英译本的17个版本已被全球900余家图书馆收藏,显示出其在国际学术与文化传播中的广泛影响力。

目前国内对莫言《丰乳肥臀》英译本的研究主要聚焦于翻译文本本身的语言特点与翻译实践,涵盖了翻译策略、翻译方法、翻译效果以及翻译伦理等多个方面。在翻译策略层面,学者们从隐喻[2]、归化[3]与顺应[4]等视角对葛浩文的英译本进行了分析,探讨其如何在跨文化语境中重构原作意象与文化内涵。翻译方法方面,研究者关注了漏译[2]、翻译补偿[5]、替换、省略[6]等技术手段,特别是在处理文化负载词、修辞结构及语篇逻辑时所体现出的灵活调适能力。在翻译效果与伦理维度,部分研究从文体风格的还原与修辞美的传递[7],以及译者伦理选择的角度[8]入手,揭示译者在忠实原著与服务译入语读者之间所作出的平衡尝试。这些研究为理解《丰乳肥臀》英译本的翻译特征与策略提供了重要参考,但整体仍以文本分析为核心,较少涉及读者接受层面的系统研究。

值得一提的是,曹进与丁瑶基于读者反应理论与奈达的测试理论,采用完形填空与阅读日志等方式,对美国田纳西州英语母语读者对《丰乳肥臀》英译本的接受度进行了实证调查。该研究从目的语读者视角出发,关注译文在实际传播语境中的可接受性,拓展了文本层面研究的边界[9]。此外,石春让与邓林运用情感分析技术对莫言十一部小说英译本的西方读者评论进行了整体考察,发现积极评价占比76.5%,并指出读者主要关注其幻觉现实主义手法与历史背景,消极评价则多针对人名记忆、叙事繁复及情节残酷等问题,该研究为莫言作品的整体海外接受状况提供了有价值的量化参考[10]。本文拟在上述研究基础上进行拓展与深化,与石春让等对多部作品的概括性分析相区别,本研究聚焦《丰乳肥臀》单部代表作,通过引入Python情感分析技术,利用海外读者评论数据,融合宏观量化分析与微观文本解读,分析《丰乳肥臀》英译本的接受状况,以期为莫言作品的国际传播效果研究提供新的视角与实证支持。

3. 研究设计

3.1. 文本数据获取

亚马逊(Amazon)作为全球最大的在线书店,具备完善的书评体系及较高的评分可信度,而好读网(Goodreads)作为全球最活跃的阅读社交平台之一,读者互动频繁、内容质量较高[11],故本研究选取上述两个平台作为《丰乳肥臀》英译本Big Breasts and Wide Hips读者评论的主要数据来源。本研究借助Python爬虫技术,分别在两大平台上检索《丰乳肥臀》英译本Big Breasts and Wide Hips并爬取相关评论数据,具体内容包括评论用户名、评论时间、星级评分及评论文本。由于平台功能差异,亚马逊的评论数据还包括评论获赞数量,且其评论形式区分为短评与长评。截至2025年5月9日,共计获取评论数据515条,其中来自好读网443条,来自亚马逊72条,评论时间范围覆盖2005年3月8日至2025年2月25日。

3.2. 文本清洗与降噪

本研究首先对原始评论数据进行了人工预处理。亚马逊平台共采集72条评论,筛选保留其中的长评,剔除2条非英文内容,最终获得70条有效评论。好读网平台共采集443条评论,剔除非英文及缺乏语义信息的评论(如仅重复评分、时间,或仅含语气词、表情符号等),最终保留223条具有分析价值的评论文本。经预处理,共获得293条评论数据,作为后续文本分析的基础。

在完成人工预处理的基础上,对评论文本进行自动化文本降噪处理。本研究运用Python的自然语言处理工具包NLTK (Natural Language Toolkit),结合自定义脚本,对文本依次执行分句、分词、标点符号剔除、停用词过滤、统一小写、词形还原等标准化清洗流程。此外,基于语料特征构建了扩展停用词表,并进一步开展二次清洗处理,以提升文本质量,为后续的情感分析与主题识别提供规范、干净的语料基础。

3.3. TextBlob情感分析

本研究采用Python中的自然语言处理库TextBlob对评论文本进行情感分析。该工具内置两种情感分析器:Pattern Analyzer和Naïve Bayes Analyzer。前者基于情感词典匹配与规则推理算法,能够计算文本的情感极性(polarity)和主观性(subjectivity)得分,适用于结构清晰、情感表达直接的英语文本;后者则基于机器学习方法,依赖于事先训练的情感标注语料,更适用于语义结构复杂、上下文依赖性较强的语料分析[10]

考虑到本研究所采集的评论多为简洁主观表达,且分析目的在于快速识别整体情感倾向而非构建分类模型,故选择默认的Pattern Analyzer作为情感分析工具。分析以评论文本为单位,逐条生成对应的情感极性与主观性得分。情感极性值取值范围为[−1, 1],其中越接近1表示情感越积极,越接近−1表示情感越消极,0则视为完全中性;主观性得分取值范围为[0, 1],值越高表示主观程度越强[12]。通过调用TextBlob的情感分析模块并结合自定义Python脚本,本文对全部经清洗与降噪处理的评论文本实现了逐条自动化情感打分,为后续分析提供了可靠的量化基础。

4. 研究结果与分析

4.1. 评论星级评价与情感极性

截至2025年5月9日,《丰乳肥臀》英译本在Amazon与Goodreads两个主流读书平台共收获3680条有效星级评分,其中Amazon平台提供165条,Goodreads平台提供3515条。各星级评分分布如下:

从总体分布来看(见表1),读者对该英译本的评价整体偏向积极。其中,4星评分占比最高,达35.4% (1302/3680),其次为5星,占比31.9% (1174/3680)。两者合计占比达67.3%,表明大多数读者对该译作持肯定态度,认可其文学质量与可读性。3星评分共827条,占比22.5%,显示出部分读者在接受过程中存在一定的理解分歧或审美差异。负面评价(1星与2星)合计为377条,占比约10.2%,属少数意见。

Table 1. Amazon and Goodreads star-rating distribution for “Big Breasts and Wide Hips

1. 《丰乳肥臀》英译本在Amazon与Goodreads平台的读者评分分布

评论星级

Amazon

Goodreads

评论总数

5

64

1110

1174

4

41

1261

1302

3

33

794

827

2

15

244

259

1

12

106

118

评论总数

165

3515

3680

从平台分布来看,Goodreads平台的评分数量明显较多,读者反馈更为活跃。其评分集中于中高级,4星与5星合计占比达67.6% (2371/3515),与总体趋势保持一致。Amazon平台评论相对较少,但也呈现出正向主导的评价格局,其中4星与5星评分共105条,占比63.6% (105/165),表明该英译本在电商平台亦获得一定认可。

基于上述数据可粗略计算整体平均评分,结果约为3.89分(满分5分),接近4星水平,进一步印证《丰乳肥臀》英译本在英语读者群体中的总体接受度较高,评论星级分布初步呈现出海外读者对该译作整体较满意的态度。

在评论星级的基础上,本文进一步引入TextBlob情感分析技术,对清洗后的293条有效评论文本进行了情感倾向识别。分析结果显示(见表2),《丰乳肥臀》英译本在两个平台的评论整体呈现出积极态势。

Table 2. Distribution and mean values of sentiment polarity in reviews of “Big Breasts and Wide Hips” on Amazon and Goodreads

2. 《丰乳肥臀》英译本在Amazon与Goodreads平台评论的情感极性分布与均值

Amazon

Goodreads

总计

积极

条数/占比

52/74.29%

164/73.54%

216/73.72%

情感均值

0.2631

0.1873

0.2055

中性

条数/占比

5/7.14%

15/6.73%

20/6.83%

情感均值

0

0

0

消极

条数/占比

13/18.57%

44/19.73%

57/19.45%

情感均值

−0.1947

−0.1644

−0.1713

总情感均值

0.1593

0.1053

0.1181

在Amazon平台的70条有效评论中,积极评论共计52条,占比74.29%,平均情感极性得分为0.2631,表明读者在评论中普遍表达了较为正向的情感态度;中性评论数量为5条,占比7.14%,情感得分均为0;消极评论为13条,占比18.57%,平均情感得分为−0.1947。Goodreads平台共计223条评论中,积极评论为164条,占比73.54%,平均情感得分为0.1873;中性评论15条,占比6.73%;消极评论44条,占比19.73%,平均情感得分为−0.1644。

从整体趋势来看,两平台的情感分布高度一致,积极评论数量占比均超过七成,显示出评论语料在文本层面亦延续了星级评分中所体现的正向接受态度。此外,积极评论的平均得分明显高于消极评论的负向得分,进一步印证了正向评价在文本情感中占据主导地位。综合所有评论计算的总体情感极性得分分别为积极0.2055、消极−0.1713,表明该英译本在英语语境下的情感接受度整体偏正,译文在读者心中构建出积极的认知印象。情感分析结果与星级评分相互印证,表明该译本不仅在表层评分中获得认可,更在情感层面激发了读者的认同,为其国际传播效果提供了细致的量化证据。

为进一步剖析情感倾向的具体分布情况,本文统计了评论情感极性(Polarity)的区间分布,以0.2为步长划分极性区间(见图1)。结果显示,无论是Amazon还是Goodreads,评论普遍集中在轻度正向区间(0.0~0.2),该区间分别占据Amazon评论的45.71%和Goodreads评论的57.85%,为出现频次最高的区间,反映出多数读者虽然整体持肯定态度,但表达情感的强度偏弱,以中性或轻微积极为主。

相较之下,情感极性得分高于0.4的强烈正向评论数量相对有限,Amazon中仅有7条(占比10%),Goodreads中共13条(占比5.84%),说明虽然读者普遍持正面态度,但极强正向情感反应的比例仍较有限,显示英译本在激发读者高度共鸣层面仍存在进一步提升空间。

至于负向区间,极端负面情绪(Polarity < −0.6)的评论极为稀少,两个平台各仅有2条,反映出对该译作持强烈否定态度的读者较为罕见。然而,这类评论的存在仍具分析价值,其批评焦点集中于文本的叙事结构、文化隔阂及翻译策略等深层问题,为理解跨文化接受中的审美分歧提供了重要线索。

Figure 1. Overall sentiment polarity distribution

1. 情感极性分布图

4.2. 读者评论的主题词云图与语义网络图分析

为深入挖掘海外读者对《丰乳肥臀》英译本的关注焦点及其评论文本的语义关联结构,本文基于预处理后的293条评论数据,运用Python生态中的可视化分析工具开展双维度文本研究。一方面,借助WordCloud库生成基于词频加权的主题词云图,以直观呈现读者评论中出现频率较高的核心词汇;另一方面,构建词汇共现矩阵,并利用NetworkX复杂网络分析工具绘制语义网络图,结合Matplotlib科学绘图库对前20个高频词的共现关系进行可视化呈现,通过节点中心性和边权重指标揭示词汇之间的语义关联结构。该双重可视化方法不仅展示了评论语料中的主要关注主题,也进一步揭示了高频词之间潜在的共现逻辑与语义联系。

从主题词云图(见图2)可以看出,读者评论中出现频率最高的词汇包括“book”“read”“Mo”“Yan”“novel”“story”等,显著聚焦于文本的叙述者身份、叙事风格与文学标签。这一现象表明,莫言作为诺贝尔奖获得者,其作者身份在评论中占据显著地位,反映出海外读者对其文学话语权的高度关注。同时,“narrator”“writing”“style”等词汇的出现,显示出读者对于叙事视角、文体风格及语言表现的感知与回应。此外,“Chinese”“family”“woman”“history”“war”等词频排名靠前,提示评论者普遍关注文本所呈现的文化背景与性别议题,其中“hip”“breast”等身体意象词的高频共现,也凸显出读者对小说标题的象征性及其现实主义风格的文化解读。在情绪表达方面,词云中“good”“interesting”“great”“strong”等积极情感词的集中出现,与文本情感分析中73.72%的正向情绪比例相互印证,进一步展现出该英译本在文学性与可读性上的接受度较高。

通过构建高频词的语义网络图(见图3)可见,“Mo”与“Yan”构成语义网络的核心节点,并与“book”“novel”“Chinese”等词紧密连接,勾勒出以“作者–作品–国别”为中心的语义关联簇。同时,“book”与“character”“China”“story”“family”等词呈现显著共现,表明读者高度关注小说的人物塑造、叙事结构与中国文化背景。值得注意的是,“breast”与“woman”“history”等词的共现路径揭示出,莫言在《丰乳肥臀》中通过身体意象与历史进程的叙事联结,为海外读者理解中国社会变迁提供了独特视角。这种将女性身体特征与历史进程相联系的叙事策略,不仅构成了小说的标志性文学特征,更成为跨文化读者把握作品主题的重要切入点。此外,“like”“good”“story”等积极评价词的频繁联结,与情感极性分析结果相互印证,进一步说明该英译本在跨文化语境中具有较高的情感接受度。

Figure 2. Thematic word cloud

2. 主题词云图

Figure 3. Semantic network diagram

3. 语义网络图

4.3. 三大主题维度下海外读者评论的质性分析

在可视化分析的基础上,本文进一步对海外读者评论展开深入的文本细读,以挖掘情感极性分数背后具体的评价立场、阐释逻辑与文化参照框架。基于高频词的语义聚类及前文主题分布,本研究将评论内容归纳为三个核心维度:其一,作者身份与叙事特征;其二,小说主题与文化阐释;其三,阅读体验与评价倾向。围绕上述维度,本文选取点赞数高、篇幅长的代表性评论进行质性分析,旨在透过典型个案,揭示海外读者如何理解、诠释并评价该译本,从而立体地呈现其在跨文化语境中的接受样态与内在动因。

1) 作者身份与叙事特征

在读者评论中,莫言作为诺贝尔文学奖获得者的身份被频繁提及,与此同时,评论者对叙事风格、语言表现和写作手法的讨论,揭示了文本叙事特征在跨文化接受中的敏感性。部分评论者明确指出,正是“诺贝尔奖得主”的身份吸引他们选择阅读该英译本,并将其与世界文学经典进行并置比较,由此可见,作者光环在很大程度上塑造了海外读者的期待视野。此外,评论中对于叙事方式的关注也十分突出。例如有读者批评“第一人称与第三人称的交替叙述”造成了阅读上的不适,而另一些读者则强调莫言“抒情而富有张力的语言”“极具创造力的隐喻”与“魔幻现实主义的独特运用”所带来的审美震撼。这种褒贬不一的评价表明,莫言的语言风格和叙事策略在跨文化传播中既可能带来陌生化体验,也可能成为文学魅力的重要来源。

2) 小说主题与文化阐释

与对作者和文体的关注相比,大量评论更聚焦于小说的主题内容与文化意义,尤其是中国历史叙事、家庭结构以及女性形象的呈现,这些维度成为海外读者解读作品的重要入口。评论普遍指出,《丰乳肥臀》以家族史为叙事核心,通过母亲及子女的命运映射出二十世纪中国社会的巨大变迁。在这一宏大叙事之中,女性角色被赋予了极其重要的象征意义。评论者注意到,母亲形象不仅是家庭的支柱,更承载了民族存续与文化韧性的象征,其坚韧与牺牲精神被解读为推动历史前行的隐喻力量。与此同时,部分读者强调小说中“强大的女性–软弱的男性”这一反讽性结构,认为莫言借此颠覆了传统父权社会的叙事逻辑。例如有评论直言,书中男性角色多以“软弱、懦怯”形象出现,而女性则以坚韧的生命力抵御灾难与压迫,从而强化了文本的性别政治意涵。还有评论将小说与《红楼梦》“金陵十二钗”的女性谱系进行类比,认为《丰乳肥臀》通过“身体意象–历史叙事”的结合,为跨文化读者提供了一个理解中国社会与性别关系的独特窗口。尽管如此,部分读者也批评作品因涉及人物与事件过多而显得“篇幅冗长、主题分散”。可见,读者在面对英译本时,既能透过叙事内容达成对中国社会历史的跨文化理解,也会因文化隔阂与象征性意象的复杂性而表现出多样化的解读路径。

3) 阅读体验与评论倾向

评论者还广泛分享了个人化的阅读体验与情感反应,其讨论焦点集中于作品的可读性、情感冲击力及翻译质量等方面。部分读者指出,阅读《丰乳肥臀》需具备一定的中国历史与文化背景知识,否则难以充分理解其叙事深度与人性刻画;他们虽承认阅读过程颇具挑战,但也强调在理解历史语境后,作品能带来强烈的思想震撼与情感共鸣。另一方面,亦有相当数量的读者对译本提出批评,多指向其翻译质量与叙事节奏,认为文本冗长晦涩,却难以与人物产生共鸣。这种评价分化凸显出跨文化接受中的内在张力:作品虽为一部分读者提供了深刻的智性启发,却也可能因文化距离与审美预期的不契合,导致另一部分读者产生明显的接受隔阂甚至审美排斥。总体而言,该英译本在整体层面获得了较多积极评价,但读者个体间的体验差异仍十分突出,反映出跨文化阅读中情感回应与价值判断的多元性与复杂性。

5. 结语

本文以Python情感分析为工具,对《丰乳肥臀》英译本的海外读者评论进行了系统考察。研究发现,英译本在Amazon与Goodreads平台整体评价积极,显示其在跨文化语境中具备较高的文学接受度和市场认可度。评论内容可归纳为三大核心维度:作者身份与叙事特征、小说主题与文化阐释以及阅读体验与评价倾向,揭示出海外读者在理解与回应过程中的多重逻辑。具体而言,诺贝尔奖得主身份强化了读者的阅读期待,文本的叙事风格与文化意象则成为评价分歧的主要来源,而个体化的阅读体验凸显了跨文化接受的复杂性。总体而言,海外读者对该英译本的接受呈现出共识与分歧并存的多元图景:在整体积极认可的基调下,个体间的阅读体验与阐释路径存在显著差异。《丰乳肥臀》英译本的海外传播案例表明,中国文学“走出去”不仅是语言的转换,更是一场涉及文化阐释、审美协商与价值判断的复杂对话。

参考文献

[1] 莫言. 丰乳肥臀[M]. 北京: 北京十月文艺出版社, 2010.
[2] 梁晓晖. 《丰乳肥臀》中主题意象的翻译——论葛浩文对概念隐喻的英译[J]. 外国语文(四川外语学院学报), 2013, 29(5): 93-99.
[3] 王玉娜. 试析目的论视角下葛浩文翻译莫言《丰乳肥臀》的策略[J]. 牡丹江教育学院学报, 2014(4): 22-22, 65.
[4] 邓隽. 语用综观视域下《丰乳肥臀》英译研究[J]. 上海翻译, 2019(5): 73-77.
[5] 曹颖, 秦琴. 莫言小说《丰乳肥臀》英译中的翻译补偿类型研究[J]. 牡丹江大学学报, 2013, 22(7): 109-111.
[6] 廖素云, 冯琰. 从认知隐喻视角小议《丰乳肥臀》中的明喻翻译[J]. 湖北民族学院学报(哲学社会科学版), 2017, 35(6): 179-183.
[7] 黄丽萍. 从文学文体学角度看《丰乳肥臀》及其英译本的修辞[J]. 山西能源学院学报, 2019, 32(5): 78-81.
[8] 王文强, 郭书法. 从翻译伦理角度看葛浩文的翻译实践——以《丰乳肥臀》英译本为例[J]. 外国语言文学, 2014, 31(3): 190-196.
[9] 曹进, 丁瑶. 《丰乳肥臀》英译本可接受性的调查研究——以美国田纳西州读者的抽样调查为例[J]. 中国翻译, 2017, 38(6): 33-38.
[10] 石春让, 邓林. 基于情感分析技术的莫言小说英译本在西方的接受程度研究[J]. 外国语文, 2020, 36(3): 91-96.
[11] 冯亚利, 黎慧. 《论语》英译本海外传播效果及其启示[J]. 湖北社会科学, 2024(6): 169-176.
[12] 管新潮, 陆晓蕾. 基于Python的语料库翻译: 数据分析与理论探索[M]. 上海: 上海交通大学出版社, 2022.