“讲好重庆故事”:地方叙事英语新闻文本语料库的构建与分析
“Telling Chongqing’s Story Well”: Construction and Analysis of a Local Narrative English News Corpus
摘要: 在“讲好中国故事”国家战略和英语教学改革的双重背景下,大学英语课程亟需融入具有地方文化特色的真实语料资源,以提升学生的跨文化表达能力与国家传播意识。本文以《中国日报》中与重庆相关的英文新闻报道为基础,构建了一个“讲好重庆故事”英语语料库,词汇总量约22,588词,文本50篇。通过关键词提取、词语共现分析、语义场归类、叙事结构识别等语言学方法,系统揭示该类语料在地方形象建构与国际传播话语中的表达规律。在此基础上,论文进一步提出将该语料库嵌入大学英语教学的设计方案,构建包含语言知识输入、叙事能力训练与文化输出任务的教学路径。研究结果表明,该语料具备较强的教学适应性和文化表达价值,能够有效服务“地方文化–英语教学”的融合需求。尽管本研究在语料来源与教学实证方面仍有提升空间,但其所提出的语料驱动教学模式为英语课程融入地方叙事提供了具有操作性与延展性的范式参考。
Abstract: Against the dual backdrop of China’s national strategy of “telling China’s story well” and ongoing college English curriculum reforms, integrating localized and culturally authentic materials into language teaching has become increasingly necessary. This study constructs an English-language corpus of localized narratives based on 50 news articles about Chongqing published in China Daily, totaling approximately 22,588 words. Through corpus linguistic techniques such as keyword analysis, collocation mapping, semantic field classification, and narrative structure identification, the study reveals how Chongqing’s urban image is constructed and disseminated in international English-language discourse. Building upon these findings, a teaching design framework is proposed that embeds this corpus into college English instruction. The design emphasizes input of authentic language, training in narrative production, and culturally oriented output tasks. The study concludes that this corpus offers strong adaptability for pedagogical use, while providing rich material for enhancing intercultural communication and local cultural articulation. Though limitations remain in terms of source diversity and large-scale instructional testing, this research offers a practical and extendable model for integrating regional narratives into English language education through corpus-based approaches.
文章引用:陶思逸. “讲好重庆故事”:地方叙事英语新闻文本语料库的构建与分析[J]. 现代语言学, 2025, 13(9): 370-377. https://doi.org/10.12677/ml.2025.139989

1. 绪论

“讲好中国故事,传播好中国声音,展示真实、立体、全面的中国”是习近平总书记在多个重要讲话中提出的国家对外传播战略核心目标。该战略不仅强调国家形象的整体塑造,也要求推动区域形象的有效传播,以增强中华文化的国际影响力与话语权。潘承君(2024) [1]在这一背景下,如何以更加专业、有效、国际化的方式传播地方故事,逐渐成为外语学界、新闻传播学界、区域研究等多学科关注的重要议题。

贺建平,刘娟等(2009) [2]城市作为国家形象的重要载体,是国家文化软实力和综合国力对外输出的重要节点。特别是在中国推进区域协调发展战略和“一带一路”倡议、成渝地区双城经济圈建设的背景下,区域城市的国际传播能力建设尤为重要。黄俊(2018) [3]重庆作为中国西部唯一的直辖市,不仅是“一带一路”和“中新互联互通项目”的关键支点,也是长江经济带的重要枢纽城市。其独特的山水城市形象、多元的文化传统、显著的工业遗产与现代化发展成果共同构成了鲜明而丰富的城市叙事资源。这些资源通过国际传播平台的有效转化,能够在世界舆论场中构建起具有中国特色和地域辨识度的重庆形象。

在实际操作中,英文新闻文本是中国城市对外传播的关键载体之一,既具有国际传播语言的直接性与可达性,也承载着文化表达、认知引导与形象建构的多重功能。基于英文新闻文本研究重庆城市形象的传播策略、话语特征及其潜在文化隐喻,能够为地方外宣话语体系建设、国际传播内容优化提供理论支持与实践参考。

然而,目前关于重庆城市形象的英文传播研究相对较少,系统性的语料资源更为匮乏,缺乏面向传播研究、语言教学与跨文化训练多元应用场景的高质量语料库支撑。因此,基于英文新闻文本构建具有地方叙事特征的语料库,并结合语料库语言学的研究范式,深入探讨重庆形象在国际传播中的语言构建特征,是深化“讲好中国故事”区域实践、拓展语言服务国家战略的重要探索。

2. 文献综述

近年来,随着语言学研究方法的不断拓展与技术手段的进步,胡开宝,李翼(2016) [4]语料库语言学逐渐成为语言教学、媒介话语分析及地方形象传播等交叉领域的重要研究工具。相关文献从语料库建设理念、媒体话语策略、新闻语篇特性以及语料在教学中的实际应用等方面,分别为本文研究提供了理论基础与实践启示。

李威(2020) [5]从语料库语言学的技术特征与操作逻辑出发,指出语料库作为语言资源储存和分析的数字平台,其多样化的存储格式、复杂的资源联系及庞大的数据体量使其在语言教学中具有天然优势。作者强调,基于“最小努力原则”,语料库的建设应追求资源调用的便利性,以提升语言资源的使用效率。这一观点提示研究者在构建专属语料库时,应注重语料的可获取性与用户操作的便捷性,确保其在教育和研究中的高效使用。

在城市传播与媒体叙事方面,贺艳,贺建平(2009) [6]以《重庆晚报》为案例,深入剖析了大众媒体在城市形象建构中的叙事策略。研究指出,媒体主要通过强调地方文化元素(如民俗与历史传统)、有意回避现代性因素等方式塑造特定的城市意象。这种策略性叙事不仅影响公众对城市的感知,也在潜移默化中构建了城市的“话语自画像”。该研究为地方英文媒体语料的选材与分析提供了启发,表明新闻文本不仅是信息传播工具,也承载着丰富的文化隐喻与认同建构功能。

关于英语新闻语料库的构建与应用,鲍玲玲(2017) [7]指出,语料库研制的核心在于准确把握建设理念,并对语料的均衡性与代表性进行科学评估。新闻文本在语体、主题、来源等方面具有较强的多样性,因此在采集过程中需确保语料的广泛覆盖与结构合理,以避免样本偏差带来的研究失真。这一研究强调了英语新闻语料在构建过程中对“质”与“量”的双重要求,为开展系统化地方语料资源建设提供了方法论指导。

在语料库与外语教学的结合方面,彭馨葭,Mark Davies [8]围绕iWeb互联网语料库的教学应用展开研究,指出语料库对英语学习者最显著的价值在于其“频率意识”与“真实语境”的呈现能力。与传统教材不同,语料库提供了更贴近真实语言使用场景的学习素材,有助于提升学习者的语言感知能力与实际表达能力。李琳,李称鑫(2021) [9]指出,语料库不仅是静态的语言材料集合,更是一种可被挖掘和激活的学习工具,其教学效用依赖于教师对语料的深度开发与合理使用。

卢磊(2016) [10]指出,现有研究从语料库建设理念、媒体叙事策略、新闻语料特性到教学场景应用,分别构建了语料库语言学在新闻语篇与语言教育中的研究基础。尽管各研究侧重点不同,但均强调了语料库在语言研究与传播实践中的方法优势与应用潜力。然而,目前仍缺乏以具体区域城市为对象,聚焦地方英文新闻文本、兼具语料库构建与话语特征分析的系统研究。本文拟以“重庆叙事”为核心,构建地方英文新闻语料库并开展话语分析,旨在丰富地方外宣语料资源,同时为城市传播研究与教学应用提供一个可复用、可扩展的实践路径。

3. “讲好重庆故事”新闻文本语料库构建

本研究所构建的语料库以《中国日报》(China Daily)英文官网1为唯一文本采集来源。China Daily是中国国家级对外传播的重要平台,具有高度的官方性与国际传播影响力,其新闻内容在国际英文传播体系中具有较高的代表性与权威性。

本研究以“Chongqing”为关键词,通过官网检索获得截止至2025年8月7日之前发布的英文新闻文本共计采集新闻文本50篇,累计文本总词数为22,588词。这些新闻报道覆盖重庆在城市建设、文化旅游、科技创新、生态环保、对外开放等多个领域的发展实践,体现出较强的地方性叙事特征与国际传播意图。新闻语体主要包括消息稿、深度报道与专题特写,语篇结构完整、语言规范,语体适中,具备良好的可读性与教学适配性。

由于本语料库的构建目标是服务大学英语教学、尤其是与“讲好重庆故事”相关的地方叙事教学目标,语料的筛选过程在新闻真实性基础上,更加强调教学可用性与话题导向的双重标准。首先,在时间上,2025年发布的文本,聚焦于“新时代”背景下重庆的城市形象与传播语言。其次,在主题选择上,筛除那些仅在文中片段提及“Chongqing”的次要材料,保留以重庆为主角、具有正面宣传导向和叙事深度的报道文本。再次,在语言表达层面,排除语言冗杂、语义模糊、篇幅极短或结构混乱的材料,确保文本在教学中具有可读性和可加工性。通过这一过程,初步爬取的百余篇新闻中,有50篇被纳入语料库正选文本,覆盖面广泛,话题集中,具备“地方性、传播性、教学性”的三重价值,表1为本文筛选原则。

Table 1. Selection principles

1. 筛选原则

筛选维

筛选原则

时间范围

聚焦“新时代”语境,反映近年重庆发展

地域聚焦

明确以重庆为报道核心,排除模糊提及或非实质性内容

主题导向

优先包含城市建设、文化传播、区域协作、生态成就等正面叙事

教学适配

语言风格标准,排除过短、信息密度低、语言不规范文本

体裁类型

选择语体清晰、逻辑结构完整的新闻稿、专访、特写类文本

为保证语料的清洁性和可教学应用,所有原始新闻文本均经过统一清洗处理。研究使用Python语言进行文本处理,配合正则表达式工具对网页中出现的冗余信息进行了过滤与去除。主要清洗环节包括:剔除HTML标签、JavaScript脚本与页面广告内容;清除文末无关推荐链接与版权信息;对文本中的段落进行统一分隔和保留;转换统一字符编码格式,确保语料能够被教学平台、语言处理程序或文本分析软件兼容识别。清洗后的文本均为英文自然语境下的新闻语篇,保留段落结构,符合语篇逻辑,可直接用于语段理解、篇章结构教学、语言模仿与话语重写等教学任务中。

从技术实施上看,本语料库采用Python爬虫技术实现对中国日报新闻平台的关键词检索与内容抓取。通过模拟浏览器行为,访问搜索结果所返回的JSON数据,在其中提取出新闻文章链接,并依次访问对应HTML页面,通过BeautifulSoup库解析页面结构,提取标题、发布日期与正文内容。对于多页文章,通过判断页面URL是否以“_2.html”、“_3.html”等方式拼接,设定循环访问逻辑,将所有页码内容顺次拼接合并,构成完整的新闻正文。此外,研究还对每篇文本自动计算词数、段落数,并记录文章原始链接及其抓取时间,形成结构化语料表格,以.xlsx格式存储,便于教师检索调用。

考虑到语料的教学导向需求,在语料结构设计中引入了教学标注理念。除了基本的标题、日期、链接与正文内容之外,语料库还添加了多个可供教师筛选和加工的元数据字段,包括文本长度、所属主题领域、语体风格、语篇结构特征等。其中,主题领域的标注基于人工初步判读,将语料划分为“城市建设”“科技创新”“文化旅游”“生态环保”“对外传播”等五至七个类别,为后续按主题组织教学内容、分模块推进教学任务提供支撑。此外,还预留了教师可进一步标注的字段,如词汇难度分级、文化典型元素识别、可用于写作任务的语篇段落等信息,为开发多样化的教学活动创造条件。

本语料库所服务的英语教学目标以“地方文化的国际表达”为核心,强调学生用英语讲述城市故事、讲述中国故事的能力培养。传统大学英语课堂往往侧重语言结构与应试能力的训练,而“讲好中国故事”理念要求学生能在国际交际中主动输出、真实表达,展现中国形象与地方文化特色。因此,本语料库为英语教学引入了基于真实传播语境、紧扣城市发展主题的语言材料,不仅使语言输入更具真实性,也有助于激发学生的表达欲望与文化认同感。

语料初步统计结果显示,50篇新闻的总词数为22,588词,平均每篇长度约451词,平均段落数为8段左右。内容覆盖广泛,其中城市建设类文本13篇,占比26%;文化与旅游相关文本9篇,占比18%;科技创新与生态环保合计占比28%;其余为教育、人才与对外合作等方向,如表2所示。词频统计结果显示,出现频率较高的词汇包括Chongqing,development,infrastructure,city,innovation等,均体现了城市发展叙事与传播导向的鲜明主题。这些文本不仅适合用于新闻语言教学,也为文化内容嵌入外语教学提供了丰富素材。

Table 2. Thematic distribution of news texts

2. 新闻文本主题分布

主题分

篇数

占比

城市建设与基础设施

13

26%

文化与旅游

9

18%

教育与人才

6

12%

对外合作与传播

8

16%

科技与创新

7

14%

生态与环保

7

14%

综上所述,本文基于“中国故事”地方实践需求,结合大学英语教学改革方向,构建了一个以重庆英文报道为核心、教学导向明确、结构设计清晰的本地叙事英语新闻语料库。该语料库在文本采集、筛选清洗、技术实现与结构设计等方面均围绕“可用于教学”这一核心展开,初步验证其在大学英语教学中具有较高的应用价值。下一章节将进一步探讨如何将本语料库嵌入教学模块,构建以地方叙事为核心的语言输出任务型教学模式。

4. 语料库分析与发现

本章将基于前文所构建的以《中国日报》英文新闻为基础的“重庆叙事”语料库,对其主要语言特征与语义结构进行系统分析。分析包括关键词使用频率、词语共现关系、语义场分布、叙事结构特征及语言复杂度等方面。研究的核心目的并非仅停留于语言统计层面,而是通过语料分析,为“如何在大学英语教学中有效融入地方叙事资源”提供语篇基础与教学参考。

在关键词频率分析中,语料库中最常出现的高频词汇依次为China (234次)、said (126次)、year (99次)、percent (81次)、new (80次)、Chongqing (76次)以及Chinese、global、development、international、local等词。这些词汇不仅反映了英文媒体中常见的新闻用语特征,更揭示了重庆叙事中所强调的几个核心要素:国家定位(China, Chinese)、发展目标(development, percent, economic)、地方身份(Chongqing, local)、国际视野(global, international)与产业特征(industry, trade)。这种词汇分布充分体现了重庆作为国家中心城市,在国家战略叙事与地方形象传播中的双重话语功能。

为了进一步分析重庆在新闻文本中的语义联结方式,本文对出现“Chongqing”的词组共现情况进行了统计。在所有与“Chongqing”搭配出现的词组中,频率最高的包括Chongqing municipality (9次)、China Chongqing (6次)、park Chongqing (5次)、Chongqing branch (3次)、Chongqing international (3次)、Sichuan Chongqing (2次)等。这些搭配反映出“重庆”在传播语境中常被置于行政定位、区域合作、产业园区与国际交流的语义框架中。这种共现结构不仅具备传播学意义,也为大学英语课堂的语言输入提供了鲜明的地方语料资源。教师可以据此引导学生理解“地名 + 功能性名词”结构的使用模式,进行地方形象输出类表达训练,例如:“Chongqing International Logistics Park has become a hub for western trade”,或“Chongqing Municipality continues to innovate in ecological urban planning”。

在语义场层面,重庆叙事的新闻报道主要围绕五大主题展开:城市发展、科技创新、文化旅游、生态建设与对外传播。这一多维度的叙事结构为教学提供了丰富的跨学科话题素材。教师可以基于每个语义场开发相应的教学模块。例如,在“生态重庆”类新闻中引导学生学习环境类词汇与被动态结构,在“文化重庆”中引导学生梳理地方文化符号如“桥都”“火锅”“山城”等的表达方式。在此基础上,教学可设计“城市形象描述”、“地方文化介绍”、“区域传播演讲”等任务,实现语言学习与文化认同的协同培养。

文本叙事结构方面,语料中普遍采用典型的新闻报道三段式逻辑,即导语(lead)-背景(context)-行动(action/result)。此外,不乏出现具有隐喻化表达的传播策略,如“Chongqing, the bridge capital of China”(桥都)、“Southwest gateway to the Belt and Road”(“一带一路”的西南门户)等表述。这些叙事结构与语言策略具有较高的教学价值。它们可作为范例,引导学生学习如何在英文表达中进行抽象化、比喻化的城市叙述,从而更自然地完成“讲重庆故事”的语言迁移与创新表达。

从语言难度维度来看,本语料库包含的50篇新闻总词汇量为14,728个清洗后有效词条,总句子数为1063句,平均句长约为17.8词,词汇多样性(lexical diversity)为0.303,意味着大约每三个词中就有一个是不同的词汇。这一数据说明语料的语言复杂度适中,既有一定挑战性,又不至于超出本科非英语专业学生的理解能力范围。相比大学英语四六级模拟文本中普遍12~14词的平均句长,本语料在句法结构与词汇深度上更贴近真实外宣语境,是推动语言输入真实性的重要资源来源。

结合以上分析,本研究所构建的语料库在话题覆盖、语言结构与文化深度上,均能有效服务于“讲好重庆故事”的英语教学目标。教师可据此设计以地方形象表达为核心的写作训练单元、口语展示模块或翻译比较任务。例如,基于“Chongqing Municipality”与“development”共现频率较高的结果,可布置“用英语撰写重庆五年发展蓝图摘要”的写作任务;而针对“Chongqing International”出现频率可引导学生撰写“国际传播中的重庆形象简报”,培养语言输出与文化策划双重能力。通过结构化引导、语料嵌入与任务驱动的结合,学生能够实现从被动接收语言知识向主动表达地方故事的能力转化,从而在教学中真正实现语言与文化、地方与世界的有机融合。

5. 结论

在本研究中,语料库并非仅作为语言输入材料,而是通过模块化的整理和任务型教学思路,被转化为具有教学潜力的课程资源。基于对《中国日报》中“重庆故事”相关英文报道的系统收集与分析,本文在语料层面揭示了地方形象的多维叙事特征,并以此为依托,构建了一个面向大学英语教学的理想化设计框架。表3系统呈现了基于“讲好重庆故事”的教学理念所设计的整体课程模块,从跨文化表达能力的提升,到具体语言技能的训练,如结构模仿、描述性写作、文化词汇拓展等,每一个教学目标都直接对应一个或多个语料库中提取的高频主题与表达模式。通过这种“语料–能力–任务–输出”四位一体的链条,教学设计能够有效地将抽象的文化叙事具象化为语言教学实践。

表4则进一步从时间序列与教学实施角度出发,描绘了语料在课堂中的动态应用路径。从第一周的地理与政策信息导入,到第五周引导学生识别新闻文本中的隐喻策略,再到最后基于多篇新闻重构“重庆故事线”的综合写作训练,整个过程不仅体现了语料的层层解构与再建构能力,更为地方叙事在语言教学中的嵌入提供了扎实路径。这种以地方话语为中心、以真实文本为支撑、以任务输出为目标的教学设计,能够有效突破了传统大学英语教学中过于依赖虚构语料、缺乏本土文化支撑的弊端。

综上所述,本文围绕“讲好重庆故事”的国家传播战略与大学英语教学改革的现实需求,构建了一个基于《中国日报》英文报道的地方叙事语料库,系统梳理其语篇特征,并提出了融合语料驱动理念与任务型教学法的教学设计方案。在语料层面,研究以地方形象、跨文化传播、叙事结构等维度为切入点,对新闻文本中的关键词、高频搭配与隐喻语篇进行了深入分析,为语料的教学适用性提供了语言与语义依据;在教学设计方面,本文开发了六周教学活动方案,通过地方主题模块、真实语篇输入与多元输出任务的结合,提出了一种兼顾语言能力培养与文化表达训练的大学英语教学模式。

Table 3. Overview of college English local narrative teaching design (Based on the “telling Chongqing’s story” corpus)

3. 大学英语地方叙事教学设计总览(基于“讲好重庆故事”语料库)

教学目

教学内容模块

核心语言技能

对应语料主题

教学活动类型

成果输出形式

提升跨文化表达能力

城市形象介绍 (重庆概况)

介绍性写作、口语表达

Chongqing Municipality, development

视频脚本撰写、PPT演讲

城市导览英文短视频

学习新闻语篇结构

新闻标题解读与语篇重构

阅读理解、结构模仿

Urban development, policy reports

新闻结构重组、续写练习

新闻改写作业

训练批判性思维

城市叙事的隐喻表达

批判性阅读、比较分析

“Bridge capital”,“Gateway”等隐喻

概念隐喻识别、小组辩论

辩论陈述稿

丰富文化表达词汇

地方文化与旅游描写

描述性语言、词汇积累

hotpot, Yangtze River, culture

词汇卡片制作、文化日记写作

城市文化短文

增强写作组织能力

地方故事叙述与整合

写作逻辑、过渡语使用

多主题融合新闻

故事线设计、 短文拼接

英文故事 写作稿

需要强调的是,本研究所提出的教学方案仍属于理想化的设计,尚未经过课堂实践的系统检验。换言之,本文的贡献主要在于提出一种可能的教学模式,而非验证其实际成效。因此,本研究的结论应被理解为基于语料调查和理论推演的探索性成果,而非经过实证验证的最终模型。未来的研究有必要通过课堂实验、学生反馈与量化数据分析,对这一教学设想的可行性与效果进行进一步评估和修正。

本文通过构建以重庆地方叙事为核心的英语新闻语料库,并在此基础上提出教学设计设想,为大学英语课程引入本土叙事资源提供了新的思路。虽然仍存在语料来源单一、实证环节缺乏等局限,但本研究所呈现的探索路径为“讲好重庆故事”在英语教学中的转化提供了初步参考,也为后续开展实证研究奠定了语料与方法基础。

Table 4. Classroom teaching activities and corpus integration points

4. 课堂教学活动示意与语料嵌入点

教学主题

活动设计

使用语料

输出成果

第1周

重庆地理与政策概况

阅读导向 + 地图口语训练

Chongqing Municipality

城市简介演讲

第2周

城市建设叙事

新闻拆解 + 关键词卡片

development, infrastructure

教学新闻词汇卡

第3周

文化资源与非遗

类比写作 + 视频模仿

culture, intangible heritage

模仿类文化短文

第4周

新闻语篇结构

新闻摘要与续写训练

economy, innovation

模拟新闻稿

第5周

城市品牌与隐喻

隐喻识别 + 观点写作

bridge capital, gateway

批评性短评

第6周

故事设计与重述

叙事图谱设计 + 故事复述

combined reports

城市主题故事稿

NOTES

1《中国日报》(China Daily),https://www.chinadaily.com.cn/。

参考文献

[1] 潘承君. 语料库辅助的教材话语分析路径——以大学英语教材为例[J]. 当代外语研究, 2024(4): 83-94, 117.
[2] 贺建平, 刘娟, 常烨, 吕夺印, 程名. 重庆形象之域外媒体呈现[J]. 西南民族大学学报(人文社科版), 2009, 30(11): 133-138.
[3] 黄俊. 重庆城市媒介形象的追溯与流变——基于70年来《人民日报》头版涉渝报道的分析[J]. 重庆交通大学学报(社会科学版), 2018, 18(3): 128-135.
[4] 胡开宝, 李翼. 当代英语教材语料库的创建与应用研究[J]. 外语电化教学, 2016(3): 34-39.
[5] 李威. 语料库语言学在英语教育中的应用[J]. 中国教育学刊, 2020(S1): 81-82.
[6] 贺艳, 贺建平. 媒体叙事策略与城市形象的建构——基于《重庆晚报》的媒体叙事研究[J]. 新闻知识, 2009(12): 56-57.
[7] 鲍玲玲. 新闻英语语料库研制及应用分析[J]. 宏观经济管理, 2017(S1): 248.
[8] 彭馨葭, Mark Davies. iWeb互联网语料库及其在英语教与学中的应用[J]. 外语电化教学, 2020(4): 73-81, 12.
[9] 李琳, 李称鑫. 基于语料库的常用商务英语专业词汇研究[J]. 外语学刊, 2021(4): 64-69.
[10] 卢磊. 利用语料库重建学习者的学习模式[J]. 外语研究, 2016, 33(4): 63-67.