1. 引言
摘要是学术论文正文前的一段概括性文字,是论文在撰写、发表、交流、检索、收录等方面必不可少的一部分。论文摘要高度概括了正文内容,是正文实质性内容的浓缩[1]。因其能够帮助读者快速把握论文要点,现已成为文献检索的关键要素[2]。随着国际学术交流日益频繁,我国的学术期刊也树立了冲出国门,走向世界的目标。在此背景下,论文摘要的英译质量显得至关重要,它构成了外界了解我国学术期刊及其研究成果的首要窗口。
然而,当前国内学术论文的英文摘要质量参差不齐,特别是在语言表达、学术规范以及篇章结构等方面与国际权威期刊呈现明显差距。这不仅削弱了我国研究成果的国际传播效果,也降低了国内期刊参与全球学术对话的竞争力。值得注意的是,国内期刊的英文摘要多为翻译而来,而国际顶尖期刊如Nature上的文章摘要则多为直接创作而成,这种来源上的差异对两者之间的语言特征产生了深远影响,也是造成两者在语言规范性和学术表达准确性上存在差距的重要原因之一[3]。
近年来,国内学者逐渐认识到学术论文摘要的重要价值,并展开了多项研究。宋冰玉[4]通过对比汉英母语者的博士学位论文英文摘要,从词汇多样性、词汇复杂度和词汇密度三个维度,研究了母语背景与学科差异对摘要中词汇丰富度的影响;寇芙蓉[5]通过对比分析硕士学位论文与国内外权威期刊论文摘要的学术词汇水平和文本易读性,发现两者在学术词汇使用和多个文本易读性指标上存在显著差异,硕士论文在学术词汇多样性和语篇衔接等方面有待提升。硕士学位论文英文摘要在名词化等语言特征的使用上也存在诸多待改进之处[6]。黄文晋[7]基于功能翻译理论,对比了中英文科技论文摘要的标准差异,并从句法和语篇层面提出了摘要英译的具体策略。郑伊梅[8]通过对比中外应用语言学期刊英文摘要的句法复杂度,发现国内学者在从属结构使用上显著少于国外学者,建议加强学术英语写作中从属结构的教学与应用。姚秋慧[9]通过分析多本医学期刊的英文摘要,总结了医学论文英文摘要中各部分的时态使用规律。李小丽等[10]探讨了科技期刊英文摘要中时态和语态的适用性,提出应根据摘要不同部分选择时态和语态,并建议多使用一般现在时和主动语态以提升表达的清晰度和简洁性。徐铭霞[11]基于Nature期刊1970~2020年的生物学论文摘要,研究了学术英语中语态的历时变化,发现主动语态使用逐渐增加,被动语态逐渐减少,且不同语步的语态变化趋势各异。
综上所述,现有研究虽已开始关注摘要英译的语言特征,但多停留于单一维度或局部层面的对比分析,普遍缺乏对学术写作与学术翻译之间本质差异的系统性探讨。特别是针对国内期刊摘要多为翻译、国际期刊摘要多为创作的这一核心差异,尚未有深入的系统性研究。本研究自建可比语料库,从词汇特征、句法特征、语态特征和时态特征等多个语言特征切入,重点分析学术写作与学术翻译之间的语言差异,旨在揭示国内学术期刊英文摘要在语言规范性和学术表达准确性等方面的具体问题,深入剖析其成因,并提出具有针对性的改进建议,为推动国内学术期刊国际化提供实证依据。
2. 研究内容
2.1. 语料来源
本研究选取两组摘要文本作为分析语料。第一组选自《湖北工业大学学报》,该刊为湖北省属高校主办的中文科技核心期刊,涵盖多个工程与科技学科。通过对该刊英文摘要的语言特征进行分析,有助于探讨国内学术期刊在英文表达中可能存在的共性现象,为进一步比较提供具体案例。另一组则选自国际顶尖学术期刊Nature,其英文摘要以语言精炼、结构严谨、信息密度高而成为国际学术写作的典范。
基于此,作者收集了2024年度《湖北工业大学学报》刊载的94篇理工类论文的英文摘要构成语料库A。为进行对照,同期从Nature期刊中随机抽取了94篇英文摘要构成语料库B。经统计,语料库A的总容量为15,217词,语料库B的总容量为19,270词。
在语料筛选环节,为确保语料的代表性与均衡性,作者采取了以下措施:对于语料库A,所选论文覆盖了源自《湖北工业大学学报》的机械工程、电气工程、材料科学、计算机科学等多个理工领域,以规避单一学科可能带来的分析偏差。针对对照语料库B,所选论文同样来自Nature期刊的生命科学、物理学、化学等多个前沿研究领域,以保证学科背景的多样性,为后续对比分析提供充分的素材支撑。通过系统比较这两组语料,可以更清晰地识别国内期刊在摘要英译实践中的主要问题与不足之处。
2.2. 研究方法
语料收集完成后,首先进行降噪预处理。具体步骤包括:将下载的PDF格式文档转换为Word格式,移除图片、表格等非文本元素,仅保留纯英文摘要文本。随后,将这些文本导出为TXT格式文件。鉴于导出的TXT文件可能存在多余空格及格式问题,使用“文本整理器”软件进行规范化处理,使其成为符合语料库检索软件要求的可读文件。
基于自建的《湖北工业大学学报》英文摘要语料库A,和Nature英文摘要语料库B,研究采用以下分析流程:① 基础计量分析:通过由英国语言学家Mike Scott开发的Wordsmith Tools软件,对两个语料库的形符数(Token)、类符数(Type)、类符/形符比(TTR)、标准类符/形符比(STTR)、高频词汇项以及平均句长等基础计量特征进行统计。语料库的计量分析与翻译语体特征研究均遵循语料库翻译学的核心研究范式[12]。② 语法特征分析:在使用词性标注工具TreeTagger对语料进行词性赋码后,借助由日本早稻田大学Anthony Laurence设计的语料库检索软件AntConc的正则表达式功能,对语料的语态特征(如主动/被动语态)以及动词时态特征进行检索与统计分析。
3. 结果及分析
3.1. 词汇特征分析
3.1.1. 词汇丰富性比较
本部分作者采用Wordsmith Tools软件,对两组语料库的类符(type)、形符(token)、类符/形符比(Type-Token Ratio, TTR)以及标准类符/形符比(Standardized Type-Token Ratio, STTR)进行统计,具体结果详见表1。
Table 1. Comparison of vocabulary richness
表1. 词汇丰富度比较
|
Token |
Type |
TTR |
STTR |
《湖北工业大学学报》 |
15,217 |
2677 |
17.59% |
37.73% |
Nature |
19,270 |
4394 |
22.80% |
49.08% |
类符(type)是指语料库中的不同词汇,或每个每一次单独出现的词形[13]。形符(token)是指语料库中出现的所有词形。类符/形符比(TTR)是指类符和形符之间的比例,可用于说明语料中词汇应用的变化性。类符/形符比越大,具体某一文本所用的词汇变化性越大,反之,则越小[14]。由于类符/形符比很容易受到文本长度或语料库容量的影响,Scott (2004)提出标准类符/形符比(Standardized Type-Token Ratio, STTR)。标准类符/形符比是指以1000个形符为单位,依次先后计算文本的类符/形符比,然后求出这些类符/形符比的平均值,便可求出标准类符/形符比。该指标的优点在于,即便语料库容量存在差异,也能直接用于比较不同文本的词汇多样性水平。依据梁茂成[15]等人的研究,STTR值越高,通常表明文本语言更为丰富,所承载的信息量也更大。
由表1数据可知,Nature的形符与类符数量均显著高于《湖北工业大学学报》,这初步说明Nature英文摘要在词汇总量和基础词汇多样性方面均占有优势。进一步观察词汇丰富度的关键指标STTR,Nature的数值(49.08%)比《湖北工业大学学报》(37.73%)高出11.35个百分点,这一显著差异表明Nature摘要的词汇变化性更强。例如,在表述“展示/证明/发现”这一语义时,Nature摘要展现出显著的动词多样性,灵活运用了诸如demonstrate、reveal、identify、show、find、establish等多个动词。然而《湖北工业大学学报》英文摘要在该语义的表达上则显得较为单一,其动词选择高度集中于show和find。类似地,在表达“导致/引起”概念时,Nature摘要同样采用了丰富多样的动词,包括cause、lead to、result in、induce、trigger、promote等。而《湖北工业大学学报》在该表达上亦呈现局限性,其动词使用主要集中于cause和lead to。
Nature期刊选词范围更广,有效避免了相同词汇的过度重复使用,其摘要能够更灵活、多样地表达复杂的学术概念与内容。相比之下,《湖北工业大学学报》英文摘要的词汇多样性相对不足,词汇选择的灵活性较低。这种局限可在一定程度上制约其学术表达的丰富性和精确性。
3.1.2. 高频词汇项比较
高频词汇项指在语料库中使用频率显著偏高的词汇。作者运用Wordsmith Tools软件的Wordlist功能,提取了两组语料库中出现频次最高的前20位词汇,统计结果详见表2和表3。
Table 2. Top 20 high-frequency words in corpus A
表2. 语料库A前20位高频词
Word |
Freq. |
Percent |
the |
1579 |
10.10% |
of |
803 |
5.14% |
and |
696 |
4.45% |
to |
255 |
1.63% |
is |
231 |
1.48% |
in |
226 |
1.45% |
A |
185 |
1.18% |
By |
140 |
0.90% |
was |
139 |
0.89% |
with |
121 |
0.77% |
on |
116 |
0.74% |
that |
115 |
0.74% |
for |
95 |
0.61% |
were |
91 |
0.58% |
results |
77 |
0.49% |
algorithm |
73 |
0.47% |
method |
73 |
0.47% |
are |
69 |
0.44% |
as |
66 |
0.42% |
this |
66 |
0.42% |
Table 3. Top 20 high-frequency words in corpus B
表3. 语料库B前20位高频词
Word |
Freq. |
Percent |
the |
878 |
4.39% |
of |
752 |
3.76% |
and |
683 |
3.42% |
in |
454 |
2.27% |
to |
371 |
1.86% |
a |
365 |
1.83% |
that |
249 |
1.25% |
we |
214 |
1.07% |
with |
187 |
0.94% |
for |
154 |
0.77% |
is |
151 |
0.76% |
by |
140 |
0.70% |
are |
104 |
0.52% |
on |
98 |
0.49% |
as |
97 |
0.49% |
from |
94 |
0.47% |
here |
91 |
0.46% |
cell |
88 |
0.44% |
these |
88 |
0.44% |
this |
83 |
0.42% |
数据显示,语法功能词(如冠词、介词、连词)在两个语料库中均占据主导地位,其在《湖北工业大学学报》语料库和Nature语料库中的占比分别为28.13%和22.64%。
作者进一步借助Wordsmith的Keywords功能进行对比分析,发现两组语料在定冠词“the”和不定冠词“a”的使用上存在显著差异,《湖北工业大学学报》中“the”的出现频次(1581次)远高于Nature期刊(878次)。相反,不定冠词“a”在《湖北工业大学学报》中的使用频次(194次)则明显低于Nature期刊(377次)。
上述对比说明,相较于Nature期刊,《湖北工业大学学报》摘要存在定冠词“the”使用过度而不定冠词a使用不足的现象,部分语料中存在冠词选择不当的问题。例如:
例1:
原文:“By analyzing the influence of the buffer status on the equipment of each station…”。(基于可用度评价的混联装配线缓冲区优化配置方法[J]. 湖北工业大学学报, 2024, (01))
分析:此处的“the equipment of each station”为泛指性表达,定冠词“the”可省略,以更符合英语表达习惯。
修改建议:“By analyzing the influence of the buffer status on equipment of each station…”。
3.2. 句法特征分析
基于Wordsmith Tools的句法层面检测,本部分作者重点考察了平均句长指标。平均句长是指翻译文本语句的平均长度。平均句长的计算以句号、问号和感叹号为标记[14]。统计结果如表4示:
Table 4. Comparison of syntactic features
表4. 句法特征比较
|
语料库总句数 (Sentences) |
每篇平均句数 |
平均句长 (Mean in words) |
《湖北工业大学学报》 |
503 |
5 |
36.12 |
Nature |
781 |
8 |
27.59 |
数据显示,《湖北工业大学学报》语料库共有503句,平均每篇摘要5句,每句平均36.12词;Nature语料库共781句,平均每篇摘要8句,每句平均27.59词。由此可见,国内期刊摘要的平均句数虽少于国际期刊,但单句长度却比后者多出8.53词,这表明前者的句法结构普遍更为复杂,而后者则呈现出显著的简洁性特征。在学术传播语境中,过长的句式可能增加认知负荷,不利于信息高效传递[16]。相较而言,Nature摘要的简明表达更符合国际学术文本的传播要求。例如:
例2:
原文:“Foundations of cement soil have many engineering problems such as limited strength improvement, large late deformation, and susceptibility to mechanical property deterioration under the corrosive effect of seawater.” (膨润土辅助微生物固化砂土的试验研究[J]. 湖北工业大学学报, 2024, (05))
分析:句子将“强度提升有限”“后期变形大”“海水腐蚀下力学性能易劣化”三个问题集中嵌套在“such as”结构中,修饰成分密集导致单句承载信息过多,符合国内期刊长句冗余的典型特征,不利于读者快速抓取核心问题。
修改建议:“Cement soil foundations face three key engineering challenges: limited strength improvement, significant late deformation, and mechanical property degradation under seawater corrosion.”
3.3. 语态特征分析
在英文写作中,恰当运用语态是一项基础要求,科技论文英文摘要的语态使用更是兼具规范性与灵活性[17]。Antconc正则表达式可以检索被动语态结构,检索前需对目标语料库进行词性标注处理[13]。作者利用Treetagger软件完成了对语料库的词性标注。显示信息设置为word + pos tag,其余按照默认选项运行。检索结果如表5所示:
Table 5. Comparison of the number of passive voices
表5. 被动语态数量比较
|
被动语态数量 |
《湖北工业大学学报》 |
397 |
Nature |
169 |
统计发现,国内外期刊英文摘要在语态方面相差较大,《湖北工业大学学报》被动语态出现了397处,而Nature期刊仅出现169处。前者英文摘要的被动语态使用频次远高于后者。
上述结果表明,国内期刊英文摘要存在被动语态的滥用现象。Nature在语态使用上灵活多样,不依赖于固定单一的语态形式,而是交替采用主动、被动语态及系表或主谓句型,既满足了意义表达的需要,又避免了因频繁使用单一语态使文章较为呆板的问题,而《湖北工业大学学报》的英文摘要在语态使用上相对单一,过多依赖被动语态,这可能会影响表达的生动性和简洁性[18]。同时,被动语态的过度使用会导致句子显得冗长且缺乏清晰的主语,增加读者理解的难度。此外,被动语态过度使用还可能掩盖研究的主体和责任归属,不利于突出研究者的贡献和主动性[19]。例如:
在描述实验过程时,国内期刊英文摘要可能会使用“Experiments were conducted to test the hypothesis”(实验被进行以检验假设),而Nature期刊的英文摘要则更倾向于使用“Researchers conducted experiments to test the hypothesis”(研究人员进行了实验以检验假设),后者通过使用主动语态,清晰地指出了行为的主体,使句子更加简洁明了。又如:“…a clock synchronization algorithm based on unscented Kalman filter is designed.”,(基于无迹卡尔曼滤波的精密时钟同步算法[J]. 湖北工业大学学报, 2024, (01))该句中的被动语态“is designed”导致表达拖沓,建议转换为主动语态,使其更加简洁:“…we design a clock-synchronization algorithm based on an unscented Kalman filter.”
3.4. 时态特征分析
时态是英文摘要写作的一个难点,其运用得正确与否直接关系到整篇摘要的质量。本部分作者通过Antconc软件的正则表达式功能,对两组语料的时态使用情况进行了统计,主要关注一般现在时、一般过去时、完成时态和进行时态的使用频次。统计结果如下:
3.4.1. 一般现在时
在学术摘要写作规范中,一般现在时主要用于描述普遍成立的研究结论、客观事实、规律或已知结论,以突出其时效性和普适性。通过对两组语料库的检索与统计,作者发现《湖北工业大学学报》语料库使用的一般现在时句为335个,Nature期刊为664个。两者数量都较多,这说明国内外期刊英文摘要均常选用一般现在时句。然而,Nature期刊一般现在时句为《湖北工业大学学报》的近2倍,这种差异反映了国际期刊更注重使用一般现在时来强调研究的普遍意义、当前有效性、研究结论或陈述普遍事实,而国内学者在翻译摘要时,可能受到原文时态习惯或翻译策略的影响,更倾向于用过去时来描述研究过程或具体发现。因此,国内学者在英译摘要时需注意时态的语境适配性,通过调整时态使用提升摘要的国际接受度。
3.4.2. 一般过去时
一般过去时主要用于描述本研究具体的、已完成的研究活动、方法、步骤和特定的、一次性的研究结果。检索结果显示,《湖北工业大学学报》语料库使用的一般过去时句为168个,Nature期刊使用的一般过去时句为127个。从绝对数量来看,两者差别不大,前者略高于后者。然而,结合两组语料库的总容量(语料库A 15,217词,语料库B 19,270词)来看,《湖北工业大学学报》的一般过去时使用密度明显高于国际期刊Nature,这一差异揭示了两种摘要写作在时态选择偏好上的重要区别。国际期刊作者在撰写摘要时,更倾向于将核心的研究背景、目的、普遍结论和客观事实置于一般现在时框架下阐述,仅在必须强调某个具体操作或特定发现发生在过去且已完成时才选用一般过去时。因此,尽管Nature期刊摘要篇幅更长,其过去时的使用数量反而低于《湖北工业大学学报》。
3.4.3. 完成时态
完成时态包括现在完成时、过去完成时、将来完成时和过去将来完成时。完成时在学术写作中常用于表示过去发生的动作对现在造成的影响或产生的结果,以及强调动作的完成性和持续性。统计结果显示,《湖北工业大学学报》语料库中现在完成时态出现17处,而Nature语料库现在完成时态则出现65处。同时,两组语料中各含有1个过去完成时态句,且均没有出现将来完成时和过去将来完成时。
显然,Nature期刊的英文摘要中完成时的使用频率远高于《湖北工业大学学报》的英文摘要。在学术摘要中更多地使用完成时,能够更精准地体现研究成果的积累和延续性,以及研究对当前领域的影响;而《湖北工业大学学报》的英文摘要完成时使用较少,这表明其在表达研究的关联性和成果的延续性方面稍显不足。
3.4.4. 进行时态
进行时态包括现在进行时、过去进行时、将来进行时和过去将来进行时。摘要中的进行时态可以用来展示现在这一期间正在进展中的研究和进行中的试验,或者陈述现在这一时期正在持续中的科学现象或研究状态。
检索结果表明,在Nature期刊英文摘要中,进行时态共出现8处,其中现在进行时6处,过去进行时和将来进行时各2处;相比之下,《湖北工业大学学报》的英文摘要中没有出现进行时态。在摘要中,无论对于国际期刊还是国内期刊,进行时都不是一种使用较多的时态,差别在于国际期刊作者对这种时态的使用稍多。在进行时态的四种形式中,现在进行时是最常用的。
4. 原因分析
4.1. 词汇层面
词汇差异源于三方面:一是国内作者多为非英语母语者,词汇深度与广度有限,翻译时过度依赖高频通用词,难以匹配国际期刊的丰富表达;二是译者对国际学术英语规范理解不足,重原文信息传递而轻英文摘要简洁多变的文体要求;三是缺乏专业审校,词汇单一、搭配不当等问题未被修正,最终导致译文词汇丰富性与准确性差距显著。
4.2. 句法层面
句法层面上的差异主要源于中文句式的负迁移。中文意合的流水句结构被译者机械套用,未按英文形合要求拆分重组,形成冗余复合句与臃肿从句,违背简洁原则。同时,译者对“一句一核心信息”原则掌握不足,单句承载过多修饰成分,且国内期刊平均句长偏高、审校未及时建议拆分。长句不仅降低信息密度,还因被动语态滥用加剧冗余,影响可读性与传播效率。
4.3. 语态层面
被动语态滥用主要源于期刊规范的结果,许多国内工程类期刊的投稿指南明确要求或习惯上偏好使用第三人称和被动语态,这使得作者为了满足发表要求而主动选择被动表达,形成了路径依赖。其次,传统学术写作观念的束缚也加剧了这一现象。国内学界长期受“科技文本需客观中立”的传统认知影响,认为被动语态能弱化主体、增强客观性,却忽视了国际学界早已转向“清晰、有力、主动”的表达趋势。最后,中西文化差异的深层作用也不容忽视。中国文化的集体主义倾向,使得研究者更倾向于隐去个人主体,避免将“我”或“我们”作为动作发出者置于主语位置;而西方文化的个体主义则鼓励作者在文本中明确自身贡献,这一差异直接反映在语态选择的偏好上。
4.4. 时态层面
时态差异主因是规范认知与翻译策略不足。国内译者对“现在时表结论、过去时述方法”的国际惯例理解不深,受中文时态隐性特征影响机械翻译;翻译以“忠实原文”为优先,缺乏时态动态调整意识,过度使用过去时、规避完成时,削弱成果累积性表达。此外,中西学术文化传统差异及国内时态训练不足,也加剧了时态误用问题。
4.5. 来源层面
根本差异在于摘要生成方式:国内英文摘要多由中文原文翻译而来,受原文语言结构、表达习惯与文化背景制约;国际顶尖期刊摘要则为作者直接英文创作,更注重语言流畅性与信息有效传递,二者生成逻辑的不同直接导致语言特征差异。
5. 改进建议
基于《湖北工业大学学报》与Nature英文摘要的对比分析,为提升国内学术期刊英文摘要质量、增强国际传播力,现提出核心改进建议:
首先,在词汇层面,需提升学者词汇量与国际学术表达敏感性,期刊联合专业机构开展培训,强化近义词辨析、术语精准使用等能力,借助权威语料库学习顶级期刊表达,建立专家双重审校机制。其次,在句法层面,需克服中文负迁移影响,践行“一句一信息”原则,拆分重组流水句、删减冗余,控制句长,审稿环节将句法简洁性列为核心评价标准。此外,在语态层面,需平衡主被动语态,更新学术观念,学习顶级期刊语态策略,明确主动语态适用场景,期刊修订投稿指南,摒弃片面强调第三人称的陈旧要求。时态上,要精准把握规范:一般现在时陈述背景、目的等,一般过去时描述研究方法与结果,现在完成时体现结果延续性,减少进行时误用,加强时态审查纠错。理念层面,要将英文摘要定位为“基于中文研究的英文再创作”,译者需具备学术写作意识,调整语言策略适配英文语境,期刊明确翻译与写作标准差异,鼓励跳出对等翻译思维。
提升质量需译者、作者、期刊等多方协同,通过加强培训、更新理念、优化审校、完善规范、借鉴国际经验,弥合差距,使英文摘要成为国际学术沟通桥梁,助力中国学术成果全球传播。
6. 总结
本研究通过对比《湖北工业大学学报》与Nature期刊英文摘要的语言特征,揭示了国内期刊在多个语言维度上的不足,具体包括:词汇丰富度有限、表达重复;句式冗长复杂,信息密度低;过度使用被动语态,主语模糊;时态选择偏重过去时,现在时与完成时使用不足。特别是针对学术写作与学术翻译之间的本质差异,本研究深入探讨了两者在语言特征上的不同表现及其成因,提出了针对性的改进建议。同时,本研究仍存在一定局限性:首先,所选语料来源较为单一,期刊类型与学科覆盖面有限,结论的普适性仍需通过更广泛的研究加以验证;其次,研究仅聚焦于语言特征,未深入探讨摘要内容结构、逻辑连贯性等对国际传播的影响;同时,未对译者背景进行差异化分析,可能忽略了个体因素对翻译质量的潜在影响。
基金项目
湖北省非物质文化遗产研究中心2025年开放基金项目。
项目名称:中国非物质文化遗产术语汉英对照语料库建设研究。
项目编号:HGFY202501004。
NOTES
*第一作者。
#通讯作者。