1. 引言
学术摘要作为传递科研成果、促进信息快速传播的重要媒介,在跨学科交流中发挥着不可替代的作用。随着学科交叉和融合趋势的不断强化,不同学科间的语言特征差异逐渐显现,为有效的跨学科沟通带来了诸多挑战,尤其是在学科写作规范的极端差异性下,例如计算机科学与应用语言学等学科交汇的场景中,研究者往往因学科话语特征差异而产生交流困难或误解。尽管当前学术界对学术摘要语言特征已有大量探讨,但对“学科性”(disciplinarity)这一核心概念的认识依然不足,跨学科语篇研究中对于不同学科话语实践如何塑造特定语言特征的解释力仍显薄弱。
本研究基于Hyland提出的社会建构主义理论[1],探讨学术共同体如何通过话语实践塑造不同学科的语言特征,进而揭示摘要语言特征差异背后的社会互动逻辑与建构机制。本研究旨在系统考察不同学科学术摘要在语言特征上的差异,揭示其背后的学科话语实践特征,为促进跨学科沟通的有效性提供理论依据与实践指导。
2. 文献综述部分
2.1. 摘要与跨学科研究
本研究的研究主体,摘要,是以提供文献内容梗概为目的、不加评论和补充解释、简明确切地记叙文献重要内容的短文。其基本要素包括研究的目的、方法、结果和结论,具有独立性和自明性,拥有与文献同等量的主要信息[2]。学术摘要语言特征研究对学术交流意义重大,相关研究从多方面展开。丁春指出,摘要具有浓缩论文信息、提供检索便利等作用,其语言应严谨,规范使用科学技术名词术语,且有统一写作格式[3]。梁晓鹏认为,摘要在内容上可分为说明型和资料型,写作时要考虑内容、结构和语言,语言上要简明,避免迂回表达,且引述词、时态语态、视角和要点排列等都要有特定规律[4]。这为针对学术摘要的相关研究的开展提供了清晰具体的方向与指标。刘永厚和张颖从语步结构、时态、语态三个角度对比中外学者论文摘要[5]。这些研究聚焦于学术摘要本身的语言特征,为学术写作和研究提供了重要参考,对提升学术交流质量有积极意义。然而,尽管已有研究在摘要语言特征方面积累了丰富成果,对于不同学科间摘要语言差异的系统对比仍显不足。
在当今学术研究领域,随着科技和产业革命的迅速推进,跨学科研究已成为学术界关注的热点之一。然而,跨学科研究在理论层面依旧存在许多模糊与分歧,尤其体现在对“学科交叉”、“跨学科”等概念的界定与分类上。王涛指出,学科性是高校跨学科演变的核心维度,但国内外跨学科分类尚未统一,概念的界定仍然存在不严谨和模糊之处[6]。回顾已有研究可以发现,20世纪国外学者曾提出多种分类方式,如OECD中提出的四类划分[7]、黑克豪森的六类划分以及Stember的五类划分[8]。这些分类方法为跨学科研究提供了重要理论框架,但同时也暴露出概念界定和分类的不统一性等问题。程工进一步指出,跨学科研究的有效开展需要共同的观念基础、相互适配的理论体系以及恰当的学科分工,强调了跨学科研究的长期性与艰巨性[9]。这些研究共同揭示了跨学科研究的理论挑战与必要性。
尽管跨学科研究在理论和分类上存在一定模糊性,但近年来,不同学科领域纷纷从实践角度探索跨学科研究的新视角与新方法,并逐渐形成了丰富的实践经验与案例。雷茜以多模态文体学为例,成功地将社会符号学的多模态话语分析理论与文体学知识融合,展现了超学科性研究的实践路径[10]。此外,聚焦语言使用的学科差异研究也在不断丰富:何中清和闫煜菲从元话语视角,对比数学和应用语言学论文的引言,揭示了学科属性对语言选择的具体影响[11];张磊和李雪红则聚焦于局部语法,探讨了软、硬学科及应用、纯理学科研究性论文中例举短语的意义特征,进一步揭示了学科文化与论证模式之间的差异[12]。与此同时,赵家明和杨梅将批评性语篇分析方法引入跨学科研究中,提出了理性与多元文化互动的思维范式融合,强调了跨学科研究在理论与实践中的双重价值[13]。这些研究共同表明,尽管跨学科研究路径多样,但均强调语言特征、话语实践与学科属性之间的内在联系,为本研究进一步探讨摘要句法特征与学科身份建构之间的关系奠定了理论基础。
2.2. 句法复杂度研究
句法复杂度是衡量语言产出中句法结构多样性与复杂性的关键指标,在众多语言研究领域有着重要应用。句法复杂度指语言产出中句法形式的复杂程度,也被称为句法复杂性或句法成熟度[14],通常包含句法结构的复杂特征和多样性两个维度[15] [16]。这一概念在二语习得、学术写作、翻译研究以及文本难度调控等领域备受关注,相关研究成果颇丰。
在二语写作研究范畴内,句法复杂度与学习者语言能力的关联性成为研究重点。钱隆和高松借助依存树库展开深入探究,结果显示,平均依存距离、宾语关系平均依存距离等基于依存语法的指标,能够精准区分汉语学习者的语言水平。具体而言,高级水平学习者往往倾向于运用更多低频率的依存关系,以此提升作文的句法多样性[17]。李慧娴、郑咏滟和秦文娟的研究则表明,精细化句法复杂度指标可作为综合型指标的有力补充,更为细致地呈现高质量作文的句法特征。例如,特殊疑问词引导的定语从句、动词后非谓语ing做补语等结构,均与写作质量存在紧密联系[18]。
在学术写作领域,不同学科的学术语篇在句法复杂度方面呈现出显著差异。李少杰、张琦和王英力针对海事领域展开研究,发现海洋工程、海商法和海洋运输这三个学科在句子长度、句式结构和短语结构上各具特点。其中,海商法因使用更多子句,致使句子更长;而海洋工程则更倾向于使用长句和专业术语[19]。高彦梅和周江平通过对比不同学科水平作者的学术论文摘要,揭示了语义密度和句法复杂度的分布规律。研究发现,母语作者的句法复杂度显著高于研究生和本科生[20]。上述研究对不同学科间语篇差异的分析路径与方法,为本研究提供了重要参考。
2.3. 当前研究
综上所述,已有研究对学术摘要功能、跨学科语言差异以及语言复杂度特征进行了广泛探讨,然而仍存在以下不足之处:首先,现有研究对跨学科学术摘要语言特征差异的系统对比不足,未能有效整合和量化不同学科在句法、词汇等层次上的差异;其次,对这些语言差异背后的社会建构机制仍需深入探讨,特别是从学术共同体话语实践的视角进行分析的研究甚少;此外,当前学术界对“学科性”(disciplinarity)的概念化尚显模糊,亟需理论层面的进一步完善和澄清。
鉴于上述研究现状与不足,本研究提出以下三个具体研究问题:
不同学科(计算机科学与应用语言学)在摘要语言特征(句法复杂度)上是否存在显著差异?
如何从社会建构主义视角解释这些语言差异背后的学科话语实践特征?
当前关于“学科性”(disciplinarity)概念化存在哪些不足,本研究如何填补这一理论缺口?
通过解决以上问题,本研究期望为跨学科话语实践与交流提供更加深入的理论阐释和实证依据。
3. 研究方法
3.1. 语料库构建
本研究构建了两个跨学科学术摘要语料库,分别来自应用语言学和计算机科学领域的核心期刊。鉴于近年来学术文本生成技术的发展对摘要撰写方式可能产生潜在影响,为确保数据的稳定性与一致性,本研究从每个学科中选取了7种国际著名且高影响因子的期刊,在每种期刊中随机选取了2021年及以前发表的25篇英文摘要,共收集摘要350篇。论文摘要从Scopus数据库中获取并整合,所有文本统一为UTF-8编码的.txt文件,以便后续语言学分析(表1)。
Table 1. Journal sources of research paper abstracts
表1. 研究论文摘要期刊
应用语言学期刊 |
计算机科学期刊 |
Applied Linguistics |
IEEE Trans. on Neural Networks and Learning Systems |
Journal of English for Academic Purposes |
IEEE Trans. on Pattern Analysis and Machine Intelligence |
English for Specific Purposes |
Journal of Machine Learning Research |
Journal of Second Language Writing |
Information Sciences |
System |
Journal of the ACM |
TESOL Quarterly |
Knowledge-Based Systems |
Journal of Pragmatics |
Expert Systems with Applications |
在分析前,我们先对所有摘要文本进行了基础的数据清洗,包括删除非英文字符和带有样式符号的文本,并符合统一格式。最终语料库的描述统计如下表2:
Table 2. Corpus of research paper abstracts
表2. 研究论文摘要语料库
|
摘要总数(篇) |
总词数(词) |
最短摘要(词) |
最长摘要(词) |
平均长度(词/篇) |
标准差 |
应用语言学摘要 |
175 |
31549 |
95 |
312 |
180.00 |
32.06 |
计算语言学摘要 |
175 |
33759 |
68 |
362 |
193.50 |
66.84 |
3.2. 理论基础
本研究采用Hyland提出的社会建构主义学术写作理论作为分析基点[1],观察并证明不同学科摘要语言特征的变异机制。社会建构主义认为,语言是在社会中被构建出来的,它是学术社群进行知识构造、权威确立和人身识别形成的关键手段。Hyland指出,不同学科中的语言样态,反映了学科社群对于知识表达方式和学术交流的隐性约束。根据这个理论,应用语言学有着较强的理论表达和论证路径,因此常通过复杂句和从句展示推理过程;而计算机科学则更倾向合理精简的名词表达,展示信息密度和术语化的特点。
因此,社会建构主义不仅能用于证明摘要语言特征上的学科差异,更能用于揭示其背后的论证逻辑和社会动因。
3.3. 句法分析工具与指标选择
本研究采用TAASS (Tool for the Automatic Analysis of Syntactic Sophistication and Complexity) [21]作为主要的句法复杂度分析工具,配合L2 Syntactic Complexity Analyzer [22]以补充传统指标的提取,力图从整体复杂度与具体结构两个层面综合刻画跨学科摘要的句法复杂度特征。
首先,L2 Syntactic Complexity Analyzer提供了14项广泛使用的传统句法复杂度指标,主要涵盖五大维度:产出单位长度、句子整体复杂度、从属结构比率、并列结构使用,以及短语复杂度。该分析器已被大量研究证实具有良好的信度和效度[22] [23],特别适用于探测学术语篇的宏观句法特征(表3)。
Table 3. Traditional syntactic complexity measures in L2SCA
表3. L2SCA中的传统句法复杂性指标
|
类型 |
指标名 |
1 |
平均句子长度 |
MLS |
2 |
平均T单位长度 |
MLT |
3 |
平均从句长度 |
MLC |
4 |
从句密度 |
C/S |
5 |
动词短语密度 |
VP/T |
6 |
从句密度(T单位) |
C/T |
7 |
依附从句密度(从句) |
DC/C |
8 |
依附从句密度(T单位) |
DC/T |
9 |
T单位密度 |
T/S |
10 |
协调结构密度(T单位) |
CT/T |
11 |
句法结构密度(T单位) |
CN/T |
12 |
句法结构密度(从句) |
CN/C |
13 |
从属结构密度(T单位) |
CP/T |
14 |
从属结构密度(从句) |
CP/C |
其次,考虑到传统指标无法揭示语言结构的具体语法构造差异,本研究进一步引入从TAASSC选取的9项句法精细度指标,聚焦学术文本中语法结构的使用频率、稳定性与变异性。从表4可以看到,这些精细指标能揭示不同学科在构式选择策略、术语表达偏好及句法典型性方面的差异,适合细致比较摘要写作中的语言实践。
Table 4. Fine-grained syntactic measures from TAASSC employed in the study
表4. 研究中采用了TAASSC的细粒度句法度量
|
类型 |
指标名 |
1 |
结构使用频率 |
CFreqA |
2 |
学科典型搭配 |
LCFreqA |
3 |
术语主流性 |
CRefPctA |
4 |
动词主导结构 |
FaithVCA |
5 |
动词搭配强度 |
DeltaPVCA |
6 |
结构使用多样性 |
CTTRA |
7 |
共现强度 |
CollexRA |
8 |
高频搭配统计稳健性 |
CFreqLogAll |
9 |
泛结构变异性 |
CFreqSDAll |
注:A代表学术。
最后,考虑到学术英语中名词短语在传递信息密度、实现名词化策略中的关键作用[24] [25],本研究补充引入TAASSC中的6项名词短语复杂度指标,用以衡量det (限定词)、amod (形容词修饰)、prep (介词短语修饰)、vmod (动词短语修饰)、nn (名词堆叠)和rcmod (定语从句)等依存结构在名词短语中的平均出现频率。这一维度有助于揭示不同学科在语法压缩与名词化表达方面的倾向(表5)。
通过结合TAASSC和L2SCA两套工具,本研究能够在整体结构复杂度与细颗粒语法特征之间建立起互补的指标系统,从而多层次地呈现不同学科摘要在句法使用上的特征。
Table 5. Fine-grained phrasal measures from TAASSC employed in the study
表5. 研究中采用了TAASSC的细粒度短语度量
|
类型 |
指标名 |
1 |
每个名词短语中形容词修饰语的平均数量(不含代词) |
Adj/N |
2 |
每个名词短语中定语从句的平均数量(不含代词) |
RC/N |
3 |
每个名词短语中介词短语的平均数量(不含代词) |
Prep/N |
4 |
每个名词短语中名词作依存项的频率(不含代词) |
NN/N |
5 |
每个名词短语中限定词数量 |
Det/N |
6 |
每个名词短语中动词性修饰成分的平均数量 |
Vmod/N |
3.4. 数据分析方法
本研究在通过TAASSC工具提取各类句法复杂度指标后,使用R语言对所得数据进行了统计分析。考虑到本研究关注的两组语料来自两个相对独立的学科范畴,且样本数量一致(均为175篇),因此采用独立样本t检验(independent samples t-test)来检验不同指标在两组语料间是否存在显著性差异。
鉴于本研究同时检验的语言学指标数量较多,若单独逐项进行显著性检验,可能会提升第一类错误(Type I error)发生的概率。为此,我们引入Bonferroni校正对多重比较结果进行了调整,从而提高整体分析的稳健性。此外,考虑到统计显著性并不能完全反映实际差异的强度,我们进一步计算了每个比较项的效应量(Cohen’s d),以量化组间差异的实际影响力。根据Cohen的标准[26],效应量大小可分为小(d = 0.2)、中(d = 0.5)和大(d = 0.8)三个等级。
由于样本容量较大(总共350篇),依据中心极限定理,即便原始数据未严格满足正态分布的假设,独立样本t检验仍具备良好的鲁棒性,因此未进行额外的正态性检验。
4. 结果
4.1. 粗粒度句法复杂度指标
如表6所示,在14个L2SCA句法复杂度指标中,共有7项在两个学科间存在统计显著差异。具体而言,应用语言学(AL)摘要在MLS (句子长度)、MLT (T-unit 长度)、CP/T (主从复合句占比)、CP/C (复合句中主从句比例)、CN/T (每T-unit中复杂名词短语数量)、CN/C (每从句中复杂名词短语数量)以及VP/T (动词短语密度)方面均显著高于计算机科学(CS)摘要。上述差异的t值范围为2.695至5.875,p值经Bonferroni校正后均小于0.05,对应的效应量d范围在0.372至0.796之间,表明这些差异不仅具有统计显著性,也具备中等至较大的实际效应。其余指标均未达到显著性水平。
Table 6. Differences between AL and CS abstracts on L2SCA
表6. AL和CS摘要在L2SCA上的差异
指标 |
Mdn (Q1, Q3) |
t |
p |
d |
AL |
CS |
MLS |
28.12 (25.36, 31.10) |
25.06 (22.24, 28.32) |
4.615 |
<0.05a |
0.596 |
MLT |
26.70 (23.14, 29.42) |
23.95 (20.65, 26.88) |
3.872 |
<0.05a |
0.519 |
MLC |
17.02 (14.14, 19.32) |
16.21 (13.68, 17.81) |
1.720 |
0.097 |
0.239 |
C/S |
1.72 (1.44, 1.88) |
1.62 (1.32, 1.86) |
2.024 |
0.074636 |
0.280 |
VP/T |
2.51 (2.04, 2.86) |
2.29 (1.92, 2.62) |
2.695 |
<0.05a |
0.372 |
C/T |
1.61 (1.38, 1.77) |
1.52 (1.27, 1.73) |
1.942 |
0.081254 |
0.265 |
DC/C |
0.41 (0.29, 0.43) |
0.32 (0.22, 0.41) |
2.254 |
0.057558 |
0.305 |
DC/T |
0.60 (0.39, 0.76) |
0.52 (0.27, 0.69) |
1.913 |
0.083873 |
0.261 |
T/S |
1.09 (1.00, 1.51) |
1.07 (1.00, 1.13) |
1.146 |
0.288527 |
0.157 |
CT/T |
0.46 (0.34, 0.58) |
0.41 (0.24, 0.56) |
1.998 |
0.072529 |
0.276 |
CP/T |
1.06 (0.71, 1.28) |
0.70 (0.42, 0.91) |
5.875 |
<0.001a |
0.796 |
CP/C |
0.68 (0.45, 0.84) |
0.51 (0.27, 0.65) |
4.798 |
<0.001a |
0.652 |
CN/T |
4.12 (3.42, 4.71) |
3.53 (2.88, 4.08) |
4.317 |
<0.05a |
0.601 |
CN/C |
2.68 (2.12, 3.12) |
2.41 (1.89, 2.70) |
2.823 |
<0.05a |
0.395 |
注:Mdn表示中位数;Q1表示第一四分位数;Q3表示第三四分位数。a表示p值显著。此处的p值均为经过Bonferroni校正后的结果。加粗的指标表示在统计上存在显著差异。
4.2. 句法精细度指标
表7展示了9个TAASSC句法精细度指标的比较结果。其中,仅有LCFreqA (词素构式组合频率-学术语域)在两个学科之间存在显著差异。具体来看,AL显著低于CS (Mdn = 13210.67 vs. 21762.45, t = −3.976, p < 0.01, d = −0.542),表明计算机科学摘要中出现更高频的构式搭配。其余指标,包括构式频率、搭配强度、构式多样性等,虽然在均值或中位数上存在一定差异,但在统计上均未达到显著水平。
Table 7. Differences in syntactic refinement between AL and CS summaries
表7. AL和CS摘要在句法精细度上的差异
指标 |
Mdn (Q1, Q3) |
t |
p |
d |
AL |
CS |
CFreqA |
154863.92 (102841.13, 199325.41) |
160887.61 (130442.83, 197102.79) |
−0.983 |
0.398 |
−0.139 |
LCFreqA |
13210.67 (2054.76, 21948.82) |
21762.45 (4883.09, 30314.10) |
−3.976 |
<0.05a |
−0.542 |
FaithVCA |
0.07 (0.05, 0.08) |
0.07 (0.05, 0.08) |
−0.418 |
1 |
−0.059 |
DeltaPVCA |
0.04 (0.03, 0.05) |
0.04 (0.03, 0.05) |
0.235 |
1 |
0.041 |
CollexRA |
5.20 (1.26, 8.21) |
4.62 (1.45, 6.82) |
1.144 |
1 |
0.162 |
CTTRA |
0.85 (0.77, 0.94) |
0.84 (0.78, 0.92) |
0.434 |
1 |
0.062 |
CRefPctA |
0.88 (0.85, 0.92) |
0.88 (0.86, 0.94) |
−0.958 |
1 |
−0.135 |
CFreqLogAll |
4.76 (4.54, 4.98) |
4.85 (4.65, 5.07) |
−2.318 |
0.14135 |
−0.320 |
CFreqSDAll |
895372.26 (770145.08, 1069435.70) |
917451.18 (862201.37, 1048856.62) |
−1.104 |
1 |
−0.156 |
注:A表示学术。Mdn表示中位数;Q1表示第一四分位数;Q3表示第三四分位数。a表示p值显著。此处的p值均为经过Bonferroni校正后的结果。加粗的指标表示在统计上存在显著差异。
4.3. 名词短语复杂度指标
在6项名词短语复杂度指标中,除Vmod/N外,其余5项均达到显著性水平(见表8)。其中,CS摘要在Det/N、Adj/N、NN/N和RC/N上均显著高于AL,t值分别为−7.214、−6.389、−7.348和−3.176,p值均小于0.05,且效应量均为中等至大(d范围:−0.422至−0.935)。唯一未达到显著差异的是Vmod/N,说明两组语料在使用动词性修饰语方面并无明显差异。
Table 8. Differences in noun phrase complexity between AL and CS abstracts
表8. AL和CS摘要在名词短语复杂度上的差异
指标 |
Mdn (Q1, Q3) |
t |
p |
d |
AL |
CS |
Det/N |
0.27 (0.21, 0.33) |
0.38 (0.29, 0.47) |
–7.214 |
<0.001a |
–0.912 |
Adj/N |
0.35 (0.28, 0.43) |
0.47 (0.38, 0.55) |
–6.389 |
<0.001a |
–0.802 |
Prep/N |
0.29 (0.25, 0.35) |
0.27 (0.21, 0.32) |
4.112 |
<0.001a |
0.562 |
Vmod/N |
0.04 (0.02, 0.07) |
0.04 (0.02, 0.07) |
1.214 |
1 |
0.170 |
NN/N |
0.20 (0.13, 0.26) |
0.33 (0.23, 0.42) |
–7.348 |
<0.001a |
–0.935 |
RC/N |
0.02 (0, 0.04) |
0.04 (0, 0.06) |
–3.176 |
<0.05a |
–0.422 |
注:Mdn表示中位数;Q1表示第一四分位数;Q3表示第三四分位数。a表示p值显著。此处的p值均为经过Bonferroni 校正后的结果。加粗的指标表示在统计上存在显著差异。
综上所述,应用语言学摘要在整体句子长度及从句使用方面表现出更高的复杂度,而计算机科学摘要则在名词短语内部结构上更为复杂和精密。这一差异初步验证了两个学科在语法构式偏好与信息组织方式上的不同倾向。
5. 讨论
5.1. 学科属性对摘要语言特征的影响
本研究的结果表明,不同学科的摘要在语言特征上存在显著差异。在结果中已经提到,应用语言学(AL)摘要在MLS (句子长度)、MLT (T-unit长度)、CP/T (主从复合句占比)、CP/C (复合句中主从句比例)及CN/T (每T-unit复杂名词短语数量)等句法复杂度指标上显著高于计算机科学(CS)摘要。这种差异说明应用语言学倾向于使用更复杂的句法结构,以此来清晰呈现逻辑论证和理论推导的过程[1]。此外,AL学科常涉及抽象概念的深入阐释与理论探讨,而长句和复杂从句的频繁使用恰好能满足此需求[27] [28]。例如:
Ex. 1 “Examples are forms of code glosses similar to reformulations that help readers understand writers’ intended meanings…” (AL)
这个句子不仅嵌套了多个从句,还通过复合结构展开复杂观点,体现了语言学摘要中论证的细致性。相比之下,计算机科学摘要语言的相对简洁则突显其信息传递效率导向,这与学科以实验方法和技术细节描述为核心特征的惯例密切相关[24] [29]。例如:
Ex. 2 “In this paper, we propose a novel hierarchical Bayesian model and an efficient estimation method…” (CS)
这个例子中,CS的摘要开篇直接陈述研究目的与方法,结构直白、句式精练,体现了该学科重效率、轻修辞的语言风格。
名词短语复杂度分析的结果进一步验证了这一差异。CS摘要中Det/N、Adj/N和NN/N的使用显著高于AL摘要,表明计算机科学领域更多地通过名词堆叠和术语凝练实现信息的高度压缩。以语料中的表述为例,kNNs等词汇的使用便展示了计算机科学中十分典型的嵌套名词结构和技术术语的堆叠,相比之下,AL摘要表现出更高的Prep/N使用频率,通过介词短语扩展信息,有助于强调研究路径与过程的逻辑清晰性。
Ex. 3 “…the training samples located in the leaf nodes, their kNNs, and the nearest neighbor of these kNNs…” (CS)
Ex. 4 “…based on an automatic search of potential candidates then a manual annotation was performed using the UAM Corpus Tool…” (AL)
5.2. 摘要语言差异的社会建构主义解释
根据社会建构主义理论,学术语言不仅仅是知识传播的媒介,更体现学科社群长期形成的社会话语规范[1]。本研究揭示的学科语言差异正是学科社群话语规范长期塑造的结果。
应用语言学的高句法复杂度展示了该学科对逻辑严谨性和理论精密性的追求[1] [30]。该学科的学术社群倾向通过细致的语言结构和复杂的从属关系表达理论推导的严密逻辑。如AL语料中的句子就展示出典型的逻辑推理句式以及结构对称性,体现其理论内聚力与论证深度。
相对而言,计算机科学的语言风格则体现出明确的学科规范,即语言表达需高度精炼和信息化[31]。这一特点也与其学术实践密切相关,如实验研究结果的直接展示、技术描述的明确性等,推动学科社群形成了精简、术语化的语言表达方式。CS摘要常见表述中经常直接呈现研究效果,重实证轻论证,契合工程技术学科强调输出导向的写作惯例。
Ex. 5 “…the equivalence between the units exemplified and those exemplifying seems to be governed by the degree to which exemplifying units are expanding or compacting…” (AL)
Ex. 6 “…the CommPPO algorithm gained more rewards and achieved the largest fuel consumption reduction (11.6%)…” (CS)
社会建构主义理论在一定程度上帮助解释了不同学科群之间存在的语言差异,这种语言差异不仅源于个体偏好,更源于学科共同体内部稳定的社会认知与话语实践,从而提供了更深入的理论视角。
5.3. 本研究对学科性(Disciplinarity)概念化的贡献
本研究在语言维度上为“学科性”(disciplinarity)的概念化提供了具体的证据支持和理论深化。过往的学科性研究多停留于宏观视角,关注学科边界与跨学科合作形式[6] [9]。本研究通过对摘要语言特征的详细分析,展示了不同学科在具体语言使用上的差异,这种微观视角丰富了对学科性的理解。
尤其是通过句法复杂度、句法精细度与名词短语复杂度的具体对比分析,本研究明确揭示了学科社群如何通过语言实践规范其内部交流[22] [32]。例如,CS摘要中“…computes the same tight bounds in polynomial time…”这样的表达高度术语化、抽象而简洁,显示该学科对于语言形式统一和技术精确度的重视;而AL摘要如“…presenters in the hard sciences… make more use of the interactional features…”则展现出对语篇参与性和人文表达维度的更高重视。
从这个意义上,本研究为学科性提供了语言学实证基础,并开辟了研究学科特征的新途径。未来的研究可以考虑扩展到更多学科,或引入更多层面的语言特征以进一步拓展“学科性”的语篇建构视角。
综上所述,本研究不仅证实了学科属性对语言使用的深刻影响,更推动了学术话语研究在理论和方法论层面的深入发展。
6. 结论与启示
本研究旨在从跨学科视角探讨应用语言学(AL)与计算机科学(CS)期刊摘要在语言特征上的差异。研究发现,AL摘要更倾向于使用复杂的句法结构,这体现在其较高的句子平均长度、从句密度以及名词短语复杂度等指标;与之相对,CS摘要则更频繁地运用名词堆叠与术语化表达,显著体现于限定词、形容词修饰和名词修饰等指标。这些结果回应了本研究提出的核心问题,证实了不同学科的摘要写作风格存在显著差异。
从理论层面来看,本研究为Hyland所提出的社会建构主义学术写作理论提供了有力的实证支持。研究表明,学术语言不仅是一种单纯的信息传递媒介,更承载着学科共同体内部存在的知识建构与社会认同功能。通过具体的句法与名词短语结构分析,本研究进一步丰富了“学科性”(disciplinarity)的概念内涵,揭示了不同学科在知识生产与传播过程中如何通过特定的语言实践实现学科身份与规范的建构。此外,本研究所使用的句法精细度与名词短语复杂度指标,有效弥补了传统句法复杂度研究的宏观局限,为不同学科语言特征分析提供了更细致和深入的方法论工具。
实践层面,本研究对学术写作教学具有明确的启示意义。针对AL领域,教师应侧重培养学生的逻辑推理与复杂句结构使用能力;而在CS领域,教学则应更加关注如何实现信息的精准、简洁与高效表达。本研究的成果也有助于增强跨学科科研合作中的语言敏感性,提醒研究人员注意因术语及句法差异可能带来的理解障碍,以更有效地实现跨学科间的沟通。此外,本研究所识别的语言特征指标也为摘要自动生成技术与语料驱动写作辅助工具的开发提供了切实有效的参考依据,有望帮助相关技术更好地适应跨学科的写作需求。
不过,本研究仍存在一些值得关注的局限性。首先,尽管本研究选取的学科在一定程度上可代表工科和文科所具有的学科写作规范的极端差异性,但研究所选样本也仅限于2门学科范畴(AL和CS)的14本英文学术期刊,研究结果在更广泛的具体学科(如医学、社会学、环境科学等)、期刊类型与语言背景下的普适性尚待进一步检验,语料库规模有待进一步扩大。其次,TAASSC工具在依存结构识别过程中存在一定误差,可能对部分指标的准确性产生一定影响。此外,本研究仅采用了社会建构主义单一的理论视角进行阐释,未来研究中可以引入批评话语分析或认知语言学等多样化理论视角,以更全面地阐明学科话语实践的复杂性。
未来研究可在现有基础上进一步拓展分析的学科范围,如涵盖医学、社会学和环境科学等领域,以验证并丰富跨学科语言差异的理解。同时,也建议未来研究探索多模态特征与文本语言的交互作用,特别是图表与配图如何与文本共同建构意义。此外,结合语步结构与句法特征的交叉分析,也将进一步深化我们对学科话语规范与社会建构机制的认知与理解。