1. 引言
企业年度报告作为公司的关键信息披露文件,是企业向全球相关投资者展示自身商业功绩的重要窗口。华为技术有限公司(以下简称“华为”)和苹果公司(以下简称“苹果”)分别为中美两国顶尖科技类公司,其企业年度报告在两国商业领域具有代表性作用,对二者年报的对比研究可以揭示中美两国科技类公司在企业治理、经营理念、可持续发展战略以及价值观的不同侧重,并基于研究结果可为科技类中企的英文年报撰写提供有益参考。
在中国知网中以“企业年报”为关键词,并以“外国语言文学”为学科类别进行检索,得到93条结果,剔除部分不相关文献之后,最终得到90条可用结果。图一为基于CiteSpace关键词分析功能对已得到的90条结果进行可视化后的关键词共现图谱,详情见图1:
Figure 1. Co-occurrence map of keywords in corporate annual reports
图1. 企业年报关键词共现图谱
由图1可知,从关键词分布来看,国内外语言学界针对企业年报的研究主要聚焦于翻译策略、语料库应用、评价理论及情感分析等方面,例如,卢珊通过研究华为与苹果2024年英文年报,多维度分析了两家巨头年报叙事话语特征、语域功能差异以及翻译策略[1];部寒、王立非建立了约1800万词符的企业财务英语语料库,基于可读性研究框架测量并对比分析了中美企业财务语篇的可读性[2];黄志华、刘沙沙、钟玉兰采用评价理论作为分析框架,聚焦于人际意义这一维度,以探讨联想公司英文企业年报如何有效地传递企业信息、表达企业立场、塑造企业形象[3];Azimi Mehran、Agrawal Anup采用深度学习模型分析了1993~2017年间美国众多上市企业年报,并指出年报中异常积极的情感表达是一个“预警信号”[4]。此外,部分关键词如“企业身份”“企业形象”的呈现指出了相关研究不单关注文本语言层面的表达,还强调在传播商业文化过程中的语篇功能,例如,乌楠、张敬源以华为2017年年报为语料,从主题互文策略入手,探究年报语篇主题互文策略的实现方式及企业形象的维护[5]。
总体而言,现有研究从理论构建与实证分析两方面推动了企业年报语篇的理解,呈现出多视角、多层级的探讨格局。然而,多数研究仍聚焦于单一语种、单一企业或局部语言现象,缺乏基于大规模语料、系统对比中美企业年报整体语言特征的研究。尤其缺乏在长时段内对代表性科技企业年报语言演变的跟踪分析,以及结合语言特征与企业传播策略的整合性探讨。因此,本文以华为与苹果近十年(2015~2024)官方年度报告为研究对象,旨在揭示两者在语言特征上的差异,并结合两者企业年报的撰写优点,为科技类中企“走出去”过程中如何撰写英文年报来树立企业形象和宣传企业文化、价值观提出相关建议及有效参考。
2. 研究设计
2.1. 研究问题
本文依托语料库数据分析工具,从词汇、句法、语义三个层面对华为和苹果官方企业年报进行系统对比分析,主要聚焦于以下两个核心问题:
1. 华为和苹果官方企业年报在词汇、句法、语义三个层面上有哪些差异?
2. 相关科技类中企英文年报的撰写可以在哪些方面得到改进?
2.2. 研究语料
本文研究语料为2015~2024年官方发布的华为企业年报英文版(来源:https://www.huawei.com/en/annual-report)和苹果企业年报(来源:https://investor.apple.com/investor-relations)。经统计,2015-2024年的华为官方企业年报英文版总形符数为640,221,苹果官方企业年报的总形符数为467,316。两者均为科技类公司官方企业年报,在性质、目的、时间跨度上有很大的相似度,具有较强的可比性。
2.3. 研究工具和方法
本研究首先将使用一款作者署名为“风林”的免费软件“文本整理器”对前文所得到的语料分别进行文本清理,大致包括文字符号类、空格段落类以及标点符号类的清理;随后使用WordSmith Tools中的WordList功能分别对已清理好的语料进行类符/形符比、词长、高频词、单现词、句长部分指标的数据统计;再运用Python工具分别对语料文本进行自动词性赋码,结合WordSmith Tools Concordance功能进行特定词性检索完成词汇密度和衔接结构方面的数据统计;最后利用Wmatrix7工具分别对语料文本进行语义层面分析。
3. 结果与讨论
本部分内容将涵盖华为官方企业年报英文版与苹果官方企业年报在词汇、句法、语义三个层面特征的详细数据统计,并根据数据对比进行讨论,再进一步针对相关科技类中企的企业年报的撰写提出有益建议。
3.1. 词汇层面特征
本文对比的词汇层面特征主要包括以下四个方面:词汇丰富度、词汇复杂度、词汇密度、范化特征和创造性程度。
1. 词汇丰富度
词汇丰富度是文本分析中的一个重要数据指标。衡量一个文本的词汇丰富度通常用类符/形符比(TTR)来表示。形符等同于日常口语中的“词”,类符作为一个统计量,指的是语料库文本中任何一个独特的词形[6]。需要指出的是,当文本篇幅存在显著差异时,直接采用类符/形符比进行词汇丰富度测量会存在明显局限性。因此,为了有效规避篇幅变量对研究结果的干扰,我们常使用标准化类符/形符比(STTR)作为核心评估指标。其计算方法是通过计算语料文本每1,000词的类符/形符比,再求得到的类符/形符比的平均值,最后得到的数值即为标准化类符/形符比。本研究使用WordSmith Tools工具中WordList功能下的Individual statistics页面分别对华为官方企业年报英文版与苹果官方企业年报进行词汇丰富度数据分析,具体数值见表1。
Table 1. Lexical richness comparison
表1. 词汇丰富度比较
|
华为 |
苹果 |
类符 |
45,366 |
9,103 |
形符 |
640,221 |
467,316 |
STTR (%) |
45.49 |
32.45 |
STTR标准差 |
54.28 |
66.09 |
Significance (P) |
0.000 |
—— |
在文本中,类符/形符比值越高,则可以从某种层面上反映出词汇的使用更加丰富[7]。从表1可以看出,华为企业年报的标准化类符/形符比(45.49%)高于苹果企业年报的标准化类符/形符比(32.45%),且卡方检验(UCREL Significance Test System)表明两者差异具有统计学显著性。由此可以看出,在词汇丰富度层面,华为企业年报用词种类更多,选词范围更广。造成华为企业年报词汇丰富度高于苹果这一结果的原因可能为前者长期处于复杂的国际环境及贸易政策中,为规避国际舆论、贸易壁垒等风险,其年报文本话语除披露财务信息之外,还带有一定的外交色彩。
2. 词汇复杂度
文本的词汇复杂度通常可通过平均词长来衡量,即文本中形符(单词)平均所含字母的数量。词长标准差可反映单词长度在平均词长数值上下浮动的程度[8]。本文继续沿用上一部分词汇丰富度数据分析方法,得到表2数据,并将字母词数分布数据导入Excel,生成标准化后的字母词数统计图,详见图2。
从表2可见,华为企业年报的平均词长和词长标准差都大于苹果,这说明华为企业年报在词汇选择上更倾向于使用较长、较复杂的单词。这种用词倾向可能会在一定程度上增加读者在阅读和理解主旨时的认知负担。进一步结合图2数据可知,华为企业年报在7个字母及以上词汇的使用频率(37.42%)明显高出苹果企业年报(30.61%),这在一定程度上可能增加了文本的整体阅读难度。
Table 2. Comparison of average word length
表2. 平均词长比较
|
华为 |
苹果 |
平均词长(个字母) |
6.19 |
5.55 |
词长标准差 |
3.92 |
3.41 |
Figure 2. Distribution of letter word count after standardization
图2. 标准化后字母词数分布图
3. 词汇密度
词汇密度是衡量文本信息量和阅读难度的重要量化指标,通常指实词(如名词、动词、形容词、副词)在文本总形符中的占比。本研究首先使用Python工具(使用NLTK工具包)分别对华为和苹果企业年报进行自动词性赋码,然后利用WordSmith中的Concordance功能对已赋码的文本进行检索,统计出各种实词词类的形符数量,最后计算得到词汇密度,具体数据见表3。
Table 3. Statistical data on notional words and lexical density
表3. 实词及词汇密度统计数据
|
华为 |
苹果 |
名词 |
274,737 |
194,304 |
形容词 |
66,864 |
51,544 |
副词 |
15,515 |
11,550 |
动词 |
88,946 |
58,706 |
实词形符数 |
446,062 |
316,104 |
词汇密度(%) |
69.67% |
67.64% |
Significance (P) |
0.000 |
—— |
Ure的研究表明,书面语文本的词汇密度通常大于40% [9]。根据表3可知,华为和苹果企业年报的词汇密度都高于40%,且华为企业年报的词汇密度显著高于苹果。由此可见,华为企业年报的信息量更大,由词汇密度反映出的阅读难度上较苹果企业年报更高。
对不同词性的统计可以进一步揭示文本的范化特征。例如,华为企业年报的名词形符占比为42.91%,而苹果企业年报的名词形符占比为41.58%。尽管英语语言系统本身具有较强的名词化倾向,华为企业年报通过特定的翻译策略使得这一倾向更为突显,使得文本信息量更高,增强了文本的正式程度,同时也体现了英译文本的范化特征。
4. 范化特征
范化特征在一定程度上体现文本的语言规范性。范化是翻译共性的一种,指的是译者在翻译过程中存在“遵从甚至夸大目的语典型特征和做法的趋势”[10]。名词化词缀是英语的典型语言特征之一[11]。Biber提出,后缀tion/sion、ment、ness和ity及对应的复数形式可体现名词化[12]。本文使用WordSmith Tools工具中的Concordance功能,对华为和苹果企业年报中的名词化词缀进行统计。一般而言,名词化词缀使用率较高,往往体现出更明显的范化特征,并在一定程度上增强了语言的规范性和正式程度。相关统计数据见表4。
Table 4. Comparison of nominalizing affixes
表4. 名词化词缀比较
|
华为 |
苹果 |
总形符数 |
640,221 |
467,316 |
名词化词缀频数 |
36,062 |
18,966 |
名词化词缀频率(%) |
5.63 |
4.06 |
Significance (P) |
0.000 |
—— |
根据表4可知,华为企业年报中的名词化词缀频数为36,062,频率为5.63%;苹果企业年报中的名词化词缀频数为18,966,频率为4.06%。华为企业年报名词化词缀使用频率显著高于苹果。这一结果表明,华为企业年报更倾向于使用目的语中典型的名词化结构,体现出较为突出的范化倾向,并在语体上呈现出具有较强的规范性。
5. 创造性程度
单现词指的是在语料文本中只出现过一次的词汇,可以通过比较单现词的比例来衡量语料文本创造性程度。单现词所占比例越低,说明该语料文本创造性程度越低。Kenny [13]和胡显耀[14]等曾在各自的研究中使用单现词作为一个衡量语料文本创造性程度的变量。本研究利用WordSmith Tools工具中WordList功能下的Frequency页面分别统计华为和苹果企业年报中的单现词频次,具体统计数据如表5所示。
根据表5数据可得知,华为企业年报的单现词占比为57.70%,高于苹果的单现词占比24.72%,且卡方检验表明两者数据具有显著差异性,在一定层面上进一步表明了华为企业年报创造性程度显著高于苹果。因为,前者企业年报文本强调中国特色话语体系,具有较强的叙事色彩;而后者为上市公司,其年报的写作需要遵循SEC (美国证卷交易委员会)的披露规范,语篇倾向于简洁、透明、合规。
Table 5. Statistics of hapax legomena
表5. 单现词统计
|
华为 |
苹果 |
类符总计 |
45,366 |
9,103 |
单现词总计 |
26,174 |
2,250 |
单现词占比(%) |
57.70 |
24.72 |
Significance (P) |
0.000 |
—— |
3.2. 句法层面特征
本文对比的句法层面特征主要包括两个方面:句式特征和衔接结构。
1. 句式特征
平均句长是衡量句式特征的常用指标,指的是句子的平均单词数,在一定程度上反映了文本在句法层面的结构复杂性。本研究使用Wordsmith Tools中WordList功能下的Individual statistics页面分别对华为与苹果企业年报进行句长数据分析,平均句长相关数据如表6所示。
Table 6. Comparison of average sentence length
表6. 平均句长比较
|
华为 |
苹果 |
句子数目 |
21,705 |
10,121 |
平均句长 |
29.03 |
43.00 |
平均句长标准差 |
31.50 |
46.01 |
Leech在一项研究中得出各语体的平均句长为17.8的结论[15]。如表6所示,华为与苹果企业年报的平均句长均超过17.8。值得注意的是,苹果企业年报文本的平均句长(43.00)显著高于华为企业年报的平均句长(29.03)。任敬辉、关丽娟指出,深受英语注重形合的影响,英语在组合句子时通常使用关联词等语言形式将句子中的分词和词语连接起来[16]。尤其在正式书面表达中,英语句子通常较长,且结构严谨,故而苹果企业年报的平均句长高于华为企业年报。
2. 衔接结构特征
现有的研究发现中文以并列结构为主,英文以从属结构为主,基于Blum-Kulka的“显化”研究发现可以推测华为企业年报英文版会保留中文多并列结构这一特征[17]。本研究首先使用Python工具分别对华为及苹果企业年报进行自动词性赋码,再使用Excel中筛选功能对已赋码的语料表格进行检索,其中并列结构检索符号为CC;从属结构检索符号IN,衔接结构特征相关数据见表7。
表7数据显示,华为企业年报的并列结构占比高于苹果,而从属结构占比则低于后者。这一差异很可能受到中英文句法特征的影响。中文偏好使用并列结构,呈现出“流水句”的特点;而英文则倾向于采用主从复合句,注重逻辑层级关系。
Table 7. Cohesive features
表7. 衔接特征
|
华为 |
苹果 |
|
次数 |
比例(%) |
次数 |
比例(%) |
并列 |
33,093 |
4.67 |
27,035 |
4.34 |
从属 |
64,535 |
8.47 |
61,544 |
10.63 |
3.3. 语义层面特征
语义是语言表达的核心,不同地域、文化背景下的群体语言表达习惯不同。通过分析文本语义可以揭示不同文本背后蕴藏的语言特征差异以及价值观差异。使用Wmatrix7语义标注系统对语料文本进行语义域赋码处理后,获得了华为和苹果企业年报的语义域统计,具体见表9与表10。其中参数O1和O2分别表示特定语义域在研究语料库与参考语料库(BE21,规模约为1.12亿词符)中的出现频次,1%和2%为其对应标准化频率值,“+”符号标识该语义域在研究语料库中的使用频率显著偏高,LL (对数似然率)数值则用于衡量这种频率差异的统计显著性,LL值越高表明组间差异的显著性水平越强。
Table 9. Top 10 semantic domains in Huawei’s corporate annual report
表9. 华为企业年报前10大语义域
|
语义赋码 |
语义赋码集 |
O1 |
1% |
O2 |
2% |
LL |
1 |
Z99 |
Unmatched |
2177 |
11.96 |
33466 |
2.73 |
+ |
2992.66 |
2 |
Y2 |
Information technology and computing |
181 |
0.99 |
1021 |
0.08 |
+ |
541.03 |
3 |
I2.1 |
Business: Generally |
186 |
1.02 |
1410 |
0.11 |
+ |
464.32 |
4 |
I4 |
Industry |
96 |
0.53 |
444 |
0.04 |
+ |
318.90 |
5 |
S8+ |
Helping |
278 |
1.53 |
5450 |
0.44 |
+ |
285.37 |
6 |
M3 |
Vehicles and transport on land |
176 |
0.97 |
2656 |
0.22 |
+ |
246.79 |
7 |
T3- |
Time: New and young |
145 |
0.80 |
2383 |
0.19 |
+ |
185.08 |
8 |
A2.1+ |
Change |
192 |
1.05 |
4243 |
0.35 |
+ |
166.27 |
9 |
W4 |
Weather |
72 |
0.40 |
634 |
0.05 |
+ |
161.99 |
10 |
I2.2 |
Business: Selling |
135 |
0.74 |
2344 |
0.19 |
+ |
161.59 |
Table 10. Top 10 semantic domains in Apple’s corporate annual report
表10. 苹果企业年报前10大语义域
|
语义赋码 |
语义赋码集 |
O1 |
1% |
O2 |
2% |
LL |
1 |
Z99 |
Unmatched |
44705 |
7.83 |
33466 |
2.73 |
+ |
21409.56 |
2 |
I2.1 |
Business: Generally |
12115 |
2.12 |
1410 |
0.11 |
+ |
19836.38 |
3 |
N1 |
Numbers |
21283 |
3.73 |
12901 |
1.05 |
+ |
13383.99 |
4 |
I1.1 |
Money and pay |
7269 |
1.27 |
1605 |
0.13 |
+ |
9518.12 |
5 |
I2.2 |
Business: Selling |
7995 |
1.40 |
2344 |
0.19 |
+ |
9069.80 |
6 |
I1 |
Money generally |
5131 |
0.90 |
1281 |
0.10 |
+ |
6340.38 |
7 |
I1.2 |
Money: Debts |
3613 |
0.63 |
976 |
0.08 |
+ |
4287.50 |
8 |
Q1.2 |
Paper documents and writing |
6244 |
1.09 |
3756 |
0.31 |
+ |
3960.97 |
9 |
A2.2 |
Cause & Effect/Connection |
6634 |
1.16 |
5190 |
0.42 |
+ |
2973.92 |
10 |
I1.3 |
Money: Cost and price |
2507 |
0.44 |
738 |
0.06 |
+ |
2837.44 |
从表9和表10语义域分布数据来看,华为和苹果企业年报文本呈现出不同的语篇特征和价值取向。
其中,华为企业年报中出现频率最高的几大语义域为“Unmatched (Z99)”“Information technology and computing (Y2)”“Business: Generally (I2.1)”以及“Industry (I4)”,这表明华为在其年报中笔墨着重在信息科技研发、企业经营、优化产业链等几大主题;而苹果企业年报语义域分布主要集中在“Business: Generally (I2.1)”“Numbers (N1)”“Money and pay (I1.1)”以及“Business: Selling (I2.2)”,表明其年报更聚焦于财务状况、市场交易以及资本流动等方面。
同时,“Helping (S8+)”和“Change (A2.1+)”等语义域在华为企业年报中的高频使用,说明年报中除了汇报技术革新成果及产业扩张形势外,还着重强调企业社会责任和人文关怀,体现出华为在全球变革中承担着积极角色;相比之下,苹果企业年报中“Money generally (I1)”和“Money: Debts (I1.2)”语义域的高频出现揭示其文本注重财务透明性,此外,“Paper documents and writing (Q1.2)”和“Cause & Effect/Connection (A2.2)”语义域凸显出苹果重视财务合规、文件记录,反映出其理性化管理风格。
从总体语义域统计来看,二者年报呈现出迥异的语篇特征和价值导向:华为企业年报呈现出“技术–产业–责任”三维叙事型表达,而苹果企业年报更偏向于“资本–市场–合规”逻辑链条表达;华为企业年报以技术创新与产业发展为导向,苹果企业年报以营收利润、股东回报为核心。
4. 研究发现及建议
4.1. 研究发现
通过以上数据分析可知,与苹果企业年报原文对比,华为企业年报英文版具有以下特点:① 词汇层面:词汇丰富度较高、难词和长词使用较多、文本信息量较多、范化特征突出、文本创造性程度较高;② 句法层面:深受中文“流水句”句式结构影响,多并列结构;③ 语义层面:两家企业因企业定位、企业战略等因素的不同导致二者年报文本呈现出迥异的语篇特征和价值导向。
4.2. 提出建议
基于上述差异,并结合苹果年报在语言简洁性、逻辑结构与读者接受度方面的优点,本文就中国科技类企业英文年报的撰写提出如下具体建议:
1. 在保持专业性的前提下优化词汇选择:避免机械追求词汇复杂性与多样性,应在核心陈述部分(如“业务概览”“战略展望”)严格使用已定义的行业核心术语(如5G, ESG);在非技术描述部分可采用常用词替代生僻词汇,如以“use”替代“utilize”,以“show”替代“demonstrate”,从而在保持专业形象的同时减轻非专业读者的理解负担。
2. 增强词汇策略的语境适配性:针对华为年报词汇丰富度高但可能影响理解连贯性的问题,建议在相近语义场中建立“词簇”意识,如在表达“发展”时,可依据语境灵活选用“growth”“progress”“advancement”或“expansion”;在表达“创新”时,可依据语境灵活选择“innovation”“breakthrough”“pioneering”“cutting-edge”;表达“增长”时交替使用“growth”“expansion”“progress”“advancement”。此举可在避免机械重复的同时,增强文本的修辞层次与语境贴合度。
3. 适度引入英语句法结构以增强逻辑层次:在保持中文叙事逻辑的基础上,可有意识地在因果关系、条件假设等复合句中增加从属连词、衔接短语的使用,提升句间衔接与逻辑显化,逐步接近英语主从结构主导的句法规范,例如使用“As a result…”替代“We did A. B happened.”以强化因果链;使用“Although we face challenges…”以凸显对比关系;使用“Provided that… we will…”以明示条件逻辑。通过系统引入此类主从结构,可显著提升语篇的逻辑外显度与条理性。
4. 统筹平衡技术理性与商业感性:避免年报因表达过于技术化或生硬而导致感染力和亲和力的缺失,建议在年报编写中采用“技术–责任–市场”三维融合策略,例如在“研发投入”“技术成果”部分,补充该技术对客户价值、行业生态或社会发展的具体影响;在“财务绩效”“市场表现”部分,嵌入企业价值观与文化理念的简要陈述;在“可持续发展”“公司治理”部分,结合具体数据说明企业社会责任举措的实际成效。通过将“Helping”“Change”等人文语义域与“Business”“Money”等商业语义域有机整合,实现技术叙事、责任表达与商业逻辑的协同传播。
5. 结语
本研究主要聚焦于分析华为与苹果企业年报在语言特征上的差异这一目标,利用语料库分析工具WordSmith Tools, Python以及Wmatrix7对华为与苹果企业年报进行词汇、句法、语义三个层面的对比分析,发现两者在词汇、句法、语义三个层面上存在较大的语言特征差异。本研究的发现可为相关科技类中企于“走出去”过程中如何撰写英文年报来树立企业形象和宣传企业文化、价值观提出相关建议及有效参考。
尽管本研究语料时间跨度较长,但本研究仍然存在一些层面上的局限性。例如:在研究方法方面,本文主要从词汇、句法和语义三个层面上展开分析,尚未深入考察修辞手法(如比喻、排比、对偶等)在不同文化文本中的使用差异;未来研究可将年报按章节(如致股东信、MD & A、CSR报告)进行切分,对比分析不同功能语篇的语言特征,使得研究内容及指导建议更具科学性和实践意义。