1. 引言
数字化作为一个促进企业运营绩效的重要指标,被众多行业所关注。数字化水平作为衡量中国上市企业发展前景的主要依据,已经成为了每个上市企业所关心的问题。随着互联网的普及与运行,AI、云计算、GPT-4等技术也得到了不断的深入和发展,同时企业的数字化发展也成为了一种趋势。大数据、云计算不断渗透到各行各业,无论是发展的农畜牧业、亦或者是新兴的创造业,与制造业相关的中国上市企业都需要利用数字化的模式提升企业的竞争力。上市企业的年报所包含的数字化信息恰恰是反映其企业数字化水平的重要因素之一。
国内外学者围绕企业数字化水平测度、数字化转型进行了丰富的研究,研究认为数字化转型显著提升了企业运营绩效,有利于改善公司治理、提升企业价值水平等[1] [2]。陈飞等[3]通过熵权法构建长江中游城市群制造业数字化水平指数,认为数字化技术升级、数字化创新升级及数字化效益升级对于推动制造业的数字化转型具有重要的推动作用;吴非等[4]借助爬虫技术归集企业年报中的“数字化转型”关键词,刻画出企业数字化转型强度,实证检验企业数字化转型对股票流动性的影响及其渠道机制。同时,越来越多的研究开始使用文本挖掘手段提取企业年报中的非结构化信息。谢诗蕾等[5]采用文本分析技术从2009~2020年A股上市公司提炼可读性指标衡量信息披露质量,考察了ESG绩效对信息披露质量的影响;杨兵等[6]运用计算机文本挖掘技术并结合情感分析,测算企业风险预期指数,实证研究了企业风险预期对投资策略选择的影响机制和内在逻辑。
尽管国内外对于企业数字化水平测度的研究较为丰富,但是多采用熵权法、层次分析法等方法,对于公司年报文本中蕴含的非结构化信息挖掘不够。此外,现有研究通常对数字化转型的前因与结果研究较多,但是对于我国企业的数字化水平的现状分析并不多见。鉴于此,本文基于文本挖掘法对我国制造业上市企业年报中数字化相关关键词进行词频统计以量化其数字化水平,并从横向与纵向两个方面对不同行业、不同区域的制造业上市企业数字化水平进行对比分析。本文的研究有助于上市公司清晰了解自身的数字化水平状况,对于如何提升创造业上市企业具有一定的理论指导意义,为制造业上市企业数字化水平的提升提供决策参考和建议。
2. 相关概念及研究方法
2.1. 数字化转型与数字化水平
数字化转型的概念较广泛,其定义目前尚未达成统一。周济[7]认为制造业数字化转型是产品利用先进数字技术实现创新升级,进而改变制造业的生产方式以及产业形态。Hess等[8]提出数字化转型是指产品、服务、企业组织架构以及商业模式通过数字技术进行优化重构。苏杨[9]将数字经济发展分为信息数字化、业务数字化和数字化转型三个阶段,其中数字化转型是新的发展阶段,一方面能够发展可持续性经济,拓展高质量发展新空间,另一方面推动传统产业的数字化转型,为社会发展带入新动力。
数字化水平是个体或组织在数字化环境中获取、处理和运用信息的能力和水平的体现,它反映了个体或组织对数字技术的掌握程度以及利用这些技术解决实际问题的能力。数字化是一个系统、长期的特定过程,包括多种技术的学习、搭配和组合[10]。对于不同类型的企业而言,其数字化过程不尽相同。如今,已经有越来越多的制造业企业开始应用数字技术来重构组织的生产流程、管理方法和商业模式,制造业正面临前所未有的机遇和挑战。王嘉璐等[11]认为制造业数字化主要体现在其生产流程、交易流程等通过先进的数字化制造技术进行优化,进而实现效率的大幅度提升。
2.2. 数字化水平测度方法
在当今数字化转型的浪潮中,企业数字化水平已成为衡量其竞争力与未来发展潜力的重要指标。如何准确测度企业的数字化水平,成为学术界与业界共同关注的焦点。
对于企业数字化水平的测度,传统方式是通过指标体系的构建形成对某个企业数字化水平的测量。学者王汀汀等[12]就是采用这一方法,他用熵值法确定制造业企业的数字化水平各个指标的权重,再利用线性加权法计算综合水平。这种方法虽然在理论上更为严谨,能够综合考虑企业数字化进程的多个方面,但其复杂性也带来了操作上的挑战,包括数据收集的全面性、指标选取的合理性以及模型构建的科学性等。与此同时,随着自然语言处理技术的不断进步,文本挖掘的准确性和效率也在不断提升,为企业数字化水平的测度提供了更加可靠的技术支持。越来越多的学者采用数据挖掘的方法对企业年报等文本数据进行分析,以实现企业数字化水平的衡量。学者任碧云等[1]采用企业当年数字化相关关键词出现的频数和当年行业内所有企业出现总频数的比值作为企业数字化水平度量指标。显然,文本挖掘方法数据获取相对容易,且能够直接反映企业在数字化方面的关注度与实践度。
鉴于上述两种方法的优缺点,本文选择采用文本挖掘的方式来评估企业的数字化水平。这种方法不仅具有数据获取便捷、处理自动化的优势,还能够在一定程度上克服单一指标法可能带来的片面性,更加全面地反映企业的数字化水平。
3. 中国制造业数字化水平测度及比较
3.1. 中国制造业数字化水平测度
3.1.1. 样本选择
本文研究以2013年至2022年间沪深A股制造业的上市企业作为初始样本,经过严格筛选:(1) 剔除了存在ST、*ST标记的制造企业,以确保样本的精确性和典型性;(2) 剔除信息传输、软件和信息技术相关的制造业;(3) 剔除数据严重缺失的企业。通过深入分析每家公司的行业地位、所占市场份额以及竞争优势等多维度指标,筛选出了一批业务前景广阔、发展潜力巨大,且能够保持持续稳定增长的企业,最终确定了424家具有代表性的上市公司作为研究样本。
依据证监会行业分类标准,对这424家样本公司进行了细致的划分,共涵盖了26个不同的制造领域(见表1)。此外,为了更深入地了解这些企业的地域分布特点,进一步进行了区域划分。具体而言,将这些企业分为了东、中、西三个区域:东部区域涵盖了上海市、北京市、天津市等经济发达省市;中部区域则包括安徽省、山西省、江西省等中部崛起地区;西部区域则囊括了陕西省、四川省、云南省等西部开发重点省份(见表2)。
Table 1. Industry distribution table of listed companies
表1. 上市公司所属行业分布表
所属行业 |
企业数量 |
医药制造业 |
57 |
电气机械及器材制造业 |
52 |
化学原料及化学制品制造业 |
44 |
专用设备制造业 |
36 |
汽车制造业 |
31 |
有色金属冶炼及压延加工业 |
26 |
通用设备制造业 |
26 |
非金属矿物制品业 |
24 |
金属制品业 |
13 |
橡胶和塑料制品业 |
13 |
农副食品加工业 |
11 |
化学纤维制造业 |
11 |
纺织服装、服饰业 |
10 |
黑色金属冶炼及压延加工业 |
10 |
酒、饮料和精制茶制造业 |
8 |
食品制造业 |
7 |
铁路、船舶、航空航天和其它运输设备制造业 |
7 |
造纸及纸制品业 |
6 |
仪器仪表制造业 |
5 |
印刷和记录媒介复制业 |
5 |
石油加工、炼焦及核燃料加工业 |
5 |
文教、工美、体育和娱乐用品制造业 |
2 |
家具制造业 |
2 |
其他制造业 |
2 |
木材加工及木、竹、藤、棕、草制品业 |
1 |
合计 |
424 |
Table 2. Regional distribution table of listed companies
表2. 上市企业所属区域分布表
区域 |
数量 |
东部地区 |
280 |
中部地区 |
88 |
西部地区 |
56 |
合计 |
424 |
3.1.2. 数据获取与处理
处理上市公司数字化水平相关数据的过程中,通过阅读文献和收集资料,筛选出与企业数字化相关的关键词,并依据学术研究与行业报告、政策法规与标准、企业实践案例以及逻辑分析与数据驱动等多个方面,按数字化技术、数字化商业模式、企业数字化建设三个维度进行分类(见表3)。
Table 3. Keywords related to digitalization level
表3. 数字化水平相关关键词
数数字化技术 |
区块链、云计算、虚拟现实、传感器、数字编码、人工智能、机器学习、计算机视觉、VR、AR、增强现实、5G、AI、可视化、物联网、工业互联网、虚拟艺人、虚拟偶像、知识图谱、算法、自然语言处理、智能学习分析引擎、私有云、混合云、公有云、IT、云原生、云组件、RPA、机器人、BIM、AIFUND、前端、Hadoop、Flink、IoT、大数据、数据挖掘、智能合约、Pow、PoS、Dapp、DAO、数据库、MongoDB、MySQL、NewSQL、NoSQL、DBMS、数据收集、数据清洗、文本挖掘、NLP、神经网络、深度学习、云服务器、云存储、ASIC、万物互联、软件、操作系统、RFID、驱动、汇编语言、数字技术、计算机技术、信息技术、智能技术、4G、DCS、DT、EDA、GIS、NC、互联网、云服务、数据分析、计算机、无人、自动、无线、远程、宽带、网络、3D、3维、web、数据赋能、工业云、海量数据、算力、数字控制、数字通信、数字网络、云联网、人脸识别、数据开发、数据地图、数据驱动。 |
数数字化商业模式 |
互联网+、互联网战略、互联网平台、数字经济、数字营销、电商、电子商务、平台经济、直播、新媒体、APP、小程序、公众号、微商城、线上线下、生态协同、智慧零售、网上商城、线上商城、微店、网络零售、C2M、B2B、B2C、C2B、C2C、B2F、O2O、互联网造星、短视频、数字文创、OMO、融媒体、移动题库、直播教学平台、智慧商圈、智慧商业、智能产品体验、智慧物业、线上营销、智慧物流、云超、云专柜、线上销售、电子商城、SEM、SEO、智能客服、数字科技、产业互联网、新零售、新型零售、智能零售、新业态、UGC、PGC、OGC、SaaS、PaaS、laaS、M-B、loT、B2G、G2B、B2M、M2C、ABC、BAB、P2C、P2P、B2S、SNS-EC、网络销售、网络营销、营销网络、营销网点、线上、移动互联网、互联网模式、在线、IaaS、线下、多渠逍、全渠道、新渠道、线上线下一体化、线上线下融合、在线化、CRM、引流、移动端、主播、博主、朋友圈、大众点评、口碑、自媒体、微商、网上、网购、数字创意、智能快递柜 |
企企业数字化建设 |
信息化、数字化、智能化、数据化、智慧化、信息管理、信息系统、信息集成、信息软件、信息终端、智能终端、知识管理、网络化、移动办公、智能办公、在线办公、工业信息、工业通信、ERP、智慧电厂、智能工厂、电子化、管理软件、影像系统、检验检测系统、管理平台、会诊平台、智慧医院、电子病历系统建设、云病案系统、智库、指挥系统、OA、产品系统、服务系统、企业微信、线上运营、数字经营、网站、数智化、自动控制系统、数据中心机房、中台、管理系统、SOME、数字措施、智慧运营、数据应用、智慧财务、数据支撑、MIS、运营系统、数据管理、数据网络、数据平台、数据中心、数据科学、关系型数据库、数字终端、数字智能、云平台、BI、智能制造、智能设备、智能管理、智能识别、商务智能、自动控制、自动监测、自动生产、EMR、EPR、MES、Oracle、SAP、U9、EAS、信息网络、智慧制造、智慧工厂、智能、信息安全、网络安全、用友、金蝶、信息资产、智能成本控制、SmartPlantFoundation、AVEVA、AIM、办公平台、在线多维度管控、系统运维、数据接口、工程数据、管理数据、自动化分拣系统、信息服务、智能调度、PC、DevOps、营销管理系统、OCC |
随后,利用Python程序将上市公司年报从PDF格式转化为txt文本,并通过jieba库对关键词进行分词处理,统计出各公司2013~2022年间在数字化技术、商业模式及建设方面的关键词出现次数和总频率。最后,将这些数据整理至Excel表格,并结合国泰安数据库(CSMAR)的信息,完善了上市公司所在地区、行业及股票代码等关键数据,从而完成了全面的数据爬取工作,最后得到424家企业2013~2022年共计4240条数据,如表4所示。
Table 4. Statistical results of keyword frequency for enterprise digitalization
表4. 企业数字化关键词词频统计结果
股票代码 |
股票简称 |
行业
代码 |
所属
省份 |
数字化技术词数 |
数字化商业模式词数 |
企业数字化建设词数 |
总数 |
总词频 |
002029 |
七匹狼:2013 |
C18 |
福建 |
67 |
27 |
37 |
159 |
0.0736% |
002092 |
华茂股份:2013 |
C17 |
安徽 |
14 |
2 |
12 |
33 |
0.01936% |
000959 |
首钢股份:2013 |
C31 |
北京 |
7 |
0 |
7 |
14 |
0.01108% |
... |
... |
... |
.. |
... |
... |
... |
... |
... |
3.2. 中国上市企业数字化水平分析
3.2.1. 上市企业数字化总体水平
(1) 上市企业总体数字化平均水平
将每年上市企业2013~2022年数字化水平加总除以企业总数量,得到中国上市近10年企业数字化平均水平随时间变化的趋势图(图1)。
Figure 1. Trend chart of the average level of digitalization of listed manufacturing enterprises over time (2013~2022)
图1. 制造业上市企业数字化平均水平随时间变化的趋势图(2013~2022)
在2013年至2022年的十年间,424家上市公司在数字化水平方面呈现出稳步上升的趋势。特别是在2014年以后,这些企业的数字化水平有了显著的提升。这一变化反映了我国制造业企业日益重视并加强数字化发展,以适应日益激烈的市场竞争和科技进步的要求。这些企业在数字化技术、数字化商业模式以及企业数字化建设等方面的投入和努力,不仅提升了自身的竞争力和创新能力,也为整个制造业的转型升级注入了新的动力。
(2) 不同维度的数字化水平演化
从图2中可以清晰地观察到,制造企业在数字化技术、数字化商业模式以及企业数字化建设这三个维度上的投入和重视程度均呈现出逐渐提升的趋势。
Figure 2. Trend chart of the average frequency of words in three dimensions over time (2013~2022)
图2. 三个维度词频平均数随时间变化的趋势图(2013~2022)
从2013年到2022年,数字化技术维度的词频平均数经历了一个先上升后下降再上升的过程。这表明数字化技术在不同年份的社会关注度、讨论热度或实际应用情况有所变化。数字化技术词频平均数在2015年至2018年期间相对较高,特别是2017年和2018年达到了一个高峰。这可能反映了在这段时间内,数字化技术得到了广泛的关注和推广,相关讨论和应用增多。随后几年,数字化技术词频平均数有所下降,这可能意味着在这段时间内,其他议题或技术吸引了更多的注意力,或者数字化技术的讨论热度有所减退。
在三个维度中,企业对于数字化建设的重视程度尤为突出。从2013年至2022年,企业的数字化建设水平始终保持着稳步的提升速度,展现出强烈的发展势头。到2021年,数字化建设水平已经超越了企业的数字化技术水平,成为推动企业数字化转型的关键因素。这一变化不仅反映了企业在数字化转型过程中的战略调整,也体现了企业对于数字化建设在提升运营效率、优化管理流程、增强市场竞争力等方面的重要性的深刻认识。随着技术的不断进步和市场的不断变化,制造企业正逐渐将数字化建设作为推动企业发展的核心动力,以应对日益激烈的竞争环境。
从2013年到2022年,企业的数字化商业模式增长速率相对缓慢,截止至2022年,也一直保持在一个较低的水平。这表明制造企业在数字化商业模式的探索上仍有待深入发展。造成企业数字化商业模式水平难以快速提升的原因可能在于,许多制造企业缺乏清晰明确的数字化战略。数字化商业模式不仅要求企业掌握先进的技术,更需要具备前瞻性的创新思维和市场洞察力。因此,要提升企业商业模式数字化水平,首先,企业应制定明确的数字化战略,明确数字化转型的目标和路径。其次,企业需要加强员工数字化技能的培养和提升,以适应数字化商业模式的发展需求。最后,企业还应积极培养创新思维和市场洞察力,不断探索和实践新的数字化商业模式,以推动企业的数字化转型和升级。
3.2.2. 不同行业数字化水平比较
通过分析不同行业的数字化水平有助于深入了解各行业数字化发展的现状,评估其数字化进程,并为制定未来的数字化策略提供重要依据。能够更加清晰地认识到不同行业在数字化方面的优势和不足,从而更有针对性地推进数字化转型。
为了便于行业对比分析,本研究对部分行业进行了归类整合,将电气机械及器材制造业、通用设备制造业、印刷和记录媒介复制业纳入机械制造业范畴;将纺织服装业、服饰业、纺织业、家具制造业、酒、饮料和精制茶制造业、农副食品加工业、食品制造业、文教、工美、体育和娱乐用品制造业、造纸及纸制品业归类为轻纺工业;非金属矿物制品业、黑色金属及压延加工业、化学纤维制造业、化学原料及化学制品制造业、石油加工、炼焦及核燃料加工业、橡胶和塑料制品业、医药制造业、有色金属冶炼及压延加工业则归为资源类加工工业;铁路、船舶、航空航天和其它运输设备制造业、仪器仪表制造业、专用设备制造业则统一归为机械电子制造业。
图3为六个行业2022年的企业数字化水平的比较,可以观察到各行业在数字化水平上存在明显的差异。其中,机械电子制造业的数字化水平表现最为突出,资源类加工工业的数字化水平相对较低,仅为0.0100%,是这些行业中最低的,这可能与资源类加工工业的传统生产模式、技术特点以及市场需求等因素有关,导致其在数字化转型方面进展较慢。从图中还可以看出,不同行业之间的数字化水平存在较大的差异,这一数据揭示了各行业在数字化进程中的不均衡发展状况,凸显了针对不同行业制定具体数字化战略的必要性。这种差异可能受到多种因素的影响,包括行业特点、技术实力、市场需求、政策支持等。因此,在推动数字化转型的过程中,需要针对不同行业的特点和需求,制定差异化的政策和措施,积极引入并应用数字化技术,以促进各行业数字化水平的均衡发展。
Figure 3. The average digitalization level of enterprises in different industries in 2022
图3. 2022年不同行业企业数字化平均水平
3.2.3. 不同行业数字化水平比较
首先,东部地区的数字化水平在整个观察期内一直相对较高,且呈现出稳中有升的趋势。这表明东部地区在数字化发展方面处于领先地位,并持续保持增长势头。其数字化水平的稳步上升可能与该地区发达的经济、丰富的科技资源和先进的基础设施密不可分。
中部地区的数字化水平相较于东部地区略低,但在十年间也实现了稳步的提升。虽然其增长速度可能不如东部地区显著,但整体上看,中部地区的数字化进程也在不断推进。
西部地区的数字化水平在起始阶段相对较低,但在后续年份中呈现出较快的增长势头。特别是近几年,西部地区的数字化水平有了显著提升,这可能与国家政策的支持、西部地区自身的发展需求以及科技的快速普及有关。
从整体来看,三个地区的数字化水平都在不断提升,但存在明显的地区差异。这种差异可能受到地区经济发展水平、科技投入、政策支持等多种因素的影响。为了促进全国数字化水平的均衡发展,需要加大对中西部地区的支持力度,推动数字技术的普及和应用,缩小地区间的数字化鸿沟(图4)。
Figure 4. Development trend of average digitalization level of enterprises in different regions (2013~2022)
图4. 不同区域企业数字化平均水平发展趋势图(2013~2022)
4. 研究结论与启示
4.1. 研究结论
本文基于2013~2022年间沪深A股上市企业年报文本,利用文本挖掘方法测度了我国制造业上市企业数字化水平,对其数字化水平总体情况进行了分析,并对不同行业和不同区域数字化水平进行了比较,得出以下研究结论:
(1) 整体来看,中国上市企业数字化水平在逐年提高,2013年以前,增速比较平稳,在2014年增长速度有明显的加快。从不同数字化应用的角度来看,企业数字化建设的词频越来越高,甚至在2021年超过了数字化技术,说明企业越来越重视组织架构和业务流程的智能化,但是数字化商业模式的词频一直处于较低水平。
(2) 按照行业来看,从2013年到2022年,所有行业的数字化平均水平都在上涨,各行业在数字化水平上存在明显的差异,从整体趋势来看,机械制造业、汽车制造业、金属制品业和资源类加工工业的数字化水平逐渐提升,显示了这些行业在数字化转型方面的积极进展。这种趋势对于整个经济的数字化转型具有积极意义,有助于提高生产效率和创新能力。
(3) 按照区域来看,我国上市企业数字化水平发展极不均衡,呈现东部强,中、西部弱的特点。虽然各个地区数字化水平都在随时间上升,但是东部地区上市企业的数字化水平始终高于中、西部地区,并且差距在逐年增加,但是2020年,中部地区上市企业的数字化水平有显著的提升,且在渐渐追赶东部地区。
4.2. 政策建议
4.2.1. 政府层面
(1) 优化法律与监管环境:完善数据安全、隐私保护、知识产权等方面的法律法规,为企业提供清晰的法律框架,同时保护消费者权益,增强公众对数字化的信任。
(2) 加大财政支持与税收优惠:增加政府补助,大力扶持西部地区企业以及农业类、能源类和房地产行业企业的数字化转型。西部地区经济发展水平相对落后,也常年面对人才短缺的难题。政府应当放宽西部地区人才引进政策,吸引数字化技术研发人才在西部地区安居乐业。也应当加大对农业类、能源类和房地产行业的数字化转型补贴力度,鼓励相关行业企业积极进行数字化转型。
4.2.2. 企业层面
(1) 制定明确的数字化战略:鼓励企业根据自身业务特点和市场需求,制定长期的数字化转型战略规划,引导企业建立健全数据管理体系,加强数据采集、存储、分析和保护能力,通过数据分析优化运营流程、产品开发和服务定制,实现数据驱动的业务增长。
(2) 迎接挑战,积极探索新的数字化商业模式:将数字化营销巧妙运用到产品和服务的推销当中,探索互联网平台 + 内容、网红经济、网红带货、短视频营销、虚拟数字人偶像等等数字时代营销新模式。既要有“流量”,又要保证“质量”,让数字化商业模式为数字经济注入活力。
4.3. 研究展望
限于现有的能力,本文的研究也存在一些不足:
(1) 由于能力有限,仅仅采用了文本挖掘的研究方法。虽然这种方法在当前研究背景下是适用的,并且已经提供了一些有价值的发现,但是文本挖掘的方法忽略了数字化实践的质量与效果,仅能从表面文字上进行了量化,这在一定程度上可能限制了研究视野和深度,使得某些潜在的、更为复杂的因素未能被全面考虑和揭示。
(2) 此外,本文的研究焦点主要集中在制造业领域。虽然制造业是一个重要的经济部门,具有广泛的应用背景和现实意义,同时也应该意识到,对于其他的一些行业或领域,如服务业、金融业或医疗健康等,本研究的方法和结论可能并不完全适用。
基金项目
湖北省大学生创新创业训练计划项目“基于年报文本分析的制造业上市企业数字化能力的影响因素研究(S202310488095)”。