1. 引言
大数据是信息化发展的新阶段,习近平指出“推动大数据技术产业创新发展、构建以数据为关键要素的数字经济、运用大数据提升国家治理现代化水平”的战略部署,为我国构建大数据时代国家综合竞争新优势指明了方向。当前大数据应用尚处于初级阶段,根据大数据分析预测未来、指导实践的深层次应用将成为发展重点。
中国的制造业在中国经济中起到举足轻重的作用,伴随着国家产业转型不断升级,国家积极推动创新驱动发展的背景下,如今的中国人口老龄化情况日益凸显,同样的伴随着低成本发展的优势也有所减弱,环境规制强度逐渐增强以及劳动力价格上涨,使得中国制造业面临着新的发展瓶颈期,而这急需寻求新的升级之路。大数据具有成本节约效应、效率提升效应和创新赋能效应,是制造业创新驱动的重要驱动力,正因为此,大数据分析对如今国内的制造业来说极其重要。我国此前提出“互联网+”发展战略,推动移动互联网、云计算、大数据、物联网等与制造业融合发展,促进消费互联网、工业互联网的发展,这为中国制造业升级提供了重要的机遇。本文在此背景下,以2002年到2019年制造业企业数据的实证分析探究技术创新在大数据背景与企业升级间的影响,同时探究大数据在供给侧与需求侧在制造业中的渗透,对制造业企业创新能力的影响。
2. 文献综述与假设提出
(一) 工业大数据与数字经济
物质、能量、信息是构成客观世界的三要素。随着计算机的出现,大数据一词由cox and ellsworth (1997)首次提出,而新的世界观也在此基础上渐渐形成,即大数据、物理世界、人类社会的人机物三元世界。大数据是一个综合型概念,它包括1) 因具备海量、多样、快速等特征而难以进行管理的数;2) 对这些数据进行储存、处理、分析的技术;3) 能够通过分析这些数据获得实用价值和观点的人才和组织。Saggi (2018)认为大数据包括网络的生成、采集、储存、高级数据分析、数据可视化和价值创造决策 [1]。工业大数据是在大数据发展的过程中提出的,池宇(2020)指出工业大数据是新一代信息技术与制造业深度融合的产物,对制造业生产方式,运作模式,生态体系产生重大而深远的影响,日益成为新工业革命的关键支撑和促进制造业实现数字化转型的重要基石。而数字经济是以数字化的知识和信息作为关键生产要素,以数字技术为核心驱动力量,以现代信息网络为重要载体,通过数字技术与实体经济深度融合,不断提高经济社会的数字化、网络化、智能化水平,加速重构经济发展与治理模式的新型经济形态,它指的是一个经济系统 [2]。李英杰(2021)指出经过20多年的发展,经济从最初单指信息产业发展态势,逐步演变为承接农业经济、工业经济的第三类经济形态,并正逐渐取代工业经济,成为引领经济社会发展的新功能。《中国数字经济发展白皮书(2020年)》显示,2019年我国数字经济规模达到35.8万亿元,占GDP比重达36.3%。党中央指出发展工业大数据是贯彻落实国家系列部署、实现高质量发展的战略选择 [3]。近年来,国家连续提出各种政策文件,提出促进大数据技术创新的产业应用。党的十九届四中全会首次提出将数据作为生产要素参与利益分配,标志着我国正式进入数字经济“红利”大规模释放时代。加快工业大数据发展,推动工业大数据参与进价值创造和产业升级的过程,是国家落实发展战略,实现成熟数字经济化时代的必然过程 [4]。
(二) 大数据背景、技术创新与制造业双向驱动
近年来,学者对大数据及“互联网+”对制造业升级影响的理论和实证研究呈上升趋势。主要不同的视角可以分为供给侧视角和需求侧视角,而更多的研究是从某一单独的视角进行大数据对制造业升级的影响。另一方面,从目前梳理的理论中比较少的学者研究大数据经济时代对企业创新的影响 [5],那么,以下是对相关文献的梳理。
基于供给侧视角来对大数据进行研究是以供给侧生产活动为大数据应用场景,表现为企业在自身业务生产、交易、物流、储存、融资方面的活动与大数据方面的融合,一般大数据对企业的影响是通过精简生产要素数量、提高生产要素质量来提升产业和企业的生产效率、降低生产成本。董俊艳,彭艳芝(2020)发现我国大数据对发展仍处于初级阶段,驱动企业链向高端环节发展,促进制造业转型升级发展极其重要 [6]。吴爱东(2021)研究了不同地区制造业在大数据背景下受到的影响,结果发现大数据对不同地区制造业高质量发展的促进作用不同。Ranganathan等、li等通过综合供应链来分析供给侧下互联网技术对企业系统结构的集中化、正规化和高层次化的重要驱动作用,提出互联网可以在供给侧下为企业生产效益带来显著的正向驱动作用 [7]。李海舰等认为在这个大数据快速发展的时代,传统的企业应加快步伐朝着智慧型企业发展。
基于大数据需求侧的升级驱动。大数据需求侧的发展有利于提升用户体验,为消费升级提供新动力,而消费者需求的增强又反过来激发企业生产产品和销售方式的创新。Brvnjolfsson等指出互联网技术引发了商品交换方式的巨大变化,拓展了商品交换的空间、地点、时间,并且极大的降低了交易费用,提升了交易效率;而如今大数据杀熟的现象层出不断,新的营销方式也应势而生,杨盼等对此对大数据下的精准营销给出了自己的见解,并提出针对用户信息的营销思想,Saunders等认为“互联网+”可以培养个性化消费与消费者结构的改变,增加消费群体,从而拉动制造业转型升级。曾世宏等研究了互联网促进公共服务消费升级的内在机制与传导机制,实证检验了互联网影响公共服务消费者的异质性效应、拥堵效应以及门槛效应 [8]。
吴爱东讲述了大数据通过产品创新、产业创新、商业模式创新,为传统制造业创造价值增值的大数据的创新赋能效应,大数据以及互联网下的产业企业的技术创新成为企业的核心竞争力,企业生命周期同样也随着网络时代的进步逐渐缩短,创新成了企业竞相追寻的方法,不仅是微观的企业层面的内部创新,产业间的创新也逐渐激烈,传统的制造业与服务业间的界限在大数据的推动下渐渐模糊,产业间开始交叉发展,推动产业转型 [9],创新在其中起着十分重要的作用。那么技术创新在其中扮演着什么样的角色呢?
通过文献梳理不难发现:首先,供给侧和需求侧在如今的大数据时代里都对制造业产生着重要的影响而在研究中两者也存在着密切的关系,本文着重研究供给侧方面产生的影响,并提出以下假设:
假设一:大数据背景驱动企业提高全要素生产力来进行产业升级和生产力发展。
假设二:大数据背景驱动企业增强创新水平进而提高全要素生产力。
3. 研究设计
(一) 样本筛选与数据来源
本文主要选取了2008~2019年中国制造业上市公司为初始研究样本,结合证监会发布的“上市公司行业分类指引2001”对国家“五年规划”大纲中提及的产业进行标准化分类,最终在行业筛选时剔除了金融、房地产等服务性行业,同时剔除了ST、企业,以及财务数据缺失严重的样本,最终共得到762家样本公司,8835个观测值。另外,对于上市公司专利的筛选,本文依据国泰安数据库里的数据提取符合条件的专利数据。从国家统计局中提取互联网普及率,另外,对样本上市公司的其他财务数据来源于 CSMAR。为降低极端值对结果的不利影响。通过stata15.0软件的相关处理,本文对连续变量进行上下1%的Winsorize 处理并得到相关研究结果。
(二) 指标构建
1) 解释变量
互联网普及率:反映一个国家或地区经常使用因特网的人口比例,通常国际上用来衡量一个国家或地区的信息化发达程度
2) 被解释变量
本文研究重点是上市公司受大数据背景的影响,其生产力发展和企业升级的情况,因此绿色全要素生产率作为被解释变量,其中专利数量为中介变量,考虑到创新是一个持续的过程,专利申请流程耗费时间较长,本文用上市公司的专利申请数据来衡量企业的技术创新,这可以更具时效性地考察企业技术创新活动产生的影响,同时借鉴虞义华等的做法,使用企业当年所有申请的专利中最终获得得到的授权的专利数来衡量创新。最后,本文又用不同方法测量的全要素生产率来进行稳健性检验。
3) 其他指标
在已有研究的基础上,通过分析筛选后,本文选取了一些控制变量来保证数据来源的稳定性:进行对数处理的企业规模lnsize、产权性质State、盈利能力Roa、托宾Q值TobinQ、企业年龄Age、经营活动产生的现金流量净额Cfo、股权集中度tq、董事会独立性ldp,企业净利润netprofit,第一大股东持股比例,政策强度Policypower,变量名称、符号和定义如表1所示。

Table 1. Symbols and definitions of each variable
表1. 各变量符号和定义
4) 模型设定
为了有效检验大数据对企业生产力发展的影响以及企业技术创新的关系,本文借鉴巴伦和肯尼(Baron & Kenny, 1986)、李政和杨思莹(2018)对中介效应模型的设计,运用分步回归的方法,运用温忠麟等(2014)提出的修正的中介效应检验方法,建立如下三个回归方程具体的模型设定如下:
其中,c为自变量X对因变量Y的总效应,为X对Y的直接效应,a为X对中介变量M的效应,b是控制了X的影响后M对Y的影响,ab为经过中介变量M的传导的中介效应。据此以专利申请数为例构建如下模型,第一步以绿色全要素生产率为因变量,以互联网普及率为自变量构建方程;第二步,以专利申请数为因变量,互联网普及率为自变量构建方程,具体如下:
(1)
(2)
(3)
式(2)中Pat表示企业的专利申请数,如果假设二假设成立,那么待估系数均应显著,并且如果与符号一致,则表明大数据通过影响技术创新间接影响企业的生产力发展;若与符号相反,则技术创新可能起到的间接作用会在一定程度上遮掩大数据对企业生产力发展的实际作用。
4. 实证结果分析
(一) 中介效应
通过对数据的收集和stata15.0的使用,对数据进行回归检验分析,探究大数据对制造业的影响。在进行豪斯曼检验的情况下,结果显示选择固定效应模型。在回归的过程中,进行年份及地区的固定基础上回归结果如表2所示:表2列示了中介效应的检验过程,第一列是去除其他控制变量情况下的回归结果,第二列是加上控制变量后的回归结果,也是模型的回归结果1、2列对比不难发现互联网普及率促进企业全要素生产率的提升,互联网普及率与全要素生产率在1%的水平下显著,这说明大数据的发展促进企业生产力发展,从而促进企业升级,而且不受其他控制变量的影响;第3列是对模型3的回归,可以发现分别为1.063、0.009、1.310,此时与符号一致,则表明大数据通过影响技术创新间接影响企业的生产力发展,至此中介效应成立,假设1、假设2均成立。大数据的发展通过促进企业技术创新从而促进企业进行生产力发展,提高全要素生产率,进而适应不断变化的环境。

Table 2. Return between Total Factor productivity and patent application and Internet penetration under the O p method
表2. Op法下全要素生产率与专利申请和互联网普及率间的回归
(二) 稳健性检验
为了保证回归结果的稳健性,本文又采取了lp法测算的全要素生产率作为应变量,回归结果如表3所示:不难发现其结果并没有发生改变,大数据与企业全要素生产率代表的企业生产力发展间呈正相关关系,而技术创新在其中充当着中介的作用,大数据的发展通过刺激企业进行技术创新从而刺激企业对生产力发展提出要求,提高自己的发展水平。

Table 3. Return between Total Factor productivity and patent application and Internet penetration rate under the O p method
表3. Op法下全要素生产率与专利申请和互联网普及率间的回归
(三) 企业所有制异质性分析
进一步考察企业所有制异质性,回归结果结合表4,首先是非国企,比较表第2列和第6可以看出大数据非国企中技术创新的中介效应并未发生作用,而在国企中存在着中介作用,而这种情况同样通过了稳健性检验,这说明,大数据的发展更有利于国企企业的生产力发展,究其原因国企在国家政策方面更有优势,国企更易接收到政策方面的支持,并且做出相应的回应,国企的影响更为大一点。

Table 4. Return of enterprise nature
表4. 分企业性质的回归
5. 主要研究结论与政策启示
本文基于2008年~2019年企业微观数据与互联网普及率进行实证分析,运用中介模型研究了大数据背景下对企业生产力发展,企业转型的影响,实证结果表明大数据背景的发展,促进制造业企业的生产力发展,提高了制造业企业全要素生产率,并且,大数据通过对技术创新的促进从而提高制造业企业的生产力发展。根据以上研究本文提出以下建议:
一是积极落实数字经济发展战略,推进制造业升级。政府及相关部门应加强互联网基础设施的建设,鼓励制造业实施数字经济来提高生产效率,提升生产规模水平;企业应紧跟时代发展步伐,主动形成与利用“互联网+”带来的平台效应集聚效应和柔性效应,加快不同企业和产业之间的知识溢出,提高生产技术水平和生产效率,扩大企业的生产规模,实现产业升级。
二是各地区完善对大数据影响制造业升级的相关政策。地方政府要有针对性地根据不同制造业特征来制定政策:对于消费品制造业来说,不仅要重视消费者市场需求对它的发展影响,利用“互联网+”消费侧的市场研究和数据分析优势来获取精准的市场动态信息,降低企业的经营风险,减少企业成本,增加市场份额,也要注重推进供给侧的项目落实;而对资本性制造业、中间品制造业来说,应加强对供给侧的应用,强化企业内部大数据建设和系统使用,积极吸收国内外的先进生产技术和知识学习,进而提高企业生产效率和生产技术水平。
三是充分发挥政府作用推动大数据紧密相关的供给侧的应用。中国目前“互联网+”在供给侧和需求侧的双向驱动作用发展呈现不均衡的现状,主要表现为“互联网+”需求侧作用强而供给侧作用比较弱。中国经济发展如今正处在转变发展方式、优化经济结构和转换增长动力的关键期,因此,要实现制造业升级和高质量发展,必须要加大供给侧的驱动作用。供给侧的发展对制造产业和企业具有广泛的适用性和渗透性,产业互联网对生产的影响则更为直接、也更为明显,因此应加强供给侧的应用工作,为企业提供技术创新、信息化以及大数据管理的帮助,降低企业对新技术研发和使用的试错成本,促进企业间、产业间的技术溢出,推动产业和企业创新升级。