1. 引言
在数字技术迅猛发展的背景下,数字经济正驱动全球贸易变革。中国作为全球贸易大国,跨境电商规模持续扩大,但长期面临“低端锁定”困境——核心技术不足、质量同质化严重,制约了价值链地位提升。2021年《“十四五”对外贸易高质量发展规划》明确提出以数字化转型加强出口质量建设。
政策层面,2014年起“大数据”连续八年被写入国务院《政府工作报告》,党的十九大强调数字技术与实体经济深度融合,为跨境电商数字化转型提供支撑。公共卫生事件期间,线下受阻进一步凸显大数据在需求预测、供应链优化等环节的价值。因此,探究大数据如何影响跨境电商出口产品质量,对破解瓶颈、实现贸易强国意义重大。
现有研究多聚焦传统制造业,对跨境电商场景关注不足。针对大数据应用现状如何、影响机制怎样、企业异质性是否存在等问题,本文通过文本分析构建企业大数据应用指标,结合微观贸易数据进行实证研究,填补相关空白。
2. 文献综述
2.1. 大数据应用与国际贸易
大数据作为集成信息资产,通过降低信息不对称、优化资源配置重塑国际贸易模式。在跨境电商场景中,大数据应用能突破地理空间限制,帮助企业精准捕捉全球市场需求[1],通过用户行为数据分析实现产品定制化开发,提升国际贸易适配性。肖静华等[2]指出,跨境电商企业利用大数据进行虚拟仿真实验,可显著降低研发成本与贸易风险;唐松等[3]则验证了大数据在供应链协同、跨境物流优化中的核心作用。但过度投入数字基础设施也可能挤占生产资源,对中小企业跨境贸易造成挤出效应[4]。
信息论创始人香农认为,信息是一种降低不确定性的东西[5],在企业决策相关领域,拓宽获取信息的渠道有助于企业做出有效的决策[6]。一方面,大数据应用能够加快知识的传播和共享,提高创新参与者之间的连通性,重组创新资源和创新过程。从这个角度看,应用大数据能够在现实世界实现研发资源的优化配置;通过吸收海量有效信息,企业可以精准把握市场的需求动向与企业内部的现实情况,借助大数据相关的技术工具对创新活动的行进方向进行演进与推断[3] [7],最终做出更符合客户需求的创新决策,从源头降低企业创新活动失败的风险。在创新项目实施阶段,对知识的管理能力是企业将创新行为持续下去的关键[8],大数据应用可以通过提升企业的知识管理能力来助力创新项目的实施[9] [10],从而提高企业创新活动的成功率。在创新成果转化阶段,企业通过大数据可以更好地理解环境和客户需求,助力创新成果成功转化。通过运用数据管理方法,企业可以使用爬虫、神经网络、支持向量机等大数据相关技术挖掘与分析消费者的基本信息、行为和交易数据来建设客户画像体系[11] [12],从而有助于企业快速锁定企业创新成果转化的目标与对象。通过针对精准定位的潜在消费群体采取适当的营销手段,企业能够增加新产品相关的销量与收入[13],实现创新成果的成功商业化,从而提升企业的创新效率。另一方面,李廉水等[4]提出,过度投入数字基础设施也可能挤占生产资源,对中小企业跨境贸易造成挤出效应。
2.2. 跨境电商出口产品质量衡量
产品质量是跨境电商参与国际贸易竞争的核心要素,其衡量方法已形成多元体系。Schott [14]提出的单位价值法,通过出口价格间接反映质量,适用于跨境电商多维度贸易数据。该方法不仅可以研究企业、产品、国家、年份等四维微观数据的产品质量变化,还可以研究行业、产品、国别、年份等多维宏观层面的产品质量变动。然而,这种方法存在一些缺陷。价格不仅包括质量信息,还包括成本因素。用产品价格来估计产品质量是不准确的。随后,Hallak和Schott [15]突破了价格等于质量的假设,使用需求反向法来衡量产品质量。这种方法的基本逻辑是从需求端引入消费者对质量的偏好,建立包含质量的消费者需求函数,并利用消费者的选择对质量进行回溯,使质量变得可衡量。对于相同价格的产品,市场表现越好,产品质量就越高。施炳展[16]、樊海潮和郭光远[17]等人使用该方法对产品质量进行了研究。
2.3. 文献评述
现有研究已证实大数据对贸易效率的提升作用,但尚未深入剖析其对跨境电商出口产品质量的影响机制,且缺乏针对国际贸易场景的微观实证检验。同时,关于跨境电商企业数字化转型的异质性研究较为零散,未能结合企业所有制、区域分布、存续周期等维度展开系统分析。本文通过构建精准的大数据应用指标,聚焦跨境电商出口产品质量,填补了现有研究在国际贸易场景应用中的空白。
3. 理论分析与研究假设
3.1. 大数据应用影响跨境电商出口产品质量的机制
大数据为跨境电商企业研发创新提供了双重支撑,进而通过强化技术创新能力,间接驱动出口产品质量升级。从创新经济学的视角来看,大数据作为一种新型生产要素,其价值并非直接体现于生产端,而是通过提升企业的“知识整合能力”与“动态能力”来实现创新绩效的转化。
首先,大数据通过提升研发精准度,直接促进了企业高质量技术创新成果的产出。根据知识基础观,企业的创新优势来源于其对异质性知识的获取、整合与重构能力。在研发前端,企业通过整合内外部多源数据,实时洞察全球市场的碎片化需求,实现从“生产导向”向“需求导向”的转变。这种数据驱动的能力有助于精准定位利基市场,明确创新方向,降低研发试错风险[18]。研发成功率的提升使企业积累更多高质量技术方案,进而提高专利授权的可能性。
其次,大数据通过加速研发进程,提升了技术创新的效率与迭代速度。从数字化转型理论视角来看,企业数字成熟度的提升将推动创新范式从“线性研发”向“迭代试错”转变。在研发中端,通过虚拟仿真与数字孪生等技术,企业能在虚拟环境中高效测试产品,缩短周期、降低成本。这种低成本的快速试错加速了技术孵化和商业化进程,从而更快地将成熟技术转化为专利,推动企业专利授权数的增长。
最后,技术创新作为核心传导机制,将大数据势能转化为产品质量竞争力。演化经济学视角下,企业技术创新能力的积累是一个“路径依赖”与“能力构筑”的过程。施炳展和邵文波[19]指出,创新能力是跨境电商出口产品质量升级的核心驱动力。大数据驱动下获得的授权专利经过实质性审查,具备排他性和应用价值。将这些专利嵌入生产,可有效解决出口产品同质化、低附加值等“低端锁定”问题。因此,大数据通过提升企业技术创新水平(以专利授权数衡量),间接推动出口产品质量升级,形成“大数据应用→技术创新(专利授权增加)→质量升级”的传导路径。
3.2. 研究假设
基于上述分析,本文提出核心假设:
H1:大数据应用对跨境电商企业出口产品质量提升具有显著促进作用。
H2:大数据应用通过促进技术创新从而提升跨境电商企业出口产品质量。
H3:大数据应用对国营或国有控股跨境电商企业、东部地区跨境电商企业的出口产品质量的促进效应更显著。
4. 计量模型和数据说明
4.1. 模型构建
为检验大数据应用对跨境电商出口产品质量的影响,构建基准计量模型:
(1)
其中,下标i、c、h、t分别表示企业、进口国、HS6位数产品和年份;被解释变量qualityit为企业i在t年出口至c国产品h的质量;核心解释变量Bigdatait为企业i在t年大数据应用程度(年报中大数据相关关键词频率加一后取对数);Xit为控制变量(公司规模、资产负债率、总资产周转率);λit为企业固定效应,γit为企业 − 年份固定效应;εit为随机误差项。
4.2. 变量及其测度
4.2.1.被解释变量:跨境电商出口产品质量(Quality)
借鉴施炳展[16]的需求反向法,通过构建产品需求函数:
(2)
其中qicht为出口数量,picht为出口价格,χct为进口国年份固定效应。回归得到εicht后,结合产品替代弹性σ计算质量初始值:
(3)
再进行标准化处理:
(4)
其中max(Quaicht)和min(Quaicht)分别为产品h质量的最大值和最小值。
4.2.2. 核心解释变量:大数据应用程度(lnBigdata)
基于上市公司年报文本分析,抓取“人工智能技术”“区块链技术”“云计算技术”“大数据技术”“数字技术应用”等关键词,统计出现次数并加一后取对数,作为大数据应用程度代理变量。具体衡量指标如表1。
Table 1. Keywords and definitions related to “Big Data”
表1. “大数据”相关关键词及定义
关键词 |
定义 |
人工智能技术(ai) |
研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 |
区块链技术(blockchain) |
按照时间顺序,将数据区块以顺序相连的方式组合成的链式数据结构,并以密码学方式保证的不可篡改和不可伪造的分布式账本。 |
云计算技术(cloudcomputing) |
通过网络“云”将巨大的数据计算处理程序分解成无数个小程序,通过多部服务器组成的系统进行处理和分析这些小程序得到结果并返回给用户。 |
大数据技术(bigdata) |
企业收集、处理与利用的海量、高速、多样化的数据要素或资产。 |
数字技术应用(digitaltech) |
一项与电子计算机相伴相生的科学技术 |
4.2.3. 控制变量
本文采取如下控制变量:资产负债率(lev):年末总负债/年末总资产;总资产周转率(ato):营业收入/平均资产总额;公司规模(size):年末总资产自然对数。
(1) 样本选择与数据来源
初始样本为2007~2015年中国A股上市公司,剔除总资产缺失、净资产为负、ST/PT企业、金融类企业等无效样本后,最终得到351,680条观测值。大数据应用变量来自年报文本分析,财务数据源自国泰安(CSMAR)数据库,跨境电商出口数据取自中国海关进出口数据库。
(2) 变量描述性统计
表2报告了主要变量的描述性统计结果。样本期间,企业出口产品质量(quality)的均值为0.524,取值介于0到1之间,这表明样本企业在出口产品质量上存在一定的离散度,既有质量较低的产品,也有质量达到顶峰的产品。均值为0.524说明样本整体质量中等,但标准差0.267反映了显著的“质量分化”,验证了研究背景中提到的“低端锁定”与转型升级并存的现实,使得研究质量提升机制具有现实意义。核心解释变量大数据应用程度(lnBigdata)的均值为0.755,最小值为0,最大值达到4.205,企业间差异较大。标准差接近均值反映了企业数字化转型进程的“不均衡性”。这种技术采纳的鸿沟为实证分析提供了关键的识别基础,使得我们可以对比大数据应用强弱对质量的不同影响。
Table 2. Descriptive statistics
表2. 描述性统计
变量 |
观测值 |
均值 |
标准差 |
最小值 |
最大值 |
quality |
351,680 |
0.524 |
0.267 |
0 |
1 |
lnBigdata |
351,680 |
0.755 |
0.998 |
0 |
4.205 |
lev |
351,680 |
0.446 |
0.19 |
0.03 |
0.925 |
ato |
351,680 |
0.822 |
0.392 |
0.053 |
2.907 |
size |
351,680 |
22.428 |
1.415 |
19.525 |
25.966 |
5. 实证结果和分析
5.1. 基准回归
表3汇报了基准回归结果。列(1)控制企业固定效应,未加入控制变量时,lnBigdata系数显著为正(0.00140*),表明大数据应用初步促进跨境电商出口产品质量提升;列(3)加入控制变量后,核心系数升至0.00306,且总资产周转率(0.0483)与公司规模(0.00705)显著为正,资产负债率(−0.0409)显著为负;列(2)和(4)加入年份固定效应后,结果依然稳健,核心系数进一步提升至0.00389和0.00333。研究假设H1得到验证。
Table 3. Benchmark regression results
表3. 基准回归结果
|
(1) quality |
(2) quality |
(3) quality |
(4) quality |
lnBigdata |
0.00140* (2.01) |
0.00389*** (4.62) |
0.00306*** (3.93) |
0.00333*** (3.91) |
lev |
|
|
−0.0409*** |
−0.0369*** |
|
|
|
(−5.31) |
(−4.75) |
ato |
|
|
0.0483*** |
0.0431*** |
|
|
|
(14.99) |
(12.67) |
Size |
|
|
0.00705*** (3.81) |
0.00524* (2.19) |
_cons |
0.523*** (777.87) |
0.521*** (684.13) |
0.342*** (8.23) |
0.385*** (7.17) |
年份固定效应 |
No |
Yes |
No |
Yes |
企业固定效应 |
Yes |
Yes |
Yes |
Yes |
N |
351,668 |
351,668 |
351,668 |
351,668 |
5.2. 稳健性检验
5.2.1. 内生性检验
(1) 被解释变量滞后三期:考虑到大数据应用程度影响企业的出口产品质量需要一定的时间,同时也为进一步缓解可能存在的反向因果问题,本文对企业出口产品质量变量进行滞后三期处理,回归结果如表4的第(1)、(2)列所示。可以发现,经滞后三期处理后,无论是否加入控制变量,核心变量lnBigdata的系数估计值仍然显著为正,大数据的应用程度仍然在1%及以上的统计水平上显著促进了企业的出口产品质量的提升,与基准回归结果一致,结果依然稳健。
Table 4. Endogeneity test
表4. 内生性检验
|
滞后处理回归 |
|
工具变量回归 |
(1) |
(2) |
(3) |
L3.quality |
L3.quality |
quality |
lnBigdata |
0.0230*** (10.88) |
0.0235*** (11.06) |
0.616*** (6.27) |
_cons |
0.515*** (200.60) |
−0.146 (−0.74) |
|
年份固定效应 |
Yes |
Yes |
Yes |
企业固定效应 |
Yes |
Yes |
Yes |
控制变量 |
No |
Yes |
Yes |
N |
97,178 |
97,178 |
293,488 |
(2) 工具变量估计:我们所选取的工具变量为利用地理信息系统(GIS)所计算得到的距离类型的变量,是各城市与杭州的球面距离。我们将工具变量与地级市层面(除本市外)的普惠金融指数进行交互,作为新的具有时间变化效应的工具变量。表4的第(3)列报告了采用工具变量估计的回归结果。表4回归结果表明在处理完内生性问题后,大数据应用提高企业的出口产品质量的基本结论不变。
5.2.2. 替换变量
本文进行企业出口产品再度量(quality1、quality2)。本部分借鉴白延涛(2022)的做法使用常弹性估计产品质量,将产品替代弹性σ替换为5和10,重新测算出口产品质量(quality1、quality2)。回归结果如表5所示,lnBigdata系数均显著为正,与基准回归一致,结论稳健。
Table 5. Robustness test results of the remeasurement of export product quality
表5. 出口产品质量再度量稳健性检验结果
|
(1) quality1 |
(2) quality1 |
(3) quality2 |
(4) quality2 |
lnBigdata |
0.00299*** (3.52) |
0.00254** (2.96) |
0.00299*** (3.52) |
0.00254** (2.96) |
lev |
|
−0.0309*** (−3.92) |
|
−0.0309*** (−3.92) |
ato |
|
0.0344*** (10.12) |
|
0.0344*** (10.12) |
size |
|
0.00391 (1.62) |
|
0.00391 (1.62) |
_cons |
0.546*** (705.60) |
0.444*** (8.24) |
0.546*** (705.60) |
0.444*** (8.24) |
年份固定效应 |
Yes |
Yes |
Yes |
Yes |
企业固定效应 |
Yes |
Yes |
Yes |
Yes |
N |
336,213 |
336,213 |
336,213 |
336,213 |
5.3. 中介效应检验
为进一步揭示大数据应用影响跨境电商出口产品质量的内在传导路径,本文引入技术创新作为中介变量进行机制检验。技术创新是以科学技术知识及其创造的资源为基础、以创造新技术为导向的企业核心活动,既是构筑企业国际竞争优势的关键来源,也是保障跨境电商企业可持续发展的战略支撑。在数字经济背景下,大数据应用能够通过赋能技术研发——如精准识别全球市场需求缺口、降低研发试错成本、加速创新成果商业化——进而推动出口产品质量升级。本文基于数据的准确性和可获得性,选取企业专利授权数(Inn)作为技术创新的代理指标,以检验“大数据应用→技术创新→出口产品质量”这一传导机制是否成立。表6结果表明,大数据应用通过促进企业技术创新,从而提升了产品质量,验证H2。
Table 6. Mediation effect test
表6. 中介效应检验
|
Inn |
lnBigdata |
0.0672*** (2.8726) |
_cons |
−1.3260 (−0.6927) |
年份固定效应 |
Yes |
企业固定效应 |
Yes |
控制变量 |
Yes |
N |
351,668 |
5.4. 异质性检验
5.4.1. 企业所有制
考虑到企业所有制的显著差异,大数据的应用程度对跨境电商企业出口产品质量可能存在异质性影响,为此本文将样本区分为国营或国有控股企业、私营企业和中外合资企业,并分别进行回归。估计结果报告在表7中。国营或国有控股企业lnBigdata系数为0.00606,显著为正;私营企业与中外合资企业系数不显著。可能原因在于:首先,国企在政策资源获取上具有天然便利性,更容易参与国家数字基建项目并获得税收优惠及政府数据资源支持。其次,依托多元化的融资渠道和较低的融资成本,国企能够承担数字化转型初期的高额投入,为技术应用提供稳定的资金保障。此外,国企普遍设有研发中心或专门的数据部门,具备较强的技术吸收能力与制度惯性,使其在技术引入后能够快速实现组织适配。最后,数字化转型周期长、见效慢,国企凭借较强的抗风险能力,能够持续推进大数据技术与生产流程的深度融合,从而实现出口产品质量的稳步提升。相比之下,私营企业在融资约束、人才吸引、政策对接等方面仍存在短板,短期内较难实现大数据与质量提升的有效联动。验证H3。
Table 7. Heterogeneity test of enterprise ownership
表7. 企业所有制异质性检验
|
(1) |
(2) |
(3) |
国营或国有控股企业 |
私营企业 |
中外合资企业 |
quality |
quality |
quality |
lnBigdata |
0.00606*** (3.29) |
0.00105 (1.03) |
0.00514 (1.43) |
_cons |
0.514*** (342.99) |
0.525*** (538.15) |
0.514*** (159.47) |
年份固定效应 |
Yes |
Yes |
Yes |
企业固定效应 |
Yes |
Yes |
Yes |
控制变量 |
Yes |
Yes |
Yes |
N |
107,557 |
205,124 |
23,131 |
5.4.2. 企业地理位置
根据样本企业所在地区不同划分为东部地区、西部地区以及中部地区。回归结果如表8所示。东部地区企业lnBigdata系数为0.00350,显著为正;西部地区系数不显著,中部地区系数为−0.0106,显著为负。可能的原因是东部地区基础设施完善、人才集聚,为大数据与跨境电商融合提供良好条件,而中部地区虽加快数字基建,但在人才、产业适配、数据要素配置上仍存“数字鸿沟”。一方面,传统制造业占比高,转型路径依赖强,短期内引入大数据可能因资源错配产生摩擦成本;另一方面,数据服务生态不成熟,隐性成本高,抑制了技术创新与质量升级的协同。因此,中部地区的负向效应并非技术本身问题,而是区域数字化进程中的结构性矛盾所致。H3得到验证。
Table 8. Heterogeneity test of region
表8. 地区异质性检验
|
(1) |
(2) |
(3) |
东部地区 |
西部地区 |
中部地区 |
quality |
quality |
quality |
lnBigdata |
0.00350*** (3.70) |
0.0118 (1.88) |
−0.0106*** (−3.90) |
_cons |
0.532*** (558.72) |
0.499*** (110.53) |
0.500*** (319.14) |
年份固定效应 |
Yes |
Yes |
Yes |
企业固定效应 |
Yes |
Yes |
Yes |
控制变量 |
Yes |
Yes |
Yes |
N |
257,169 |
10,543 |
54,038 |
6. 结论和政策建议
6.1. 研究结论
本文基于2007~2015年微观数据,实证分析大数据应用对跨境电商企业出口产品质量的影响,得出以下结论:第一,大数据应用能显著提升跨境电商出口产品质量,总资产周转率与企业规模具有正向调节作用,资产负债率则抑制质量提升;第二,通过滞后项处理与工具变量回归,验证了结论的稳健性;第三,中介效应表明,大数据应用通过促进企业技术创新从而提升出口产品质量;第四,异质性分析表明,大数据应用的促进效应在国营或国有控股企业和东部地区企业中更为显著。
6.2. 政策建议
第一,强化数字基础设施与数据开放。在国家跨境电商综合试验区率先搭建公共数据服务平台,整合海关、物流、税务等多元数据资源,向中小企业开放标准化接口与分析工具。鼓励地方政府与头部平台合作建设“产业带数据中心”,围绕重点出口品类构建行业数据模型,降低企业数据应用门槛,提升赋能效率。
第二,实施差异化财税激励。针对中西部跨境电商企业设立数字化转型专项补贴,对大数据系统采购、数据安全认证等支出给予最高30%的投入补贴。对实现产品质量提升的企业给予所得税减免或研发费用加计扣除倾斜。鼓励银行设立“数字贸易贷”,为高负债但具成长潜力的中小企业提供信用增级与贴息支持。
第三,推动产教融合人才培养。教育部与商务部可联合推进“跨境电商数字人才培育计划”,在高校设立“大数据 + 国际贸易”双学位项目,建设校企联合实训基地。鼓励企业建立“数据分析师”岗位标准,推动职业资格认证与职称评定衔接,提升从业人员数字化能力。
7. 研究不足与展望
本研究虽在理论与实证上取得进展,但仍存在以下局限:一是数据局限。海关与工业企业数据截至2015年,未能涵盖近年跨境电商高速发展及疫情后数字化转型的新阶段,后续需结合最新数据验证结论稳健性。二是测度局限。以年报关键词频衡量大数据应用,虽具操作性,但难以全面反映企业实际应用深度,后续可构建包括系统建设、数据架构、岗位设置等在内的多维指标体系。三是机制路径局限。本文聚焦技术创新路径,但大数据还可能通过供应链协同、客户管理、品牌建设等影响质量,未来可拓展多路径对比分析。