基于变系数Cox模型分析影响电商平台用户的决策时长的因素
Based on the Variable Coefficient Cox Model to Analyze the Factors Influencing the Decision-Making Duration of Users on E-Commerce Platforms
摘要: 本文将比例风险模型应用于用户下单时长的研究,揭示影响下单时长的变量及其对用户下单决策的影响。利用比例风险模型识别影响用户下单时长的变量并对其进行参数估计,如商品价格、用户情况、促销信息、用户个体差异等。并通过实例分析评估各因素的影响程度,量化各个因素对用户下单时长的影响,并分析这些因素如何提高或延缓用户的下单决策。基于模型结果,提出优化建议,帮助电商平台改善用户体验和转化率。
Abstract: This paper applies the proportional hazards model to the study of the time it takes for users to place orders, revealing the variables that influence the time and their impact on users’ ordering decisions. The proportional hazards model is used to identify the variables that influence the time it takes for users to place orders and to estimate their parameters, such as product prices, user conditions, promotional information, and individual differences of users. The paper also analyzes the degree of influence of each factor through an example and quantifies the impact of each factor on the time it takes for users to place orders. It further analyzes how these factors can enhance or delay users’ ordering decisions. Based on the results of the model, the paper proposes optimization suggestions to help e-commerce platforms improve user experience and conversion rates.
文章引用:毛围, 汪韫頔. 基于变系数Cox模型分析影响电商平台用户的决策时长的因素[J]. 电子商务评论, 2025, 14(1): 3362-3373. https://doi.org/10.12677/ecl.2025.141420

1. 引言

1.1. 研究背景

随着互联网技术的发展,尤其是移动互联网的普及,消费者可以随时随地进行购物。智能手机、平板电脑以及快速的网络连接使得在线购物体验更加便捷。新冠疫情期间,线下购物受到限制,消费者转向在线购物[1]。很多以前不习惯网络购物的消费者开始接触并习惯于这种购物方式,从而带动了电商的快速增长。网上购物使得消费者能够访问来自全国乃至全球各地的产品和品牌,极大丰富了购物选择。电商平台提供的比价功能也帮助消费者做出更理性的购物决策。

在电商竞争日益激烈的市场中,增强用户的黏性至关重要,通过精确的用户数据分析,平台可以实施个性化的服务和产品推荐,从而增强用户黏性,降低流失率。与此同时,理解用户的行为和需求,有助于优化购物流程及用户界面设计,提升转化率。例如,通过分析购物车放弃率,电商平台可以针对性地优化付款步骤和提供多种支付方式;掌握用户的数据和偏好,电商平台能够更有效地进行二次营销和促进交叉销售[2]。发送促销信息、赠送个性化优惠券等都能有效提升二次购买的可能性;在竞争激烈的电商市场,能够深入理解用户需求和行为的电商平台能够制定更为精准的市场策略和运营模式,从而获取竞争优势;通过分析用户的购物数据和反馈,电商平台可以提升客户服务质量。实现快速响应用户咨询、及时解决售后问题,从而增强用户满意度和好评率;通过积极的用户互动和良好的购物体验,电商平台可以逐渐建立品牌忠诚度。用户对平台的信任感会在一定程度上影响他们的购买决策,愿意重复在同一平台购物。

网上购物的普及为电商平台带来了巨大的机遇,然而,要在这场竞争中脱颖而出,掌握用户的需求与行为、更好地服务用户是关键。电商平台必须重视用户体验,通过数据分析和个性化策略,提升用户的满意度与忠诚度,从而在市场中占据一席之地[3]。购物车是用户在电商平台购物过程中一个重要的环节。用户将商品加入购物车后,是否最终下单,往往取决于多个因素,其中下单时间是一个关键变量。研究用户信息、商品信息与下单时间之间的关系,可以帮助电商平台理解用户在购物决策过程中所经历的心理过程和行为模式。

1.2. 研究目的

通过分析用户信息、商品信息与下单时间之间的关系,揭示用户在购物过程中可能存在的犹豫和决策延迟的原因[4]。价格是影响消费者购物决策的重要因素。通过对用户信息和商品信息的分析,研究其对购物车转化率的影响。研究目的在于了解用户下单的敏感度,探讨商品情况如何影响用户的购买决策。促销活动(如折扣、限时抢购、满减等)是吸引用户下单的重要手段。研究促销信息的展示方式和时机对购物车转化率的影响,可以帮助电商平台优化促销策略[5]。研究目的在于探讨不同类型的促销信息如何影响用户的购物决策,尤其是在购物车放弃率高的情况下,如何通过有效的促销信息刺激用户完成购买。

本文的研究目的可以总结为:揭示用户信息、商品信息与下单时间之间的关系,并识别影响用户决策的关键时间节点。分析商品价格、用户情况、促销信息等因素对购物决策的影响,为电商平台提供数据支持,帮助其制定更有效的市场策略。为电商平台优化购物体验、提升转化率提供实证依据,以增强用户满意度和忠诚度,实现可持续发展。通过这些研究目的的实现,本文希望能够为电商行业的理论研究和实践应用提供有价值的参考,推动在线购物体验的不断改善。

2. 研究方法

比例风险模型(Cox Proportional Hazards Model)是一种常用于生存分析的统计模型,主要用于研究时间到事件发生的影响因素。在电商背景下,事件指的是用户完成购买,下单时长即为事件发生的时间。因此,将比例风险模型应用于用户下单时长的研究,能够有效揭示影响下单时长的变量及其对用户下单决策的影响。分析影响用户下单时长的因素:利用比例风险模型识别影响用户下单时长的变量,如商品价格、用户情况、促销信息、用户个体差异等。评估各因素的影响程度,量化各个因素对用户下单时长的影响,并分析这些因素如何提高或延缓用户的下单决策。基于模型结果,提出优化建议,帮助电商平台改善用户体验和转化率。

Cox模型是1972年由D. R. Cox [6]提出的一类半参数生存分析模型,该方法最大的优点是对生存时间的分布没有要求,降低了构建模型的复杂性,同时结合了参数法和非参数的优点,既可以对影响生存时间的因素进行分析,也可以对影响生存率的因素进行分析。但是由于研究的深入,发现对于一些给定的情况,Cox模型已经无法满足当前问题解决的需要。由其衍生出来的变系数Cox模型是在原模型的基础上进行发展和改进,相对于原型,它的灵活性更强。变系数Cox模型假定系数不是固定的,而是另外一个自变量的未知形式的函数,在这种情况下,变系数Cox模型不仅可以处理更高维数据,而且还具有普通Cox模型所不具备的灵活性及适应性,更加线性直观,便于解释。

关于变系数Cox模型的研究主要是针对于参数估计和变量选择进行展开,目前,变系数模型的参数估计方法主要有核光滑估计、多项式样条估计和光滑样条估计三种,这些方法都建立在最小二乘法之上。2000年Cai [7]等人基于局部多项式回归对模型的系数进行拟合,并且说明这种方法选择出来的结果具有渐近正态性这个优良性质;同年You [8]等人提出一个修正的局部线性估计,并且还证实了它的估计值具有渐进正态性和一致性这两个优良性质。

Cox模型是通过考虑解释变量对生存时间的影响,来分析生存数据的一种回归模型。它假设不同样本之间的风险比是恒定的,即“风险比”不随时间变化,称之为比例风险假设,简称PH (Proportional Hazards)假设。Cox模型是基于该假设下成立的,该假设表示为:

λ( t| X i ) λ( t| X j ) =exp( X i β X j β )

而变系数Cox模型则是在比例风险假设不成立的情况下衍生出来的,假设变系数Cox模型的样本构成为 ( T ˜ i , Δ i , X i ),i=1,,n, Δ i =I( T ˜ i C i ) n为样本量, T ˜ i =min( T i , C i ) T i C i 分别为个体i的生存时间和删失时间,且相互独立, Δ i 为事件标识变量,当 Δ i =1 表示样本发生危机事件,当 Δ i =0 表示样本未发生危机事件,假设观测的死亡时间不存在打结现象,失效时间 T ˜ 的风险函数变系数Cox模型的形式为:

λ( t|X;U )= λ 0 ( t )exp{ β ( U ) T X }

其中, λ 0 ( t ) 为基准风险函数, X i = ( X i1 ,, X ip ) T 表示观测到的个体ip维协变量, β( U )= ( β 1 ( U ),, β p ( U ) ) T p维变系数列向量,U为系数的自变量。

与传统Cox模型使用的部分似然估计方法相似,变系数Cox模型也可以通过部分似然来进行估计,变系数模型的部分似然函数可以表示为:

L( β( U ) )= i: Δ i =1 exp( β( U ) X i ) jR( u i ) exp( β( U ) X j )

其中, R( u i ) 是在变量 u i 时仍在风险集中的个体。

3. 实例分析

该部分数据来源于Kaggle Dateset公布的某电商平台的购物数据,该数据集包含55,000个综合客户交易条目,数据集包含指标如表1

Table 1. Dataset metrics

1. 数据集指标

指标名

指标含义

Customer ID

每个客户的唯一标识符

Transaction ID

每个交易的唯一标识符

Gender

客户的性别,分类为男性或女性

Age group

客户的年龄组,分为几个范围

Purchase Date

交易发生的时间戳

Product Category

所购买产品的类别,例如电子产品、服装等

Discount Availed

指示客户是否享受了任何折扣(Yes/No)

Discount Name

应用的折扣的名称

Discount Amount (INR)

买家获得的折扣金额

Gross Amount

应用任何折扣之前的总金额

Net Amount

应用折扣后的最终金额

Purchase Method

使用的付款方式

Location

购买所在的城市

本文利用R语言对此数据集搭建变系数Cox模型如下:

λ( t|X )= λ 0 ( t )exp{ β 1 Gender + β 2 AgeGroup+ β 3 ProductCategory + β 4 DiscountAvailed+ β 5 DiscountName+ β 6 DiscountAmount + β 7 GrossAmount+ β 8 PurchaseMethod+ β 9 Location }

并通过自适应法进行参数估计,结果如表2,对于各变量的参数估计可视化如图1~9,通过参数估计结果来看,Age Group中在年龄45~60之间的用户购物的考虑时长较长,其他年龄段的用户下单时间较快,考虑时间较短;Product Category中大部分常见生活用品的下单时长都较长于一些小众商品;Discount Availed对于用户的影响能明显地看出折扣活动的存在加快了用户下单购物的速度,而在众多Discount Name折扣活动中,活动SAVE10似乎更受用户的喜爱,相较于其他折扣活动,用户在SAVE10活动中下单的速度更快,考虑的时间更短;从Discount Amount折扣金额上看,值得分析的是折扣力度的大小并未加快用户下单速度,从Gross Amount商品总额上看,对于商品价值较高的物品,用户下单时间反而更快,考虑时长更短;在众多Purchase Method支付方式中,常使用Credit Card,Google Pay UPI,PhonePe UPI的用户下单时间较长,考虑的时间较长,这类用户可作为潜力用户针对性发展和培养;不同Location地区的用户下单的速度大同小异,对于从参数估计中发现的下单速度较慢的地区可进行深入分析。

Table 2. Parameter estimation results

2. 参数估计结果

指标

指标内容

参数估计

Gender

GenderMale

0.034582115

GenderOther

0.01794229

Age Group

Age.Group25-45

−0.004297042

Age.Group45-60

0.0031503

Age.Group60 and above

−0.004367268

Age.Groupunder 18

−0.005226415

Product Category

Product.CategoryBooks

0.003548615

Product.CategoryClothing

0.021762945

Product.CategoryElectronics

0.01481866

Product.CategoryHome & Kitchen

0.03367462

Product.CategoryOther

−0.028959089

Product.CategoryPet Care

0.041037661

Product.CategorySports & Fitness

0.026474142

Product.CategoryToys & Games

0.023864892

Discount Availed

Discount.AvailedYes

−0.026683516

Discount Name

Discount.NameFESTIVE50

0.01461825

Discount.NameNEWYEARS

0.02632663

Discount.NameSAVE10

−0.008387354

Discount.NameSEASONALOFFER21

0.017738248

Discount.NameWELCOME5

0.021762945

Discount Amount

Discount.Amount..INR.

0.005468172

Gross Amount

Gross.Amount

−0.00000686

Purchase Method

Purchase.MethodCredit Card

0.006676648

Purchase.MethodDebit Card

−0.020001047

Purchase.MethodGoogle Pay UPI

0.001459669

Purchase Method

Purchase.MethodInternational Card

−0.029214563

Purchase.MethodNet Banking

−0.010846241

Purchase.MethodPaytm UPI

−0.010892576

Purchase.MethodPhonePe UPI

0.009438442

Location

LocationBangalore

−0.007783231

LocationChennai

0.010665713

LocationDehradun

0.016745636

LocationDelhi

−0.017516903

LocationHyderabad

−0.029393595

LocationJaipur

−0.008588812

LocationKolkata

0.002516072

LocationLucknow

0.028641393

LocationMumbai

−0.023823082

LocationOther

0.008489617

LocationPune

−0.03588282

LocationSrinagar

0.016446909

LocationVaranasi

−0.0016318

Figure 1. Gender parameter estimation visualization

1. Gender参数估计可视化图

Figure 2. Gender parameter estimation visualization

2. Gender参数估计可视化图

Figure 3. Gender parameter estimation visualization

3. Gender参数估计可视化图

Figure 4. Discount Availed parameter estimation visualization

4. Discount Availed参数估计可视化图

Figure 5. Discount Name parameter estimation visualization

5. Discount Name参数估计可视化图

Figure 6. Discount Amount parameter estimation visualization

6. Discount Amount参数估计可视化图

Figure 7. Gross Amount parameter estimation visualization

7. Gross Amount参数估计可视化图

Figure 8. Purchase Method parameter estimation visualization

8. Purchase Method参数估计可视化图

Figure 9. Location parameter estimation visualization

9. Location参数估计可视化图

4. 结果与讨论

4.1. 年龄段分析

观察结果:45~60岁年龄段的用户购物考虑时长较长,若用户属于该年龄段,则其购物的决策时长对比其他用户会增长e0.003倍,而其他年龄段的用户下单时间较快。

讨论及建议:针对性营销,针对45~60岁用户,可以考虑提供更多的产品教育和信息,例如详细的产品说明、用户评价、使用指南等,以帮助他们做出决策;个性化推荐,利用数据分析,针对这一年龄段用户的购买历史和浏览习惯,提供个性化的产品推荐,减少他们的考虑时长。

4.2. 产品类别分析

观察结果:常见生活用品的下单时长普遍较长,而购买小众商品的用户相对其他用户来说其下单时间加快了e0.02倍。

讨论及建议:优化产品展示,对于生活用品,可以通过优化产品页面设计、提高产品的可见性和吸引力,来提升用户的购买意愿;促销活动,针对小众商品,可以设计一些限时促销活动,吸引用户尝试购买,提升其销售量。

4.3. 折扣活动分析

观察结果:商品是否有折扣活动明显使用户的下单速度加快了e0.02倍,同时在各类折扣活动中SAVE10折扣活动更受欢迎,参数估计结果显示在该折扣下的商品,用户下单的决策时长缩短e0.008倍。

讨论及建议:增强折扣活动的宣传,加大对SAVE10活动的宣传力度,可以通过邮件、社交媒体等渠道进行推广,吸引更多用户参与;设计多样化的折扣活动,研究其他成功的折扣活动,尝试推出不同类型的折扣(如满减、买一送一等),以满足不同用户的需求。

4.4. 折扣金额分析

观察结果:参数估计结果为正,表示折扣金额的大小并未显著加快用户下单速度,反而折扣金额若增加用户的决策时间越长,平均增长e0.005倍。

讨论及建议:研究用户心理,深入分析用户对折扣的心理预期,可能需要设计一些“心理价格”折扣策略,例如小幅折扣但强调其价值感;结合产品价值,对于高价值商品,可以考虑提供更高的折扣力度,以刺激用户购买。

4.5. 支付方式分析

观察结果:使用信用卡、Google Pay UPI和PhonePe UPI的用户下单时间较长,若用户使用PhonePe PUI进行支付则其决策时间平均增长e0.009倍,PhonePe PUI是这三种支付方式中对用户决策时长影响最大的。若用户使用Google Pay UPI进行支付,则其决策时间平均增长e0.001倍,是这三种支付方式中增长用户决策时长程度最小的。

讨论及建议:优化支付流程,针对这些支付方式,优化支付流程,减少用户在支付环节的等待时间,提升用户体验;培养潜力用户,针对这些用户群体,提供会员制度或积分奖励,鼓励他们提高购买频率。

4.6. 地区分析

观察结果:从参数估计值的绝对值大小看不同地区用户下单速度还是有差异存在,有少部分地区如Lucknow下单速度明显较慢,该地区的用户决策时长相对其他地区来说平均增长e0.02倍,也有地区如Hyderabad,Mumbai,Pune,该地区的用户下单速度较快,平均缩短下单时长约e0.03倍。

讨论及建议:深入市场调研,对下单速度较慢的地区进行市场调研,了解用户的购物习惯、偏好和痛点,制定相应的市场策略;区域性营销活动,针对特定地区推出本地化的营销活动,例如节日促销、地方特色商品等,以提升用户的购买兴趣。

5. 总结

通过对用户购物行为的深入分析,发现年龄段、产品类别、折扣活动、支付方式和地区等多种因素对用户的购物决策和下单速度有着显著影响。

各个因素对用户下单决策时长的影响具有明确的量化特征:

年龄段:45~60岁用户决策时间增加e0.003

产品类别:小众商品下单速度加快e0.02

折扣活动:有折扣时下单速度提升e0.02倍,SAVE10折扣影响决策时长缩短e0.008倍;

折扣金额:折扣金额增加时,决策时间增加e0.005倍;

支付方式:PhonePe UPI决策时间增加e0.009倍,Google Pay UPI增加e0.001倍;

地区:Lucknow下单慢速增长e0.02倍,而聚焦地区如Hyderabad、Mumbai、Pune决策时长缩短约e0.03倍。

综合这些量化分析,商家可以制定数据驱动的策略,以提升用户体验和销售业绩。电商平台作为管理者,应根据这些洞察制定相应的策略,以提升用户体验、加快下单速度并增强用户的忠诚度。未来,随着技术的不断进步和市场环境的变化,电商平台应持续关注用户行为的变化,灵活调整运营策略,以保持竞争优势。电商平台可以制定出更具针对性的营销策略和用户培养计划,从而提升用户体验和平台的整体销售业绩。建议定期监测这些策略的实施效果,并根据市场反馈进行调整。

参考文献

[1] 邓永胜, 章铭珠, 成可, 等. 消费者生鲜电商平台购菜意愿与行为差异性分析[J]. 农业与技术, 2024, 44(18): 134-139.
[2] 刘伟, 张珊, 张雨婷. 助推发展新电商聚力激活新动能[N]. 联合日报, 2024-09-27(002).
[3] 夏近秋. 电子商务平台用户体验对购买意愿的影响研究[J]. 商场现代化, 2024(21): 25-27.
[4] 谢静. 数字化时代下的服装品牌营销策略[J]. 西部皮革, 2024, 46(16): 26-28.
[5] 李瑶. 电商品牌营销策略与消费者购买意愿研究——基于消费者参与、消费者感知价值的中介作用[J]. 商业经济研究, 2024(14): 55-58.
[6] Cox, D.R. (1972) Regression Models and Life-Tables. Journal of the Royal Statistical Society Series B: Statistical Methodology, 34, 187-202.
https://doi.org/10.1111/j.2517-6161.1972.tb00899.x
[7] Cai, Z., Fan, J. and Li, R. (2000) Efficient Estimation and Inferences for Varying-Coefficient Models. Journal of the American Statistical Association, 95, 888-902.
https://doi.org/10.1080/01621459.2000.10474280
[8] You, J., Zhou, Y. and Chen, G. (2006) Corrected Local Polynomial Estimation in Varying‐Coefficient Models with Measurement Errors. Canadian Journal of Statistics, 34, 391-410.
https://doi.org/10.1002/cjs.5550340303