1. 引言
蔬菜类商品作为人们日常消费的重要组成部分,其定价直接关系到消费者的日常开支和商家的盈利能力。然而,由于蔬菜类商品的特点,如易腐性、季节性强、供应链复杂以及市场供需波动频繁,其定价问题长期以来具有较高的复杂性和不确定性。在传统的定价方式中,商家通常根据经验、市场行情或简单的定价模型来制定价格,缺乏科学性和动态调整能力,导致利润最大化与消费者满意之间难以平衡。随着大数据技术、人工智能和物联网的发展,蔬菜类商品的自动定价系统逐渐成为研究热点。通过实时采集蔬菜的供应量、需求量、气候变化、生产成本以及市场竞争等多维数据,结合智能算法进行分析和预测,可以动态调整价格,实现价格的科学化、精准化和智能化。自动定价系统不仅能够提高商家的经济效益,还能通过合理引导消费需求,减少资源浪费,助力农业现代化与数字化发展。因此,研究蔬菜类商品的自动定价系统,探索其在实际应用中的可行性与优化策略,不仅具有重要的经济意义,也为推动农业产业链数字化转型提供了重要的参考依据。如张伟等[1]探讨了农产品价格波动的主要影响因素,提出了政策建议。高佳楠等[2]结合动态模型与大数据技术,优化了蔬菜价格的形成机制。赵明等[3]在分析供应链视角下的价格波动规律的前提下,提出了跨区域协调机制。王强等[4]利用时间序列分析方法揭示了蔬菜市场价格波动的规律。李健[5]研究了绿色农业种植模式对价格的正向作用及其市场表现。
本文以蔬菜类商品为研究对象,从市场需求、定价模型等多角度展开分析,基于2023年数学建模竞赛C题[6]中附件1-4提供的销售明细、批发价和损耗率等数据,建立数学模型以解决自动定价与补货问题,旨在为蔬菜类商品定价提供科学有效的解决方案。问题一中,需要分析蔬菜品类和单品之间的销售量分布及相互关系;问题二中,以品类为单位进行补货,需要研究销售总量与定价之间的关系,并计算7月1~7日每日的补货量和定价策略,以实现商超收益最大化;问题三中,在销售单品数量限定为27~33个、最小陈列量2.5千克的前提下,依据6月24~30日数据,需要制定7月1日的单品补货量和定价策略,同时要兼顾市场需求和收益;问题四中,需要探讨如何收集更多数据,以优化蔬菜商品的补货与定价策略,并分析数据收集的依据。
2. 问题的分析
2.1. 问题一分析
对于第一小问,通过统计附件二中的单品编号,将其分为6个蔬菜品类,并采用假设检验方法分析各品类的销售量分布规律及其相互关系;对于第二小问,统计附件二中的单品销售数据,运用假设检验方法进一步分析单品之间的销售量分布规律及其相互关系。
2.2. 问题二分析
第一步:构建多元函数,拟合各蔬菜品类的销售总量与成本加成定价之间的趋势关系,分析定价对销售的影响;第二步:采用时间序列模型预测未来一周各蔬菜品类的补货需求量,确保供应链的及时性与稳定性;第三步:基于第一步中的拟合函数,制定以商超收益最大化为目标的定价策略,优化各品类的价格,以寻找销售量最高或销售最低时的最优定价。
2.3. 问题三分析
第一小问:筛选出满足数量范围及最小陈列量要求的27个单品,统计其不同日期的销售量以此作为灰色预测模型的原始序列,并通过SPSS预测7月1日的补货需求量;第二小问:基于非线性规划模型求解商超收益最大化的最优定价策略,以优化商品的价格设置。
2.4. 问题四分析
第一步:除附件数据外,还可采集市场上同类蔬菜的价格与历史销售数据、季节性供给情况及季节结束后的价格波动数据,以及顾客的反馈意见;第二步:分析并阐明采集相关数据的背景依据,为后续研究和分析提供支持和参考。
3. 模型的建立与求解
3.1. 问题一模型的建立与求解
3.1.1. 数据预处理
对附件2中每个单品的销售情况进行分析,统计出已销售单品,剔除退货单品,再对每个单品进行统计归类,得出6大品类的结果。
3.1.2. 探究品类之间销售量和单品之间销售量的分布规律
1) 数据的选取
在品类销售和单品销售的数据选取中,分别以6个品类销售平均值和每个单品销售平均值作为数据来分析分布规律。
2) 正态分布假设检验
通过SPSS软件对品类销售平均值和每个单品销售平均值进行Shapiro-Wilk检验,结果分别如表1和表2所示。并结合对应的正态分布pp图,如图1和图2所示,验证是否符合正态分布假设。在Shapiro-Wilk检验中,若显著性
则拒绝原假设,认为不服从正态分布;如果
则接受原假设,认为服从正态分布。在pp图中,若样本数据服从所假定的正态分布,则散点较好地落在原点出发的45˚线附近,反之则不符合。
Table 1. Significance test of category sales averages
表1. 品类销售平均值显著性检验
变量名 |
样本量 |
中位数 |
标准差 |
偏度 |
峰度 |
S-W检验 |
K-S检验 |
销量平均值 |
6 |
0.116 |
0.101 |
0.846 |
0.385 |
0.921 |
0.185 |
通过表1和图1分析,S-W检验中显著性
和样本散点数较好落在直线附近,所以在品类之间销售量呈正态分布规律。
Figure 1. PP plot of category sales averages
图1. 品类销售平均值pp图
Table 2. Significance test of individual product sales averages
表2. 每个单品销售平均值显著性检验
变量名 |
样本量 |
中位数 |
标准差 |
偏度 |
峰度 |
S-W检验 |
K-S检验 |
销量平均值 |
247 |
0.547 |
0.487 |
4.231 |
3.911 |
0.633 |
0.204 |
Figure 2. PP plot of individual product sales averages
图2. 每个单品销售平均值pp图
通过表2和图2分析,S-W检验中显著性
同样样本散点图基本落在直线周围,所以在每个单品之间销售量基本呈正态分布规律。
3.1.3. 品类之间销售量和单品之间销售量的相互关系
对于相互关系的探究,采用皮尔逊相关系数来度量每个变量之间的相关性,其值介于−1和1之间,若绝对值越大说明该变量之间越相关。
1) 皮尔逊相关系数检验
选取每个品类之间销售的总和、均值和方差作为品类之间相关系数的计算数据,选取各个单品销售量作为单品之间相关系数的计算数据,求出品类之间销售量的相关系数,如表3所示。假设
,即该变量之间相关性为0;而
,即该变量之间相关性不为0。
2) 相关系数分析
Table 3. Correlation coefficient table of sales volume between categories
表3. 品类之间销售量的相关系数表
|
花菜类 |
辣椒类 |
花叶类 |
茄类 |
水生根茎类 |
食用菌 |
花菜类 |
1 |
0.787 |
0.674 |
0.231 |
0.564 |
−0.645 |
辣椒类 |
0.787 |
1 |
0.783 |
0.634 |
0.823 |
0.723 |
花叶类 |
0.674 |
0.783 |
1 |
0.896 |
−0.821 |
−0.856 |
茄类 |
0.231 |
0.634 |
0.896 |
1 |
−0.942 |
0.875 |
水生根茎类 |
0.564 |
0.823 |
−0.821 |
−0.942 |
1 |
−0.786 |
食用菌 |
−0.645 |
0.723 |
−0.856 |
0.875 |
−0.786 |
1 |
通过表3数据可知,取其系数的绝对值,得出结果大部分趋近于1,各品类之间销售量呈现显著性。
3.2. 问题二模型的建立与求解
3.2.1. 数据预处理探究各蔬菜品类的销售总量与成本加成定价的关系
选取各蔬菜品类打折销售总量、未打折销售总量和全部销售总量作为因变量,以其对应打折平均售价、未打折平均售价和全部平均售价作为自变量,如表4所示。
Table 4. Data selection for each category of vegetables
表4. 各品类蔬菜数据选取
|
花菜类 |
花叶类 |
茄类 |
食用菌类 |
水生根茎类 |
辣椒类 |
打折平均售价(元/千克) |
7.65 |
4.27 |
6.08 |
6.50 |
10.73 |
8.15 |
未打折平均售价 |
9.22 |
6.42 |
10.75 |
8.75 |
12.15 |
9.86 |
全部平均售价 |
9.14 |
6.32 |
10.58 |
8.70 |
12.04 |
9.69 |
打折销售总量(千克) |
2238.387 |
13407.101 |
5508.327 |
600.012 |
6349.631 |
3649.649 |
未打折销售总量 |
39551.390 |
185252.452 |
86136.785 |
21842.107 |
69782.095 |
36957.903 |
全部销售总量 |
41789.777 |
198659.553 |
91645.112 |
22442.119 |
76131.726 |
40607.552 |
可通过函数拟合[7]来描述不同品类蔬菜商品在不同售价之间的趋势关系,蔬菜品类平均售价
、当天蔬菜品类销售总量
,构建两者之间函数表达式:
(1)
对于非线性静态模型参数a、b、c运用非线性最小二乘法,代入上表4数据。对于函数的检验,通过可决系数
对拟合结果进行评价,
越接近1,函数的拟合效果就越好。
(2)
以花菜类数据为例进行拟合,得到花菜类的拟合函数图像,如图3所示,对函数图像趋势分析可得:若花菜类以花叶类和食用菌类的售价售出时,花菜类总销售量呈上升趋势;以茄类、水生根茎类和辣椒类的售价售出时,总销售量呈下降趋势。
Figure 3. Fitted function plot for cauliflower category
图3. 花菜类的拟合函数图像
3.2.2. 探究各蔬菜品类的日补货总量
对于未来一周的补货总量预测,采用时间序列预测中的自回归移动平均模型(ARIMA),模型的表达式为ARIMA (p, q, d),其中p为非季节自回归阶数,d为非季节差分阶数,q为非季节移动平均阶数。模型通过数据的自相关性和差分的方式,分析在数据背后的时间序列模式,运用时间序列模式来预测未来的数据。
1) 获取时间序列数据
收集2020年7月1日到2023年6月30日各品类每日的销售量作为时间序列数据,通过SPSSPRO软件进行数据分析。
2) 时间序列的预处理
平稳化检验:可通过ADF单位跟
进行显著性检验或运用自相关函数ACF检验,反映了同一序列在不同时序的取值之间的相关性。公式为:
(3)
其中:
为自身时间序列值,
为有序随机变量序列的协方差。
序列平稳化:若时间序列数据不平稳,可通过
阶差分变换即对相距一期的两个序列值之间的减法运算。记
为
的
阶差分:
(4)
3) 模型参数确定与模型检验
以花菜类数据为例,进行时间序列分析,画出对应的花菜类拟合时间序列图,如图4所示。其中参数确定可通过PACF图、ACF图分别确定
值、
值;
可以根据差分后的平稳性检验得到。模型检验可通过预测图的拟合优度
:回归平方和在总平方和中所占的百分比,数值越大,模型预测效果越好。通过时间序列分析得出的结果与前几天的销售结果相差不大,可以作为7月1日~7日的补货量。
Figure 4. Fitted time series plot for cauliflower category
图4. 花菜类拟合时间序列图
4) 模型预测
通过SPSSPRO软件分析,得出预测结果,如表5所示。
Table 5. Daily replenishment forecast for various vegetable categories from July 1 to July 7
表5. 各种蔬菜品类7月1日~7月7日的日补货量预测结果
|
花菜类 |
花叶量 |
辣椒类 |
茄类 |
食用菌 |
水生根茎类 |
7月1日 |
22.86 |
125.37 |
83.89 |
22.66 |
53.01 |
20.137 |
7月2日 |
20.42 |
116.10 |
85.29 |
20.84 |
42.00 |
21.08 |
7月3日 |
19.27 |
118.83 |
85.79 |
17.68 |
32.28 |
21.47 |
7月4日 |
18.72 |
121.38 |
85.89 |
17.32 |
43.56 |
21.84 |
7月5日 |
18.45 |
125.17 |
85.90 |
16.67 |
51.56 |
22.21 |
7月6日 |
18.32 |
126.51 |
86.10 |
18.40 |
44.47 |
22.56 |
7月7日 |
18.24 |
125.49 |
85.67 |
19.40 |
45.40 |
22.91 |
3.2.3. 商超收益最大下品类定价策略构建
由第一问中各蔬菜品类销售总量与售价之间的关系趋势结果可知在不同品类售价的情况下,各类蔬菜的销售总量不同。若存在收益最大,则函数表达式为:
(5)
其中
为当天品类销售量,
为定价,
为品类平均批发价格,
为当日品类补货量。
若销售总量最低,则存在的合理定价才能使不同品类获取利润最大化。因为销售商品总量为较低值代表商品未售完,则定价策略考虑商品平均售价、商品平均损失率和商品批发成本。
则定价表达式为:
(6)
其中
为品类的平均损失率,
为商品平均售价。
若销售总量最高,则存在最优定价才能使不同品类获取利润最大。因为销售商品总量为最高值代表商品全售完,这时根据问题二第一小问得存在对应最优定价,应使用最优定价作为未来定价。
则定价表达式为:
(7)
其中:
为高销售量下的品类定价。
3.3. 问题三模型的建立与求解
3.3.1. 探究各蔬菜单品的日补货量
对于蔬菜单品在7月1日的补货量预测,可采用灰色预测模型[8],模型基于灰色系统理论,通过收集不完全信息和不确定的数据,建立灰色微分方程来描述和预测系统的行为,从而进行未来数据预测。
1) 原始数列预处理
根据2023年6月24~30日的每个单品收益大小筛选出27个,且满足最小陈列量的要求并对27个单品的每日销售量进行统计。
设原始序列为
,经过1次累加生成数列为:
,其中:
2) 建立灰微分方程
定义
的灰导数为:
(8)
令
为数列
的领值生成数列,即:
(9)
从而构建灰微分方程模型为:
(10)
3) 构造数据矩阵O、Y
求解出发展系数
和灰作用量
,可通过构造数据矩阵
:
(11)
数据向量矩阵
:
(12)
令
,求解上述微分方程得
。
4) 精度检验
残差检验:若残差绝对值
小于0.1则认为达到较高要求;小于0.2则达到一般要求。公式如下:
(13)
级比偏差值检验:若级比偏差值绝对值
小于0,则认为达到较高要求;小于0.2则达到一般要求。公式如下:
(14)
根据灰色预测模型GM (1, 1)求解出的结果与24日~30日的数据相比相差并不大,没有出现数据突变等异常情况,符合增幅趋势。
5) 模型预测
通过SPSSPRO软件分析,预测得出结果如表6所示。
Table 6. Replenishment quantities and pricing results for each product on July 1
表6. 各单品7月1日补货量和定价结果
单品 |
7.1补货量(千克) |
7月1日最优定价 |
云南生菜(份) |
38.320 |
8.000 |
小米椒(份) |
28.659 |
1.800 |
云南油麦菜(份) |
27.921 |
4.800 |
金针菇(盒) |
22.729 |
6.968 |
西兰花 |
18.592 |
2.900 |
芜湖青椒(1) |
16.564 |
4.889 |
螺丝椒(份) |
13.337 |
15.141 |
娃娃菜 |
12.584 |
11.124 |
竹叶菜 |
11.674 |
4.794 |
双孢菇(盒) |
9.279 |
5.523 |
小皱皮(份) |
9.276 |
3.124 |
螺丝椒 |
8.749 |
8.000 |
上海青 |
8.236 |
3.200 |
长线茄 |
7.968 |
5.365 |
净藕(1) |
7.535 |
5.200 |
海鲜菇(包) |
7.274 |
25.273 |
菠菜(份) |
7.187 |
24.000 |
红薯尖 |
6.192 |
3.400 |
紫茄子(2) |
6.175 |
5.176 |
苋菜 |
6.089 |
5.200 |
西峡花菇(1) |
5.884 |
3.417 |
木耳菜 |
5.591 |
3.700 |
小青菜(1) |
5.365 |
3.700 |
姜蒜小米椒组合装(小份) |
5.182 |
12.000 |
洪湖藕带 |
4.530 |
3.400 |
高瓜(1) |
4.044 |
6.000 |
3.3.2. 商超收益最大化下单品定价策略构建
对于实现收益最大化的单品定价策略,可基于非线性规划模型求解每个单品的最优定价,从而制定科学的定价方案。非线性规划模型能够综合考虑商品价格、需求量以及成本等多重因素,通过优化目标函数(通常为收益函数),在约束条件下计算出每个单品的最佳定价。
1) 相关性数据的收集
由第一小问中筛选的27个单品,统计附件2和附件3中筛选单品销售量、单品平均批发价格和历史销售单价的最大、最小值;同时运用预测得来的单品每日补货量。
2) 确定目标函数
若存在商超收益最大,则目标函数为:
(15)
其中
为单品定价,
为单品销售量,
为单品平均批发价格,
为单品补货量:
3) 确定约束条件
条件一:单品销售满足最小陈列量2.5千克且小于单品补货量
:
(16)
条件二:单品定价不得超于历史最高定价和低于历史最低定价:
(17)
4) 最优单品定价的求解
运用Matlab代码求解得出结果,如表6所示。基于非线性规划模型通过Matlab所求解出的最优定价中出现3个异常数值但整体符合24日~30号的价格区间。
3.4. 问题四模型的建立与求解
除了题目中附件所提供的数据,还可以收集以下信息:市场上同类蔬菜商品的价格和历史销售数据,以分析价格变化趋势;季节性问题中商品供应的丰富度及季节结束后的价格波动情况,用来了解供需动态;以及顾客的反馈意见数据,以评估消费者对商品的满意度和需求偏好。
3.4.1. 市场其他商超销售情况
根据参考价格效应[9],消费者对价格的认知通常会受到参考价格的影响。参考价格是消费者在购买前用于比较当前价格的基准,在购买蔬菜商品时,消费者往往会货比三家,将当前价格与其他同类蔬菜商品的价格进行对比,从而选择最合适的商品。
采集市场中各类蔬菜商品的销售数据,不仅可以反映不同蔬菜的销售情况,还能揭示其销售趋势及季节性变化。消费者对蔬菜商品的参考价格是影响其购买决策的重要因素之一。因此,商超在制定定价策略时,应综合考虑市场上其他商超的同类商品价格,忽视参考价格效应可能会对蔬菜商品的销量和收益产生不利影响。
3.4.2. 季节性蔬菜商品情况
季节性产品的需求具有显著的时间特性,受时间变化的影响较大。例如,商超的供应季节通常集中在4月至10月,此时货源丰富,供应充足;而在其他月份货源可能不足,导致蔬菜供应量随着月份变化呈现不连续的状态,进而影响蔬菜商品的价格波动。此外,由于蔬菜类商品的生产具有明显的季节性特征,季节结束后往往面临库存积压和易损耗的问题,从而对商品的销售量和定价产生不利影响。
为应对这些问题,商超可以在非供应旺季适当补充其他种类丰富的蔬菜商品,以减少供应量随时间波动的影响,提升商品供应的连续性。同时,对于季节性结束后库存量较大、易损耗的商品,可通过降价促销等方式加快库存周转,降低损失,促进销售。
3.4.3. 顾客自身反馈需求
根据顾客感知价值理论[10],顾客对所购买商品的评价具有主观性,通常基于其对商品的期望价值。然而,随着时间和环境的变化,这种期望价值也会发生动态变化,从而影响商品的价格走势。对于蔬菜商品而言,其期望价值主要体现在营养价值与价格之间的权衡上。
商超可以通过发布调查问卷,收集消费者对不同蔬菜品类的感知价值,并进行综合评分。结合蔬菜品类价格的波动情况,可将商品划分为不同的价格弹性区间,从而制定出收益最大化的定价策略。通常,通过分析顾客感知价值的特征,可以发现顾客的感知价值随着产品价格的提高呈现递减趋势。这一结论为优化定价策略提供了重要依据。
4. 模型评价
4.1. 模型的优点
在模型数据统计过程中,采用Excel软件进行数据统计和计算,其操作简便且功能强大,具有较高的实用性。在假设检验中,通过正态分布检验能够以较少的试验次数快速得出结论,极大提升了便捷性和效率。在相关关系分析中,基于皮尔逊相关系数的计算方法,可以直观展示两个变量之间的相关性,不仅简化了分析过程,还增强了模型的直观性和实用性。定价策略通过拟合函数精确描绘销售量与售价之间的关系,具备较强的确定性和科学性。在补货预测方面,由于样本量较小,灰色预测模型在处理不完全信息和小样本数据时表现出较高的精度和可靠性,使得预测结果更加准确,从而为后续决策提供了有力支持。
4.2. 模型的缺点
假设检验易受假设条件不变性的影响,可能导致结果产生偏差,即使样本数量相同,也无法完全消除这一影响。同时,皮尔逊相关系数作为衡量线性相关性的指标,对于非线性关系无法有效刻画,并且对异常值较为敏感,这可能导致结果失真。在问题四的分析中,由于涉及的因素较多,进一步增加了分析的复杂性,并可能对结论的可靠性产生一定影响。
5. 结论
本文通过时间序列分析、灰色预测模型和非线性规划模型,对蔬菜类商品的定价与补货问题进行了系统建模与优化分析,研究结果可以为商超蔬菜类商品的定价和补货提供理论依据和实用的实施方案,对商超蔬菜类商品的智能化管理提供了重要参考,具有一定的应用价值和推广意义。未来,结合大数据技术和实时市场信息,可进一步提升模型的动态适应性和决策效果,从而为商超的运营效率和收益增长提供更有力的支持。
基金项目
广东理工学院科技项目:基于灰色关联分析的广东省区域经济发展因素研究(2024YBZK001);
广东理工学院质量工程项目:《离散数学》混合式教学的实践与效果研究(JXGG2024152)。