多模型融合驱动的湘西州零食店营业额的预测与仿真

doi:10.12677/sd.2025.1512351

期刊菜单

多模型融合驱动的湘西州零食店营业额的预测与仿真
Prediction and Simulation of Xiangxi Prefecture Snack Store Revenue Driven by Multi-Model Integration

DOI: 10.12677/sd.2025.1512351, PDF, HTML, XML, 科研立项经费支持
作者: 顾旭阳, 方东辉^*：吉首大学数学与统计学院，湖南吉首
关键词: 营业情况仿真；MH-MAP；LSTM；网格搜索法；粒子群算法；Business Situation Simulation； MH-MAP； LSTM； Grid Search Method； Particle Swarm Algorithm

摘要: 近年来，中国经济持续增长，零食消费市场快速发展，消费者对零食的需求日益旺盛。在此背景下，本研究提出一种融合多种算法的建模策略，对零食店营业额进行系统仿真。首先，基于问卷调查选取12项关键指标，构建结构方程模型，识别出影响消费者购买意愿的三大核心因素，并建立购买意愿评价体系；其次，采用长短期记忆网络(LSTM)预测店铺人流量，结合粒子群算法(PSO)对模型参数进行优化，获得训练集R²为0.9067，验证集R²为0.9142；最后，整合目标店铺实际数据，运用Metropolis-Hastings (MH)算法与最大后验估计(MAP)方法对营业额进行仿真，并通过网格搜索法确定购买意愿临界点v，使模型验证的平均R²达到0.88。基于上述结果，本文总结了研究结论，并探讨了模型在实际运营中的潜在应用。

Abstract: In recent years, China’s economy has continued to grow, the snack consumption market has developed rapidly, and consumer demand for snacks has been increasingly strong. In this context, this study proposes a modeling strategy that integrates multiple algorithms to systematically simulate the revenue of snack shops. First, based on a questionnaire survey, 12 key indicators were selected to construct a structural equation model, identifying three core factors influencing consumer purchase intention and establishing a purchase intention evaluation system. Second, a long short-term memory network (LSTM) was used to predict store foot traffic, combined with a particle swarm optimization (PSO) algorithm to optimize model parameters, achieving R² 0.9067 for the training set and R² 0.9142 for the validation set. Finally, actual data from the target store were integrated, and the Metropolis-Hastings (MH) algorithm and maximum a posteriori estimation (MAP) method were used to simulate revenue, with the purchase intention threshold v determined through grid search, resulting in an average verification of R² 0.88 for the model. Based on the above results, this paper summarizes the research conclusions and explores the potential applications of the model in practical operations.

文章引用：顾旭阳, 方东辉. 多模型融合驱动的湘西州零食店营业额的预测与仿真[J]. 可持续发展, 2025, 15(12): 207-219. https://doi.org/10.12677/sd.2025.1512351

1. 引言

1.1. 研究背景

随着国民经济水平提升与居民可支配收入增长，消费者对生活品质的追求逐步从基本生活满足转向休闲享受与个性消费。零食行业作为休闲消费的重要组成部分，迎来快速发展阶段。据中国报告大厅统计，2024年中国零食市场规模已突破1.5万亿元，年增长率超过11%，显示出巨大的市场潜力。

1.2. 国内外研究综述

国内学者胡娴娴[1]基于4R理论分析了零食店的营销现状并提出了优化策略，研究还建议零食店应加强品牌故事的传播，通过情感连接提升品牌忠诚度。王红[2]运用波特五力模型探讨了在消费者消费观念变化背景下零食店的扩张路径，指出供应链优化与数字化工具的应用是提升运营效率的关键。

国外，学者Ratnadianti A [3]等人聚焦于中小微零食企业的数字营销策略，通过分析消费者在线行为与企业营销绩效，揭示了数字营销组合对消费者偏好的影响机制。

尽管现有研究在营销与运营方面取得了一定成果，但在多模型协同仿真与动态策略反馈方面仍存在不足。因此，本研究通过构建“消费者购买意愿–人流量动态–经营模拟”的跨学科分析框架，为零食店运营研究提供了新的理论视角。基于混合研究方法(SEM-LSTM-MH/MAP)的系统整合，实现了对零食消费行为的“心理动因识别–时空特征预测–消费场景模拟”系统性分析。

2. 购买意愿评价模型

2.1. 指标选取与数据处理

以湘西州某高校旁的“零食很忙”店铺为研究对象，数据来源于问卷调查、实地观测与门店记录。(除问卷数据完成量化外，其余数据均保持原始状态，未作额外清洗。)

首先，我们于2025年6月针对目标店铺的消费者群体发放问卷，共回收200份有效样本，收集了包括年龄(Q1)、职业(Q2)及月可支配支出(Q3)等12项指标，并对所有定性指标进行了统一量化处理。其次，我们通过实地估算结合插值法得到了2025年3月初至6月末的日度人流量数据，并记录了同期的门店日营业额。

2.2. 基于结构方程模型对购买意愿的原因分析

在消费者行为研究领域，购买意愿被视为预测实际购买行为的核心先行指标，其形成过程受到多维度影响因素的复杂作用。因传统分析方法(如回归分析法)无法同时捕捉多变量间的交互作用及潜在变量的间接效应，本文选用结构方程模型展开深入研究。

结构方程模型[4] (Structural Equation Modeling, SEM)整合了因子分析与路径分析的优势，构成一种能够处理多变量关系的综合统计方法，为解决上述问题提供了系统性框架。

2.2.1. 效度分析与理论模型

研究首先运用spsspro对12个初始指标进行因子分析以实现降维，最终提炼出四个核心公因子：购买意愿、消费能力与背景、广告与产品吸引力以及购买环境与品牌偏好，具体见图1。

Figure 1. Dimensionality reduction of purchase intention indicator

图1. 购买意愿指标降维

为深入研究消费能力与背景、广告与产品吸引力以及购买环境与品牌偏好这三个因子对消费者购买意愿的影响，本文做出以下模型(图2)：

Figure 2. Theoretical model

图2. 理论模型

依据理论模型，本文做出以下3个假设(表1)：

Table 1. Model assumptions

表1. 模型假设

H1	消费能力与背景对购买意愿有显著影响
H2	广告产品与吸引力对购买意愿有显著影响
H3	购买环境与品牌偏好对购买意愿有显著影响

2.2.2. 数据效度检验

通过AMOS运算，得到模型的各项指标参数如下表2。

Table 2. Parameters of each index of the model obtained by AMOS analysis

表2. 经AMOS分析得到的模型各指标参数

Model	CMIN/DF	GFI	PNFI	PCFI	IFI elta2	TLI rho2	CFI
Default model	1.47	0.88	0.63	0.69	0.95	0.93	0.95
Saturated model	0.00	1.00	0.00	0.00	1.00	0.00	1.00
Independence model	8.06	0.41	0.00	0.00	0.00	0.00	0.00

根据表2~5的数据分析结果可知，模型拟合指标均达到理想水平：CMIN/DF = 1.470，且IFI、TLI (Delta2)、CFI (rho2)均大于0.9，这支持了模型与数据匹配度高，能够有效呈现各公因子间的因果路径。

2.2.3. 路径系数分析

① 非标准化

基于非标准化路径系数的分析结果显示，在0.1的显著性水平下，假设H1、H2、H3均成立。这表明消费能力与背景、广告产品与吸引力、购买环境与品牌偏好均对购买意愿存在显著影响。

Table 3. Hypothetical paths and significance analysis of factors influencing consumer purchase intention

表3. 影响消费者购买意愿的因素假设路径与显著性分析

假设路径	Estimate	P	Label
消费能力与背景 $\to$ 购买意愿	−0.532	***	H1
广告产品与吸引力 $\to$ 购买意愿	0.221	0.068	H2
购买环境与品牌偏好 $\to$ 购买意愿	0.379	0.011	H3

其中，消费能力与背景对购买意愿为负向影响，广告产品与吸引力、购买环境与品牌偏好为正向。

② 标准化

为了直观地展示不同因素对消费者购买零食意愿的具体影响，我们给出标准化下的路径系数图(图3)。

路径分析显示，消费能力与背景对购买意愿具有显著的负向影响，其标准差每增加一个单位将导致购买意愿下降0.53个标准差；相比之下，广告产品与吸引力、购买环境与品牌偏好则呈现正向影响，分别带动购买意愿提升0.23和0.33个标准差。

Figure 3. SEM path diagram

图3. SEM路径图

2.3. 购买意愿评价模型建立

基于路径分析，结合其标准化的系数，建立对消费者“购买意愿”的模拟模型：

$Y = \frac{X_{f}^{0.5} X_{2, f}^{0.2} X_{3, f}^{0.3}}{W_{}^{0.5} W_{2}^{0.2} W_{3}^{0.3}}$

这里，变量 $Y$ 为购买意愿， $X_{f}, X_{2, f}, X_{3, f}$ 分别为消费能力与背景 $X$ ，广告产品与吸引力 $X_{2}$ 、购买环境与品牌偏好对应的分值 $X_{3}, W, W_{2}, W_{3}$ 为各自变量对应的层数。考虑自变量对购买意愿 $Y$ 的因果关系，按层对自变量赋值(将 $X_{2}, X_{3}$ 分为5层，据当地居民月收入水平实际情况对 $X$ 进行划分)。

实际情况中，消费者的购买决策被分为两种基本情形：“购买”与“不购买”。为了更精确地量化购买意愿，设立意愿临界点 $v$ ：

$Y_{i} = {\begin{cases} \begin{matrix} 1 & δ (X) > v \end{matrix} \\ \begin{matrix} 0 & δ (X) \leq v \end{matrix} \end{cases}$ ，(临界点v为待定常数) (2-1)

为了更精确地模拟“零食很忙”在特定时间段内的总营业额，我们还需要将每位顾客的单次消费金额纳入考量，即：每个 $Y_{i}$ 都对应一个消费金额 $Z_{i}$ 。

由上，我们建立特定时间段 $t$ 内的总营业额：

$W_{t} = \sum_{i = 1}^{N} {Y^{'}}_{i} Z_{i}$ (2-2)

其中， $N$ 代表时间 $t$ 内的人流量。

3. 零食店人流量预测模型

3.1. 长短期记忆网络预测

本研究采用长短期记忆网络(Long Short-Term Memory, LSTM)对零食店日8时段人流量数据进行建模，以揭示其变化规律并实现预测[5]。其原理结构框架如下图4：

Figure 4. LSTM structure schematic diagram

图4. LSTM结构原理图

本研究以湘西州某高校周边的“零食很忙”店铺为对象，对其人流量展开预测分析。构建的堆叠式LSTM模型包含3个LSTM层、2个Droupout层和1个全连接输出层。由于模型参数量庞大，为克服手动调参的困难，后续将对模型实施优化。

3.2. 基于粒子群优化算法的模型优化

为获得LSTM模型的最佳性能，采用粒子群算法对以下六个参数进行自动化寻优：迭代次数、批量大小、第一与第二LSTM层神经元数、全连接层神经元数以及学习率[6]。

具体步骤如图5所示：

Figure 5. Flowchart of particle swarm optimization algorithm

图5. 粒子群算法寻优流程图

粒子群优化过程中适应度曲线如图6所示：

Figure 6. PSO fitness curve

图6. PSO适应度曲线图

最终，通过粒子群算法进行寻优，得到表4。

Table 4. Optimization parameter table

表4. 寻优参数表

迭代次数	批量大小	第一层LSTM神经元数	第二层LSTM神经元数	全链接层LSTM神经元数	学习率
159	24	246	104	27	0.005

使用寻优所得参数继续训练LSTM模型，按80%训练集和20%验证集进行划分。Python求解结果显示，训练集准确率为0.9067，验证集准确率为0.9142。

最终对“零食很忙”店铺人流量预测如图7所示：

Figure 7. Comparison of actual and projected foot traffic at the target snack store in June 2025

图7. 2025年6月份目标零食店实际与预测人流量的对比图

4. 零食消费金额的模拟

4.1. 相关分布的确定

定义可支配收入为消费能力与背景 $X$ 的近似指标。收集湘西州各县的城镇居民月可支配收入与150条目标门店实时消费数据，以此来拟合 $X$ 和 $Z$ 的分布;并对问卷数据估算，推断出不同收入区间内单次消费金额与月可支配收入的比例结构。

Table 5. Distribution of spending power and single-purchase amount

表5. 消费能力与单次消费金额的分布

单次消费金额	$Z ~ Gamma (4.23, 0.08)$
消费能力与背景(可支配收入)	$X ~ Lognormal (8.05, {0.39}^{2})$ $\log (X) ~ N (4.23, {0.39}^{2})$

其中， $Z_{}$ 与 $X$ 通过 $\frac{α}{β} = 2.2 % \cdot X$ 进行连接。

4.2. 样本抽取

观察到过往人流量 $N$ 主要来源于周边居民与学生。本文假设来店消费的顾客只来自附近居民和学生。每位顾客经过店铺的概率由其购买频率所决定(具体情况如表6所示)。

Table 6. Frequency and frequency distribution of single snack purchase amounts

表6. 零食单次消费金额区间频数与频率分布表

单次消费金额区间	20~50	51~80	81~120	120以上
频数	328	63	3	20
频率	80%	15.4%	0.6%	4%

由此，规定出单次零食消费额抽样规则。

对于总样本 ${Z^{(1)}, Z^{(2)}, \dots, Z^{(N)}}$ ， $\forall Z^{(i)}, i = 1, \dots, N; j = 1, 2, 3, 4$ ，都有：

${\begin{cases} P (Z^{(i)} \in M_{j}) = P (M_{j}) \\ P (Z^{(i)} | M_{j}) = \frac{1}{M_{j, L}} \end{cases}$ (4-1)

其中， $M_{j}$ 为金额依次增大的单次消费区间， $M_{j, L}$ 、 $P (M_{j})$ 分别为该区间长度和对应的频率。

对于可支配收入 $X$ ，如若直接从分布中抽取样本 ${X^{(1)}, X^{(2)}, \dots, X^{(N)}}$ ，此时日零食消费额 $Z^{(i)}$ 对应的可支配收入具有很大的随机性，为了避免这种情况，我们采用MH-MAP算法对可支配收入 $X$ 进行采样。

(1) 模型设定

先验分布：

由上文， $\log (X) ~ N (μ = 8.05, σ = 0.39)$ 。因此， $X$ 的先验分布：

$p (X) = \frac{1}{X σ \sqrt{2 π}} \exp (- \frac{{(\log X - μ)}^{2}}{2 σ^{2}})$

似然函数：

给定 $X$ ，日零食消费额 $Z$ 服从伽马分布：

$Z | X ~ Gamma (α = k (X), β = 0.3)$

其中， $k (X) = 2.2 % β X$ 。

伽马分布的密度函数：

$p (Z | X) = \frac{β^{k (X)}}{Γ (k (X))} z^{k (X) - 1} e^{- β z}$

(2) 后验分布推导

根据贝叶斯定理，后验分布为：

$p (X | Z) \propto p (Z | X) p (X)$

取对数简化计算：

$\log p (X | Z) = \log p (Z | X) + \log p (X) + C$

其中，C为常数。

对数似然项：

$\log p (Z | X) = k (X) \log β - \log Γ (k (X)) + (k (X) - 1) \log Z - β Z$ (4-2)

对数先验项：

$\log p (X) = - \log X - \frac{{(\log X - u)}^{2}}{2 σ^{2}} + C$ (4-3)

其中，C为常数。

(3) MH算法

目标是从后验分布 $p (X | Z)$ 中采样，MH算法[7]步骤如下：

Step 1：初始化。从先验分布生成初始值 $X^{(0)}$ ，即 $\log (X^{(0)}) ~ N (8.05, 0.39)$ 。

Step 2：提议分布。采用对称的随机游走提议分布：

$\log X^{'} = \log X^{(t)} + ε, ε ~ N (0, ϒ^{2})$

其中 $ϒ$ 为步长参数(这里取 $ϒ = 1$ )。

Step 3：接受概率。计算接受候选值 $X^{'}$ 的概率：

$φ = \min (1, \frac{p (X^{'} | Z)}{p (X^{(t)} | Z)})$ (4-4)

由于提议分布对称，接受概率简化为：

$φ = \exp (\log p (Z | X^{'}) + \log p (X^{'}) - \log p (Z | X^{t}) - \log p (X^{(t)}))$

Step 4：迭代采样

生成均匀随机数 $u ~ Uniform (0, 1)$ ，若 $u \leq φ$ ，则接受候选值： $X^{(t + 1)} = X^{'}$ 。
否则保留当前值： $X^{(t + 1)} = X^{(t)}$ 。

Step 5：收敛与记录

重复 $T$ 次迭代(不做预热处理)。
记录所有样本 ${X^{(1)}, X^{(2)}, \dots, X^{(T)}}$ 。

(4) 最大后验估计(MAP)

在MH采样过程中，跟踪具有最高对数后验密度的样本：

${\hat{X}}_{M A P} = \arg \max_{X^{(t)}} [\log p (Z | X^{(t)}) + \log p (X^{(t)})]$ (4-5)

(5) 流程总结与实现

对每个观测到的 $Z_{i}$ (共 $N$ 个)：

初始化：从先验分布生成初始 $X^{(0)}$ 。
MH采样：执行次迭代(这里取 $T = 100$ )，生成后验样本 ${X^{(1)}, \dots, X^{(100)}}$ 。
计算MAP [8]：从样本中选择后验密度最大的 $X$ 作为估计值。
输出结果：得到与每个 $z_{i}$ 对应的 ${\hat{x}}_{M A P}$ 。

5. 零食店营业额模拟

5.1. 模拟流程解释

模拟第 $t$ 天的营业额：(1) 用LSTM预测出当天的人流量 $N$ ，并单次消费金额的抽样原则抽取每个人可能造成的消费 ${Z^{(1)}, Z^{(2)}, \dots, Z^{(N)}}$ ，(2) 由MH-MAP算法估计出与 $Z_{i}$ 对应的可支配收入 $X_{i}$ ，(3) 判别第 $i$ 个人的购买意愿(具体流程如图8所示)。

如果 $δ (X)$ $> v$ ，则选择进行购买： ${Y^{'}}_{i} = 1$ 。
反之，不进行购买： ${Y^{'}}_{i} = 0$ 。

计算该天总营业额：

${\hat{X}}_{M A P} = \arg \max_{X^{(t)}} [\log p (Z | X^{(t)}) + \log p (X^{(t)})]$

注：后续只需求得临界点v即可完成模拟。

Figure 8. Simulation flowchart

图8. 模拟流程图

5.2. 基于网格搜索法确定临界点

本文以最大化 $R^{2}$ 为目标，通过遍历搜索确定最优临界点 $v$ ，鉴于 $v$ 的取值受到多个随机变量的干扰，为降低误差的影响，采用多次寻优以研究其规律：

(1) 临界点 $v$ 以步长0.001从0.09逐步增加至0.77，每步计算模型解释度 $R^{2}$ ：

$R^{2} = 1 - \frac{\sum_{t} {({\hat{W}}_{t} - W_{t})}^{2}}{\sum_{t} {(W_{t} - \bar{W})}^{2}}$ (5-1)

其中， $n$ 为模拟总天数， $W_{t}$ 为第 $i$ 天营业额真实值， ${\hat{W}}_{t}$ 为第 $i$ 天营业额预测值。

(2) 找到最小的 $R^{2}$ ，输出其对应的临界点 $v$ 。

(3) 重复步骤(1)~(2)多次，输出所有的最优临界点 $v$ 及对应的 $R^{2}$ 。

由于寻优结果稳定，这里仅展示1次遍历结果(展示 $R^{2}$ 有效部分)：

Figure 9. Optimization results

图9. 寻优结果图

Figure 10. Optimal R² range

图10. 最优R²范围图

如图9与图10所示，通过对临界点的多次寻优，发现其结果稳定在0.71，且所有R²值均位于 $[0.87, 0.94]$ 之间。这一分布集中、结果稳定的特性，证明了模型在模拟店铺营业情况时具有高度的可靠性。因此，本研究取定 $v = 0.71$ 作为最终的模型临界点。

5.3. 模型验证

为检验模型的有效性，随机抽取了该零食店60天的历史人流量数据，并分别进行了10次日营业额的模拟。通过将模拟结果与真实营业额进行对比分析，以评估模型的准确度。

这里给出2次模拟营业额与真实营业额的比对图。

如图11所示，模拟营业额(红色散点)与实际营业额(蓝色散点)在多数时段内高度吻合，且两者60天的变动趋势(黑色曲线)基本一致，这直观证实了模型模拟的有效性。进一步由表7可知，R²介于0.84至0.90之间，均值达0.88，表明模型对实际营业额的波动具备优异的解释力度。

Figure 11. Comparison of simulated and actual sales figures for a random target snack shop over 60 days

图11. 随机60天目标零食店的营业额模拟值与真实值比对图

Table 7. Ten Simulations R²

表7. 十次模拟R²

0.88

0.86

0.90

0.88

0.84

0.85

0.84

0.85

0.89

0.90

6. 结论与模型应用

6.1. 结论

(1) 消费能力与背景对购买意愿存在显著负向影响(Estimate = −0532, P < 0.1)；购买环境与品牌偏好(Estimate = 0.221, P < 0.1)以及广告与产品吸引力(Estimate = 0.379, P < 0.1)均对购买意愿具有显著正向促进作用。

(2) 基于粒子群优化算法(PSO)对LSTM模型参数进行寻优后，模型在训练集与验证集上的准确率分别达到0.9067与0.9142，预测人流量与实际值吻合良好，表明模型具备优秀的预测性能与可靠性。

(3) 在零食店营业模拟中，临界点 $v$ 经多次寻优结果均稳定在 $[0.70, 0.72]$ 区间，说明算法具有良好的稳定性。模型验证阶段的平均R²值为0.88，表明模拟结果能够较好地反映真实营业情况，进一步验证了模型的有效性。

6.2. 模型应用

(1) 模拟仿真：通过仿真实验推演验证运营策略的可行性，以降低资源错配风险。首先，深入分析市场需求与竞争格局，识别不同产品的市场潜力与定位；其次，结合企业产能与资金约束，科学制定广告预算分配方案；最后，实施多渠道整合营销，通过跨平台广告投放提升品牌曝光与吸引力。在此基础上，利用模型进行多情景模拟与利润对比，从而评估策略有效性，为实际决策提供支持，确保其在真实应用场景中发挥预期效果。

(2) 人力的动态调配：基于LSTM模型实现小时级人流量的精准预测，进而指导排班优化。例如在预测的高峰时段增派收银与导购人员，以缩短顾客等待时间、提升服务效率；在低谷时段则合理缩减人力配置，有效控制运营成本，实现资源效率最大化。

基金项目

本文系2025年湖南省吉首大学大学生创新创业训练计划项目省级课题“多模型融合驱动的湘西州零食店营业额的预测与仿真”(课题编号：S202510531053)的阶段性成果。

NOTES

^*通讯作者。

参考文献

[1]	胡娴娴. 大数据时代零食很忙营销现状及策略的优化——基于4R理论[J]. 现代企业, 2024(12): 53-55.
[2]	王红. 消费降级背景下的“零食很忙”加速扩张现状分析——基于波特五力模型[J]. 商场现代化, 2024(15): 38-40.
[3]	Ratnadianti, A., Fahmi, I. and Hannan, S. (2020) Digital Marketing Strategy of Small and Medium Enterprises for Snack in Bogor City. Jurnal Manajemen dan Agribisnis, 17, 74-85. [Google Scholar] [CrossRef]
[4]	李芳芳. 基于结构方程模型的顾客保留及其决定因素研究[D]: [硕士学位论文]. 哈尔滨: 哈尔滨工业大学, 2007.
[5]	白一鸣. 基于LSTM的调度中台操作票智能可靠性校验方法[J/OL]. 云南民族大学学报(自然科学版): 1-7. https://link.cnki.net/urlid/53.1192.N.20251017.1620.008, 2025-12-15.
[6]	叶子怡, 王梦欢, 焦盼雨, 等. 基于Bi-LSTM-PSO的三维编织复合材料传热和力学性能的协同优化[J/OL]. 北京航空航天大学学报: 1-15. 2025-12-15.[CrossRef]
[7]	缪季, 段立平, 刘吉明, 等. 基于改进MCMC算法和代理模型的结构仿真模型更新[J]. 上海交通大学学报, 2025, 59(8): 1114-1122.
[8]	秦玉瑞, 朱巴邻, 王忠海, 等. 基于最大后验估计的编码孔图像重建算法[J]. 强激光与粒子束, 2024, 36(9): 145-156.

为你推荐

友情链接