1. 引言
“吃”在居民日常生活中占据核心地位,据国家统计局数据,2024年我国居民人均支出达28,227元,其中食品烟酒消费占人均支出的29.8%。自热食品因精准适配这一需求实现逆向激活,行业进入繁荣期。电商平台成为行业增长的核心引擎——据中国电子商务研究中心数据,2023年我国自热食品线上销售额占比已超62%。互联网技术升级降低了交易成本,电商平台通过“秒杀、满减、直播带货”等多元化营销工具实现流量聚合,而疫情期间线下企业的电商化转型进一步提高了行业线上渗透率。
随着电商行业增速放缓,市场竞争逻辑已从“流量争夺”转向“需求精准匹配”,品牌需依托电商数据洞察用户偏好以实现差异化发展。本研究引入技术接受模型与消费价值观理论作为分析基础,技术接受模型指出,消费者对产品或渠道的“感知有用性”(如自热食品的性价比、配送效率)与“感知易用性”(如电商平台的搜索便捷性、下单流程),是影响购买行为的核心心理因素;消费价值观理论则强调,实用型消费者更关注产品功能与价格,体验型消费者更重视口感与场景适配性。基于此提出初步逻辑:40岁以上群体或因实用型消费价值观,更倾向选择饱腹性强、性价比高的自热米饭;自由职业者因高频加班场景,对自热面类的“感知易用性”(快速加热、操作简单)认知更强,进而提升购买偏好。以“自嗨锅”为代表的新锐品牌,正是通过“速食与正餐融合”的产品创新(契合体验型需求),叠加电商直播场景化展示(提升感知易用性),在2020年“618”期间仅用21分钟即实现1亿元线上销售额,成为行业差异化发展的典型标杆。在电商渠道带动下,自热火锅、米饭、粥类等细分品类快速扩容,但行业仍面临电商场景下的特有挑战,加热安全隐患引发的线上差评扩散直接影响品牌信誉,不同品类适配的电商营销工具差异不明导致运营效率低下,平台品类推荐与用户需求错位造成流量浪费。基于此,本研究聚焦电商场景下消费者购买偏好及影响因素,融合消费者特征与电商行为双维度展开分析,为行业电商精准运营提供数据支撑。
本研究以哈尔滨市各区县居民为研究对象,采用“线上标签抽样与线下补充”的混合方法收集数据,基于各区县人口比例及电商消费标签进行配额发放,回收问卷1113份,线下补充发放问卷190份;经系统去重与人工审核,最终获得有效问卷972份,有效率87.33%。研究以“自热火锅”为参照类,构建“购买类型、消费者特征、电商行为”的多项Logistic回归模型。以自热火锅为参照,自热米饭的偏好差异体现在年龄、职业与收入维度,40岁以上群体偏好显著高于其他年龄段,服务业人员、自由职业者、工人的倾向更为突出,且3000~5000元等中低收入群体接受度更高;自热面类的偏好差异在职业维度最显著,自由职业者偏好最高,工人、服务业人员次之,同时呈现“年龄越大偏好越强”的规律,3000~5000元群体为核心消费群体;作为占比仅5.20%的小众品类,自热粥类的偏好集中在年龄与收入维度,18岁以下群体及3000~5000元等中低收入群体接受度更高,各职业群体则普遍呈现弱偏好,生活状态维度对多数品类的影响则不显著。
本研究的实践价值在于:为品牌电商运营提供群体与品类精准匹配策略,如针对3000~5000元收入群体开发粥类组合装,针对自由职业者设计面类“深夜加班”主题营销;同时为平台优化推荐算法提供区域特征参数,降低品类错配率。区别于宏观趋势分析,本研究的区域样本和细分维度,更贴合东北城市“寒地快节奏”的消费特征,其结论可作为北方城市自热食品电商运营的参照模板。
2. 文献综述
现有关于自热食品的研究围绕品牌运营、市场发展、品类竞争、技术优化、消费适配及环保处理等维度展开,形成了针对性的研究成果。
在品牌与市场层面,周永刚[1]剖析“自嗨锅”成功逻辑,指出其通过调研优化“新世代”用户口味、坚守环保包装与品质把控构建核心竞争力;周潇斐、殷玮[2]补充其IP塑造、高额广告引流及折扣券、组合套餐等营销手段,助力品牌成为行业新锐并带动行业发展;许礼清[3]则提出当前行业正经历洗牌,热度降温暴露网红经济局限——虽能短期聚流拓市,却难消消费者对品质的顾虑。
品类关系与技术优化方面,何沛凌[4]研究认为,预制菜因消费场景、便捷性与自热食品存在差异,短期内难以取代后者;孙浩文等[5]从原辅料搭配、添加剂应用、预处理技术、传热效率及包装设计等角度,梳理出自热食品品质优化的技术路径。
消费与环保领域,冯德建与何瑛[6]从资质、包装、品牌等维度给出自热食品选购建议;王静杰[7]针对盲人操作自热食品的问题,开展产品结构与包装设计优化;彭皓月等[8]分析了自热食品销量向好的原因及现存隐患;董小红[9]则强调需重视自热食品食用后的废弃物处理问题。游芸妹等[10]从消费者价值观的视角构建了消费者价值观对有机农产品购买意愿的影响机理模型。
综上,现有研究已覆盖自热食品多关键领域,侧重品牌实践、技术优化与消费指导,但尚未深入探讨电商场景下消费者特征与细分品类购买偏好的关联,这为本次研究提供了切入方向。
3. 抽样设计
本次调查利用2021年进行的第七次人口普查数据,为了使抽取的样本量更为科学,采用了配额抽样,根据黑龙江省哈尔滨市各区县常住人口分布、年龄分布以及性别分布得出本次调查所需的最大样本量。
根据第七次黑龙江省哈尔滨市人口普查结果,得知,哈尔滨的人口性别分布为男:女约为1:1,年龄分布0~14岁、15~59岁、60岁以上的比例分别为10.46%、67.56%、21.98%。
根据上述分布,设样本总数为
,哈尔滨市常住人口区县层的比例为
,年龄比例为
,性别比例为
,可以建立配额计算模型:
经计算可得
。
因此,在本次调查中,最大样本量是1087份。在实际调查中,一共收集了1113份问卷,经系统和人工筛查后,有效问卷为972份。问卷的有效率是87.3315%。
基于哈尔滨市各个区县的常驻人口数,我们进行了样本量容量分配,如表1所示,并在各层权内进行方便抽样。
Table 1. Distribution of sample size
表1. 样本量分布
区县 |
常驻人口占比 |
发放问卷数量(份) |
南岗区 |
13.89% |
151 |
香坊区 |
11.19% |
122 |
道里区 |
10.96% |
119 |
道外区 |
8.10% |
88 |
呼兰区 |
7.69% |
84 |
五常市 |
7.24% |
79 |
双城区 |
6.33% |
69 |
阿城区 |
5.00% |
54 |
尚志市 |
4.63% |
50 |
宾县 |
4.44% |
48 |
巴彦县 |
4.20% |
46 |
松北区 |
4.13% |
45 |
依兰县 |
2.58% |
28 |
平房区 |
2.39% |
26 |
方正县 |
1.84% |
20 |
延寿县 |
1.83% |
20 |
通河县 |
1.80% |
20 |
木兰县 |
1.76% |
19 |
因此,在本次调查中,最大样本量是1087份。在实际调查中,我们一共收集了1113份问卷,经系统和人工筛查后,有效问卷为972份。问卷的有效率是87.3315%。
4. 基于多项Logistic回归的自热食品用户种类偏好分析
为了研究与预测消费者的购买种类选择倾向,我们就现有的972份数据进行了多项Logistic回归分析。其中的变量包括年龄(4个分类)、职业(5类),生活状态(4类)、收入(4类)以及购买种类(4类)。分析的目标是:建立消费者购买种类选择倾向的预测模型,分析影响因素。其中,购买种类为被解释变量,其余的变量为解释变量。
4.1. 样本基本特征
972份有效样本的分布特征如表2所示:
Table 2. Results of multinomial logistic regression analysis for case study
表2. 多项Logistic回归分析案例分析结果
|
|
个案数 |
边际百分比 |
购买类型 |
自热火锅 |
390 |
40.10% |
自热米饭 |
289 |
29.70% |
自热面类 |
241 |
24.80% |
自热粥类 |
51 |
5.20% |
年龄 |
18岁以下 |
18 |
1.90% |
18岁~25岁 |
360 |
37.00% |
25岁~40岁 |
543 |
55.90% |
40岁以上 |
51 |
5.20% |
职业 |
学生 |
140 |
14.40% |
服务业人员 |
135 |
13.90% |
自由职业者 |
230 |
23.70% |
工人 |
108 |
11.10% |
单位工作人员 |
358 |
36.80% |
生活状态 |
独居 |
100 |
10.30% |
和家人一起 |
638 |
65.60% |
集体宿舍 |
201 |
20.70% |
合租 |
32 |
3.30% |
收入 |
1000元以下 |
17 |
1.70% |
1000~3000元 |
176 |
18.10% |
3000~5000元 |
292 |
30.00% |
5000~7000元 |
341 |
35.10% |
7000元以上 |
146 |
15.00% |
有效 |
|
972 |
100.00% |
缺失 |
|
0 |
|
总计 |
|
972 |
|
表2给出了样本在购买类型、年龄、职业、生活状态与收入上的基本情况。可以直观地看出,消费者选择自热火锅这个种类的观测较多。
4.2. 模型拟合检验
Table 3. Model fitting effect
表3. 模型拟合效果
模型 |
模型拟合条件 |
似然比检验 |
显著性 |
−2对数似然 |
卡方 |
自由度 |
仅截距 |
1091.899 |
|
|
|
最终 |
740.358 |
351.541 |
6 |
0.000 |
如表3所示,可见零模型和当前模型的回归方程显著性检验结果。可以看到,零模型的−2倍的对数似然为1089.899,当前模型为740.358,似然比卡方值为351.541 (1091.899~740.358),概率p值为0.00。在显著性水平为α = 0.05的情况下,p值小于0.05,则应该拒绝回归方程显著性检验的原假设,说明解释变量全体与广义Logit P之间的线性关系显著,模型选择正确。
Table 4. Variable significance
表4. 变量显著性
效应 |
模型拟合条件 |
似然比检验 |
自由度 |
显著性 |
简化模型的−2对数似然 |
卡方 |
截距 |
|
0 |
0 |
. |
职业 |
809.355 |
68.998 |
20 |
0.000 |
年龄 |
774.994 |
34.637 |
12 |
0.001 |
生活状态 |
784.679 |
44.321 |
16 |
0.000 |
收入 |
800.853 |
60.496 |
16 |
0.0000 |
卡方统计是最终模型与简化模型之间的−2对数似然之差。简化模型是通过在最终模型中省略某个效应而形成。原假设是,该效应的所有参数均为0。a 因为省略此效应并不会增加自由度,所以此简化模型相当于最终模型。
上表(见表4)给出了模型引入(或剔除)各解释变量后似然卡方值。可以看到,当前模型的−2倍的对数似然值是740.358。剔除职业后的模型的−2倍的对数似然值为809.355,与当前模型(最终模型)相比,似然比卡方值为68.988 (809.355~740.358),所以68.988是职业进入模型带来的;同理,年龄、生活状态和收入对应的卡方分别都是其带入模型的。职业、年龄、生活状态以及收入的卡方检验的概率p值分别为0.000,0.001,0.000和0.000,在显著性水平α = 0.005的情况下,他们对广义Logit P的线性显著性均是显著的。
4.3. 回归结果分析
本部分以自热火锅为参照类,通过多项Logistic回归模型的回归系数(
)、显著性水平(P)及优势比(
),分析年龄、职业、生活状态、收入对自热米饭、面类、粥类购买偏好的影响。其中,
表示某群体相对于参照群体选择目标品类的概率倍数:
> 1说明该群体更倾向选择目标品类,值越大倾向越强;
< 1则说明倾向更弱;P < 0.05为统计显著。
结合模型核心输出,以下表格仅保留显著变量及关键参数(变量分类对应:年龄1 = 18岁以下、2 = 18~25岁、3 = 25~40岁、4 = 40岁以上;职业1 = 学生、2 = 服务业人员、3 = 自由职业者、4 = 工人、5 = 单位工作人员;生活状态1 = 独居、2 = 和家人一起、3 = 集体宿舍、4 = 合租;收入1 = 1000元以下、2 = 1000~3000元、3 = 3000~5000元、4 = 5000~7000元、5 = 7000元以上)。
Table 5. Regression results of self-heating rice (B)
表5. 自热米饭(B)回归结果
变量分类 |
系数(
) |
标准误差 |
显著性 |
|
截距 |
−1.025 |
0.777 |
0.187 |
|
年龄 = 1 |
−1.155 |
1.068 |
0.28 |
0.315 |
年龄 = 2 |
−0.874 |
0.436 |
0.045 |
0.417 |
年龄 = 3 |
−1.404 |
0.402 |
0 |
0.246 |
年龄 = 4 |
0b |
. |
. |
. |
职业 = 1 |
1.099 |
0.378 |
0.004 |
3.002 |
职业 = 2 |
1.698 |
0.266 |
0 |
5.463 |
职业 = 3 |
1.778 |
0.262 |
0 |
4.759 |
职业 = 4 |
1.56 |
0.334 |
0 |
4.759 |
职业 = 5 |
0.692 |
0 |
0 |
1.997 |
职业 = 6 |
0b |
|
|
|
生活状态 = 1 |
−0.013 |
0.684 |
0.985 |
0.987 |
生活状态 = 2 |
−0.64 |
0.616 |
0.299 |
0.527 |
生活状态 = 3 |
−0.235 |
0.647 |
0.716 |
0.79 |
生活状态 = 4 |
−0.61 |
0 |
0.716 |
0.544 |
生活状态 = 5 |
0b |
|
|
|
收入 = 1 |
0.781 |
0.961 |
0.416 |
2.183 |
收入 = 2 |
1.366 |
0.397 |
0.001 |
3.918 |
收入 = 3 |
1.537 |
0.337 |
0 |
4.649 |
收入 = 4 |
1.082 |
0.311 |
0.001 |
2.949 |
收入 = 5 |
0b |
|
|
|
Table 6. Regression results of self-heating noodles (C)
表6. 自热面类(C)回归结果
变量分类 |
系数(
) |
标准误差 |
显著性 |
|
截距 |
−1.218 |
0.713 |
0.096 |
|
年龄 = 1 |
−1.326 |
1.081 |
0.22 |
0.266 |
年龄 = 2 |
−1.285 |
0.455 |
0.005 |
0.277 |
年龄 = 3 |
−1.609 |
0.418 |
0 |
0.2 |
年龄 = 4 |
0b |
. |
. |
. |
职业 = 1 |
0.728 |
0.396 |
0.066 |
2.07 |
职业 = 2 |
0.985 |
0.325 |
0.002 |
5.463 |
职业 = 3 |
2.049 |
0.271 |
0.000 |
7.757 |
职业 = 4 |
1.747 |
0.338 |
0 |
5.738 |
职业 = 5 |
0.927 |
0 |
0 |
2.528 |
职业 = 6 |
0b |
|
|
|
生活状态 = 1 |
0.212 |
0.603 |
0.405 |
3.36 |
生活状态 = 2 |
−0.574 |
0.545 |
0.292 |
0.563 |
生活状态 = 3 |
0.487 |
0.575 |
0.397 |
1.628 |
生活状态 = 4 |
0.822 |
0 |
0 |
2.275 |
生活状态 = 5 |
0b |
|
|
|
收入 = 1 |
1.335 |
0.933 |
0.152 |
3.799 |
收入 = 2 |
1.311 |
0.418 |
0.002 |
3.709 |
收入 = 3 |
1.526 |
0.351 |
0 |
4.598 |
收入 = 4 |
0.796 |
0.352 |
0.014 |
2.218 |
收入 = 5 |
0b |
|
|
|
Table 7. Regression results of self-heating congee (D)
表7. 自热粥类(D)回归结果
变量分类 |
系数(
) |
标准误差 |
显著性 |
|
截距 |
14.233 |
1.714 |
0 |
|
年龄 = 1 |
2.589 |
1.203 |
0.031 |
13.313 |
年龄 = 2 |
−0.972 |
0.739 |
0.189 |
0.378 |
年龄 = 3 |
−0.866 |
0.676 |
0.2 |
0.421 |
年龄 = 4 |
0b |
. |
. |
. |
职业 = 1 |
−18.53 |
0.719 |
0.004 |
8.97E−09 |
职业 = 2 |
−17.265 |
0.543 |
0 |
3.18E−08 |
职业 = 3 |
−16.687 |
0.455 |
0 |
5.66E−08 |
职业 = 4 |
−17.061 |
0.334 |
0 |
3.89E−08 |
职业 = 5 |
0.692 |
0 |
0 |
1.997 |
职业 = 6 |
0b |
|
|
|
生活状态 = 1 |
0.574 |
0.807 |
0.477 |
1.775 |
生活状态 = 2 |
−0.508 |
0.661 |
0.442 |
0.602 |
生活状态 = 3 |
0.117 |
0.737 |
0.874 |
1.124 |
生活状态 = 4 |
0.888 |
0 |
0 |
2.43 |
生活状态 = 5 |
0b |
|
|
|
收入 = 1 |
−0.326 |
1.89 |
0.863 |
0.721 |
收入 = 2 |
3.299 |
0.807 |
0 |
27.086 |
收入 = 3 |
2.19 |
0.784 |
0.005 |
8.937 |
收入 = 4 |
1.572 |
0.755 |
0.037 |
4.817 |
收入 = 5 |
0b |
|
|
|
表5~7分别给出了三种品类下模型参数估计结果,依次为各回归系数估计值、标准误、Wald统计量的观测值、自由度、Wald统计量观测值的概率值,
,以及两类别(分母为参照类)概率比95%置信区间的上下限。其中,购买类型(A)、第六个职业(职业6)、第四个年龄(年龄4)、第五个生活状态(生活状态5)和第五个收入(收入5)为参照类。
在自热粥类回归结果(表6)中,职业变量出现极端负系数(职业1 = −18.53、职业2 = −17.265、职业3 = −16.687、职业4 = −17.061),且对应EXP(β)值极小(8.97E−09至5.66E−08),经多维度诊断检验,发现各职业细分群体与自热粥类的交叉样本量严重不足,导致模型系数估计出现偏差。计算职业与年龄变量的方差膨胀因子(VIF) = 1.23 (<10),排除多重共线性干扰;进一步采用“逐步回归法”重新拟合模型,发现当仅纳入年龄、收入变量时,系数无极端值,纳入职业变量后极端值出现,印证样本量不足是核心原因。
根据以上表5,可得出以下结论。以自热火锅为参照类,自热米饭的偏好差异在年龄、职业、收入维度均有体现,生活状态维度无显著影响。年龄层面,40岁以上群体对自热米饭的偏好显著高于其他年龄段,18~25岁、25~40岁群体的偏好则显著较弱。职业维度中,服务业人员、自由职业者、工人对自热米饭的偏好显著突出,其中服务业人员的倾向最强。收入维度呈现明显的中低收入偏好特征,3000~5000元、1000~3000元群体的接受度显著高于高收入群体,且3000~5000元群体的倾向更为明显。
根据表6,自热面类的偏好差异在职业维度最为显著,自由职业者对其偏好程度最高,工人、服务业人员次之,均显著高于其他职业群体。年龄维度呈现“年龄越大偏好越强”的显著规律,40岁以上群体的倾向显著高于18~25岁、25~40岁群体。收入维度中,3000~5000元群体成为核心消费群体,其偏好显著高于高收入群体,生活状态维度未表现出统计上的显著差异。
作为占比仅5.20%的小众品类,根据表7,自热粥类的偏好差异集中在年龄和收入维度,职业维度则普遍呈现弱偏好。年龄层面,18岁以下群体是核心偏好客群,其选择倾向显著高于其他年龄段。收入维度中,中低收入群体的接受度显著更高,1000~3000元、3000~5000元群体的倾向尤为突出,其中3000~5000元群体与该品类的匹配度最高。职业维度上,学生、服务业人员、自由职业者、工人对自热粥类的偏好均显著较弱,未形成突出的偏好群体。
4.4. 模型预测结果
Table 8. Model prediction accuracy rate
表8. 模型预测正确率
实测 |
预测 |
正确百分比 |
自热火锅 |
自热米饭 |
自热面类 |
自热粥类 |
其他 |
自热火锅 |
277 |
75 |
33 |
5 |
0 |
71.00% |
自热米饭 |
83 |
136 |
67 |
3 |
0 |
47.10% |
自热面类 |
62 |
76 |
93 |
10 |
0 |
38.60% |
自热粥类 |
16 |
15 |
14 |
6 |
0 |
11.80% |
总体百分比 |
45.10% |
31.10% |
21.30% |
2.50% |
0.10% |
52.80% |
如表8所示,自热火锅的正确预测率最高(71.00%),与该品类在样本中的占比最高(40.10%)相关;自热粥类正确预测率最低(11.80%),除样本量少(51份)外,也受前文提及的职业变量极端系数影响,导致模型对该品类的细分群体偏好预测精度较低。
5. 结论
本研究以哈尔滨市各区县居民为对象,采用“线上配额抽样(问卷网) + 线下补充发放”的方式收集数据,经筛选获得有效问卷972份,有效率87.33%。以自热食品购买类型为被解释变量,年龄、职业、生活状态、收入为解释变量,结合技术接受模型与消费价值观理论构建多项Logistic回归模型,经似然比卡方检验验证,模型拟合良好。
研究结果表明,年龄、职业、生活状态、收入均对自热食品购买类型有显著影响,且该结果与消费者行为理论高度契合。从消费价值观理论看,自热火锅为消费者首选,核心原因在于其口感丰富、场景适配性强,契合多数消费者(尤其是25~40岁群体)的体验型消费需求;40岁以上群体更倾向自热米饭,因其饱腹性强、价格亲民,符合实用型消费价值观;从技术接受模型看,自由职业者对自热面类偏好最突出,服务业人员与工人次之,本质是该群体高频面临加班场景,对自热面类“快速加热、操作简单”的感知易用性与“代餐效率高”的感知有用性认知更强;收入3000~5000元群体对自热粥类接受度最高,反映出中低收入群体即实用型需求更关注产品性价比,与消费价值观理论中“价格敏感型消费决策”逻辑一致。生活状态的差异主要体现在自热面类选择上,独居、合租群体倾向略高于与家人同住群体,这是因为独居群体对“无需多人分享、单人份便捷加热”的感知易用性需求更强烈,进一步印证了技术接受模型的核心观点。模型整体预测正确率52.80%,其中自热火锅预测正确率达71.00%,远超其他品类,这既与样本分布相关,也说明体验型消费需求对应的品类更易通过消费者特征进行预测,为理论应用于实践提供了数据支撑。
本研究存在三方面局限,需结合数据分析修正结果进一步说明:其一,样本结构存在细分群体样本量不足的问题,如18岁以下群体(1.9%)、各职业与自热粥类的交叉样本(均<10份),导致部分变量(如职业)出现极端系数,影响了细分群体分析的精度;其二,生活状态对自热面类的弱显著影响未在初始分析中体现,反映出对模型结果的细致度把控不足,后续研究需逐一核对各变量分类的显著性,避免遗漏关键差异;其三,抽样方法为配额抽样,未采用分层概率抽样,且18岁以下(样本占比1.9%)、40岁以上(样本占比5.2%)等群体样本量不足,可能导致模型对小众群体的偏好预测偏差,未来应采用分层抽样确保各群体样本量充足,同时引入“购买频率 × 意愿评分”的连续型因变量,结合多元线性回归提升分析精度。
从实践延伸看,本研究结论可为自热食品企业电商运营提供理论指导:对主打体验型需求的品牌,可针对25~40岁群体强化自热火锅的直播场景化展示(如“家庭聚餐小火锅”“户外露营便捷餐”),提升消费者感知有用性;对聚焦实用型需求的品牌,可面向40岁以上群体与中低收入群体,推出自热米饭、粥类的“家庭装优惠套餐”,突出“性价比高、多人适用”的产品卖点;电商平台则可基于理论变量优化推荐算法,如向自由职业者推送自热面类“加班代餐专区”,向独居群体优先展示“单人份便捷加热”品类,真正实现“理论–数据–运营”的闭环。