1. 引言
校园冲突,特别是其极端形式——校园欺凌,已成为全球范围内严重影响青少年身心健康与学业发展的公共卫生问题[1]。随着数字化时代的到来,冲突行为已突破物理边界,形成线上线下交织的复杂形态,对受害者的心理与学业造成即时与长期的负面影响,其影响甚至可能延续至成年阶段,损害其社会适应能力[2] [3]。从积极心理学与预防科学的角度出发,如何从根源上识别风险、培育韧性,从而构建更具前瞻性的校园支持体系,是当前理论与实践共同面临的挑战。
在青少年发展阶段,培养和维持积极的生活状态对于其健康成长、社会适应及规避风险行为至关重要。生活状态作为一个多维度的、反映个体整体心理功能与主观幸福感的综合性构念(如心理弹性、情感体验、社会功能等维度),已被广泛视为预测青少年发展结果的关键指标[4]。它不仅是内在心理健康的晴雨表,更与一系列校园适应问题密切相关,例如,良好的生活状态已被证实是减少校园冲突与欺凌卷入倾向的重要保护因素[5]。
现有研究对青少年个体生活状态的内在形成机制关注不足,尤其是与其密切相关的核心认知决策过程,如个体如何评估风险(风险偏好)、处理信息(认知需要)及做出选择(决策风格) [6]。具体而言,风险偏好影响个体在不确定情境下的行为倾向,研究发现欺凌者可能高估风险但同时也表现出高风险的调节行为,而受害者则可能低估风险并高估行为收益[7]。认知需要反映个体进行深度思考的内在动机,与理性判断和情绪调节密切相关[8];决策风格则体现个体信息处理方式的稳定差异,如冲动型决策可能增加受欺凌后的风险行为[9];这三类核心变量共同构成了个体面对环境挑战时的心理“工具箱”。本研究以生活正向状态为例,通过量化分析,系统探讨风险偏好、认知需要与决策风格对青少年生活状态的影响机制,为校园心理健康促进与风险预防提供实证依据。
2. 数据处理与方法
本研究采用第九届“认证杯”中国数学建模网络挑战赛的问卷调查数据,结合自编或修订的心理量表进行系统测量,以生活正向状态为例,探讨风险偏好、认知需要与决策风格对青少年生活状态的影响机制,并分析性别、年龄变量的调节效应。
数据预处理包括收集、清洗、转换与标准化四个阶段:第一阶段,收集数据涵盖了8~20岁学生,按年龄划分为四组,分别为9岁组(8~10岁)、12岁组(11~13岁)、15岁组(14~16岁)、18岁组(17~20岁),以便分层比较。问卷中包含了测量风险偏好、认知需要、决策风格自变量的条目,同时,通过关键条目整合生成了本研究关注的核心结果变量“生活正向状态”,作为青少年整体生活状态的操作化指标。第二阶段,通过均值填补处理缺失值,利用箱线图和Z分数法识别异常值(将Z分数的绝对值大于3的观测值视为异常值),并在核实后予以修正或剔除,为确保每条数据的唯一性同时删除重复记录。第三阶段,为便于后续量化分析,数据转换阶段需对分类变量进行了系统的数值编码;其中,性别变量被编码为二元虚拟变量(女性= 0,男性= 1)。由于决策风格是顺序意义的分类变量,则依据其原始问卷选项的自然顺序(例如从“完全不符合”到“完全符合”),依次赋予递增的整数编码。第四阶段,数据标准化阶段则采用最小–最大标准化和Z分数标准化统一变量尺度。为消除不同变量在量纲和取值范围上的差异,本研究针对不同性质的变量采用了相应的标准化方法。对于“风险偏好”和“认知需求”这类连续型变量,采用最小-最大标准化方法,将其线性转换至[0, 1]区间内。对于近似服从正态分布的变量,则采用Z分数标准化方法,使其转化为均值为0、标准差为1的标准正态分布,标准化处理旨在满足后续参数统计方法对数据分布的前提假设,并提升Logistic回归等模型参数估计的稳定性与可解释性。
本研究采用量化研究方法,结合多种统计检验与预测模型,系统分析认知决策特质与生活正向状态的关系,具体方法如下:首先,进行正态性检验,利用SPSS软件进行Kolmogorov-Smirnov检验与Shapiro-Wilk检验,判断各指标分布特征。然后,基于正态性检验结果,选取参数或非参数检验进行群体差异分析。采用Mann-Whitney U检验(两组比较)、Kruskal-Wallis H检验(多组比较)及Dunn事后检验,分析认知决策特质在不同性别、年龄群体中的差异,明确调节效应。进一步,构建二值Logistic回归模型与随机森林模型,以生活正向状态(1 = 正向,0 = 负向)为因变量,风险偏好、认知需要、决策风格为自变量,检验自变量对因变量的预测作用,并通过特征重要性分析明确核心影响因素。Logistic回归能够提供可解释的参数估计,明确风险偏好、认知需要、决策风格自变量对因变量的方向与显著性影响;而随机森林模型则通过特征重要性排序,识别影响生活正向状态的关键变量及其相对贡献度,并有效处理变量间的复杂交互作用。通过比较两种模型的结果,可在解释性与预测性能之间取得平衡,增强结论的稳健性与全面性。
3. 实证分析
3.1. 正态性检验
为给后续差异性检验与模型构建选择恰当的统计方法,首先对核心变量风险偏好、认知需要、决策风格进行正态性评估。本研究综合运用统计检验并辅以直方图与Q-Q图进行直观可视化判断,使用Kolmogorov-Smirnov (K-S)检验与Shapiro-Wilk (S-W)检验获取定量证据,原假设H0:样本服从正态分布。
按性别与年龄分组进行检验,其中女生组有699个数据,男生组有700个数据,使用SPSS分析结果如表1与表2所示。
Table 1. Results of normality test for variables by gender
表1. 各变量分性别的正态性检验结果
|
|
Kolmogorov-Smirnova |
Shapiro-Wilk |
性别 |
统计 |
自由度 |
显著性 |
统计 |
自由度 |
显著性 |
风险偏好 |
男 |
0.114 |
700 |
0.000 |
0.926 |
700 |
0.000 |
女 |
0.188 |
699 |
0.000 |
0.882 |
699 |
0.000 |
认知需要 |
男 |
0.031 |
700 |
0.155 |
0.994 |
700 |
0.012 |
女 |
0.039 |
699 |
0.012 |
0.996 |
699 |
0.095 |
决策风格 |
男 |
0.313 |
700 |
0.000 |
0.755 |
700 |
0.000 |
女 |
0.312 |
699 |
0.000 |
0.756 |
699 |
0.000 |
注:a. 里利氏显著性修正。
由表1可知,在分性别检验中,风险偏好与决策风格的所有K-S与S-W检验p值均小于0.05,拒绝正态性原假设。认知需要的检验结果则不完全一致:在男生组中,K-S检验不显著(p = 0.155),但S-W检验显著(p = 0.012);在女生组中,S-W检验不显著(p = 0.095)。这种不一致在大样本条件下常见,需借助图形进一步判断。
Table 2. Results of normality test for each variable by age
表2. 各变量分年龄的正态性检验结果
|
年龄分组 |
Kolmogorov-Smirnova |
Shapiro-Wilk |
统计 |
自由度 |
显著性 |
统计 |
自由度 |
显著性 |
决策风格 |
8~10 |
0.256 |
263 |
0.000 |
0.793 |
263 |
0.000 |
11~13 |
0.311 |
479 |
0.000 |
0.760 |
479 |
0.000 |
14~16 |
0.353 |
323 |
0.000 |
0.723 |
323 |
0.000 |
17~20 |
0.322 |
334 |
0.000 |
0.742 |
334 |
0.000 |
认知需要 |
8~10 |
0.050 |
263 |
0.020* |
0.992 |
263 |
0.177 |
11~13 |
0.039 |
479 |
0.084 |
0.996 |
479 |
0.226 |
14~16 |
0.034 |
323 |
0.020* |
0.997 |
323 |
0.726 |
17~20 |
0.088 |
334 |
0.000 |
0.976 |
334 |
0.000 |
风险偏好 |
8~10 |
0.210 |
263 |
0.000 |
0.855 |
263 |
0.000 |
11~13 |
0.178 |
479 |
0.000 |
0.897 |
479 |
0.000 |
14~16 |
0.129 |
323 |
0.000 |
0.923 |
323 |
0.000 |
17~20 |
0.101 |
334 |
0.000 |
0.925 |
334 |
0.000 |
注:*. 这是真显著性的下限。a. 里利氏显著性修正。
由表2可知,在分年龄检验中,风险偏好与决策风格在所有年龄组下均显著偏离正态分布(p < 0.05)。对于认知需要,在8~10岁、11~13岁、14~16岁组中,S-W检验的p值均大于0.05 (分别为0.177,0.226,0.726),未拒绝正态性原假设;仅在17~20岁组中拒绝原假设(p < 0.05)。
为综合评估分布形态,绘制了各变量的直方图与Q-Q图(见图1~6)。
Figure 1. Cognitive needs histogram
图1. 认知需要直方图
Figure 2. Risk preference histogram
图2. 风险偏好直方图
图1呈近似钟形,图5显示数据点基本沿理论直线分布,仅尾部轻微偏离,结合S-W检验在多数组中不显著的结果(p > 0.05),综合判断认知需要为近似正态分布。
图2显示分布极端分散,标准差远大于均值;图4严重偏离理论直线,左尾截断。明确判断风险偏好数据不服从正态分布。图3显示标准差约为平均值的25%,虽比例较低,但绝对值极大,说明数据跨度广;而图6明显偏离理论直线,明确判断决策风格不服从正态分布。
Figure 3. Decision style histogram
图3. 决策风格直方图
Figure 4. Normal Q-Q plot of risk preference
图4. 风险偏好的正态Q-Q图
Figure 5. Normal Q-Q plot of cognitive needs
图5. 认知需要的正态Q-Q图
Figure 6. Normal Q-Q plot of decision style
图6. 决策风格的正态Q-Q图
3.2. 指标间的差异性检验
根据3.1节的正态性检验结果发现,在分别考虑性别和年龄段的情况下,除认知需要指标在部分年龄组中近似服从正态分布外,风险偏好与决策风格均表现出明显的非正态分布特征。因此,为对各项指标进行有效的组间差异比较,本研究主要采用非参数检验方法。具体而言,对于性别这类两组比较,使用Mann-Whitney U检验;对于年龄这类多组比较,先采用Kruskal-Wallis H检验判断是否存在整体显著差异,若结果显著,则进一步通过事后检验(如Dunn检验)进行两两比较,以识别具体差异来源。
3.2.1. 性别差异的Mann-Whitney U检验
将数据按照性别划分为男生组和女生组,每组各包含700个数据样本。基于原假设即男生和女生在该项指标上的位置参数相等,采用Mann-Whitney U检验方法进行分析。具体的分析结果详见表3所示。
Table 3. Mann-Whitney U test for gender-specific indicators
表3. 分性别指标的Mann-Whitney U检验
指标 |
性别 |
风险偏好 |
认知需要 |
决策风格 |
自由度 |
男 |
1400 |
1400 |
1400 |
女 |
1400 |
1400 |
1400 |
统计量 |
男 |
289126.5 |
255134.5 |
252331.0 |
女 |
222573.5 |
256565.5 |
259369.0 |
p值 |
男 |
0.000 |
0.927 |
0.622 |
女 |
0.000 |
0.927 |
0.622 |
从表3所呈现的结果中可以明确看出,在按性别分组的情况下,男生组与女生组在认知需要和决策风格这两项指标上的p值均大于0.05,因此接受原假设,认为在这两项指标上男生和女生之间没有显著差异。然而,在风险偏好的关系上,这一组的p值明显小于0.05,导致其拒绝原假设,表明在这项指标上男生和女生之间存在显著差异。基于这些分析结果,得出以下结论:认知需要与决策风格对男生和女生的影响没有显著不同,而风险偏好对男生和女生的影响则存在显著差异。
3.2.2. 年龄段整体差异的Kruskal-Wallis H检验
为进一步探究不同年龄段在各项指标上的整体差异,采用Kruskal-Wallis H检验对四个年龄段(8~10岁、11~13岁、14~16岁、17~20岁)进行多组比较。Kruskal-Wallis H检验的原假设为“所有年龄段的指标分布位置相同”,若检验结果显著(p < 0.05),则表明至少存在一个年龄段与其他组存在显著差异。具体分析结果如表4所示。
Table 4. Kruskal-Wallis test results for age-specific indicators
表4. 分年龄段指标的Kruskal-Wallis检验结果
指标 |
H统计量 |
自由度 |
p值 |
显著性结论(α = 0.05) |
风险偏好 |
7.9705 |
3 |
0.0466 |
显著 |
认知需要 |
57.2660 |
3 |
0.0000 |
显著 |
决策风格 |
12.4940 |
3 |
0.0059 |
显著 |
从表4显示,风险偏好、认知需要与决策风格三项指标的p值均小于0.05,表明三个变量在不同年龄段间均存在整体显著差异。
通过Kruskal-Wallis H检验对三个指标(风险偏好、认知需要、决策风格)在四个年龄段间的整体差异进行了分析。结果显示,青少年的风险偏好、认知需要与决策风格并非稳定不变,而是随年龄发展阶段呈现系统性的演变,可能反映了认知发展、社会经验积累及心理成熟度的共同影响。
3.2.3. 认知需要指标的Dunn事后检验
由于Kruskal-Wallis H检验显示认知需要指标在不同年龄段存在整体显著差异(p < 0.001),需进一步通过Dunn事后检验明确具体差异组别。Dunn检验通过调整多重比较的显著性阈值(使用了Bonferroni校正),比较所有年龄段两两之间的差异。分析结果如下:
Table 5. Dunn’s post-hoc test results for cognitive needs indicators
表5. 认知需要指标的Dunn事后检验结果
比较组(A vs B) |
Z值 |
未校正p值 |
校正后p值(Bonferroni) |
显著性结论(α = 0.05) |
8~10 vs 11~13 |
−3.911 |
0.0001 |
0.0006 |
显著 |
8~10 vs 14~16 |
−5.447 |
<0.0001 |
<0.0001 |
显著 |
8~10 vs 17~20 |
−1.133 |
0.2572 |
1.0000 |
不显著 |
11~13 vs 14~16 |
−2.294 |
0.0218 |
0.1308 |
边缘显著 |
11~13 vs 17~20 |
−5.028 |
<0.0001 |
<0.0001 |
显著 |
14~16 vs 17~20 |
−6.279 |
<0.0001 |
<0.0001 |
显著 |
表5结果显示,该指标的年龄差异并非简单的线性增长或任意两组皆异,而是认知需要的年龄差异呈现明显的阶段性发展特征。具体表现为,从8~10岁到11~13岁与14~16岁,认知需要均呈现显著上升趋势;而11~13岁与17~20岁之间、以及14~16岁与17~20岁之间也存在显著差异,说明认知需要在11~20岁期间持续增强,并在17~20岁阶段达到相对高点。尽管8~10岁与17~20岁之间的差异未达统计显著性,这可能反映两组在认知需要发展轨迹上处于不同形态阶段,但整体趋势仍表现为随年龄增长先显著提升、后逐渐趋于平稳的发展模式。
综上,Kruskal-Wallis H检验与Dunn事后检验共同表明:风险偏好、认知需要与决策风格三项认知决策特质在青少年不同年龄组间均存在整体显著差异,其中认知需要的年龄差异呈现明确的阶段性发展特征——从8~10岁到11~13岁与14~16岁显著上升,并在11~13岁至17~20岁、14~16岁至17~20岁之间持续增强,表明其随年龄增长呈现先快速提升、后趋于平稳的发展轨迹。
3.3. 模型预测
建立Logistic回归
为明确风险偏好、认知需要、决策风格对生活正向状态的影响方向与统计显著性,提供可解释的量化结论,构建二值型Logistic回归模型,输出清晰的参数结果。因变量生活状态为二分类变量(0 = 负向,1 = 正向),以生活正向状态为例,以风险偏好(X1)、认知需要(X2)、决策风格(X3)为自变量。通过Logit连接函数建立自变量与因变量发生比(Odds)之间的线性关系,其核心公式为:
(1)
初始模型结果如下表所示:
Table 6. Initial Logistic regression model coefficients table
表6. 初始Logistic回归模型系数表
|
B |
标准误差 |
瓦尔德 |
自由度 |
显著性 |
Exp(B) |
AUC |
X1 |
0.984 |
0.403 |
5.956 |
1 |
0.015 |
2.676 |
0.623 |
X2 |
0.187 |
0.656 |
0.081 |
1 |
0.776 |
1.205 |
0.512 |
X3 |
−0.878 |
0.600 |
2.143 |
1 |
0.143 |
0.416 |
0.525 |
常量 |
0.283 |
0.520 |
0.297 |
1 |
0.586 |
1.327 |
- |
从表6的回归结果可以看出,只有变量X1对应的p值小于0.05 (p = 0.015)。在该线性模型中,变量X2、X3对青少年生活方式状态的线性预测作用不显著(p > 0.05),二者与生活方式的关联可能存在非线性或交互效应,这一推测可通过后续随机森林模型的结果得到验证。从校园冲突视角来看,变量X1的显著正向作用表明,提升风险偏好可能增强青少年的生活正向状态,进而间接降低其卷入校园冲突的倾向。因此,剔除变量X2和X3,重新拟合模型,结果如下表所示:
Table 7. Logistic regression model coefficients after exclusion of non-significant variables
表7. 剔除不显著变量后的Logistic回归模型系数表
|
B |
标准误差 |
瓦尔德 |
自由度 |
显著性 |
Exp(B) |
AUC |
X1 |
0.886 |
0.394 |
5.056 |
1 |
0.025 |
2.426 |
0.647 |
常量 |
−0.316 |
0.196 |
2.581 |
1 |
0.000 |
0.729 |
- |
由表7结果可见,优化后的模型仅保留风险偏好(X1),其标准误差较小且p值小于0.05(p = 0.025),表明该变量对青少年生活方式正向状态的线性预测作用显著。优化后模型的AUC值提升至0.647 (95% CI: 0.608~0.686),较初始模型有所改善,表明仅保留风险偏好作为预测变量时,模型对生活正向状态的区分能力更优。
据此建立针对8~20岁群体生活正向预测的Logistic回归方程如下:
(2)
根据最终模型的回归系数分析:风险偏好(X1)的优势比Exp(B) = 2.426,表明在控制其他变量后,风险偏好每增加1个单位,青少年“生活正向”状态的发生比将提升至原来的2.426倍。这一结果从统计上量化了风险偏好对生活方式的影响,提示风险偏好可作为校园冲突预防的间接干预,提升青少年风险偏好有助于增强其生活正向状态,从而减少校园冲突的卷入倾向。
3.4. 随机森林模型预测
Logistic回归识别了风险偏好对生活方式的线性显著影响,而后续随机森林模型将进一步揭示认知需要、决策风格变量的非线性贡献,二者结合可更全面地解析校园冲突视角下青少年生活方式的影响机制。
Table 8. Feature importance table of random forest model
表8. 随机森林模型特征重要性表
特征名称 |
特征重要性 |
风险偏好 |
34.00% |
认知需要 |
49.80% |
决策风格 |
16.20% |
由表8可以看出,随机森林模型识别出青少年生活方式认知需要是影响生活方式状态的核心特征(49.80%),高认知需要的青少年更易形成理性生活方式,从而减少校园冲突的卷入倾向。风险偏好为次级核心特征(34.00%),进一步验证了风险偏好对生活正向状态的正向作用。两者共同解释了83.8%的生活方式变异,而决策风格(16.20%)作为补充特征,虽然影响力相对较小,但仍具有一定的预测价值。
Table 9. Classification evaluation metrics for random forest model training and test sets
表9. 随机森林模型训练集与测试集分类评价指标表
|
准确率 |
召回率 |
精确率 |
F1 |
AUC |
训练集 |
0.986 |
0.986 |
0.986 |
0.986 |
1 |
测试集 |
0.567 |
0.567 |
0.613 |
0.556 |
0.529 |
表9展示了随机森林模型在训练集和测试集上的分类效果,其中准确率为预测正确的样本占总样本的比例、召回率为实际正样本中被正确预测为正样本的比例、精确率为预测正样本中实际确为正样本的比例,F1值是综合反映模型性能的精确率和召回率的调和平均数,AUC值为ROC曲线下的面积,以上指标数值均越高代表模型分类性能越好。
4. 结论与讨论
本研究揭示了认知需要、风险偏好与决策风格对生活正向状态的预测作用。具体而言,高认知需要有助于提升情绪调节能力,促进理性判断,显著增强生活正向状态;风险偏好通过影响个体在不确定情境下的行为倾向与挑战应对意愿,显著增强生活正向状态;决策风格作为补充性因素,虽然Logistic回归未显著(p = 0.143),但仍具一定预测价值(16.20%)。
总体而言,三个变量主要通过影响个体“生活正向状态”,其中认知需要最具干预潜力,认知需要(首要因子)与风险偏好(显著因子)是生活正向状态核心预测因素,风险偏好每增加1单位,生活正向状态发生比提升2.426倍。提升学生认知调控能力、引导理性决策、管理风险偏好,有助于构建积极校园生态、提升学生整体的生活正向状态和心理韧性。建议在心理健康教育中融入认知行为训练,强化学生内在抗逆力,此外,随机森林模型存在过拟合,可能与未纳入家庭、同伴等环境变量有关,生活正向状态测量依赖问卷存在主观偏差,使实验结果具有一定的局限性。本研究为提升生活正向状态提供了可干预的认知心理因子,后续可通过优化样本结构、补充环境变量,采用追踪研究与质性方法,深化变量关系内在机制进行探索。
基金项目
2024年大学生创新创业训练项目(S202411305056);蚌埠学院校级自然科学研究一般项目(2024ZR05);蚌埠学院产学研合作项目(000009067)。
NOTES
*通讯作者。