1. 引言
在社会分工精细化进程中,基层劳动者,如保安、环卫工人,虽对社会运行至关重要,却因体力密集、环境艰苦、收入较低等标签长期面临职业污名化。其中,基层小区保安作为典型群体,不仅需应对对工作物理环境的负面感知,还需承受社交污名,导致其职业认同水平普遍偏低。职业认同作为个体对自身职业角色的认知、情感归属与价值接纳,直接影响其工作投入、职业稳定性及心理健康,而基层小区保安的职业认同困境不仅制约个体发展,更可能影响社区安全服务质量与社会治理效能。
现有研究多聚焦于基层劳动者职业认同的现状描述或单一因素的影响,缺乏对多因素作用机制的系统量化分析,尤其少见采用集成学习算法精准识别影响因素重要性的研究。集成学习算法通过多模型融合,能有效降低单一模型的偏差与方差,在特征重要性评估中具有更高的稳定性与准确性。
本研究的理论基础源于社会身份认同理论与压力转换理论,两大理论的逻辑耦合为研究模型与变量的构建提供了核心支撑。社会身份认同理论认为,个体通过社会群体分类构建自我概念,职业身份作为重要的社会身份维度,其认同水平取决于个体对所属职业群体的积极评价与情感归属,而职业污名化引发的“社会认同威胁”会直接冲击这一认同过程。与此同时,压力转换理论强调压力源、应对策略与心理结果的动态链条,职业污名通过工作感知转化为心理压力,而应对策略作为关键调节变量,其主动与被动的选择差异会直接影响压力向职业认同的传导路径——积极应对能阻断负面传导,被动应对则会加剧认同弱化。基于此,本研究以杭州市基层小区保安为样本,引入随机森林、AdaBoost及XGBoost三种算法,从基本信息、工作感知、应对策略、支持资源四大维度切入,系统识别职业认同的核心影响因素及优先级。研究结果可为政府、用人单位制定“靶向式”干预策略提供科学依据,对提升基层劳动者职业认同、推动职业平等具有重要现实意义。
2. 样本选取
2.1. 样本界定
本研究将杭州市基层小区保安界定为:根据链家平台提供的杭州市2023年区域房价数据,新主城区(上城区、拱墅区、西湖区、滨江区)中房价低于4万元每平方米小区的保安,其余城区(萧山区、临平区等)中房价低于3万元每平方米小区的保安(排除房价较高小区中薪资显著偏高的保安群体)。
2.2. 样本量计算
采用简单随机抽样中总体比例估计的样本量公式:
(1)
其中,显著性水平
时(对应
),绝对允许误差
,保守估计总体比例
,计算得初始样本量
。按每个小区15名保安估算得到调查范围内保安总人数
,进行样本量修正:
(2)
考虑80%有效问卷回收率,最终确定发放问卷480份。
2.3. 样本特征
本研究通过线下一对一发放问卷,回收有效问卷430份,有效率达89.6%,符合预期对有效问卷回收率的假设。样本随机性通过性别游程检验验证(Z = −1.419, p = 0.156 > 0.05),代表性良好。样本具体特征如表1所示。
Table 1. Samples characteristics
表1. 样本特征
变量 |
人数 |
占比(%) |
变量 |
人数 |
占比(%) |
性别 |
|
|
受教育程度 |
|
|
男 |
376 |
87.4 |
小学及以下 |
132 |
30.7 |
女 |
54 |
12.6 |
初中 |
178 |
41.4 |
年龄 |
|
|
高中或中专 |
98 |
22.8 |
30岁以下 |
12 |
2.8 |
专科及以上 |
22 |
5.1 |
30~40岁 |
71 |
16.5 |
从业时间 |
|
|
41~50岁 |
157 |
36.5 |
1年以下 |
38 |
8.8 |
51~60岁 |
120 |
27.9 |
1~3年 |
131 |
30.5 |
60岁以上 |
70 |
16.3 |
3~5年 |
129 |
30.0 |
婚姻状况 |
|
|
5~8年 |
61 |
14.2 |
未婚 |
41 |
9.5 |
8年以上 |
71 |
16.5 |
已婚 |
367 |
85.3 |
月工资 |
|
|
离异 |
14 |
3.3 |
4000元及以下 |
101 |
23.5 |
丧偶 |
8 |
1.9 |
4001~4500元 |
108 |
25.1 |
|
|
|
4501~5000元 |
114 |
26.5 |
|
|
|
5001~5500元 |
78 |
18.1 |
|
|
|
5500元以上 |
29 |
6.7 |
由表1样本特征可见,样本呈现典型行业特征:性别上男性占绝对主导(87.4%);年龄以中老年为主,其中41~60岁年龄占比64.4%;受教育程度集中于初中及以下(72.1%);从业时间以1~5年为主(60.5%);月工资多低于5000元(74.7%),整体低于杭州市2024年约6500元的月平均薪资。
3. 基本原理与变量测量
3.1. 核心算法原理
本研究采用三种主流集成学习算法,通过多模型交叉验证确保影响因素识别的可靠性,各算法核心原理如下。
3.1.1. 随机森林(Random Forest) [1]
随机森林通过Bootstrap抽样生成n个训练集,并以此构建n棵独立决策树。对于分类问题,模型最终采用投票制输出结果;对于回归问题,则采用均值法输出结果。其特征重要性通过两种指标衡量。
1) Mean Decrease Accuracy:变量随机置换后模型预测准确率的下降幅度,值越大表明变量对模型贡献越强;
2) Mean Decrease Gini:变量分裂节点时“节点不纯度”的下降幅度,值越大表明变量对分类效果的提升越显著。
3.1.2. AdaBoost (Adaptive Boosting) [2]
AdaBoost通过迭代训练弱分类器,对前一轮分错的样本赋予更高权重,最终将弱分类器加权融合为强分类器。其特征重要性通过“变量对分类误差的贡献度”计算,贡献度越高,变量重要性越强。
3.1.3. XGBoost (Extreme Gradient Boosting) [3]
XGBoost基于梯度提升框架,通过最小化残差构建决策树,同时引入正则化项控制过拟合。其特征重要性通过三种指标评估:
1) Gain:变量对模型预测精度的相对贡献,是衡量重要性的核心指标;
2) Cover:变量作为分裂点时影响的样本数量,反映变量的覆盖范围;
3) Frequency:变量在所有树中作为分裂点的次数占比。
3.2. 变量测量
3.2.1. 因变量:职业认同
参考朱永跃等(2020)的职业认同量表[4],从8个维度测量,包括工作内容认同(如“我了解工作要求和内容”)、工作价值认同(如“这份工作对我有意义”)、职业尊严认同(如“有人贬低这份工作时我会感到冒犯”)等,量表CR = 0.895,AVE = 0.518。
3.2.2. 自变量
自变量分为四大维度,共9个变量。所有变量具体如表2所示。
Table 2. Variable Indicators
表2. 变量指标
原始变量 |
程序变量 |
性别 |
x1 |
年龄 |
x2 |
受教育程度 |
x3 |
婚姻状况 |
x4 |
从业时间 |
x5 |
月工资 |
x6 |
工作感知 |
x7 |
应对策略 |
x8 |
支持资源 |
x9 |
职业认同 |
y |
本研究涉及的核心变量工作感知、支持资源、应对策略、职业认同,均采用李克特5点量表(1 =“完全不符合”,5 =“完全符合”),工作感知量表参考徐光毅(2024)改编使用的测量非体面工作感知的量表[5],支持资源参考Liou等(2014)开发的测量组织支持的量表[6]以及Zimet等(1988)开发的测量同事和家庭支持的量表[7],应对策略参考周晔和黄旭(2020)开发的职业污名应对策略量表[8],职业认同参考朱永跃等(2020)在研究中所使用的职业认同测量量表[4]。研究者对原始量表进行了调整,以更好地运用于本文,具体量表如下表3所示。
Table 3. Dimension scale
表3. 维度量表
主维度 |
题项 |
指标 |
主维度 |
题项 |
指标 |
职业认同 |
B1 |
明晰工作要求内容 |
应对策略 |
D1 |
否认职业低下认知 |
B2 |
认同工作价值意义 |
D2 |
主动澄清职业误解 |
B3 |
适配自身信己能力 |
D3 |
认可劳有所得价值 |
B4 |
肯定工作核心重要 |
D4 |
偏好同行同乡交往 |
B5 |
职业融入日常生活 |
D5 |
被动从事当前职业 |
B6 |
反感职业负面冒犯 |
D6 |
隐瞒自身职业身份 |
B7 |
抵触职业负面评价 |
D7 |
倾向优质职业交往 |
B8 |
割裂工作自我关联 |
支持资源 |
E1 |
工作氛围友好畅言 |
工作感知 |
C1 |
常触污秽工作物品 |
E2 |
组织关注工作满意 |
C2 |
工作致身易遭污损 |
E3 |
遇困可获组织援助 |
C3 |
工作环境偶感不适 |
E4 |
同事给予有力支持 |
C4 |
工作常陷心力交瘁 |
E5 |
工作事宜同事可助 |
C5 |
从业需忍他人冒犯 |
E6 |
家人理解并予支持 |
C6 |
承受他人职业轻视 |
E7 |
向家倾诉工作难题 |
C7 |
职业致失社交体面 |
|
|
|
3.2.3. 信效度检验
为确保研究变量的可靠性与有效性,本研究对职业认同、工作感知、应对策略及支持资源四大核心潜变量进行信度与效度检验。
信度检验聚焦量表内部一致性与题项有效性,采用标准化因子载荷、标准误(SE)及组合信度(CR),具体结果如表4所示。由表4可知,各潜变量组合信度(CR)介于0.888~0.907之间,均远高于0.7的学术临界标准;所有题项的标准化因子载荷在0.621~0.899之间,且均通过p < 0.001显著性检验,表明量表内部题项关联性强、测量结果稳定可靠,信度水平达到优秀标准。
Table 4. Reliability test sheet
表4. 信度检验表
变量 |
题项 |
标准化因子载荷 |
标准误(SE) |
CR |
职业认同 |
B1 |
0.881*** |
0.014 |
0.895 |
B2 |
0.701*** |
0.027 |
B3 |
0.753*** |
0.023 |
B4 |
0.675*** |
0.029 |
B5 |
0.657*** |
0.03 |
B6 |
0.686*** |
0.028 |
B7 |
0.705*** |
0.027 |
B8 |
0.675*** |
0.029 |
工作感知 |
C1 |
0.890*** |
0.013 |
0.903 |
C2 |
0.755*** |
0.023 |
C3 |
0.705*** |
0.026 |
C4 |
0.718*** |
0.026 |
C5 |
0.749*** |
0.024 |
C6 |
0.737*** |
0.024 |
C7 |
0.723*** |
0.025 |
应对策略 |
D1 |
0.899*** |
0.012 |
0.907 |
D2 |
0.762*** |
0.022 |
D3 |
0.672*** |
0.029 |
D4 |
0.761*** |
0.022 |
D5 |
0.733*** |
0.024 |
D6 |
0.754*** |
0.023 |
D7 |
0.745*** |
0.024 |
支持资源 |
E1 |
0.857*** |
0.017 |
0.888 |
E2 |
0.716*** |
0.026 |
E3 |
0.754*** |
0.024 |
E4 |
0.621*** |
0.033 |
E5 |
0.727*** |
0.026 |
E6 |
0.727*** |
0.026 |
E7 |
0.694*** |
0.028 |
注:***表示p < 0.001。
效度检验从结构效度与判别效度体现。结构效度通过探索性因子分析(EFA)与验证性因子分析(CFA)验证,确保量表结构与研究理论框架一致,结果如表5所示。KMO检验值0.835 ≥ 0.7,巴特利特球形度检验p < 0.001,CFA各项拟合指数均满足优秀标准,量表结构与理论框架高度契合。
Table 5. Structural validity test table
表5. 结构效度检验表
检验维度 |
检验指标 |
检验结果 |
探索性因子分析 |
KMO检验值 |
0.835 |
巴特利特球形度检验 |
χ2 = 3862.417, df = 406, p < 0.001 |
验证性因子分析 |
CFA拟合指数 |
χ2/df = 2.318, GFI = 0.902, AGFI = 0.876, CFI = 0.924, TLI = 0.915, RMSEA = 0.057 |
判别检验采用Fornell-Larcker准则进行精细化检验,确保各潜变量维度边界清晰,结果如表6判别效度检验表所示。各潜变量的AVE平方根(对角线数据)均大于其与其他潜变量的相关系数(0.476~0.587),维度区分度良好,无混淆问题。
Table 6. Discriminant validity test table
表6. 判别效度检验表
潜变量 |
职业认同 |
工作感知 |
应对策略 |
支持资源 |
职业认同 |
0.720 |
0.562 |
0.587 |
0.534 |
工作感知 |
0.562 |
0.756 |
0.518 |
0.493 |
应对策略 |
0.587 |
0.518 |
0.764 |
0.476 |
支持资源 |
0.534 |
0.493 |
0.476 |
0.731 |
4. 实证分析
4.1. 数据预处理
将430份样本按7:3比例随机分为训练集(301份)与测试集(129份),用于模型训练与验证。为简化分析,对所有变量进行编码,并通过极差标准化消除量纲影响,确保算法公平性。
4.2. 推断性统计分析
采用列联分析方法来探索个体的基本情况与职业认同之间的潜在联系,并运用Kruskal-Wallis检验来进一步细化分析。Kruskal-Wallis检验作为一种非参数统计方法,允许在不假设数据分布的前提下,比较两组或多组数据的中位数是否存在显著差异,这对于处理非正态分布的数据或有序分类数据尤为合适。
由表7和表8可知,从业时间和月工资与小区保安的职业认同存在显著关联性。已工作8年以上的保安职业认同显著更高,显示长期从业能加深职业忠诚度与认同感,并可能伴随职业成就感的累积。月工资位于5001~5500元区间的保安相较于低收入者,以及月工资超过5500元的保安相较于5000元及以下者,均表现出更高的职业认同。适度薪酬能提升职业满意度与认同感,但薪酬提升至一定高度后,边际效应减弱,表明薪酬对职业认同的提升存在阈值效应。
Table 7. Basic Situation and professional identity contingency analysis table
表7. 基本情况与职业认同列联分析表
基本情况 |
假设组 |
p值 |
性别 |
H0:小区保安的职业认同与性别无关 |
0.503 |
H1:小区保安的职业认同与性别有关 |
年龄 |
H0:小区保安的职业认同与年龄无关 |
0.172 |
H1:小区保安的职业认同与年龄有关 |
受教育程度 |
H0:小区保安的职业认同与受教育程度无关 |
0.068 |
H1:小区保安的职业认同与受教育程度有关 |
婚姻状况 |
H0:小区保安的职业认同与婚姻状况无关 |
0.806 |
H1:小区保安的职业认同与婚姻状况有关 |
从业时间 |
H0:小区保安的职业认同与从业时间无关 |
0.014 |
H1:小区保安的职业认同与从业时间有关 |
月工资 |
H0:小区保安的职业认同与月工资无关 |
0.000 |
H1:小区保安的职业认同与月工资有关 |
Table 8. Analysis table of differences in professional identity
表8. 职业认同差异分析表
指标 |
频数 |
职业认同 |
H值 |
多重比较 |
M(P25, P75) |
从业时间 |
1年以下d |
38 |
2(3, 4) |
20.394*** |
a > b, c, d |
1~3年c |
131 |
4(3, 4) |
3~5年b |
129 |
4(3, 4) |
5~8年 |
61 |
4(3, 4) |
8年以上a |
71 |
4(4, 4) |
月工资 |
4000元及以下e |
101 |
3(2, 4) |
41.143*** |
c, d, e b > d, e |
4001~4500元d |
108 |
4(3, 3) |
4501~5000元c |
114 |
4(3, 3) |
5001~5500元b |
78 |
4(4, 4) |
5500元以上a |
29 |
4(4, 5) |
4.3. 单一算法特征重要性排序
4.3.1. 随机森林结果
基于R语言Random Forest包构建模型(参数:ntree = 200,mtry = 4),特征重要性如表9所示。
Table 9. Variable importance ranking in random forest
表9. 随机森林变量重要性排序
变量 |
Mean Decrease Accuracy |
Mean Decrease Gini |
x1 (性别) |
4.294 |
6.723 |
x2 (年龄) |
4.255 |
21.775 |
x3 (受教育程度) |
0.242 |
17.427 |
x4 (婚姻状况) |
0.592 |
7.548 |
x5 (从业时间) |
5.935 |
24.321 |
x6 (月工资) |
3.294 |
23.276 |
x7 (工作感知) |
24.222 |
34.691 |
x8 (应对策略) |
20.665 |
30.654 |
x9 (支持资源) |
9.412 |
23.021 |
如表9可知,工作感知(x7)的Mean Decrease Accuracy (24.222)与Mean Decrease Gini (34.691)均为最高,是影响职业认同的首要因素;应对策略(x8)次之;从业时间(x5)与月工资(x6)位列第三、四位;性别(x1)、婚姻状况(x4)的影响最弱。
4.3.2. AdaBoost结果
基于R语言adabag包构建模型(参数:boos = TRUE,mfinal = 100),特征重要性如图1所示。
Figure 1. Ranking results of AdaBoost
图1. AdaBoost排序结果
AdaBoost结果与随机森林一致:工作感知(x7)与应对策略(x8)仍为前两位;支持资源(x9)与从业时间(x5)位列第三、四位;基本信息变量(x1, x4)影响最小。这表明,无论是否对样本权重进行调整,工作感知与应对策略的核心地位均稳定。
4.3.3. XGBoost结果
基于Pythonxgboost库构建模型(参数:eta = 0.1,objective = multi:softmax,num_class = 5),以核心指标Gain为准的特征重要性如表10与图2所示。
Table 10. Variable importance ranking in XGBoost
表10. XGBoost变量重要性排序
变量 |
Gain |
Cover |
Frequency |
x1 (性别) |
0.015 |
0.007 |
0.003 |
x2 (年龄) |
0.097 |
0.130 |
0.124 |
x3 (受教育程度) |
0.092 |
0.125 |
0.135 |
x4 (婚姻状况) |
0.021 |
0.011 |
0.004 |
x5 (从业时间) |
0.126 |
0.159 |
0.159 |
x6 (月工资) |
0.105 |
0.195 |
0.159 |
x7 (工作感知) |
0.250 |
0.109 |
0.076 |
x8 (应对策略) |
0.186 |
0.168 |
0.169 |
x9 (支持资源) |
0.107 |
0.096 |
0.101 |
Figure 2. Variable Importance Ranking in XGBoost
图2. XGBoost变量重要性排序
XGBoost结果进一步验证:工作感知(x7)的Gain值(0.250)最高,贡献了模型25%的预测精度;应对策略(x8)次之(Gain = 0.186);从业时间(x5) (0.126)、支持资源(x9) (0.107)、月工资(x6) (0.105)紧随其后,基本信息变量影响微弱。
4.4. 多算法结果对比
将三种算法的变量重要性排名整合,结果如表11所示。
Table 11. Comparison of variable importance rankings across the three algorithms
表11. 三种算法重要性排名对比
变量 |
程序变量 |
随机森林 |
AdaBoost |
XGBoost |
工作感知 |
x7 |
1 |
1 |
1 |
应对策略 |
x8 |
2 |
2 |
2 |
从业时间 |
x5 |
3 |
4 |
3 |
月工资 |
x6 |
4 |
5 |
5 |
支持资源 |
x9 |
5 |
3 |
4 |
年龄 |
x2 |
6 |
6 |
6 |
受教育程度 |
x3 |
7 |
7 |
7 |
婚姻状况 |
x4 |
8 |
8 |
8 |
性别 |
x1 |
9 |
9 |
9 |
可见,三者在变量重要性排序上呈现出高度的算法间一致性。
在顶层关键变量层级,工作感知(x7)与应对策略(x8)的重要性排名在三种算法中完全趋同,分别稳定占据第1位和第2位,体现了这两类变量在研究场景下的核心作用具有算法层面的强稳健性;在中间变量层级,从业时间(x5)、月工资(x6)、支持资源(x9)的排名虽存在微小差异,但整体序列一致性较高;在底层变量层级,年龄(x2)、受教育程度(x3)、婚姻状况(x4)、性别(x1)的重要性排名在三种算法中完全一致,依次位列第6至第9位。
5. 结论与讨论
5.1. 主要结论
本研究通过随机森林、AdaBoost及XGBoost三种集成学习算法,系统识别了杭州市基层小区保安职业认同的影响因素,核心结论如下:
第一,工作感知是职业认同的首要驱动因素。从算法结果看,工作感知对职业认同的影响最强,访谈数据进一步验证:保安对工作成果被认可的感知越积极,职业认同感越高;反之,工作环境脏污、个体报告的受轻视经历等负面感知会显著降低认同。这与社会身份认同理论一致——职业作为自我概念的核心,其外部评价与内部体验直接塑造个体的认同水平。这一发现的核心理论机制源于社会身份认同理论中的社会认同威胁具象化传导——职业污名化形成的“低价值”“低层次”负面刻板印象,并非抽象存在,而是通过具体工作场景转化为保安的直接感知:对工作物理环境的负面感知、工作内容被轻视的感知,本质是社会对保安职业的负面分类转化为分类威胁,个体因所属群体被贴上负面标签而产生身份焦虑,进而排斥自身职业身份;工作成果不被认可的感知,则触发地位威胁,个体清晰感知到职业群体在社会层级中的弱势地位,导致职业自豪感缺失,最终削弱职业认同;而对工作价值、职业意义的正向感知,实质是获得了职业身份的“合法性证明”,有效缓解了社会认同威胁,强化了“我的职业有价值”的积极认知,从而提升职业认同。
第二,应对策略是职业认同的关键调节因素。三种算法均确认应对策略的重要性仅次于工作感知,这一调节效应的理论逻辑,是社会身份认同理论中身份管理策略的有效性差异与压力转换理论的有机结合:面对职业污名引发的社会认同威胁,保安的应对策略本质是不同类型的身份管理尝试——主动应对属于“积极身份管理”,通过强化职业群体的积极特质、重构职业价值认知,主动阻断“污名压力–负面认同”的传导路径,甚至将“弱势身份”转化为“值得骄傲的身份”;被动应对则属于“消极身份管理”,是对社会认同威胁的妥协与逃避,不仅无法缓解威胁,反而会通过“自我否定”强化负面职业认知,导致职业认同持续降低,这恰好印证了压力转换理论中“应对策略调节压力源与心理结果关系”的核心观点。
第三,从业时间、月工资与支持资源是职业认同的重要辅助因素。从业时间的正向影响,源于社会身份认同理论中群体归属感与内群体积极比较的动态建构,长期从业积累的联结与胜任感抵御外部负面刻板印象;月工资的5000元阈值效应,本质是经济地位与社会认同威胁的关联——低于阈值时经济劣势加剧威胁,高于阈值后边际效应减弱;支持资源通过“认同威胁缓冲机制”,提供身份合法性证明,间接提升职业认同。
第四,性别、婚姻状况等基本信息影响微弱。三种算法中其重要性均位列末位,契合社会身份认同理论“职业认同是场景互动建构”的核心逻辑:职业认同由职业评价、工作体验、应对能力等场景化因素决定,先天特征无直接塑造或显著调节作用。
5.2. 实践启示
第一,优先优化工作感知,从硬件改善与声望提升双管齐下。用人单位需聚焦工作环境优化,如配备保暖岗亭、防护装备、合理规划巡逻路线;政府与媒体则应加强职业正面宣传,例如报道保安见义勇为、协助社区治理的典型案例,通过官方平台普及“保安是社区安全第一道防线”的职业价值,逐步减少社会层面的职业污名化。
第二,强化应对策略培训,结合技能提升与心理支持。用人单位可定期开展职业污名应对专项培训,系统教授保安价值重塑、沟通技巧等实用策略;同时引入专业心理咨询服务,通过一对一咨询或团体辅导,帮助保安缓解负面情绪,如调解因职业歧视产生的较低的自我评价心理,建立积极的职业心态。
第三,完善辅助保障体系,稳定经济基础与职业发展路径。用人单位可普遍提升基层保安月工资,并建立与从业时间、技能等级挂钩的薪资增长机制;政府可推动保安职业资格认证制度,明确从基层保安到安保主管、安全顾问的晋升路径,同时将保安纳入社区公共服务人才培养体系,增强职业的长期吸引力。
5.3. 研究局限与展望
本研究在研究设计与样本选取过程中存在明显局限,需坦诚说明,具体如下:
第一,抽样框的选择性偏差显著。本研究将抽样范围限定为“新主城区房价低于4万元每平方米、其余城区低于3万元每平方米”的小区保安,通过人为设定房价阈值排除了高价小区中薪资显著偏高的保安群体。这种抽样框的人为筛选导致样本存在先天选择性偏差,仅能反映该类中低房价小区保安的职业认同特征,无法代表不同房价梯度、不同服务场景的基层保安群体,样本的整体覆盖面较窄。
第二,抽样方法存在潜在便利性偏差。尽管研究设计中采用简单随机抽样的思路,但线下一对一发放问卷的实际操作受限于调研可达性与成本,倾向于选择地理位置便利、物业配合度高、保安群体配合意愿强的小区开展调研,本质上存在“方便抽样”的特征。这种抽样方式未能完全遵循随机原则,难以覆盖杭州市不同行政区域、不同管理模式的小区保安,进一步削弱了样本的随机代表性,可能导致研究结果向“易接触、高配合度”群体倾斜。
第三,横断面数据的动态性缺失。本研究采用一次性调研获取的横断面数据,仅能静态呈现某一时刻各因素与职业认同的关联关系,无法捕捉职业认同的动态演变规律。例如,在长期从业过程中,工作感知、应对策略对职业认同的作用强度是否随时间变化,月工资提升、支持资源增加等干预措施的长期效果如何,均无法通过现有数据得到解答。
第四,地域与群体代表性有限。样本仅聚焦于杭州市,未纳入其他城市的基层保安群体。不同城市的薪资水平、社会对保安职业的认知态度、物业行业管理规范等存在显著差异,可能导致职业认同影响因素的作用优先级与强度不同,进一步限制了结论的地域推广性。
基于上述局限,本研究结论的适用范围非常有限,不能轻易推广至所有基层保安群体。
未来研究可针对性优化:一是优化抽样设计,扩大抽样框至不同房价水平、不同类型的小区,采用分层随机抽样方法,按区域、小区类型、薪资水平等维度分层抽取样本,提升样本的广泛代表性;二是补充动态数据,采用纵向追踪设计,定期调研同一批保安的职业认同变化,揭示影响因素的长期作用机制;三是扩大地域范围,将调研延伸至不同经济发展水平的城市,对比分析地域差异对职业认同影响因素的调节作用,增强结论的普适性。
基金项目
本文受到2025年大学生创新创业训练计划项目(202510336013)的支持。
本文受到2025年浙江省大学生科技创新活动计划暨新苗人才计划项目(2025R407A032)的支持。