1. 引言
留守儿童是指外出务工连续三个月以上的农民托留在户籍所在地,由父、母单方或其他亲属监护接受义务教育,年龄为18岁以下的青少年(Su, Li, Lin, Xu, & Zhu, 2013)。留守儿童往往与父母接触较少,而父母在青少年的心理成长中扮演着极其重要的角色,亲子关系和家庭教育对青少年的成长有着决定性的影响(叶一舵,白丽英,2002)。父母长期缺席孩子的成长会导致亲子亲情的缺失,破坏正常的家庭结构与功能,使得留守儿童更容易受到消极情绪的困扰,产生各种不良的心理行为问题(申继亮,刘霞,赵景欣,&师保国,2015)。研究发现,相较于非留守儿童,留守儿童的网络成瘾检出率更高(白翠平,杨艳林,&黄彦,2021)。中学阶段的留守儿童,处于生理和心理快速发展的重要时期,由于身心发展的不平衡状态更易受到外界的影响从而导致心理问题的发生(王旭等,2022)。研究发现,网络成瘾会对中学生学业发展及心理健康产生一定程度的负面影响,是目前中学生厌学休学的一个重要原因(Pfeffer, 2001),会导致孤独感等心理问题的增加(Ostovar et al., 2016),睡眠质量不佳的情况出现,甚至自伤行为的发生(黄彦,2018)。特别是父母关爱的欠缺会使他们将更容易通过网络世界逃避现实,形成网络成瘾(Astrup, Pedersen, Mok, Carr, & Webb, 2017)。截止2020年,中国农村在校留守中学生已超过140万人(教育部),数量庞大;据中国互联网络信息中心《中国互联网络发展状况统计报告》,截止于2021年12月,我国的网络使用规模已达到10.32亿,10~19岁网民占比13.3%。由于网络使用低龄化趋势明显,网络成瘾危害巨大,留守中学生问题依旧严峻,故探索留守中学生网络成瘾具体的作用机制具有重要的意义。
关于网络成瘾的研究方法更多的集中于Logistic回归、基于回归方法的中介模型的建立以此来探讨网络成瘾的影响因素。Acikgoz等人使用Logistic回归分析发现网络成瘾与青少年睡眠质量差呈正相关(Acikgoz, Acikgoz, & Acikgoz, 2022)。Cai等人采用多变量Logistic回归得到了亲子沟通是留守儿童的保护因素(Cai et al., 2021)。但通常在建模过程中前提假设条件难以严格满足,如多重共线性假设等。贝叶斯网络是通过构建有向无环图并结合条件概率表来推演揭示各因素间潜在关系和关联强度的机器学算法,具有无假设条件约束的特征,适用于解决不确定性推理,可以弥补传统统计学方法Logistic回归分析存在的不足(王斌,冯慧芬,黄平,赵敬,&易佳音,2018;魏珍等,2016)并将变量间的内部调控关系直观的可视化。
目前,故本研究通过大型横断面调查收集渝东南民族地区留守中学生在人口学信息、家庭情况、上网特征、心理学因素和网络成瘾的相关数据,在Logistic回归分析的基础上,以留守中学生网络成瘾的影响因素为节点,进一步建立基于bootstrap的贝叶斯网络模型,探讨相应变量间的依赖关系,以期识别网络成瘾的相关因素,从而为网络成瘾的检出和预防提供帮助。
2. 研究对象与方法
2.1. 研究对象
采用分层整群随机抽样方法,抽取对象为渝东南民族地区(秀山自治县、石柱自治县) 12~18岁乡镇学校学生。纳入标准:1) 乡镇中学在校学生;2) 年龄12~18岁;3) 愿意接受调查并配合完成者;排除标准:1) 有严重躯体疾病及精神障碍疾病正在接受治疗者;2) 无法配合完成调查者。本研究已获得重庆市中医院伦理委员会审批(伦理审批号:2019-ky-ks-HY-1),研究对象均已签署知情同意书并获得其家长同意。
2.2. 研究工具
2.2.1. 自编一般情况问卷
采用自编一般情况问卷收集调查对象的人口学特征,包括性别、年级等,以及家庭情况,其包括留守状态、家庭所在地、父母外出情况、父母间关系、家庭经济状况等。
2.2.2. 网络成瘾诊断量表
采用Young编制的《网络成瘾诊断量表中文版》。量表共分为20个条目,每个条目以1~5级积分,得分在20~100之间。得分越高则表示网络成瘾程度就越严重。该量表的Cronbach’s α系数为0.91。
2.2.3. 抑郁症状自评量表(PHQ-9)
研究采用抑郁症状自评量表(PHQ-9)来评估留守中学生抑郁症状情况。该量表由9个条目组成,总分范围在0~20分,分界值分别为10、15和20分来对应轻度、中度和重度抑郁。该量表的Cronbach’s α系数为0.93。
2.2.4. 匹兹堡睡眠质量指数量表(PSQI)
采用中文版的匹兹堡睡眠质量指数(PSQI)量表进行调查。量表共由23个条目组成,每个条目以1~3级计分,得分越高则表示睡眠质量越差。该量表的Cronbach’s α系数为0.90。
2.2.5. 健康问卷躯体症状群量表(PHQ-15)
采用中文版健康问卷躯体症状群量表(PHQ-15)共有15项3级评分的条目来对常见的躯体症状进行评估,随着量表得分的增加躯体症状程度逐步加深。该量表的Cronbach’s α系数为0.89。
2.2.6. 广泛性焦虑量表(GAD)
本研究采用的是广泛性焦虑量表(GAD-7),量表共分为7个条目,从0表示“完全不会”到3表示“几乎每天”,得分越高,焦虑程度越高。量表的Cronbach’s α系数为0.92。
2.3. 施测过程
本调查得到了合作学校的支持,这些学校组织了集中的问卷调查。在得到学生和其家长同意自愿参与调查后,经过培训的研究人员发放了相关的调查问卷。如果孩子或家长不愿意参与研究,可以选择退出。在调查前,调查人员或调查助理朗读问卷说明,并在填写时做进一步的解释。问卷是在整个学校的教室里完成的,问卷完成时间控制在20至30分钟。
2.4. 统计学方法
使用EpiData 3.1对数据进行双录入以确保数据的质量。采用R 4.2.1将抽取的2553例留守中学生以7:3的比例随机分为训练集和验证集,在训练集中使用“bnlearn”R包对贝叶斯网络进行构建,采用基于bootstrap方法的爬山算法对网络结构进行学习,通过设定阈值得到高置信度边的网络结构,然后通过极大似然估计法进行参数学习得到最终模型,使用Netica软件进行贝叶斯网络的可视化;在测试集来评估模型性能。同时采用单因素χ2、多因素Logistic回归对变量进行筛选,并以森林图展示回归结果,将具有统计学意义的变量纳入贝叶斯网络模型中。
3. 结果
3.1. 共同方法偏差
采用自我报告收集数据可能导致共同方法偏差(周浩,龙立荣,2004),为避免这种可能出现的偏差,本研究采用Harman单因素检验法对所有项目进行主成分因素分析,结果显示,特征值大于1的因子共有6个,第一因子解释的方差变异量为30.23%,不超过40%,表明不存在明显的共同方法偏差。
3.2. 一般情况
本研究共调查5973名中学生,其中参与问卷调查的有5471人,回复率为91.59%,收回有效问卷4923份,有效率82.42%;被试对象平均年龄为14.63;男生2483人(50.44%)、女生2440人(49.56%);其中,留守中学生共2553例(48.25%),留守女生1281例(50.18%),留守男生1272例(49.82%);单亲留守1156人(45.28%),双亲留守1397人(54.72%)。见表1。

Table 1. Univariate analysis of the detection of Internet addiction among left-behind secondary students [n(%)]
表1. 留守中学生网络成瘾检出率的单因素分析[n(%)]
p1是测试训练队列中是否网络成瘾检出差异的概率;p2是测试验证队列中是否网络成瘾检出差异的概率;p3是测试训练和测试数据集差异的概率值。
3.3. 单因素分析
在训练集和验证集中,是否独生子女、与父母沟通情况、家庭类型、上网时长、抑郁、焦虑、躯体症状、睡眠质量与网络成瘾检出率差异均具有统计学意义(p < 0.05),且在留守儿童中年龄对于网络成瘾检查率的差异无统计学意义p > 0.05。同时分析表示训练集和验证集不存在统计学差异。
3.4. 多因素Logistic回归分析
将单因素分析结果中具有统计学意义p < 0.05的变量纳入多因素logistic回归模型中对重要变量进行筛选,由于相关研究表示家庭类型与网络成瘾间存在显著相关性,因此在最终模型中将该变量纳入,并将多因素logistic回归结果可视化为森林图。多因素分析结果显示筛选出5个危险因素:性别(OR = 1.54, 95%CI: 1.20~2.00, p < 0.001),上网时长(OR = 5.97, 95%CI: 4.56~7.82, p < 0.001),抑郁(OR轻度抑郁 = 2.12, 95%CI: 1.53~2.94, p < 0.001; OR中度抑郁 = 2.95, 95%CI: 1.93~4.51, p < 0.001; OR重度抑郁 = 3.30, 95% CI: 1.86~5.86, p < 0.001),躯体症状(OR = 1.45, 95%CI: 1.09~1.93, p = 0.011)以及睡眠质量(OR良好睡眠 = 1.77, 95%CI: 1.30~2.40, p < 0.001; OR一般睡眠 = 1.86, 95%CI: 1.18~2.92, p = 0.007),结果如图1所示。

Figure 1. Forest plot for multivariate Logistic regression model
图1. 多因素Logistic回归模型森林图
3.5. 贝叶斯网络模型结果
3.5.1. 构建网络
依据多因素Logistic回归分析模型筛选出的5个变量,考虑到性别和与父母沟通情况对于网络成瘾检出率的影响,因此纳入最终模型进行学习和预测。本研究在训练集中使用爬山算法对贝叶斯网络结构进行学习,并通过BIC评分来筛选最优网络结构。为了确保学习到稳定的网络结构,我们通过Bootstrap法提取1000个样本进行计算,为每个样本计算一个网络,然后取其平均值得到最终的网络结构。由图2可知,与网络成瘾直接相关的因素有3个,分别为上网时长、抑郁和焦虑。部分因素会间接影响网络成瘾的检出。同时该网络结构表明了网络成瘾直接对睡眠质量产生影响。
得到贝叶斯模型的网络结构后,通过最大似然法学习得到模型参数,使用Netica软件对其进行可视化展示,如图2所示。

Figure 2. Bayesian network model for the associated factors of Internet addiction
图2. 贝叶斯网络结构示意图
3.5.2. 网络成瘾的原因诊断
通过对贝叶斯网络中的结局变量固定,即当确诊为网络成瘾者时,网络更新后获得其他变量的后验概率,由其他节点的状态变化以此来分析出风险点,探索留守中学生网络成瘾的致因。结果如图3所示,焦虑状态为肯定的可能性从15.1%增加到了21.6%;上网时长 ≥ 6小时的可能性从21%上升为45.7%;重度抑郁状态的可能性从8.39%上升到17.3%,重度抑郁的可能性从13.1%增加到19.5%,轻度抑郁的可能性从28.1%增加为34.8%;同时值得注意的是与父母沟通情况不满意的可能性从19.6%增加为27.9%。

Figure 3. Posterior probability distribution of nodes given Internet addiction evidence
图3. 网络成瘾证据下节点后验概率分布
3.5.3. 模型评估及验证
为检验模型的预测能力以确保分析的可靠性,本研究对模型的预测准确率进行了计算,结果如表2所示。分析结果显示,贝叶斯网络模型在训练集总体预测正确率为81.60%,验证集81.28%,证明模型具有较好的分类预测性能。Logistic回归模型在练集总体预测正确率为68.68%,验证集78.43%。

Table 2. Performance comparison of the different algorithms
表2. 两种模型性能比较
4. 讨论
本研究纳入多元Logistic回归模型筛选后的变量,通过基于bootstrap方法爬山算法构建了贝叶斯网络模型,探讨了留守中学生群体网络成瘾各相关因素间存在的网络关系。最终的模型发现焦虑、抑郁和上网时长是网络成瘾检出的直接节点。由贝叶斯网络模型进行节点“网络成瘾”后验概率发现,日均上网时长大于等于6小时留守中学生群体检出网络成瘾风险最大,这与以往研究发现每日网络使用3小时以上的中学生增加了网络成瘾检出风险的结果一致(Riehm et al., 2019; 鲍成臻,高丽丽,&韩历丽,2021)。抑郁可能是因为父母外出的留守青少年更容易受到心理问题的影响(Aguilera-Guzmán, de Snyder, Romero, & Medina-Mora, 2004),同时父母监管的减弱增加了问题行为发生的可能性(范兴华,方晓义,2010),使该群体在感到抑郁时难以从父母处获得支持与爱护,进而引发对于网络的依赖形成成瘾行为(赵冬梅,程星露,王婷,郭雅莉,&覃晓静,2019)。研究发现焦虑对网络成瘾的检出有直接关系,这可能是焦虑的留守群体由于在现实生活中面临学业以及人际交往压力,转而向虚拟世界寻求慰藉(Amiel & Sargent, 2004),以求缓解现实生活中的焦虑,导致沉迷网络。同时发现网络成瘾与睡眠质量相关,有研究表明网络成瘾与睡眠质量呈正相关关系,即随着网络成瘾程度的增加睡眠质量愈发糟糕,且网络成瘾者较非网络成瘾者的睡眠质量差的情况高发(Acikgoz et al., 2022),这一结果也在青少年群体研究证实(Bruni et al., 2015; Huang et al., 2020; Kang et al., 2020)。网络成瘾导致不良睡眠质量可能是智能设备的光线和声音可能会扰乱个体的睡眠节律、延迟向睡眠的过渡、缩短剩余睡眠时间,从而导致睡眠质量不佳(Kocas & Şaşmaz, 2018)。
与父母沟通情况和每日上网时长相关,研究发现当上网时长大于等于6小时时,与父母沟通不满意的概率大幅度上升,且在与父母沟通情况的三种状态中,对父母沟通不满意的留守中学生检出网络成瘾的风险最大,在模型中日均上网时长直接作用于网络成瘾,这有可能一方面是这一群体本身由于父母角色的缺失导致孩子与父母的沟通缺乏,进一步通过网络消磨时光增加了网络成瘾的风险(杨婉君,2021);另一方面是这一时期的特殊性,青春期的叛逆导致不愿与父母沟通或者发生冲突,从而通过使用网络排解压力。贝叶斯网络模型放宽了条件独立假设前提,大幅度的弥补了Logistic回归模型的敏感性问题,且由于贝叶斯网络模型的特性,不仅可以做到其他经典概率模型不能提供的直观可视化因素间的依存关系,也可以实现模型的动态学习依据后验概率寻找致因链。相比于传统统计模型Logistic回归仅能筛选出独立的相关因素,贝叶斯网络模型将有向无环图和条件概率表相结合进一步解释各变量间的关联,有助于发现网络成瘾检出的潜在影响因素。本研究进一步通过模型的准确率、敏感度和特异度指标对比,验证了相较Logistic回归,贝叶斯网络模型展现了更好的模型性能。
同时,本研究也存在两方面的局限性。首先,本研究采用的是横断面的调查研究,探讨调查了留守中学生网络成瘾的相关因素,但并不能因此得到因果推论,应在以后研究中进一步改进。其次,本研究使用的量表均来采用自陈式量表,未来研究可增加访谈等调查方式进一步提高调查的精确性。
基金项目
本文为重庆市科卫联合中医药科研项目“渝东南地区留守儿童网络成瘾现况调查及中医体质、情志变化研究”(2019ZY023315)以及重庆市科卫联合医学科研项目“秀山自治县留守儿童网络成瘾与自杀行为特征现况调查及干预模式的探索研究”(QNXM20192068)的阶段研究成果。
NOTES
*通讯作者。