1. 引言
全球气候变暖已成为日益严峻的挑战,其中,由人类活动所产生的CO2被认为是主要的推动因素之一。随着全球城市化进程的快速推进,过量的CO2排放成为不容忽视的问题。特别是发展中国家,其在全球温室气体排放中扮演着举足轻重的角色。预计到2030年和2050年,发展中国家的碳排放量将占全球的60%以上[1]。而中国作为全球最大的CO2排放国[2],其第二大碳排放行业正是交通运输业[3]。据预测,到2035年中国交通碳排放量将占全球交通碳排放量的三分之一以上[4],且在未来将一直保持着增长的势头[5]。因此,了解和解决中国交通运输业存在的问题对应对全球气候变暖的挑战至关重要。
通勤行为作为交通出行的重要类别,其碳排放机制受到多种因素的影响,这些因素与其他类型的出行行为具有一定的相似性,主要包括社会经济特征、建筑环境特征和出行特征三大类。在此基础上,研究者们还关注主观因素对通勤碳排放的影响。例如,已有研究证实了时间压力[6]和风险感知[7]等主观因素也在通勤决策行为中扮演着重要角色。此外,家庭类特征的影响对于揭示通勤行为决策机制及其环境影响同样至关重要。家庭作为社会的基本单元,在个体通勤行为及其环境效应中扮演了关键角色。研究家庭特征对通勤碳排放的影响,不仅有助于深化对个体通勤行为决策机制的理解,还能揭示家庭层面的环境影响动态。这一视角为解析通勤碳排放的形成机制提供了关键线索,同时可为制定环境友好型交通政策提供科学依据和实践参考。
本研究采用TabNet模型作为工具。相较于传统的线性模型,它作为深度学习模型对于隐藏在非线性数据中的信息更为敏感;相较于其他机器学习和深度学习模型,它在处理表格数据方面展现出显著的优势。首先,TabNet模型能够直接接受原始表格数据作为输入,省去了繁琐的预处理步骤,因而能够保留数据的完整性和原始信息。其次,TabNet模型采用了序列注意力机制以提高模型的学习效率,在每个决策步骤中选择最相关的特征进行推理。与此同时,TabNet模型不仅能够提供全局解释性,还能够提供局部解释性,这使得其在解释模型结果时更加直观和可信。TabNet模型在各种不同领域的数据集上都已经表现出了优于或不逊色于其他表格学习模型的性能[8]。
2. 相关研究回顾
低碳出行已成为全球发展战略的重要组成部分,探讨影响通勤行为的因素对于应对气候变化具有重要意义。现有研究表明,影响通勤碳排放的因素可大致分为主观因素和客观因素两大类。在客观因素中,个体的社会经济特征长期以来是研究重点,如年龄、性别、有无子女等因素[9] [10]。近年来,随着城市化的加速,城市建成环境的影响逐渐受到关注[11]。例如,基础设施[12]、城市扩张[13]等都与居民出行碳排放呈现复杂的非线性关系。此外,诸如工作密度、距离公交站台和市中心的远近等微观因素也显著影响通勤碳排放[14]。然而,这些研究更多聚焦于个体属性和外部环境,对家庭作为一个整体如何影响通勤行为的讨论相对有限。主观因素方面,出行者的态度和偏好对通勤行为的影响早有论述。研究发现,家庭成员的环保意识会显著影响年轻人的环保行为[15],而对公共交通的积极态度能增加公共交通的使用倾向[16],而对公共交通的积极态度能增加公共交通的使用倾向[17] [18]。此外,出行者对灵活性、舒适度等的偏好也影响其出行选择[19] [20]。不难看出,现有的出行影响因素研究涉及的内容广泛且全面,但将家庭作为整体单位来探讨主观因素与碳排放之间关系的研究仍显不足。
另外在研究方法上,近年来,人工智能技术,尤其是深度学习,为探索通勤行为及碳排放的复杂机制提供了强有力的工具。例如,基于人工神经网络的预测模型已成功应用于多国碳排放强度的研究[21]。深度学习的优势在于其对高维数据的处理能力,能够捕捉特征间的非线性关系,这为家庭维度下通勤碳排放研究提供了新的方法路径。本研究采用TabNet模型,结合家庭特征和个人出行行为,深入挖掘家庭在通勤碳排放中的主导作用,为低碳政策制定提供科学依据。
3. 数据
3.1. 解释变量
本研究所用到的数据来自在中国浙江省温岭市进行的一项居民出行调查。调查的样本范围覆盖了温岭市主城区。调查对象为被调查家庭六周岁及六周岁以上的常住和外来人口(包括保姆、雇佣、寄居者等)。最终设置可能对通勤碳排放产生的影响因素(解释变量) 21个,其中包括个人类特征9个以及家庭类特征12个。具体如下:
(1) 性别:男性 > 1,女性 > 2;
(2) 学历:小学 > 1,初中 > 2,高中 -> 3,本科 > 4,大学及以上 > 5;
(3) 收入(每月):一千元以下 > 1,一千到两千 > 2,两千到三千 > 3,三千到五千 > 4,五千到八千 > 5,八千以上 > 值6;
(4) 孩子年龄:没有孩子 > 0,孩子小于6周岁 > 1,孩子小于18周岁 > 2,孩子大于18周岁 > 4;
(5) 家庭成员对于公交/摩托/汽车的支持度:强烈反对 > 1,不支持 > 2一般 > 3,支持 > 4,很支持 > 5;
(6) 交通环境感知变量(是否清楚家附近公交线路走向及时刻、站牌或网络上的公交线路信息是否准确、停车是否方便、开车出行时是否经常堵车):按李克特评分法设置1、2、3、4、5,分数越高表示对于题项的所描述的感受越趋于正面;
(7) 定量变量:年龄、出行次数、家庭人数、车辆拥有情况、交通工具拥有情况、家庭出行主要方式、家庭成员平均出行次数、家庭成员平均出行距离、家庭成员平均出行时间、家庭人均碳排放。
3.2. 被解释变量
被解释变量研究对象是出行者每次通勤的碳排放。研究中采用了IPCC提出的“自下向上”碳排放计算方法,即根据出行距离计算出行者的碳排放。具体通勤碳排放的公式如下:
(1)
公式(1)中,CE为居民通勤一天所产生的出行碳排放,L为居民的通勤距离,F为居民所用交通工具的交通碳排放因子。
为了获取每位出行者及其家庭成员在通勤过程中的出行距离和所采用的交通工具,调查中除了居民出行调查表还配发了居民出行时刻表。出行者需要根据实际情况填写每次出行的起始时间、终点时间以及所采用的交通方式。通过出行者提供的数据,可以获得确切的通勤情况,进而将其纳入公式2以计算每位居民的通勤距离。
(2)
公式(2)中,L为居民每一次的平均通勤距离,M为一次通勤所用的时间,V为通勤时所使用的交通工具的速度,T为那一天中出行者的通勤次数。
4. 方法论
4.1. TabNet模型
TabNet模型接收原始特征输入后,首先经过特征转换器提取特征间的复杂关系和信息。然后,通过注意力转换器根据特征的重要性权重调整特征的表示,用于后续计算特征选择的掩码。这个掩码表示每个特征对模型决策的贡献程度,在每个决策步骤中,TabNet都使用掩码来选择最具有解释性的特征。最后,TabNet将所有决策步骤的结果综合起来,生成最终的预测结果。
TabNet的主要工作机理包括以下四个部分:
(1) 特征选择:特征选择中的关键在于注意力转换器。TabNet使用可学习的掩码
来选择哪些特征在决策过程中起关键作用,每个特征向量相应的掩码用
的形式表达,其中
为特征向量。掩码可以通过公式3得到:
(3)
其中,
是一个可训练的函数,
是先验比例项。
先验比例项表示特定特征在之前的步骤中被使用的程度,它可通过公式4得到:
(4)
其中,
是松弛参数。当
等于1时,意味着一个特征只能在一个决策步骤中被使用;当
增加里,意味着一个特征可以在多个决策步骤中被使用。
为了控制特征的稀疏性,还使用了熵形式的稀疏正则化项,公式如下所示:
(5)
其中,
是一个小的数值稳定性常数。总损失表现为
。
(2) 特征处理:经过筛选的特征将通过特征转换器进行处理,特征转换器由共享层和决策步骤相关的层组成。其中,共享层确保了在不同的决策步骤中使用相同的特征。而决策步骤相关的层则根据当前决策步骤对特征进行进一步的处理。
最后的输出内容包括决策输出向量
和信息向量
两部分,即模型在处理输入特征后所获得的关于决策和信息的结果,可通过公式(6)计算得到:
(6)
其中,
属于
空间,
属于
空间。
(3) 可解释性:TabNet中使用了聚合特征重要性掩码
来揭示每个步骤对最终决策的贡献,可通过公式(7)计算得到:
(7)
表示在模型中的第
个决策步骤中,关于第
个样本的第
个特征的掩码。如果
那么在该步骤中,第
个样本的第
个特征对决策没有贡献。
是一个系数,代表第
个样本在第
个决策步骤中的聚合决策贡献,可通过公式(8)计算得到。
(8)
其中,如果
,则意味着在第
步中的所有特征对整体决策没有贡献。
(4) 自监督学习:TabNet使用自监督学习来提高模型性能,并在自监督学习阶段考虑了重构损失,形式如公式9所示。
(9)
其中,
表示重构后的输出,
表示原始输入。
4.2. 特征重要性评估
本研究利用已训练好的模型在测试集上进行特征重要性评估。具体方法是对每个特征进行置换后预测,计算模型在测试集上预测的均方误差(MSE)的变化来衡量特征的重要性。如果置换后的误差显著增加,说明该特征对模型预测的重要性较高。均方误差的计算如公式10所示:
(10)
其中,
表示第
个特征的均方误差,
表示测试集的样本数量,
表示第
个样本,
表示将第
个特征进行置换后的第
个样本,
表示原始预测结果,
表示置换后的预测结果。
5. 结果
为了深入探索对通勤碳排放产生影响的因素,本研究使用基于TabNet的特征重要性评估模型对于数据进行了详细全面的分析。
5.1. 家庭特征对通勤碳排放的整体影响
根据表1可以发现,家庭特征的平均重要度为0.223,个人特征的平均重要度为0.188。具体而言,前10个对通勤碳排放影响最显著的特征中,有8个属于家庭特征。这表明家庭因素在塑造个人通勤选择中具有更为显著影响力。这种“家庭大于个人”的现象也说明了大多数通勤者在进行出行决策时往往将家庭的情况置于首位。再对表1中的各项家庭特征进行进一步观察,发现“家庭出行主要方式”、“交通工具拥有情况”和“家庭人均每日出行次数”三个家庭特征在这一影响中扮演着主导角色(重要度:0.5192、0.2411和0.2233),“家庭出行主要方式”更是以绝对的优势占据第一。这不仅反映了个人通勤行为受到家庭内部成员之间在出行方式选择上的协商与共识的影响,更突显了个人的通勤行为受到家庭环境的深刻影响。
Table 1. Importance of variables in commuting carbon emissions
表1. 各变量对通勤碳排放的影响的重要度
变量 |
重要度 |
家庭人均碳排放量 |
0.174376 |
家庭人数 |
0.173433 |
孩子年龄 |
0.175712 |
家庭出行主要方式 |
0.519211 |
家庭人均每日出行次数 |
0.223339 |
家庭人均每次出行时间 |
0.170379 |
家庭人均每次出行距离 |
0.164827 |
车辆拥有情况 |
0.163943 |
交通工具拥有情况 |
0.24109 |
家庭成员对于汽车的支持度 |
0.170806 |
家庭成员对于公交的支持度 |
0.168959 |
家庭成员对于摩托的支持度 |
0.16879 |
性别 |
0.165848 |
年龄 |
0.168433 |
学历 |
0.158244 |
收入 |
0.16774 |
出行次数 |
0.168125 |
站牌或网络上的公交线路信息是否准确 |
0.169257 |
是否清楚家附近公交线路走向及时刻 |
0.170947 |
开车出行时是否经常堵车 |
0.169072 |
停车是否方便 |
0.167143 |
5.2. 家庭特征对于不同性别群体通勤碳排放影响的差异
根据表2可以发现,男性和女性的通勤碳排放受到不同因素影响的反馈程度存在显著差异。对于女性而言,各种因素对其通勤碳排放的影响相对均衡,差异不大。这表明女性的碳排放受到家庭特征(平均重要度:0.3763)和个人特征(平均重要度:0.3756)的影响相对平衡。然而,对于男性而言,家庭特征(平均重要度:0.3142)对碳排放的影响更为显著,而个人特征(平均重要度:0.2862)的影响相对较小。具体而言,男性的通勤碳排放量主要受家庭特征中的“家庭出行主要方式”(重要度:0.3834)和“家庭人均每日出行次数”(重要度:0.3568)影响。这说明通过家庭的主要出行方式和家庭平均出行次数一定程度上可以较为合理的推测出家庭中男性成员的通勤碳排放量。这种现象可能源于社会中对男女在家庭角色和责任分工的差异。在传统家庭结构中,男性往往被期望承担更多的经济责任和交通出行任务,因此他们的通勤行为更受家庭因素的影响。
Table 2. Differences in the impact of household characteristics on commuting carbon emissions by gender
表2. 家庭特征对不同性别通勤碳排放的影响差异
变量 |
重要度 |
男 |
女 |
家庭人均碳排放量 |
0.3309 |
0.3758 |
家庭人数 |
0.2988 |
0.3756 |
孩子年龄 |
0.3016 |
0.3759 |
家庭出行主要方式 |
0.3834 |
0.3777 |
家庭人均每日出行次数 |
0.3568 |
0.3785 |
家庭人均每次出行时间 |
0.2879 |
0.3744 |
家庭人均每次出行距离 |
0.2893 |
0.3765 |
车辆拥有情况 |
0.2838 |
0.3753 |
交通工具拥有情况 |
0.3218 |
0.3759 |
家庭成员对于汽车的支持度 |
0.2958 |
0.3767 |
家庭成员对于公交的支持度 |
0.2934 |
0.3766 |
家庭成员对于摩托的支持度 |
0.3278 |
0.3765 |
家庭类特征均值 |
0.3142 |
0.3763 |
个人类特征均值 |
0.2862 |
0.3756 |
5.3. 家庭特征对于不同年龄人群通勤碳排放影响的差异
根据表3可以发现,在小于18岁的未成年人群和大于50岁的高龄人群中,家庭特征与个人特征的平均重要度差值均小于0.001。这意味着这两类人群的通勤碳排放受两类因素的影响相对均衡;而在19至50岁的成年人群中,两类因素之间的影响差异则呈现了显著的差别。这种差异性可能部分源于不同年龄群体在生活阶段和行为模式上的差异。
未成年人和高龄人群的这种相似性可能源于这两类群体在平时的生活中相较于其他人群会更多地依赖于家庭支持和社会保障:未成年人通常由家庭照顾,而老年人可能依赖于社会福利和家庭关怀。这两个年龄群体的出行频率普遍较低,且由于年龄或健康条件的限制往往无法使用家庭交通工具,更多地依赖于包容性更大的公共交通、步行或家庭成员的协助。相比之下,19至50岁的成年人群可能更多地处于生活和事业发展阶段,其通勤行为频率更高、更多样化。而这种通勤行为又受到家庭特征的影响,例如家庭中是否有孩子需要照顾、家庭是否有多辆交通工具等。这些因素导致了家庭特征在该年龄段人群中的重要性明显增加,并在不同家庭特征间呈现出明显差异。
Table 3. Differences in the impact of household characteristics on commuting carbon emissions by age
表3. 家庭特征对不同年龄通勤碳排放的影响差异
变量 |
重要度 |
0~18 |
19~30 |
31~40 |
41~50 |
50+ |
家庭人均碳排放量 |
0.1487 |
0.3717 |
0.3984 |
0.3407 |
0.5750 |
家庭人数 |
0.1482 |
0.3596 |
0.3356 |
0.3052 |
0.5742 |
孩子年龄 |
0.1490 |
0.3614 |
0.3125 |
0.3000 |
0.5732 |
家庭出行主要方式 |
0.1474 |
0.3848 |
0.3321 |
0.3574 |
0.5710 |
家庭人均每日出行次数 |
0.1495 |
0.3845 |
0.3177 |
0.3178 |
0.5745 |
家庭人均每次出行时间 |
0.1484 |
0.3560 |
0.3116 |
0.2909 |
0.5715 |
家庭人均每次出行距离 |
0.1484 |
0.3600 |
0.3218 |
0.3158 |
0.5761 |
车辆拥有情况 |
0.1488 |
0.3562 |
0.3176 |
0.3136 |
0.5767 |
交通工具拥有情况 |
0.1494 |
0.3741 |
0.3935 |
0.3233 |
0.5752 |
家庭成员对于汽车的支持度 |
0.1486 |
0.3560 |
0.3105 |
0.2993 |
0.5741 |
家庭成员对于公交的支持度 |
0.1499 |
0.3555 |
0.3353 |
0.3126 |
0.5752 |
家庭成员对于摩托的支持度 |
0.1483 |
0.3577 |
0.3789 |
0.3397 |
0.5780 |
家庭类特征均值 |
0.1487 |
0.3648 |
0.3388 |
0.3180 |
0.5745 |
个人类特征均值 |
0.1487 |
0.3611 |
0.3199 |
0.3087 |
0.5753 |
5.4. 家庭特征对于不同收入人群通勤碳排放影响的差异
表4展现了家庭特征对不同收入人群通勤碳排放的影响差异。在0~2000收入群体中,家庭特征与个人特征的平均重要度差值为0.0011,各项因素对通勤碳排放的影响相对均衡。然而,随着收入水平的提高,家庭特征与个人特征的平均重要度差值逐渐拉大,即家庭特征对通勤碳排放的影响逐渐凸显,且占据更为重要的位置。具体而言,“家庭出行主要方式”和“交通工具拥有情况”这两个因素随着收入水平的提高,对通勤碳排放的影响程度得到了显著且持续的上升。
Table 4. Differences in the impact of household characteristics on commuting carbon emissions by income
表4. 家庭特征对不同收入通勤碳排放的影响差异
变量 |
重要度 |
0~2000 |
2000~3000 |
3000~5000 |
5000+ |
家庭人均碳排放量 |
0.1868 |
0.1851 |
0.4515 |
0.4181 |
家庭人数 |
0.1848 |
0.1761 |
0.3027 |
0.3832 |
孩子年龄 |
0.1850 |
0.1747 |
0.3075 |
0.3342 |
家庭出行主要方式 |
0.1850 |
0.2340 |
0.3514 |
0.8100 |
家庭人均每日出行次数 |
0.1889 |
0.2227 |
0.3717 |
0.3327 |
家庭人均每次出行时间 |
0.1856 |
0.1672 |
0.3291 |
0.3709 |
家庭人均每次出行距离 |
0.1856 |
0.1685 |
0.3120 |
0.4462 |
车辆拥有情况 |
0.1855 |
0.1665 |
0.3120 |
0.3538 |
交通工具拥有情况 |
0.1836 |
0.1841 |
0.3385 |
0.4562 |
家庭成员对于汽车的支持度 |
0.1846 |
0.1703 |
0.2949 |
0.3810 |
家庭成员对于公交的支持度 |
0.1850 |
0.1689 |
0.3348 |
0.3620 |
家庭成员对于摩托的支持度 |
0.1867 |
0.1662 |
0.3315 |
0.4041 |
家庭类特征均值 |
0.1856 |
0.1820 |
0.3365 |
0.4213 |
个人类特征均值 |
0.1845 |
0.1686 |
0.3180 |
0.3774 |
5.5. 模型结果可靠性对比论证
在本文的研究中,采用了TabNet神经网络模型对通勤碳排放的影响因素进行探索。为保证结果的可靠性,还将其与当前常用的四个机器学习模型进行了对比:K最近邻(KNN)、支持向量机(SVM)、梯度提升决策树(GBDT)和线性回归。在模型结果的对比中,使用了LOSS值(损失函数)、RMSE (均方根误差)和MAE (平均绝对误差)三个指标进行综合考察。LOSS值衡量了模型训练中预测与真实值的差异,反映了优化表现。RMSE和MAE评估了模型在测试集上的预测精度。从表5对比实验的结果中可以看到,发现每个模型的LOSS、RMSE和MAE都满足“良好”的标准,这表明它们在这个任务上都有较为良好的表现。但是TabNet模型在LOSS (0.1539)和RMSE (0.3923)两个指标上都位居第一,在MAE上也仅以不到0.01的差距位居第二。综合来看,TabNet模型在本次任务中具有更为优秀的性能。
Table 5. Performance evaluation of different models
表5. 各模型的性能检测结果
模型 |
LOSS |
RMSE |
MAE |
TabNet |
0.1539 |
0.3923 |
0.2802 |
KNN |
0.2040 |
0.4517 |
0.2723 |
SVM |
0.1661 |
0.4075 |
0.2872 |
GBDT |
0.1646 |
0.4057 |
0.3294 |
线性回归 |
0.1573 |
0.3967 |
0.2930 |
6. 结论
本研究通过TabNet模型对居民出行日常数据进行分析,以期理解家庭对于居民通勤碳排放的影响,从而为低碳出行提供有建设性的建议。在研究中,不仅对家庭特征进行了全面更新和整合,还用深度学习模型深入分析了家庭因素对通勤碳排放的影响,最终得到了一系列严谨的结果。首先,通过研究家庭特征对通勤碳排放的整体影响,发现家庭特征相较于个人特征在通勤碳排放中扮演着更为重要的角色。其中,家庭中的主要出行方式、家庭的交通工具拥有量、家庭成员的平均出行次数在这一影响中起着主导作用。其次,通过研究家庭特征对于不同人群通勤碳排放影响的差异,发现不同的家庭特征在不同性别、年龄和收入人群中的作用存在显著差异。随着性别、年龄、学历和收入水平的变化,家庭特征逐渐在各人群中展现出相似的优势地位。其中,“家庭主要出行方式”更是摆脱了群体差异,在男性、中青年、高收入人群中均有优异表现。但是,对于女性、未成年、高龄、低收入这几类人群来说,各项因素对通勤碳排放的影响较为均衡。
通过对以上结果的整理和分析可以证明,对于大多数人来说,家庭情况不仅是通勤时的优先考虑对象,而且家庭特征还能够反过来用于推断反映个人通勤碳排放的程度。基于这个结论,本文认为政府和相关机构应该从家庭层面制定更有效、更有针对性的低碳出行政策。在公共交通建设、自行车道建设、低碳交通补贴等方面,更多地将“为不同家庭提供更多的出行选择”这样的人本位目标与城市发展结合起来,政策制定者还可以根据家庭情况的变化来评估低碳减排政策的实施效果。
基金项目
国家自然科学基金(71601118);上海理工大学大学生创新创业项目(XJ2024141)。
NOTES
*通讯作者。