1. 引言
贫困是一个伴随人类社会发展的长久问题。准确测度贫困,是制定反贫困政策、促进社会发展的重要环节。传统贫困测度主要依赖于经济统计数据,但统计数据往往获取成本高、难度大且滞后于现实发展状况,因此寻找一种及时、便捷、能有效替代经济数据的新数据源成为贫困测度领域的关注焦点。近年来,夜间灯光数据(Nighttime Lights, NTL)凭其独特优势成为贫困测度领域的新数据源。1997年,Elvidge团队通过展示灯光数据与区域发展的联系,率先开启了灯光数据在发展经济学中的应用[1]。后续研究再次证实灯光数据具有作为替代经济指标的能力,其不仅能填补市级及以下区域经济统计数据的空白,还能早于传统数据更及时地为经济提供预测信息,而且不受地域和时间限制、具有统一性可以进行不同尺度和不同区域的对比分析[2]。这使夜间灯光数据迅速成为经济分析的新型数据来源。但灯光数据在复杂的贫困测度领域并非完美无缺,比如其难以区分国际贫困线(1.90美元)附近及以下的人口以及他们的经济活动差异,因为这些地区灯光亮度通常很低且变化不大,难以追踪相关人口的生计活动[3]。这促使研究者重新审视夜间灯光数据这一新数据源在贫困监测中的应用,并考虑如何突破这些局限。基于此,本文旨在梳理夜间灯光数据作为在贫困测度新数据源的核心应用方向,深入分析其在实际应用中的局限,并从多角度提出可行的优化路径。
2. 贫困测度数据需求和夜间灯光数据属性
在贫困测度领域,深入理解贫困测度的数据需求以及夜间灯光数据的独特属性,对于精准评估贫困状况具有重要意义。
2.1. 贫困测度的数据需求
贫困是一个复杂的多维问题,因此,准确衡量贫困需要多层面和多尺度的数据。联合国可持续发展目标(SDGs)明确提出“消除一切形式的贫困”,为实现这一目标,需要整合多个数据源以支持贫困识别和衡量。在经济维度上,现阶段世界银行采用每天2.15美元(2017购买力评价)的贫困线来识别极端贫困群体,这需要依赖于收入或消费数据以测量个体或家庭的经济能力,从而确定贫困阈值。欧盟和OECD国家采取更直接的方法来识别相对贫困,使用收入中位数的一定比例作为相对贫困线,这是收入数据在贫困识别和测量领域的经典应用,充分体现了收入数据在贫困识别中的重要性。
但是贫困测量不能只局限于经济这一单一维度。联合国开发计划署(UNDP)强调,多维贫困指标还包括教育、健康和生活水平等关键维度。教育和健康数据对于准确反映人力资本状况至关重要,比如,“儿童辍学率”反映教育机会的缺失,“儿童死亡率”能反映医疗卫生条件和健康保障水平。在生活水平方面,基础设施数据可以衡量个人或家庭的生活质量。这些多维数据也是贫困评估过程中不可或缺的基础。
2.2. 传统经济数据的局限性
在贫困测量的实践领域,宏观统计数据和微观入户调查数据是最广泛使用的两类经济数据,但是这些传统的贫困测量数据暴露出诸多局限。
从宏观统计数据来看,这些数据往往以年为界限、以较大的行政区域为单位进行汇总,如某年的省级、市级或区级数据,这造就如下几个问题:第一,内部差异被掩盖。一个区内不同村落的经济发展水平、贫困程度可能差距较大,但在宏观数据中,真实状况会被平均化而掩盖,无法精准呈现真实的贫困分布状况。第二,个体、群体差异被忽视。宏观数据侧重某个区域整体的平均水平或总体趋势,难以体现个体、群体之间在收入、教育、健康等方面的具体差异。第三,数据时效性差。宏观统计数据常常以年为界限进行统计,一些落后国家的数据可能滞后一到两年,这使得政策制定者难以及时掌握由于经济波动、自然灾害等引起的贫困状况波动,不利于对贫困状况进行动态监测和及时干预。
微观入户调查数据同样具有不足。第一,是覆盖局限性。受地理环境约束与基础设施条件限制,我国部分偏远地区入户调查工作存在极大的挑战,存在严重的统计盲区。第二,是数据质量问题。入户调查数据主要依靠被调查对象自述,由于隐私顾虑、记忆偏差、瞒报虚报、抽样误差等问题,导致数据失真或者无法全面反映总体的情况。第三,是季节性偏差。调查若集中于某一个特定季节,如农业季节,该季节收入较高,在这个季节进行数据收集可能导致数据偏高,无法全面反映家庭全面真实的经济状况。最后,是数据整合与可比性问题。不同机构开展的入户调查,在调查指标、问卷设计、调查方法等方面都存在差异,导致数据难以直接整合和对比,给跨研究的贫困问题分析带来了困难。
2.3. 夜间灯光数据的双重属性
夜间灯光数据在替代经济指标和贫困测量方面展现出的独特价值,主要是因为它具有物理客观性和社会特征性的双重属性。
首先是物理客观性。卫星传感器是收集夜间灯光数据的关键。在全球范围内,传感器遵循着统一技术设定,基于光辐射原理对夜间灯光进行收集和记录,这既保证了全球数据的一致性,也避免了传统数据收集过程中因不同地区人为设定标准不同而导致的数据不可比的问题。
其次是社会特征性。夜间灯光数据能够反映人类社会活动的诸多方面。以人口分布和城市化进程为例,人口密集的地区往往灯光亮度较高,因为人口集中区域意味着更多的生活、工作和娱乐照明的使用。同时,随着越来越多的人口向城市聚集,城市规模不断扩张。这些都在灯光数据上体现为灯光亮度的提升和覆盖范围的扩大,这也为学者利用夜间灯光数据反演人口数据[4]、模拟城市人口分布[5]提供新的数据源。
2.4. 传统贫困数据与灯光数据的互补性
传统贫困数据和灯光数据各有优缺点,两者结合使用可以克服单一数据集的局限性,提供更加全面、精准的贫困衡量视角。
传统数据包含着丰富的社会信息。宏观统计数据可以呈现整体贫困率的变化趋势,为制定大规模反贫困战略提供宏观指导。而微观入户调查数据可以准确掌握个体或家庭的收入、消费、教育、健康、就业等数据,对精准识别贫困和采取个性化帮扶措施能起到关键作用。但如上文所述,宏观数据存在掩盖内部差异、忽视个体群体差异和缺乏时效性等缺点,而微观数据则存在覆盖面有限、数据质量不高等问题。夜间灯光数据具有独特优势,可以对传统数据的缺点进行补充。灯光数据的物理属性保持了数据的客观性,也使得世界范围内数据具有一致性和可比性;其社会属性则可以直观展现社会发展和经济活动状况。
传统数据和灯光数据在贫困测量方面可以发挥互补作用。灯光数据的全覆盖性、实时性等特点,可以克服宏观数据的区域内差异问题。灯光数据还可以更准确地定位贫困区域,绘制出更精细的贫困地图,有助于有效、合理投放扶贫资源。而微观入户调查数据可以对灯光数据进行验证和补充。同时,在难以开展入户调查的区域,可以通过灯光数据辅助判断贫困状况。此外,在分析家庭状况时,灯光数据所反映的用电量和夜间活动强度,可以与微观数据中收入和消费等数据相互印证,减少因数据漏报瞒报造成的偏差。传统数据和灯光数据的互补,能够提高贫困测量的准确性和覆盖面,有利于反贫困政策的制定和贫困地区的发展。
3. 夜间灯光数据核心应用方向
夜间灯光数据因其独特优势,在贫困测量领域显示出强大的应用潜力,为贫困问题研究开辟了新途径。它不仅有助于准确呈现当前的贫困状况,还有助于预测贫困状况和客观评估扶贫政策的影响。
3.1. 贫困地图绘制
贫困地图是确定援助和发展资源分配目标的重要工具,而灯光数据提供了一种新的绘制方式。传统的贫困地图通常基于单一的贫困线(如每天2.15美元的国际贫困线),并对整个行政区域(国家或省份)的贫困人口进行空间分类和绘制。如果贫困地图能够每年或每半年更新一次,就可以用来跟踪特定地区扶贫工作的成效。灯光数据使得这种想法成为可能[6]。国际地球科学信息网络中心(CIESIN)基于1990~2002年卫星图像中的空间信息和调查数据,结合人口普查数据,得出了基于消费的贫困和不平等指标,并绘制了贫困地图,加深了人们对贫困人口分布变化以及贫困人口生活的地理环境条件的了解[7]。
中国在全面脱离绝对贫困之前,扶贫地区认定缺乏科学合理的方法而受到质疑。传统贫困界定多通过随机抽样或入户调查获取贫困数据,这种方式难以取得大范围的调查数据,无法满足贫困研究需求。而且常规贫困识别和测量简单基于农民收入单一指标,无法识别贫困特征。基于此,潘竟虎等人(2016)引入夜间灯光数据构建多维贫困指标体系,绘制出中国多维贫困地图,并与国家划定的扶贫重点县进行对比,发现单纯依靠经济收入划定扶贫地区是存在缺陷的,并据此给出了贫困县的调整建议[8]。
3.2. 贫困状况预测
贫困状况预测是巩固脱贫成果、监测脱贫状况和制定有效防止返贫政策的重要依据。灯光数据为贫困预测提供了新的有效途径。传统贫困预测方法依赖于宏观数据或微观调查数据,由于这些数据自身局限性,导致贫困预测的覆盖面有限,且难以精准、及时反映贫困动态变化。但是灯光数据能够使得这种更高效的贫困预测变为可能[6]。Jean等人(2016)认为只基于夜间灯光数据来预测贫困的方法过于简单,便结合“迁移学习”“神经卷积网络”等机器学习方法,再利用日间卫星图像构建了新的夜间灯光数据贫困预测模型。这种新的贫困预测模型不仅在本地区的应用中能够准确反映和预测贫困状况,而且在无调查数据但有灯光数据的地区也能够得到有效的贫困衡量和预测结果。这说明灯光数据能够弥补贫困研究中因传统数据不足的缺陷,为贫困状况预测和政策制定提供有力支撑[3]。
3.3. 政策效果评估
准确评估反贫困政策的效果,对于优化政策、提升反贫困成效等方面起着至关重要的作用。在中国,精准扶贫政策的实施取得了举世瞩目的反贫困成就,但传统的政策评估多依赖于有限的实地调研数据和滞后的统计数据,这难以全面、及时地反映反贫困政策实施后带来的实际影响。夜间灯光数据的运用便为政策效果评估带来了新的契机。基于此,斯丽娟等人(2020)基于夜间灯光数据测算了区域扶贫质量和考察了其时空演变特征,发现中国扶贫质量在2000~2018年之间平均提高了11.19%,且相对发达地区具有较强的带动作用,但是区域间贫困县的扶贫质量呈现出显著的“东部 > 中部 > 西部”区域差异。据此给出需要针对不同省份的贫困县采取差异化区域扶贫政策和措施的建议[9]。
4. 夜间灯光数据局限
夜间灯光数据虽然在贫困测量领域具有广泛应用前景,但是也存在一些缺陷会影响贫困状况测量的准确性。
4.1. 技术限制
在实际应用中,夜间灯光数据在技术层面存在一些问题,会影响其准确性和有效性,这在贫困测量应用中存在诸多负面影响。例如,郑渊茂等人(2020)指出,DMSP/OLS数据分辨率较低(1 km)且存在辐射饱和问题,导致精度不高,难以精准捕捉微弱灯光信号,在应用中可能低估实际情况。NPP/VIIRS数据虽在辐射饱和(动态范围扩大)、空间分辨率(742 m)方面有所改进,但存在背景噪声、数据时间跨度较短(2012年至今)等不足[10]。NPP/VIIRS夜间灯光数据在夏季、北半球、中高纬度地区还存在失真现象,而且会受到短暂光源(火光、渔船等)、杂散光源(大气、云层、极光、闪电等)以及河流湖泊反射光的干扰,从而存在大量背景噪声,而且还会出现因短暂光源或地表反射率过高导致的极高值现象[11] [12]。唐霞等(2023)表明,中国的珞珈一号虽然具备更高的分辨率(130 m),在实际应用中也受物理因素如复杂地形等干扰,例如在长江大桥处灯光反射会误判建成区的提取范围,一些偏远道路周边亮度值实际较低,但因道路在影像中表现为高亮度值而造成识别误差[13]。这些都表明夜间灯光数据的技术限制会导致贫困程度的错误测算,使得贫困地图绘制产生误差,会影响其准确性和应用效果,需要在实操中运用技术手段消除这些负面影响。
4.2. 数据提取方法缺陷
在实际研究和应用中,灯光数据提取方法存在的问题也影响其应用的有效性和准确性,进而对贫困测量产生不利影响。现阶段灯光数据多数为区域研究,而城市内部精细化尺度研究不足[10],这个问题的主要原因在于数据提取方法存在缺陷。王晓艳等(2021)指出,传统的建成区提取方法,如经验阈值、突变检测法等会受到OLS传感器缺陷的限制,在城市中心强光区会出现光饱和现象,影响建成区的提取精度[11]。唐霞等(2023)也提到,传统确定阈值的方法都有各自的局限性,例如,动态阈值法虽然操作简单却无法有效表达建成区的空间信息[13]。李启华等(2023)指出,传统的数据提取方法(如掩膜法)会忽略有效灯光区域变化,且基于年度均值影像校正的灯光数据处理方法会累积误差[12]。这些都表明,当前灯光数据的提取方法存在缺陷,这可能会导致误判贫困地区经济发展趋势,影响灯光数据在贫困问题中的分析和应用。
4.3. 社会文化干扰
夜间灯光数据在反映社会、经济活动等方面也存在缺陷,尤其是会受社会文化因素的干扰。熊雨阳等(2023)提出,夜间灯光数据虽与人口密度、经济水平等反映人类活动强度的数据高度相关,但无法准确量化这些因素,也不能准确区分机场、工厂等产生射频干扰的设施。不同地区的社会文化和经济结构差异较大,人类活动产生的干扰情况不同,但夜间灯光数据难以体现这些差异[14]。这说明社会文化因素对夜间灯光数据的确存在干扰,而且灯光数据难以考虑到不同地区的文化习俗、生活习惯等产生的影响,从而影响对贫困区域和程度的准确判断。
5. 夜间灯光数据优化路径
5.1. 数据质量提升
多源数据融合是提升夜间灯光数据质量的重要方法之一。兴趣点(POI)数据蕴含了丰富的地理空间信息,与夜间灯光数据融合,能修正灯光数据的偏差。城市中商业区、住宅区、工业区等不同功能区的灯光分布和亮度差异较大,POI数据可以准确定位这些区域,有助于分析灯光与经济活动、人口分布之间的关系。例如,老旧商业区灯光设施陈旧,灯光亮度不高,但POI数据却显示此处商业活动频繁,结合POI数据能修正只使用灯光数据高估该地区贫困程度的情况。此外,利用深度学习算法识别传统光源,可有效消除瞬时光源或干扰性光源(如火光和渔船)的影响。深度学习模型通过学习大量光源图像数据,能够准确区分不同类型的传统光源,让基于灯光数据的贫困测量结果更可靠,更能真实反映区域贫困水平。
5.2. 本土化适配
不同地理环境和发展水平的地区对夜间灯光数据计算模型有不同的需求,因地制宜调整模型至关重要。热带雨林、高原牧区等特殊地理区域以及具有独特经济结构的发展中国家,传统通用模型难以准确反映当地的实际情况。热带雨林中茂密的植被会阻挡传感器信号,导致光照数据采集不全;高原牧区人口分散、季节性迁徙频繁,会影响基于夜间灯光数据构建的贫困测量模型的准确性。发展中国家在经济结构、产业布局、社会文化等方面与发达国家不同,也需要开发结合自身特点的模型。
5.3. 机器学习驱动优化
夜间灯光数据的技术限制和社会文化干扰等问题,还可以使用机器学习等方法实现数据质量的提升和贫困模型的优化。针对夜间灯光数据的噪声和失真问题,“卷积神经网络”、“生成对抗网络”等机器学习方法可以自动监测并过滤掉火光、渔船等瞬时光源或者反射光,也可以修正过饱和辐射问题,经过机器学习方法优化过的灯光数据具有良好的精度和时空一致性[15]。机器学习方法还能够从灯光数据中挖掘贫困的深层特征,提高贫困识别和预测的能力。例如,为解决传统循环神经网络难以捕捉长期关系问题而设计的长短时记忆网络法,能够选择性保留或遗忘历史信息,实现有效捕捉数天、数月甚至更长时间跨度的时序规律和短期波动。假设某农村地区雨季(6~8月)因农业活动减少导致夜间灯光亮度下降,长短时记忆网络法通过学习历史年份同期数据,则可以识别雨季的灯光亮度变化趋势,减少因为雨季的灯光减弱而导致的贫困率误判。
5.4. 多维贫困指标耦合
建立灯光数据与多维度贫困指标的整合体系,是灯光数据在贫困研究领域的一个重要方向。贫困涵盖经济、社会、教育、医疗等多方面内涵,仅依靠灯光数据无法全面衡量贫困状况。目前,灯光数据与多维贫困指标的整合研究还处于探索阶段,尤其是在权重调整方面。今后可以深入研究如何科学合理地确定灯光数据和其他多维贫困指标的权重。例如,在教育资源匮乏的地区,应适当提高教育指标在贫困测度中的权重。通过权重调整,可以使综合指标体系更准确地反映不同地区、不同发展阶段的贫困特征,为制定和实施反贫困政策提供更可靠的依据。
6. 结论
夜间灯光数据因其独特的双重属性,可以作为贫困测度的新数据源,并在贫困地图绘制和政策效果评估等方面都可以发挥重要作用。它突破了传统方式的局限,能更加准确地呈现贫困分布,有助于反贫困资源的合理分配,还能弥补传统政策评估的不足,推动反贫困政策的优化。
但是夜间灯光数据在实际应用中存在技术限制、提取方法缺陷和社会文化干扰等问题。例如,DMSP/OLS数据分辨率低且辐射易饱和,NPP/VIIRS数据存在有背景噪声、时间跨度短和失真现象等问题,这些都会干扰传感器对灯光强度的判断,从而导致基于夜间灯光数据的贫困程度和贫困地图绘制都存在问题。而且,现有灯光数据提取方法存在缺陷,传统建成区提取和阈值确定方法会受到现有传感器技术局限的影响,难以准确反映精细信息,还会累积误差,影响对贫困区域的界定。同时,夜间灯光数据还会受到社会文化因素的干扰,难以准确量化相关因素和区分人类活动设施,影响对贫困状况的准确判断。为此,可通过多源数据融合提升数据质量,结合POI数据与深度学习算法修正灯光偏差、去除干扰。而且应该推动模型本土化适配,针对不同区域特点、结合机器学习等方法优化灯光数据和贫困识别预测模型。同时构建综合耦合体系,动态调整权重,全面反映贫困特征。
未来随着技术进步与研究深入,夜间灯光数据在贫困测度领域可以取得更大进展。持续关注数据质量提升,加强跨学科研究,完善技术和模型,能为全球反贫困事业提供更有力的支持,助力实现全球反贫困目标。