1. 引言
实现双碳目标的关键在于充分利用具有无污染、清洁等可再生资源,而切合时宜的太阳能脱颖而出,成为世界各国新兴战略产业的重要内容。钙钛矿型太阳能电池(Perovskite solar cells),简称PSC。结构示意如图1所示,得益于其出色的光电转换效率和低廉的生产成本,展现出巨大的发展潜力。钙钛矿太阳能电池已成为光伏领域的一项革命性技术,在过去十年中在功率转换效率(PCE)方面取得了显著进展。从2009年的3.8%的初始效率开始[1],PSC迅速发展,目前单结器件的记录达到了令人印象深刻的26.1%。这种效率的快速提高,再加上低成本的制造潜力,使PSC成为传统硅基太阳能电池的潜在竞争对手。
Figure 1. Schematic diagram of PSC structure
图1. PSC结构示意图
当前钙钛矿光伏电池的效率问题亟待解决。为了提高有机光伏电池的效率,我们可以通过材料的优选和器件结构的优化来实现。为了克服这一难题,机器学习(ML)算法应运而生。通过性能预测优选设计制备新型光伏材料,机器学习算法不仅能够解决上述问题,还能够节省研发成本并提高资源利用率。相关人员在机器学习算法的基础上预测了钙钛矿材料的光学性质、磁性、电导率等重要性质,并通过实验证实了这些预测结果的准确性。利用数据驱动的人工智能(Artificial Intelligence,简称AI)进行选法增优的实施,利用已有的数据集通过科学的数据分析并运用机器学习对储能材料进行优选,找出符合条件的机器学习算法实现材料设计的快速筛选并针对性进行PSC的应用,从而有效率地提高PSC性能。
PSC的基本结构主要有光活性层、透明导电基底、电子传输层和空穴传输层等。PSC通常有n-i-p和p-i-n两种结构[2],PSC的工作原理如图2所示,是将光能转化为电能,其过程主要包括了激子的生成、载流子的分离和电子传输过程。在此过程中,电流得以通过外部负载,从而实现太阳能到电能的转换。然而,值得注意的是,钙钛矿与ETL/HTL之间的带隙不匹配可能会引发非辐射复合现象。
钙钛矿太阳能电池,作为第三代太阳能电池的重要代表,以其独特的钙钛矿结构,成为当前备受关注的新型光伏技术。Yaping Wen等人通过机器学习建立了QSPR模型,提出一个同时优化OSC的D/a分子对和器件规格的新框架[3],具有前所未有的高精度和一致性,加快了OSC效率的提高。本文需在考虑有机光伏材料的结构的同时,关注OSC的实验制造条件。
Figure 2. PSC working principle diagram
图2. PSC工作原理图
基于机器学习的钙钛矿太阳能电池性能预测与影响因素研究进展:孔瑞盈[4]在2024年提出通过光电多物理场耦合模型结合机器学习模型,成功预测了钙钛矿太阳能电池(PSCs)的光学和电学性能,误差控制在3%以内,并且预测速度快。该研究还结合遗传算法优化了PSCs的结构参数,为光伏器件的快速智能化设计提供了新路径。严文生[5]教授团队在2022年的研究成果中,利用人工智能算法开发了高效的钙钛矿电池。通过机器学习算法的预测和实验验证,他们实现了22.5%的最佳平面电池效率,并通过光管理策略将转换效率提升至23.6%,同时显著提高了电池的稳定性。郅冲阳[6]在2023年的研究中,采用机器学习方法对钙钛矿太阳电池界面钝化材料的分子特征进行了分析,建立了机器学习模型来协助材料筛选。实验验证后,他们在FAMACs基和FAMA基钙钛矿太阳电池器件中分别获得了22.36%和24.47%的器件效率。Jinghao Hu [7]等人在2024年的研究中,引入了一种集成了机器学习和数据挖掘技术的目标驱动方法,用于快速筛选高效的PSC。该研究成功预测了高效PSC,并确定了影响其性能的主要因素,为优化制备工艺和推动高效PSC的发展提供了宝贵见解。赵怡程[8]等人在2023年的研究中,提出了一个名为SPINBOT的全自动平台,该平台通过机器学习引导的可靠平台加速了钙钛矿太阳能电池的优化过程。该平台加工的太阳能电池在环境大气中加工后,立即产生了21.6%的效率(PCE),并在连续运行1100小时后保持了其初始效率的90%。高进伟[9]等人在2021年的研究中,在高效钙钛矿太阳能电池机器学习和大数据挖掘方面取得了重要进展。他们的研究通过机器学习引导的搜索,发现了具有掺杂电子传输层的高效钙钛矿太阳能电池。构建梯度带结构电子传输层(ETL) [10],从而提高钙钛矿太阳能电池的性能和稳定性是一种有效的方法。利用两种不同质量的量子点(QD),即GQD和Au QD,以及氧化锡(SnO2)胶体颗粒,我们成功制备了具有梯度带结构的ETL。基于这种梯度带ETL制造的钙钛矿太阳能电池实现了22.2%的功率转换效率(PCE),而用传统SnO2 ETL制备的电池仅产生了19.6%的效率。此外,在AM 1.5 G和45C温度下连续照射1000小时,电池保持了91%的初始效率。进一步的研究表明,这种梯度带结构的构建有效地补偿了SnO2的缺陷,从而改善了其电性能。
本文旨在探索出能精准预测光伏材料性能的机器学习方法,实现影响因素的快速筛选,通过回归结果进一步分析影响钙钛矿太阳能电池性能的因素,进行影响因素重要性分析,在此基础上实现钙钛矿材料的应用,从而提高光伏材料性能。因此利用统计学知识,将结构进行特征提取,构建因素–性能模型,并与机器学习算法进行有效结合,进而实现钙钛矿光伏材料的快速筛选并为PSC的参数性能的提升提供新思路和可供参考的有效方法。
2. 数据分析与整理
本文的数据来源于The Perovskite Database数据库,该数据库致力于提供符合FAIR数据原则的钙钛矿器件数据,即数据应可查找、可访问、可互操作和可重用。本文利用该数据库中的数据,以及截至2023年发表的110篇相关机器学习–钙钛矿材料论文,对钙钛矿太阳能电池(PSC)性能进行了研究。研究中发现,光电转换效率(PCE)是评估PSC性能的关键指标,受填充因子(FF)、开路电压(VOC)和短路电流密度(JSC)三个核心参数的影响。为了提升PCE,需要优化FF、VOC和JSC参数。
研究还考虑了影响PSC性能的多种复杂因素,包括稳定性温度范围、稳定性平均相对湿度、光源类型、稳定时间总曝光、稳定性光强度、电池衰减程度、安装角度、表面清洁度等。本文将数据划分为三类:钙钛矿太阳能电池内部结构因素数据、环境气候光源数据和性能检测数据。具体数据类别包括:钙钛矿电池光伏转换效率数据:转换效率是光伏组件的核心参数,直接影响组件的发电性能;钙钛矿太阳能电池光伏组件参数数据:包括在标准测试条件下,光伏材料太阳能板在最大功率点产生的电压(Stabilised performance Vmp)、稳定最大PCE功率时所流经的电流密度(Stabilised performance Jmp)、在标准测试条件下,太阳能板在未连接任何负载时的电压(EQE integrated Jsc)、电子传输层厚度(ETL thickness)、空穴传输层厚度(HTL thickness list)、扫描速度(JV scan speed)、带隙(Perovskite band gap);钙钛矿太阳能使用环境气候光源数据:包括稳定性温度范围(Stability temperature range)、稳定性测量时的平均相对湿度(Stability relative humidity average value)、稳定性测量状态下的总暴露量(Stability time total exposure)、稳定性光强度(Stability light intensity)、稳定光源类型(Stability light source type)、测试空气类型(JV test atmosphere)。这些数据有助于深入理解环境气候因素对钙钛矿太阳能电池性能的影响。
2.1. 数据的采集和整理
数据科学和机器学习的基石在于数据的有效采集和精心整理。数据与特征的选择,不仅限定了机器学习所能达到的最佳效果,同时,数据在很大程度上决定了模型预测性能的稳定性与精准度。而算法和模型的训练与参数调优,则更多地是在尝试接近这一性能上限。ML模型对数据集的大小具有很强的依赖性,因此在使用ML算法进行模型预测时,如何找到恰到好处的大小的数据集是一个不小的挑战。
2.2. 数据质量分析
PSC性能数据集整理完成后本工作首先进行了数据质量分析,为了有效分析和预测钙钛矿太阳能电池的性能,确保数据集的高质量显得尤为重要。然而,光伏电池性能相关数据的收集往往跨越较长时间,数据总量庞大,且容易受到多种因素的影响,如检测手段、设备储存条件以及人为因素等,这些因素可能导致数据出现不同程度的偏差。数据质量问题一直是数据分析和机器学习领域面临的主要挑战之一,因为低质量的数据不仅会降低模型的性能,还可能导致预测结果的不准确,部分输出结果展示如下表1所示。
Table 1. Data quality output results (partial)
表1. 数据质量输出结果(部分)
ETL |
HTL |
PT |
PCE |
Min.: 20.00 |
Min.: 8.00 |
Min.: 230.0 |
Min.: 6.15 |
1st Qu.: 26.00 |
1st Qu.: 97.50 |
1st Qu.: 350.0 |
1st Qu.: 15.16 |
Median: 40.00 |
Median: 110.0 |
Median: 400.0 |
Median: 17.55 |
Mean: 86.12 |
Mean: 121.6 |
Mean: 416.8 |
Mean: 16.76 |
3rd Qu.: 80.00 |
3rd Qu: 192.5 |
3rd Qu.: 500.0 |
3rd Qu.: 19.30 |
Max.: 620.00 |
Max.: 250.0 |
Max.: 653.0 |
Max.: 22.30 |
NA’s: 59 |
NA’s: 64 |
NA’s: 51 |
NA’s: 0 |
2.3. 数据相关性分析
在PSC性能数据集中,数据特征丰富多样,不同特征间往往存在着隐性的相互影响。这些具有相关性的特征之间,往往会相互关联,从而导致预测模型的复杂度增加。此外,这种相关性还会在计算过程中引入大量不确定性,降低模型的精度。为了精确量化这种线性相关的程度,我们可以借助Spearman秩相关系数等常用方法,它们能有效协助我们深入理解变量间的相互关系。
Spearman秩相关系数是一个非参数性质(与分布无关)的秩统计参数,在实际计算中有较为简单的计算
的方法。具体如公式(1):
(1)
其中,
:
的秩次,
:
的秩次,
:
、
的秩次之差。
Spearman秩相关系数分析方法要求数据在理论范围内呈等距分布。然而,由于其对数据分布的严格要求,这一方法并未得到普及。在处理连续测量函数时,Pearson相关系数通常展现出更为出色的表现,因此在实际应用中更为常用。关于相关系数的解释如下图3所示。
Figure 3. Explanatory diagram of correlation coefficient
图3. 相关系数的解释图
2.4. 异常值分析
异常数据,亦被称为离群数据点,是变量中那些数值明显偏离其他观测值的特定值。分析异常数据一般包括有以下两种方法:
1) 简单统计分析
主要涉及到对所有变量进行描述性统计的初步处理,再评估数据集中每个数据的取值是否逾越了人为设定的界限。
2) 3σ原则分析法
通过应用3σ原则分析法,我们能够更为精确地识别并处理数据中的异常值,从而确保数据分析的准确性和可靠性。如公式(2)所示:
(2)
在满足上述条件的情况下,虽然这种情况可能属于极个别的小概率事件,但事实上,存在大量的数据集其分布情况并非呈现正态分布,这需要我们采取更为灵活和精确的方法进行处理和分析。
2.5. 特征标准化和归一化
在数据预处理阶段,这两种方法旨在消除不同特征间的量纲差异,确保每个特征在后续分析中拥有相同的权重,从而更有效地适应某些机器学习算法的需求。通过标准化处理,我们能够提升模型的稳定性和准确性,为数据分析工作奠定坚实的基础。常见的标准化方法具体如公式(3)所示:
(3)
其中,µ是均值,σ是标准差。这种方法的显著优势在于其能够保持数据的原始分布不变,同时灵活应对各种分布类型的数据,并有效实现多变量的标准化处理。因此,在机器学习的实践中,它常被用于对特征进行标准化,旨在提升模型的预测精度和鲁棒性。而归一化技术则是将其映射至特定的数值区间,通常是[0, 1]或[−1, 1],以适应不同算法对输入数据范围的要求。该方法可以表示为公式(4):
(4)
当某些特征具有较大的阈值时,会造成变量之间的量纲级别相差太大,它们对模型的影响可能会超过其他特征,这可能导致模型过度依赖某些特征。值得注意的是,当特征之间的取值范围差异显著时,模型的训练过程可能会变得更为漫长,需要更多时间才能达到收敛状态。此外,特征值的极端大小,无论是过大还是过小,都可能对模型的性能产生不利影响,从而影响模型的稳定性和准确性。
3. 钙钛矿太阳能电池影响因素–性能预测模型
机器学习算法的选择应基于目标问题、数据集类型及数量等因素综合考虑。在本研究中,基于数据预处理工作的基础,我们选择了九个影响光电转换率的内外因素,并结合PCE运用回归算法开展机器学习训练与预测工作。
3.1. 线性拟合回归
在进行线性拟合回归之前首先进行相关性分析,本工作利用相关分析去研究PCE分别和PT、BG、JSS、Voc、Jsc、FF、STR、SRH、STTE共9项之间的相关关系。
在此之前,利用散点图进行相关分析前探索数据间的关联关系如图4所示。同时使用Kendall相关系数来表示相关关系的强弱情况,可视化如图5所示。
Figure 4. Scatter plot of various factors and PCE
图4. 各项因素与PCE散点图
Figure 5. Kendall related visualization diagram
图5. Kendalls相关可视化图
由图5具体分析可知:PCE-PT、PCE-Jsc、PCE-Voc、PCE-FF之间有着显著的正相关关系;PCE-BG、PCE-SRH之间有着显著的负相关关系;PCE-JSS、PCE-STR、PCE-STTE之间并没有相关关系。
由表2分析可知模型R2值为0.872,意味着选取的9个因素(PT, JSS, Voc, BG, Jsc, FF, STR, SRH, STTE)可以解释PCE的87.2%变化原因。模型进行F检验,模型通过了F检验(F = 64.849, p = 0.000 < 0.05),同时可以说明这9个因素(PT, JSS, Voc, BG, Jsc, FF, STR, SRH, STTE)中至少一项会对PCE产生影响关系,此外,经过多重共线性检验,各变量VIF值均小于5,无共线性问题;D-W值接近2,证实模型无自相关性,样本数据间无关联,模型表现优异。
Table 2. General situation of linear regression model fitting
表2. 线性回归模型拟合概况
R |
R2 |
调整R2 |
RMSE |
DW值 |
AIC值 |
BIC值 |
0.934 |
0.872 |
0.858 |
1.332 |
1.741 |
347.548 |
373.191 |
3.2. 基于RF回归模型的性能预测
由图6可知:FF所占比重为47.52%,该特征的权重最高,对模型构建起着关键作用;Jsc所占比重为38.46%,重要性次之,对模型构建起着重要作用。以上2项特征的比重合计占到了85.98%,剩余7项BG、Voc、STTE、PT、SRH、JSS、STR的比重则分别为:4.01%、3.43%、2.04%、1.93%、1.24%、0.84%、0.52%。
Figure 6. XGBoot feature weight diagram
图6. XGBoot特征权重图
4. PSC性能重要影响因素分析与应用
基于以上回归预测结果,继续对影响性能的重要因素作具体分析,以便PSC更好地应用于实际。钙钛矿太阳能电池性能的主要衡量标准是光电转换效率,而光电转换效率主要由开路电压(Voc)、短路电流密度(Jsc)、填充因子(FF)三个参数决定。此外电子传输层厚度(ETL)、空穴传输层厚度(HTL)、钙钛矿厚度(PT)、电池量子效率(EQE)、带隙(BG)都在不同方面对性能存在着不同程度的影响。钙钛矿太阳能电池的界面显著影响其效率和稳定性[11]。研究人员往往更关注钙钛矿吸收层的上表面,对底部埋入界面的研究相对较少,主要是因为钙钛矿薄膜的底部难以剥离,这增加了观察和分析表征的难度。底部界面的缺陷使得优化处理比上表面更具挑战性。对于倒置的PSC,位于钙钛矿光吸收层和空穴传输层之间直接接触的界面是埋入界面。埋界面是PSCs载流子传输的直接界面,也是非辐射化合物富集的中心。缺陷密度高于钙钛矿薄膜晶体的缺陷密度。
钙钛矿太阳能电池在长期的使用过程中,特别是在潮湿和高温环境下,其稳定性表现较差[12]。随着时间的推移,钙钛矿材料会逐渐退化,进而导致太阳能电池的效率降低。因此,还需要对环境因素:稳定性相对湿度(SRH)、稳定性光强度(SLI)、稳定性温度范围(STR)、稳定性光源类型(SLST)、稳定时间总曝光(STTE)、空气类型等进行综合考虑。
4.1. 影响PSC性能的内部因素
4.1.1. J-V特性
PSC测试的性能参数主要有:Voc、Jsc、FF和PCE四个参数。最大功率Pmax由Vm和Jm共同决定,其中Vm为最大输出功率点的电压,Jm为该点的电流密度。FF和PCE的计算分别遵循公式(5)和公式(6)。其中,Pin为入射光的功率。
(5)
(6)
此外,为了衡量电池性能我们引入填充因子参数,以衡量电池最大输出功率与开路电压和短路电流乘积之比。而光电转换效率则描述了光伏器件将光能转化为电能的能力。这些概念为我们深入理解和优化钙钛矿电池性能提供了重要依据。进行电流密度–电压曲线绘制发现在标准太阳光照的条件下,在数据集中随机选取一组常规的标准器件的Voc、Jsc、FF和PCE分别为1.110 V、23.16 mA∙cm−2、0.7801和20.05%。
4.1.2. 迟滞效应
在正常情况下,PSC光电转换效率受电压扫描方向的影响并不显著。其效率可以通过J-V曲线得到实际反映。然而,对于钙钛矿太阳能电池而言,情况则有所不同。
研究发现,钙钛矿电池的J-V曲线会受到扫描速度和方向的明显影响。这种效应导致钙钛矿太阳能电池的电流响应随时间变化,并且在不同的扫描速度和扫描方向(正向扫描和反向扫描) [13]下,会出现J-V迟滞现象。因此,在评估钙钛矿太阳能电池性能时,需要特别注意扫描条件对J-V曲线的影响。
4.2. 影响PSC性能的外部因素
钙钛矿器件的长期稳定性问题已成为制约其产业化和实用化的主要瓶颈。除了钙钛矿材料内部因素对其稳定性的影响外,外部环境条件,如湿度、高温、光照、紫外线以及空气中的杂质等。研究表明,湿度、偏压、高温和紫外线(UV)是导致PSC降解的压力因素之一。目前,提高PSC长期稳定性的最常见策略包括封装、添加剂工程和成分工程的结合[14]。封装通常旨在保护钙钛矿层免受水分和/或氧气的影响,同时,添加剂和成分工程通常是通过加入稳定剂来完成的,如混合卤化物体系或替代阳离子,以提高抗降解性,进一步提高热和化学稳定性,尽管做出了这些努力,但实现商业可行性所需的稳定性仍然是艰巨的,这突显了在这个快速发展的领域继续进行研究和创新的必要性。因此,提升钙钛矿器件的稳定性,特别是在各种外部环境条件下的稳定性,是当前研究的重要方向[15]。
4.2.1. 相对湿度稳定性
研究者们观察到,水在钙钛矿晶界处的渗透更为显著。外界环境中的水能够通过金属电极渗透进入,这主要归因于钙钛矿的离子特性及其亲水性。钙钛矿薄膜或前驱体易于吸附大气中的水分,进而与其发生反应形成水合物。因此,钙钛矿器件在湿度较高的环境下极易发生降解,这一发现对钙钛矿材料稳定性的研究具有重要意义。因此,将专门讨论相对湿度稳定性对PCE的具体影响,进行数值化分析。选取一组稳定性测量时的平均相对湿度(Stability relative humidity average value,简称SRH)与PCE数据,进行可视化分析。
Figure 7. Relationship between SRH and PCE
图7. SRH与PCE关系图
从图7可以看出,二次移动平均的曲线整体呈现出跳动往下的趋势,存在着一定的反比关系,且在湿度为0时PCE值达到最高水平,而随着湿度的提升,PCE值也逐渐减小。即随着湿度的增加,钙钛矿太阳能电池的光电转换效率效果会越来越差。且影响效果较为明显,波动性也较强,故在使用PSC时,要格外注意空气湿度的影响,尽量保持干燥的环境,以免器件受损严重。
4.2.2. 热稳定性
钙钛矿薄膜因其晶格结构脆弱,在高温环境下易发生分解。在此过程中,晶界缺陷成为有机成分蒸发的通道,加剧了分解过程。钙钛矿的热降解往往起始于薄膜表面,随后部分有机成分通过热蒸发作用导致钙钛矿结构崩塌,进而继续分解为其他物质。这一过程揭示了钙钛矿材料在高温条件下稳定性差的特性,为深入研究其性能及改进提供了重要线索。
Figure 8. Relationship between STR and PCE
图8. STR与PCE关系图
因此,将专门讨论热稳定性对PCE的具体影响,进行数值化分析。选取一组稳定性温度范围(Stability temperature range,简称STR)与PCE数据,对其进行可视化分析,从折线图(图8)可以看出,二者折线整体呈现出逐渐靠拢趋势,涨柱线逐渐缩小,因此可以判断出STR与PCE值存在着一定的反比关系。且在温度范围为25度时PCE值达到最高水平,而随着温度的减小,PCE值也逐渐上升,即随着温度的增加,钙钛矿太阳能电池的光电转换效率效果会越来越差。且影响效果较为明显,波动性也较强,故在使用PSC时,要格外注意空气温度,尽可能避免温度过高带来不利于PCE的影响,尽量保持适宜的温度环境,以免影响PSC的光电转换效率,影响性能稳定性。
5. 结论
本文主要从两个方面提供性能提升方法,一个方面是利用机器学习方法对构建的因素–性能模型进行预测,选出有效预测模型;另一个方面则是基于回归模型输出结果,选取出影响PSC性能的重要因素,并结合实际应用,对重要因素作具体分析,即探究因素具体如何影响PCE的问题。
1) 在进行线性拟合回归之前,首先进行相关性分析,使用Kendall相关系数来表示以下关系的强弱情况:PCE-PT、PCE-Jsc、PCE-Voc、PCE-FF之间有着显著的正相关关系;PCE-BG、PCE-SRH之间有着显著的负相关关系;PCE-JSS、PCE-STR、PCE-STTE之间并没有相关关系。
2) 在模型构建与预测方面,本文运用三种机器学习算法进行的影响因素–性能模型构建,对模型进行验证,并使用四个指标即R2、MAE、MSE、RMSE对三个模型评估,最后对比四个评价指标的大小,得出预测效果较好的算法为XGBoost和RF,二者R2值均高于0.7。这表明因素–性能模型与机器学习算法的结合具有参考性和有效性,这为实现PSC因素的快速筛选提供了参考,更为PSC的性能提升提供新思路和可供参考的有效方法。
3) 基于RF回归模型的性能预测,在XGBoost模型中,FF所占比重为47.52%,该特征的权重最高;Jsc所占比重为38.46%,重要性次之。权重高意味着该特征在模型的决策过程中被频繁使用,对模型的预测结果影响最大。因此,FF特征可能是区分不同类别或预测目标变量的关键因素。总的来说,FF和Jsc特征的高权重表明它们在模型构建中扮演着核心角色,对模型的预测能力有着显著的影响。在实际应用中,了解这些特征的重要性可以帮助我们更好地调整和优化模型。
基金项目
河南省高等学校重点科研项目——机器学习与物理融合模型下的太阳能资源高效利用(24B480012);河南省科技攻关项目——气象与物理融合机制解耦:AI赋能光伏发电“材–管–用”(242102240051);河南省高等学校重点科研项目——转底炉直接还原炼铁中的介尺度传热传质行为及能量转化耦合机制(25A450004);校级青年基金项目——房价变动对城乡收入差距影响的实证研究(PXY-QNJJ-202005)。
NOTES
*通讯作者。