1. 引言
在全球“双碳”目标(碳达峰、碳中和)的宏观背景下,光伏产业快速发展。单晶硅片处于产业链上游关键环节,其产销策略与成本控制将直接影响下游组件乃至终端发电系统的度电成本(LCOE)与投资回报。近年来,行业产能扩张与技术迭代加速(如由P型向N型转型),叠加原材料与能源要素价格波动、下游需求不确定等因素,使晶硅片企业面临“价格下行–成本刚性–利润波动”的经营压力,亟需建立可量化、可执行的经营决策方法。
现有研究从不同角度为企业经营决策提供了参考:一方面,围绕LCOE等技术经济性指标的研究有助于刻画成本约束与竞争边界,例如Cristea等[1]对不同光伏技术路线的LCOE进行了比较分析;另一方面,基于数据驱动的预测与优化方法可为企业应对波动提供工具,例如Wang等[2]提出的组合预测框架体现了对波动序列的建模思路,Starke等[3]展示了智能算法在多目标优化问题中的应用价值。此外,制造业领域对大语言模型的应用探索正在兴起,Li等[4]总结了LLM在制造场景中的潜力与挑战,为企业将非结构化信息纳入经营研判提供了新思路。然而,针对晶硅片企业的实际经营数据,仍缺少将“利润核算–趋势预测–产销优化”整合为闭环,并进一步增强策略解释性的系统化研究。
针对上述问题,本文旨在利用数学建模与数据挖掘技术,构建一套涵盖利润分析、趋势预测与产销优化的综合解决方案。具体而言,本文的主要贡献如下:
(1) 构建精细化的月利润计算模型,量化成本与收入因子对利润的影响,并通过Z-Score标准化与线性回归筛选关键驱动因素。
(2) 引入ARIMA时间序列模型,对四种主要型号硅片(N型-182、N型-210-210、N型-210-182、P型)的销量、售价及核心变动成本进行短期预测,为企业提供可量化的市场趋势信息。
(3) 建立基于非线性规划的产销优化模型,在满足市场需求与生产约束的前提下,给出利润最大化的最优产量与定价策略,并采用trust-constr算法求解。
(4) 探索人工智能在制造业经营决策中的应用,提出融合随机森林回归与大语言模型(LLM)的智能决策路径,提升异常数据处理的鲁棒性与策略输出的可解释性。
2. 数据预处理与影响因子分析
2.1. 数据来源与标准化
本文所用数据来源于某晶硅片企业的实际生产经营记录,涵盖了2024年1月至8月期间四种主要产品(N型-182、N型-210-210、N型-210-182、P型)的销量、售价、单晶方棒成本、电费、人工成本及其他财务费用。
由于各指标的量纲和数量级差异较大(如销量为万片级,而总成本为千万元级),直接分析容易导致偏差。因此,首先采用Z-Score方法对数据进行标准化处理:
(1)
其中,X为原始数据,μ为样本均值,σ为样本标准差。标准化后的数据均值为0,标准差为1,便于进行相关性分析。
2.2. 基于线性回归的因子筛选
为了明确各财务指标对企业最终税后净利润(销售净利润)的影响程度,本文构建了多元线性回归模型。以税后净利润(销售净利润)为因变量,以销售收入、生产变动成本、生产公共成本、人工成本、所得税费用等为自变量(表1仅展示主要变量的回归结果)。
Table 1. Linear regression analysis results of financial indicators on net profit
表1. 各财务指标对销售净利润的线性回归分析结果
自变量(Independent Variables) |
回归系数(Regression Coefficient) |
显著性(Significance) |
销售收入(Sales Revenue) |
0.919 |
High |
生产变动成本(Variable Production Cost) |
−1.238 |
High |
生产公共成本(Common Production Overhead) |
−0.013 |
Low |
人工成本(Labor Cost) |
−0.031 |
Low |
所得税费用(Income Tax Expense) |
0.141 |
Medium |
注:High表示p < 0.01,Medium表示p < 0.05,Low表示p ≥ 0.05 (以SPSS输出为准)。
利用SPSS软件进行回归分析,得到的路径分析如图1所示。具体回归分析结果如表1所示。
Figure 1. Linear regression path analysis of financial indicators on net profit
图1. 各财务指标对销售净利润的线性回归路径分析
需要说明:表1中的回归系数为标准化回归系数(Beta),用于比较不同变量对净利润影响的相对强弱。回归结果用于刻画统计相关性而非严格因果关系,部分财务科目(如所得税费用)可能与净利润存在同步变化关系,相关结论主要用于识别管理关注重点。
分析结果表明:
销售收入对税后净利润(销售净利润)具有显著的正向影响,回归系数为0.919,说明扩大销售规模和提升售价是增加利润的重要途径。
生产变动成本对税后净利润(销售净利润)呈现显著的负向影响,回归系数高达−1.238,这表明原材料(单晶方棒)价格和电费的波动是制约利润增长的主要瓶颈。
其他因素如管理费用、销售费用等对利润的影响相对较小(系数绝对值均小于0.05)。
这一结论为后续模型的构建提供了重要依据:在优化模型中,应重点关注销售收入(由价格与销量共同决定)与变动成本之间的平衡。
3. 月利润计算模型的构建与验证
3.1. 模型构建
基于前述分析,我们构建了以产品为维度的月利润计算模型。定义k = 1,2,3,4分别代表四种硅片产品。
3.1.1. 收入模型
第k种产品的月销售收入Sk (元)计算如下:
(2)
其中,Qk为月销量(万片),Pk为售价(元/万片)。总收入
。
3.1.2. 成本模型
成本分为变动成本和固定成本。第k种产品的变动成本Ck主要包括单晶方棒成本
、电费
和其他变动成本
:
(3)
其中,Qk的单位为万片,
,
,
的单位为元/万片,因此Ck的单位为元。这里下标P/EP/OP分别表示“单晶方棒/电费/其他变动成本”的类别标记,与售价符号Pk无关。
月度固定成本记为F(元),用于核算全厂总利润:
(4)
为进行产品维度的利润对比分析,本文将固定成本按权重wk分摊至各产品,分摊额为
,
(5)
本文在无额外产能占用信息时取等权分摊
。则产品口径总成本与产品利润分别为:
,
(6)
3.1.3. 利润模型
最终的月度总利润Ptotal为:
(7)
为与后续分析中“各产品贡献利润占比”口径一致,本文定义各产品贡献利润(不含固定成本分摊):
(8)
并以贡献利润占比刻画结构:
(9)
同时,为进行产品口径的利润对比(含固定成本分摊),定义
,
(10)
并给出产品口径的利润贡献率(可为负):
(11)
3.2. 模型求解与结果分析
利用2024年1月至8月的平均数据代入模型进行计算。模型计算的总成本为3990.46万元,实际总成本为3879.85万元,误差仅为2.85%。图2中的净利润为税后净利润(单位:百万元):模型计算值为3.08百万元(308万元),实际值为3.47百万元(347万元),对应误差约为11.24%。本文在核算税后净利润时,对所得税费用与非经营性损益等项目采用简化处理(如按样本期均值近似或忽略),因此税后净利润口径与实际值存在一定偏差;但总成本误差较小且利润量级一致,说明模型具备用于后续预测与优化分析的可用精度。
Figure 2. Comparison and verification between model calculation results and actual financial data
图2. 模型计算结果与企业实际财务数据的对比验证
各产品的具体成本构成如表2所示。为与图3左侧饼图口径一致,表2给出各产品贡献利润(销售额-变动成本)及其占比;同时,表3给出等权分摊固定成本后的产品口径利润及利润贡献率(可为负),用于补充对比。
Table 2. Contribution profit and share of each product (Sales-Variable cost)
表2. 各产品贡献利润(销售额–变动成本)及占比
产品类型 |
销售额(万元) |
变动成本(万元) |
贡献利润(万元) |
占比(%) |
N型-182 |
1337.50 |
879.45 |
458.05 |
58.1% |
N型-210-210 |
716.34 |
665.54 |
50.81 |
6.5% |
N型-210-182 |
1146.23 |
922.10 |
224.13 |
28.4% |
P型 |
1159.59 |
1104.75 |
54.84 |
7.0% |
Figure 3. Contribution profit share (Left) and cost structure analysis (Right) of each product
图3. 各产品贡献利润占比(左)与成本结构分析(右)
Table 3. Profit and profit contribution after allocating fixed cost
表3. 分摊固定成本后的产品口径利润及利润贡献率
产品类型 |
销售额(万元) |
变动成本(万元) |
分摊固定成本(万元) |
利润(万元) |
利润贡献率(%) |
N型-182 |
1337.50 |
879.45 |
104.66 |
353.40 |
95.72% |
N型-210-210 |
716.34 |
665.54 |
104.66 |
−53.85 |
−14.59% |
N型-210-182 |
1146.23 |
922.10 |
104.66 |
119.47 |
32.36% |
P型 |
1159.59 |
1104.75 |
104.66 |
−49.82 |
−13.49% |
图2展示了模型计算值与实际财务数据的对比,整体一致性验证了模型具有可用的核算精度。
进一步对各产品的利润贡献与成本结构进行分析(如图3所示):
需要说明:表2与图3左图使用贡献利润口径(不含固定成本分摊);表3使用含固定成本分摊的产品口径利润(可为负);图2中的净利润为税后口径,因此与前两者存在税费及非经营性项目差异。
4. 基于ARIMA的市场趋势预测
为了制定科学的9月份产销计划,必须对未来的市场环境进行预判。本文采用ARIMA (自回归积分滑动平均)模型对各产品的销量、售价及核心成本进行短期预测[5]。
4.1. 模型原理
ARIMA(p, d, q)模型结合了自回归(AR)、差分(I)和移动平均(MA)三个部分,特别适合处理具有趋势性和非平稳性的时间序列数据。其数学本质是将非平稳时间序列转化为平稳序列,然后利用历史数据及其误差项来预测未来值。
4.1.1. 模型结构
设时间序列为{Xt},ARIMA(p, d, q)模型的通用数学表达式为:
(12)
其中:
L为滞后算子(Lag Operator),满足
;
d为差分阶数,
表示对序列进行d次差分,以消除非平稳趋势;
为自回归系数,p为自回归阶数;
为移动平均系数,q为移动平均阶数;
为白噪声序列,满足
,
。
4.1.2. 建模步骤
本文构建ARIMA模型的具体步骤如下:
(1) 平稳性检验:首先利用ADF (Augmented Dickey-Fuller)检验判断原始序列是否平稳。若检验统计量大于临界值(P > 0.05),则对序列进行一阶或多阶差分,直至序列平稳。
(2) 参数定阶:通过观察自相关图(ACF)和偏自相关图(PACF)初步确定p和q的范围。为避免主观误差,本文采用AIC (赤池信息准则)最小化原则自动寻优:
(13)
其中k为模型参数个数,L为似然函数值。AIC值越小,说明模型在拟合优度和复杂度之间达到了最佳平衡。
(3) 模型检验:对残差序列进行白噪声检验(Ljung-Box Test),确保残差中不包含有效信息。
4.2. 预测结果分析
4.2.1. N型-182产品预测
如图4所示,N型-182产品的售价在2024年呈现阶梯式下降趋势。ARIMA预测的9月售价均值约为16,924元/万片,其95%置信区间为[P182, min, P182, max]。销量在经历波动后预计回升,95%置信区间上界对应的市场预测上限为
。单晶方棒成本的持续下降为应对降价压力提供了一定空间。
Figure 4. ARIMA prediction results for sales, price, and cost of N-Type 182 wafers
图4. N型-182硅片销量、售价及单晶方棒成本的ARIMA预测结果
4.2.2. N型-210产品预测
对于N型-210系列产品(如图5(a)和图5(b)),市场表现相对疲软。销量预测显示其需求波动较大,且售价同样面临下行压力。这提示企业在排产时应保持谨慎,避免库存积压。
(a) N型-210-210
(b) N型-210-182
Figure 5. ARIMA prediction results for key indicators of N-type 210 series wafers
图5. N型-210系列硅片关键指标的ARIMA预测结果
4.2.3. P型产品预测
P型产品(如图6)作为传统型号,虽然售价较低,但市场需求依然存在,且近期销量有反弹迹象(8月销量达到825万片)。预测显示9月销量将维持在847.9万片的高位,表明低端市场仍有生存空间。
Figure 6. ARIMA prediction results for key indicators of P-type wafers
图6. P型硅片关键指标的ARIMA预测结果
5. 产销策略优化模型
基于ARIMA模型的预测结果,我们进一步构建非线性规划模型,旨在解决“在预测的市场价格区间内,如何安排各产品的产量和定价,才能使总利润最大化”的问题。
5.1. 优化模型构建
决策变量:
目标函数(利润最大化):
(14)
其中,
为第i种产品的单位变动成本(元/万片);Qi的单位为万片,Pi的单位为元/万片,F的单位为元,因此Π的单位为元。其中VCi取ARIMA对2024年9月单位成本预测的均值(单晶方棒成本、电费与其他变动成本同口径汇总),以反映短期成本趋势。这里下标P/EP/OP分别表示“单晶方棒/电费/其他变动成本”的类别标记,与售价符号Pi无关。
约束条件:
(1) 价格区间约束:售价必须在ARIMA预测的95%置信区间内(区间数值见后文表4):
(15)
(2) 产能与销量约束:销量不能超过企业产能上限与市场预测上限,取二者较小者:
(16)
其中
为ARIMA预测95%置信区间上界对应的市场预测测上限(基于第4节预测结果)。而
为企业当月产能上限,根据企业设备台账与9月排产计划,设定各产品产能上限分别为:N型-182为552.6万片,N型-210-210为397.1万片,N型-210-182为518.3万片,P型为714.3万片。由于受设备调试与产线切换影响,上述产能上限均小于或等于对应的市场预测上限,因此本次求解中实际销量约束主要由产能瓶颈决定。
(3) 需求弹性约束(可扩展,本文求解未启用):根据经济学原理,销量与售价通常呈负相关,可用线性需求函数刻画:
(17)
其中ai,bi为拟合系数且要求bi > 0。由于样本期仅为2024年1~8月且部分产品拟合不稳定,为保证可复核性,本文最终求解阶段未强制施加该约束,仅采用价格区间与销量上限约束。
5.2. 求解与优化效果
需要说明的是,考虑到税收政策与财务费用的非经营性波动,本节优化模型以企业经营利润(Operating Profit)为核心指标,重点考察产销策略本身的盈利能力。这与第3节仅用于模型精度验证的净利润口径有所区别,但在逻辑上是兼容的。
该模型属于带约束的非线性规划问题,本文采用Python SciPy库中的trust-constr (信任域约束)算法进行求解,其信任域思想可参考经典信任域方法文献[6]。
由于目标函数在给定销量上限与单位变动成本条件下对售价呈单调增性,且本文求解阶段未启用需求弹性约束,该结果表明,在当前市场预期的置信区间内,市场需求尚未达到饱和点,企业应采取积极的定价策略以测试市场接受上限,而非保守定价。因此,最优解建议在ARIMA预测的价格区间内取上界定价,以获得更高的单位贡献利润。
优化结果如表4所示。模型建议:
Table 4. Optimal production and sales strategy suggestions for September 2024 (with price constraints)
表4. 2024年9月最优产销策略建议(含价格约束)
产品型号 |
建议销量(万片) |
建议售价(元/万片) |
价格约束区间[Pmin, Pmax] |
N型-182 |
552.6 |
22903.6 |
[10944.8, 22903.6] |
N型-210-210 |
397.1 |
18132.5 |
[14891.1, 18132.5] |
N型-210-182 |
518.3 |
18237.9 |
[13761.8, 18237.9] |
P型 |
714.3 |
16343.3 |
[10666.6, 16343.3] |
图7展示了优化后的预期利润与历史利润的对比。优化后的9月预期经营利润(税前,不含非经营性损益)可达1179万元(红线所示),历史1~8月月经营利润均值约为449万元。其中历史月利润同样按第3节利润核算模型得到的经营利润口径计算,以保证与优化目标一致。提升幅度按
(18)
计算,约为163%。其中Πopt为优化模型得到的最优利润,为2024年1~8月历史月利润均值。
Figure 7. Comparison between historical monthly profits and expected profits from optimization model
图7. 历史各月利润与优化模型预期利润的对比
5.3. 灵敏度分析
考虑到光伏市场价格波动频繁,为验证优化策略的鲁棒性,本文对核心参数——市场售价进行了灵敏度分析。本文将“售价波动”理解为市场景气变化导致ARIMA预测价格区间整体联动变化:对表4中各产品的Pi,min与Pi,max同比例施加±5%与±10%的调整,并在每个情景下重新求解优化模型,得到对应的最优经营利润。
分析结果如表5所示。可以看出,当市场价格区间整体下移5%时,优化后的利润虽有所下降(降至961.2万元),但仍高于历史平均水平(449万元),表明策略对价格下行具有一定鲁棒性。
Table 5. Sensitivity analysis of operating profit to joint shifts of ARIMA price intervals
表5. 经营利润对ARIMA价格区间联动变化的灵敏度分析
情景(Scenario) |
价格区间联动幅度 |
预期经营利润(万元) |
较基准变动 |
乐观情景II |
+10% |
1396.8 |
+18.5% |
乐观情景I |
+5% |
1287.5 |
+9.2% |
基准情景(Base) |
0% |
1179.0 |
- |
悲观情景I |
−5% |
961.2 |
−18.4% |
悲观情景II |
−10% |
743.5 |
−36.9% |
6. 融合大模型的智能决策路径
前述的数学规划模型在处理结构化数据时表现优异,但在面对市场突发事件、政策调整等非结构化信息时存在局限性。为了提升决策系统的鲁棒性与适应性,本文进一步提出了一种融合机器学习与大语言模型(LLM)的智能决策新范式。
6.1. 技术路径
(1) 异常检测与清洗:首先利用统计学方法识别历史数据中的异常点。如图8所示,N型182产品在4月的销量(蓝色点)显著低于相邻月份,这可能是由于设备检修或临时订单取消导致的异常。
Figure 8. Comparison trends of product sales, price, and cost from Jan. to Aug. (Including actual and predicted values)
图8. 1~8月产品销量、价格及成本对比趋势(含实际值与预测值)
(2) 随机森林回归填补:利用随机森林(Random Forest)算法对清洗后的数据进行重构[7]。随机森林具有抗过拟合、非线性拟合能力强的特点,能更准确地还原真实的市场供需曲线。
(3) LLM综合决策:将清洗后的结构化数据、预测结果以及外部市场报告输入开源大语言模型(如LLaMA或Falcon)。利用LLM强大的语义理解和逻辑推理能力,生成通俗易懂的决策报告,并给出定性的风险提示(如“关注下月多晶硅产能释放对成本的影响”)。
6.2. 应用实测
为验证该路径的有效性,本文选取N型-182产品4月份的异常数据进行实证测试。需要强调的是:LLM输出仅用于生成定性解释与风险提示,不参与任何定量计算与最终决策变量求解;所有策略建议均需结合第5节优化模型约束(产能上限、价格区间与销量上限)进行人工复核后执行。
6.2.1. 交互过程示例
基于历史数据,N型-182产品在4月销量异常下降至330万片(环比下降34%)。ARIMA预测显示9月售价均值约为16,924元/万片,且存在95%置信区间波动。请结合当前N型替代P型的行业趋势,给出9月份的产销策略建议,并说明需要重点关注的风险。
分析:4月销量异常下降更可能由非市场因素(如检修、订单波动)导致。尽管短期价格下行,但N型-182在样本期内对贡献利润的贡献较高,应优先保障其稳定供给。
策略建议(需与约束核对):(1) 排产建议:在不突破产能上限与销量上限的前提下,优先分配产能至N型-182,并避免因短期价格波动造成过度减产。(2) 库存与交付:在价格下行阶段强调周转效率与订单交付节奏,降低库存积压风险。(3) 工艺与成本:重点跟踪硅耗、良率与方棒采购价的变化,以对冲售价下行带来的利润压力。
6.2.2. 实测结论
LLM给出的“优先保障N型-182供给、强调周转与成本监控”等建议,与第5节优化模型的策略方向一致:在满足产能上限、价格区间与销量上限的前提下,N型-182在最优解中获得较高的产销配置(552.6万片)。
7. 结论
本文针对晶硅片企业的经营决策难题,提出了一套从数据分析到策略优化的完整解决方案。主要结论如下:
(1) 成本控制是核心:单晶方棒成本占总成本的80%以上,且与利润高度负相关(系数−1.238),是企业降本的首要目标。
(2) N型产品是未来:N型-182产品贡献利润占比突出(约58.1%),企业应集中资源保障其生产;同时应关注N型-210-182的市场空间(约28.4%),并持续跟踪价格与成本联动。
(3) 数学优化效果显著:通过非线性规划模型制定的产销策略,理论上可使企业月经营利润(税前)提升至1179万元,较历史均值提升约163%。
(4) 智能化是趋势:融合随机森林与大语言模型的决策系统可在异常数据处理与策略解释方面为传统模型提供补充,有助于提升决策的鲁棒性与前瞻性。
(5) 局限性与展望:尽管本文模型在短期预测和静态优化中表现良好,但尚未充分考虑宏观政策突变(如贸易壁垒)及竞争对手策略的动态博弈。未来的研究将尝试引入博弈论模型,并进一步探索多模态大模型在供应链风险预警中的应用。
NOTES
*通讯作者。