基于最小二乘法的利润变动趋势分析
The Analysis of Profit Trend by Using the Least Square Method
DOI: 10.12677/AAM.2020.97122, PDF, HTML, XML, 下载: 793  浏览: 3,264 
作者: 朱娴卿, 卓超英, 滕钰琪, 余晓洁, 陈淑萍*:厦门理工学院,应用数学学院,福建 厦门
关键词: 多项式拟合牛顿插值利润增长误差Polynomial Curve Fitting Newton Interpolation Profit Growth Error
摘要: 浙江万马股份有限公司作为电缆行业知名企业,近年来发展迅速,本文以该公司10余组年利润总额数据为样本,分别利用牛顿插值与多项式曲线拟合建立相应的数学模型,并通过比较两种模型各自预测值与实际值之间的误差,得出多项式曲线拟合构造的数学模型相对更优的结论。接着,为了进一步检验该模型的有效性,本文对该公司2018年和2019年的年利润总额数据进行了验证,结果显示拟合效果良好。最后,本文利用上述模型对该公司未来2年的年利润总额进行了预测。
Abstract: Zhejiang Wanma Co., Ltd., as a well-known enterprise in cable industry, has developed rapidly in recent years. In this paper, the Newton interpolation method and polynomial curve fitting method are used respectively to establish the corresponding mathematical model by using more than 10 groups of annual gross profit data of the company. By comparing the errors of the two models, it is found that the mathematical model of polynomial curve fitting is better. Then, the total profit data of the company in 2018 and 2019 are verified in order to further test the validity of the model, and the results show that the fitting effect is good. Finally, the total annual profit of the company in the next two years is forecasted through the above model.
文章引用:朱娴卿, 卓超英, 滕钰琪, 余晓洁, 陈淑萍. 基于最小二乘法的利润变动趋势分析[J]. 应用数学进展, 2020, 9(7): 1028-1036. https://doi.org/10.12677/AAM.2020.97122

1. 引言

利润是反映一个企业盈利能力的重要指标,其增减反映着企业的发展状况。浙江万马股份有限公司,作为电缆行业知名上市公司,在近年国家基础设施建设大量投入、房地产市场大发展、民生需求逐年提升的背景下,该公司的经营规模实现了逐年提高。公司在电缆业务稳健发展的前提下,大力发展新能源业务,2019年实现营业收入97.5亿元,是2011年的2.7倍。研究与分析该公司利润增长情况,不仅有利于预测其市场运营态势与发展趋势,而且对于该企业寻求最佳的盈利途径及规划目标利润具有积极作用。

曲线拟合在人口预测、疾病感染及工业生产等方面具有非常重要的作用。2008年,从志鹏在文献 [1] 中利用傅里叶级数的数学模型来拟合故障电压与电流,并用残差、残差平方和等误差分析方法检验拟合效果,确定最佳的拟合方程。郭飞等在文献 [2] 中,利用傅里叶级数拟合偏差曲线,实现了对顶管施工中轴线控制措施的实时反馈,这将对此类工程的施工具有一定的参考意义。2017年,刘琴琴在文献 [3] 中,利用改进后的B样条曲线拟合算法解决了模型构建时因追求拟合精度而违背毒性物质对发光细菌抑制性作用等问题。

2010年,陈光在文献 [4] 中利用MATLAB计算软件包对某水厂的投矾系统进行了分析与研究,并根据大量历史数据建立了原水水质参数与实际投矾量之间的拟合曲线,并建立了一个新型的智能化自适应水处理投矾系统,该系统为曲线拟合在水厂投矾方面的应用做了有益的探索。2015年,盛立锃等在文献 [5] 中,根据某地区历年数据,构建了基于最小二乘法的多项式拟合预测模型,仿真结果表明,该方法拟合效果良好,且具有良好的预测功能,反映了多项式拟合对电力系统用电量的预测有较大的应用价值。昌霞等在文献 [6] 中收集了昆明市西山区山洪预警监测区域内13个监测点实测得到的降雨量数据,利用曲线拟合模型,对降雨数据进行不同的曲线拟合分析,结果表明幂函数的拟合效果最好。成高飞等在文献 [7] 中通过多项式拟合,得到通风机的风压风量方程,并与实测数据进行对比,得出该拟合多项式能够适用于矿井实际风压风量的计算。

2017年,杨伟在文献 [8] 中通过牛顿插值法重构信号,得到其误差是可以估计的,并通过模拟实验发现,通过牛顿插值法恢复出的信号比香农定理更加准确。2019年,戴仁辉等在文献 [9] 中利用牛顿插值方法对湖泊沉积软土的压实特性进行分析,通过常规实验表明,该方法对不同击数下软土的含水率和干密度具有较好的拟合效果。

目前,利用多项式拟合与插值研究上市公司利润增长效应的文献还不是很多。本文将利用曲线拟合和Newton插值方法对浙江万马股份有限公司最近几年的年利润总额进行整理与分析,得到了最优的数学模型,并对该公司未来两年的年利润总额进行了预测。

2. 基本概念

2.1. 曲线拟合的基本理论

在实际工作中,不是所有变量都存在线性关系。曲线拟合是指选择适当的曲线类型来拟合观测数据,并对比拟合数据与观测数据,分析变量之间的关系。

文献 [10] 描述了曲线拟合的基本原理,此算法的本质是用光滑的曲线描述离散的点,反映出离散点之间的变化规律。多项式拟合又称为最小二乘法拟合,即对于给定的 n + 1 个数据点 ( x i , y i ) ,构造如下形式的拟合函数:

φ ( x ) = c m x m + c m 1 x m 1 + + c 1 x + c 0 , (1)

其中 c i 表示此多项式的系数,m表示多项式的次数。当 m = 1 时,称之为线性拟合或直线拟合。由极值理论可知,参数 c 1 , c 2 , , c m 需要满足如下方程:

[ n + 1 i = 0 n x i i = 0 n x i m i = 0 n x i i = 0 n x i 2 i = 0 n x i m + 1 i = 0 n x i m i = 0 n x i m + 1 i = 0 n x i 2 m ] [ c 0 c 1 c m ] = [ i = 0 n y i i = 0 n y i x i i = 0 n y i x i m ] , (2)

公式(2)称为求最小二乘拟合多项式的法方程。

2.2. 牛顿插值多项式的基本理论

函数 f ( x ) 在区间 [ a , b ] n + 1 个相异的插值节点 x 0 , x 1 , , x n 处的函数值为 f ( x i ) ( i = 0 , 1 , 2 , , n ) ,则称

f [ x 0 , x 1 , , x k 1 , x k ] = f [ x 1 , x 2 , , x k ] f [ x 0 , x 1 , , x k 1 ] x k x 0 (3)

f ( x ) 关于插值节点 x 0 , x 1 , , x k 的k阶差商,其中

f [ x k ] = f ( x k ) f [ x k x k + 1 ] = f [ x k + 1 ] f [ x k ] x k + 1 x k (4)

依此类推可以得到各阶差商,且次数不超过n次的牛顿插值多项式为:

P ( x ) = i = 0 n f [ x 0 x i ] ( x x 0 ) ( x x i 1 ) . (5)

2.3. 曲线拟合的优劣评判标准

一组数据的拟合曲线不是惟一的,所以针对拟合结果,还需要进行误差分析,找到拟合效果最佳的拟合曲线。误差分析有以下几种情况:

1) 相对误差(Relative Error)

= × 100 % . (6)

相对误差越小,说明拟合值越接近真实值,即拟合效果越好。

2) 残差平方和(SSE)

残差平方和是用连续曲线近似描述平面上离散点组,其公式为:

SSE = i = 1 n w i ( y i y ^ i ) 2 , (7)

其中 y ^ i 为估计值, w i 是相应的权。一组数据SSE越小,则拟合效果越好,数据预测越成功。

3) 确定系数(R-square)

确定系数表示一个随机变量与多个随机变量关系的数字特征,其公式为:

R-square = i = 1 n w i ( y ^ i y ¯ i ) 2 i = 1 n w i ( y i y ¯ i ) 2 = 1 i = 1 n w i ( y i y ^ i ) 2 i = 1 n w i ( y i y ¯ i ) 2 . (8)

确定系数的取值范围为 [ 0 , 1 ] ,当R-square越接近1,则拟合效果越好,反之,其拟合的参考价值越低。

4) 均方根误差(RMSE)

均方根误差又称标准误差,是拟合值与真实值偏差的平方和与观测值次数n比值的平方根,计算公式为:

= SSE n = i = 1 n w i ( y i y ^ i ) 2 n . (9)

均方根误差对一组测量值中的极值误差特别敏感,能反映一个数据集的离散程度,故可很好地反映出测量的精度。

3. 数据的收集和处理

3.1. 公司概况

浙江万马股份有限公司,起源于1992年创建的浙江万马电缆厂,是国家大型企业浙江万马集团的核心企业。该公司在电缆业务稳健发展的前提下,大力发展新能源业务。在新能源产业下有万马新能源、爱充网和万马新能源投资三家全资子公司,2014~2015年间连续5次中标国网充电设备公开采集的企业,是我国国内较早从事电动汽车充电设备研发、制造和充电站智能运营管理的高科技企业,更是在2016年成为了G20杭州峰会指定充电桩品牌。如今,万马新能源已研发出新型环保材料制造的充电设备、智能化充电设备、多功能一体化交直流充电设备等多项产品,是智能充电桩方面的领军企业。

3.2. 浙江万马股份有限公司利润总额数据的收集和处理

表1所示,本文以该公司2006年至2017年的年利润总额数据作为拟合基础数据,2018年和2019年的年利润总额数据用于与预测所得的数据进行对比,以此来验证拟合曲线的拟合度。

Table 1. The total profit of Zhejiang Wanma Co., Ltd. over the years

表1. 浙江万马股份有限公司历年利润总额数据

为了更直观地了解该公司利润总额的变化趋势,我们结合数据,做出其各年度利润总额的散点图(见图1),以年份为横坐标,其中2006年为第一年记为1,以年利润总额为纵坐标。

Figure 1. Scatter chart of total profit of Zhejiang Wanma Co., Ltd. over the years

图1. 浙江万马股份有限公司历年利润总额数据散点图

借助拟合工具箱cftool对基础数据进行不同阶数的多项式拟合,以此找到拟合精度最高的拟合多项式,各阶数多项式的误差分析如表2所示。

Table 2. Root mean square error of polynomial curve fitting

表2. 各阶拟合曲线函数的均方根误差

通过比较数据可得,阶数越高,该公司的利润总额数据拟合精度越高,故当多项式的最高次 n = 4 , 5 , 6 , 7 时,所得到的拟合效果可能最佳,图2为基础数据与4至7阶拟合曲线的对比图。

Figure 2. Curve fitting for each order

图2. 各阶拟合基础数据曲线

为验证拟合多项式的拟合度,我们对该公司2018年和2019年的年利润总额进行预测,可以得到各阶多项式所对应的误差(见表3):

Table 3. Root mean square error of fitting functions

表3. 5、6、7阶拟合函数的均方根误差

Figure 3. The testing data points and curve fitting for each order

图3. 各阶拟合曲线与验证数据点

由上述图3表3可知,当 n = 4 时均方根误差最小,此时预测结果较佳。则可得到其拟合函数为:

f ( x ) = p 1 x 4 + p 2 x 3 + p 3 x 2 + p 4 x + p 5 (10)

p i 的值为:

p 1 = 0 .000193640078671 p 2 = 0 .005299428758741 p 3 = 0 .037509425480770 p 4 = 0 .028027214597900 p 5 = 0 .577940590909094

接着,本文选择5个插值节点,得到如下4次牛顿插值多项式:

g ( x ) = 0.000104533 x 4 + 0.0007074 x 3 0.00550247 x 2 + 0.153305 x + 0.46176 (11)

为了比较两种算法的优劣,表4分别给出了2018年和2019年利润总额的误差。

Table 4. The error of total profit for two algorithms in 2018 and 2019

表4. 2018年和2019年两种算法利润总额的误差

图4表4可知,多项式的拟合误差较小,即多项式拟合的效果较好。故根据式(10),可预测该公司2020年和2021年的利润总额,其结果如表5

Figure 4. The testing data points and polynomial curve of fourth order

图4. 4阶多项式曲线与验证数据点

Table 5. Total profit forecast for 2020 and 2021

表5. 2020年和2021年的利润总额预测值

4. 总结

本文基于多项式拟合与Newton插值方法分别对浙江万马股份有限公司2006年至2017年的年度利润总额数据进行了分析,并根据确定系数与残差平方和等相关指标,得到最优拟合曲线。同时,为了进一步验证所选模型的优劣,本文还利用Newton插值方法构造了牛顿插值多项式,理论结果显示本文所选的数学模型是最优的。最后,本文利用所选的数学模型对公司未来两年的年利润总额进行了预测。其数值结果表明,公司的年度利润总额呈现出持续上升的趋势。希望本课题的研究能给相关企业利润预测提供理论参考。

NOTES

*通讯作者。

参考文献

[1] 从志鹏. 基于曲线拟合方法的故障测距应用研究[D]: [硕士学位论文]. 济南: 山东大学, 2008.
[2] 郭飞,罗川舟. 基于曲线拟合的大直径顶管施工技术研究与应用[J]. 中外建筑, 2019(1): 191-192.
[3] 刘琴琴. 曲线拟合预测模型及算法在水质远程监测系统中的研究[D]: [硕士学位论文]. 杭州: 浙江理工大学, 2017.
[4] 陈光. 基于曲线拟合的智能投矾系统的应用研究[D]: [硕士学位论文]. 广州: 中山大学.
[5] 盛立锃, 曾喆昭, 李莎. 基于代数多项式模型的用电量预测研究[J]. 电力科学与技术学报, 2015(1): 35-38.
[6] 昌霞, 刘赛娥. 基于曲线拟合的降雨侵蚀力模型初探[J]. 计算机时代, 2019(2): 71.
[7] 成高飞, 郭媛. 基于多项式曲线拟合方程法的矿用风机风压特性曲线的对比研究[J]. 山西煤炭, 2019, 38(1): 48-50.
[8] 杨伟. 基于牛顿插值法的模拟信号采样与重构研究[D]: [硕士学位论文]. 兰州: 兰州大学.
[9] 戴仁辉, 陈士军, 王增亮, 易进翔. 基于牛顿插值法的软土压实特性应用研究[J]. 工程质量, 2019, 37(3): 70-71.
[10] 裴玉茹, 马庚宇. 数值分析[M]. 第二版. 北京: 机械工业出版社, 2014.