1. 引言
对于环境监测数据处理时求解标准曲线问题,其目的是利用得到的标准曲线计算待测物质的含量,以求精确评价所测水体环境或者采取合适的水处理工艺。
对此问题目前化学工作者运用基于Excel程序进行求解,如白云做过c++程序求解的探究 [1] ,其求解误差小,但是编程过程复杂。刘作云等运用最小二乘法基于Excel进行求解 [2] [3] [4] ,但得到的结果误差较大。求解标准曲线,对于化学工作者来说需要具有一定的数据处理能力以及软件操作能力,除此之外求得的标准曲线误差大小也是一直被关注与关心的。本文采用基于MATLAB的操作,将线性回归方法应用于光谱分析中,可以得到误差更小的标准曲线方程。并且本文对求解结果进行了p检验和F检验以及相关系数R的计算,结果都很好的符合要求。
2. 理论基础
线性回归利用线性回归方程的最小平方函数,对自变量和因变量之间的关系进行建模。国家规定的标准曲线做法是测定已知待测物质含量的标准试剂的吸光度值,得到一些离散点,求解通过这些点的一条直线。
由光吸收基本定律可知当实验条件满足要求时,待测物质的含量与吸光度呈线性关系,因而线性回归可运用于标准曲线求解。二者满足线性关系的前提下,影响吸光度值的条件中仅物质含量一个变量,因此采用一元线性回归分析来进行二者关系的建模。本文以吸光度值 为自变量,待测物含量 为因变量,建立一元线性回归模型:
[5]
步骤一:以国家规定的标准溶液浓度系列作为矩阵,实验得到对应的吸光度值矩阵,即
(*)
假定矩阵
,
为需要顾及的系数向量,
为随机误差向量 [6] 。
步骤二:对于准备好的数学模型,将其运用到MATLAB软件的操作当中,编程调用MATLAB中的regress函数作一元线性回归:

返回线性回归方程中系数向量
的估计值b,regress函数将Y或X中不确定的数据作为缺失数据而忽略它们,使得误差会变小。最终可以得到回归方程系数的估计值。
步骤三:进行显著性检验和误差分析。通过得到的显著性检验相关参数,与临界值比较,采用残差进行误差分析,残差是衡量不确定性的指标,残差大小可以衡量预测的准确性,残差越大表示预测越不准确,残差与数据本身的分布特性和回归方程的选择有关。

其中
为因变量的真实值,
为估计值。
3. 案例分析
3.1. 案例一
以“紫外分光光度法”测总氮含量中标准曲线求解为例,在满足定量分析要点的基础上,计算出标准试剂的浓度和扣除空白后对应的校正吸光度值(以下直接称吸光度值),得到标准溶液的总氮含量(Y)和吸光度值(X),如下表1:
构造出表中对应的线性回归矩阵算法如下:

MATLAB运行结果(表2~4,图1)
以上即利用MATLAB数学软件求得的结果及各统计参数,由表2可知求得回归方程(标准曲线方程)为
。
显著性检验
我们将原假设与对立假设分别为

1) 由表4检验p值为2.6847e−10,远小于0.01,可知显著性水平
下应拒绝原假设
,可认为吸光度值与浓度的线性关系是显著的;
2) 对于F统计量的观测值与临界值
,当
时,拒绝原假设,认为Y与X的线性关系是显著的 [7] ;反之,则接受原假设,认为Y与X的线性关系是不显著的。在表4中F统计量的观测值
,可知吸光度值与浓度有显著的线性关系。
与Excel建模方法 [2] 进行对比
将案例一的数据运用Excel建模方法最终得到线性回归方程为:
,求得其残差的均值为−5.46429e−09;在表3中得到Y的残差分析,可以看出通过MATLAB求得的线性回

Table 1. Total nitrogen standard reagent concentration and calibration absorbance value
表1. 总氮标准试剂浓度与校正吸光度值

Table 2. The estimate of the coefficients, 95% confidence upper limit and 95% lower confidence limit
表2. 系数的估计值与其置信上下限

Table 3. The real value of Y corresponds to the estimate, residual and 95% confidence interval
表3. Y的真实值对应的估计值、残差及95%置信区间

Table 4. F statistic observation value, p value, residual mean and R2
表4. F统计量观测值、p值、残差均值及R2

Figure 1. The standard curve fitting of total nitrogen
图1. 总氮的标准曲线拟合图
归方程的残差的均值(表4)在同样的精确度下为0,说明MATLAB建模较Excel建模的误差小,准确度高。
3.2. 案例二
下面以硝氮含量测定实验数据对所建立的模型进行检验,吸光度值X的数据如标准试剂中硝氮的含量Y下表5:
MATLAB程序运行结果:(表6~8,图2)
由表6,回归方程(标准曲线方程)为
。
显著性检验
由表8得出p值为2.7987e−09远远小于0.01,F统计量的观测值为
,可知该组数据的吸光度值与浓度有显著的线性关系。
与Excel建模方法 [2] 进行对比
将案例二的数据运用Excel建模方法最终得到线性回归方程为:
,求得其残差的均值为−1.76667e−07;在表7中得到Y的残差分析,可以看出通过MATLAB求得的线性回归方程的残差的均值(表8)为−1.38778e−17,可以看
。

Table 5. Nitrate nitrogen standard reagent and calibration absorbance value
表5. 硝氮标准试剂浓度与校正吸光度值

Table 6. The estimate of the coefficients, 95% confidence upper limit and 95% lower confidence limit
表6. 系数的估计值与其置信上下限

Table 7. The real value of Y corresponds to the estimate, residual and 95% confidence interval
表7. Y的真实值对应的估计值、残差及95%置信区间

Table 8. F statistic observation value, p value, residual mean and R2
表8. F统计量观测值、p值、残差均值及R2

Figure 2. The standard curve fitting of nitrous nitrogen
图2. 硝氮的标准曲线拟合图
结果分析
两个案例基于不同的化学实验,测定的是不同的物质,标准物质的含量、吸光度值也不同,通过最终的实验结果可以看出,本文建立的模型可以适用于不同要求标准曲线方程的求解,且通过与Excel建模方法对比,可知MATLAB建模的误差较小,得到的回归方程准确度更高。
4. 结论
对于标准曲线的求解问题,一直未有基于MATLAB的线性回归分析方法。本文通过探索MATLAB建模实现线性回归,可快速的得到物质含量与吸光度值的标准曲线方程,同时和Excel建模对比,减小了误差,可以得到更准确的待测物质含量,从而得对水环境质量做出更为准确的评估。