1. 直线回归方程和相关系数的计算
理化分析测试常用仪器分析法,且大多数仪器分析法都是相对分析法。因此,在分析试样时,要求先用标准物质绘制标准曲线(工作曲线),才能测定试样中的被测物含量。其中直线回归是最常用且最简单的一种。用实验数据拟合直线,要求所观测的点与线上相应点的垂直距离之差的平方和最小,即最小二乘法。呈直线的标准曲线用下式表示:
(1)
式中b是直线的斜率(回归系数),a是截距。各实验数据点可表示为(xi,yi)i=1,2,…,N。
用以下各式分别计算斜率b、截距a和相关系数r:
1.1斜率(2)
1.2截距(3)
1.3相关系数(4)
以上各式中, 是x值的平均值,是y值的平均值。相关系数r的绝对值通常大于0.99而很少小于0.90。相关系数r接近于+1和-1时,一般应给出三位以上的有效数字。
1.4 y对x的回归直线
用计算得到的斜率和截距绘制的直线就是拟合得到的最佳直线,称为y对x的回归直线。显然,实验中测得的各实验点(xi,yi)并不完全落在该回归直线上,除非相关系数r=1。y对x的回归直线可表示为:
(5)
【例1】用分光光度法在某一波长下测定一系列的被测物品标准溶液,被测物品的浓度x和吸光度y如表1中第2栏和第3栏所示。求回归直线方程和相关系数r。
为便于计算,将有关中间计算结果列于表1中。
表1 分光光度法实验数据和回归直线中间计算结果
x | y | ||||||
1 | 0 | 0.021 | -6 | 36 | -0.110 | 0.012 1 | 0.660 |
2 | 2 | 0.050 | -4 | 16 | -0.081 | 0.006 561 | 0.324 |
3 | 4 | 0.090 | -2 | 4 | -0.041 | 0.001 681 | 0.082 |
4 | 6 | 0.126 | 0 | 0 | -0.005 | 0.000 025 | 0 |
5 | 8 | 0.173 | 2 | 4 | 0.042 | 0.001 764 | 0.084 |
6 | 10 | 0.210 | 4 | 16 | 0.079 | 0.006 241 | 0.316 |
7 | 12 | 0.247 | 6 | 36 | 0.116 | 0.013 456 | 0.696 |
S | 42 | 0.917 | 0 | 112 | 0 | 0.041 828 | 2.162 |
=6 | =0.131 | - | - | - | - | - |
用式(2)和表1的数据计算斜率b:
(6)
用式(3)和表1的数据计算截距a:
(7)
用式(4)和表1的数据计算相关系数r:
0.9989(8)
2.斜率b和截距a的不确定度评定
用上述方法计算得到的标准曲线(工作曲线)可用于分析被测试样中的未知物含量,因此必须对其斜率b和截距a的不确定度进行评定。
2.1 回归的标准偏差s
(9)
式中yi是相对于xi的测得值; 是当x =xi时用式(5)计算得到的值,即从回归直线上取得的与xi对应的y值;N为数据对(x,y)的数目。
式(9)中的 是测得值y对拟合的回归直线上相应值之间的偏差平方和,与计算一组重复测量数据的标准偏差公式相似,故称其为回归的标准偏差,亦程为y-残差的标准偏差。
2.2斜率b的标准偏差s(b)及其扩展不确定度Up(b)
(a) 斜率b的标准偏差s(b)
(10)
式中 是所有xi的平均值。
(b)斜率b的扩展不确定度Up(b)
(11)
式中tp是选定置信水准p(或显著性水平a=1-p)时,根据自由度n=N-2查t-分布表所得到的t值。
2.3截距a的标准偏差s(a)及其扩展不确定度Up(a)
(a) 截距a的标准偏差s(a)
(12)
(b)截距a的扩展不确定度Up(a)
(13)
式中tp是选定置信水准p(或显著性水平a=1-p)时,根据自由度n=N-2查t-分布表所得到的t值。
【例2】某比色测定,得到表2所示的结果。试用统计方法绘制标准曲线,并评定标准曲线斜率和
截距的扩展不确定度。
表2 某比色测定的测量结果
浓度值 x (mg/ml) | 0 | 0.5 | 1.0 | 1.5 | 2.0 |
仪器响应值 y | 0.019; 0.024 0.021; 0.023 0.020; 0.021 | 0.498; 0.521 0.511; 0.513 0.515 | 0.980; 1.014 1.002; 1.005 | 1.498; 1.491 1.482 | 1.972; 2.025 1.998 |
【解】本题对同一浓度值x值平行测定了多个数目不等的仪器响应值y。采取用全部y值进行计算
的方法。
(1) 求标准曲线
(a) 用全部实验点求
(b) 计算各平方和
(c) 用式(4)计算相关系数r
由求得的相关系数r值可看出,x和y是显著的线性相关。
(d) 用式(2)计算回归直线的斜率b
(e) 用式(3)计算回归直线的截距a
(f) 求回归直线(标准曲线)
(2) 标准曲线斜率和截距扩展不确定度评定
为了便于计算,将测量值 的计算值列出于表3。
(a) 回归的标准偏差s
用式(9)计算回归的标准偏差s:
(b)斜率b的标准偏差s(b)
用式(10)计算斜率b的标准偏差s(b):
(c)斜率b的扩展不确定度Up(b)
通常选取置信水准p=95%(显著性水平a=0.05),查t-分布表,自由度n=N-2=19,得到t95(19)=2.093,用式(11)计算斜率b的扩展不确定度Up(b):
斜率b的置信区间为:
或0.9775 ~ 0.9737
(d) 截距a的标准偏差s(a)
用式(12)计算截距a的标准偏差s(a):
(e)截距a的扩展不确定度Up(a)
同(c)查得t95(19)=2.093,用式(13)计算截距a的扩展不确定度Up(a):
截距a的置信区间为:
或0.0102 ~ 0.0276
表3
xi | 0 | 0 | 0 | 0 | 0 | 0 | 0.5 |
yi | 0.019 | 0.024 | 0.021 | 0.023 | 0.020 | 0.021 | 0.498 |
0.0189 | 0.0189 | 0.0189 | 0.0189 | 0.0189 | 0.0189 | 0.5 117 | |
yi- | 0.0001 | 0.0051 | 0.0021 | 0.0041 | 0.0011 | 0.0021 | -0.0137 |
xi | 0.5 | 0.5 | 0.5 | 0.5 | 1.0 | 1.0 | 1.0 |
yi | 0.521 | 0.511 | 0.513 | 0.515 | 0.980 | 1.014 | 1.002 |
0.5117 | 0.5 117 | 0.5 117 | 0.5 117 | 1.0045 | 1.0045 | 1.0045 | |
yi- | 0.0093 | -0.0007 | 0.0013 | 0.0033 | -0.0245 | 0.0095 | -0.0025 |
xi | 1.0 | 1.5 | 1.5 | 1.5 | 2.0 | 2.0 | 2.0 |
yi | 1.005 | 1.498 | 1.481 | 1.482 | 1.972 | 2.025 | 1.998 |
1.0045 | 1.4973 | 1.4973 | 1.4973 | 1.9901 | 1.9901 | 1.9901 | |
yi- | 0.0005 | 0.0007 | -0.0063 | -0.0153 | -0.0181 | 0.0349 | 0.0079 |