一、概述
能力验证是利用实验室间对比来确定实验室能力的活动,实际上它是指认可机构为确保实验室维持较高的校准和检测水平而对其能力进行考核、监督和确认的一种验证活动,也称水平测试。能力验证活动由三个内容组成:能力验证计划、实验室间比对计划和测量审核计划、它们互为补充,从而确保CNAS的能力验证满足国际上的相关要求。
1、能力验证计划:为确定实验室在特定领域的检测、校准能力而设计和运作的实验室间比对。它是由认可机构或其授权/认可的机构组织和运作的。
2、实验室间比对计划:由其他机构组织和运作的实验室间比对项目,它与能力验证计划区别在于行为主体不同。
3、测量审核计划:实验室对被测物品进行实际测试,将测试结果与参考值进行比较的活动,即通常所谓的盲样测试。
以下就能力验证计划作简单介绍。 二、能力验证计划的作用、目的和类型 1、作用
①用于评价实验室是否具有胜任其所从事的校准/检测工作的能力,包括由实验室自身、实验室客户以及认可权威机构等所进行的评价;
②作为实验室校准/检测能力的外部措施来补充实验室内部的质量控制程序; ③这些活动也是对技术专家进行的实验室现场评审的补充; ④用以增加实验室客户对实验室能力的信任度。 2、目的
①确定实验室进行特定测量的能力,以及对实验室进行持续监控的能力;
②识别实验室存在的问题,并制定相应的补救措施,这些措施可能涉及个别人员的能力和仪器的校准等;
③确定新的测量方法的有效性和可比性,并对这些方法进行相应的监控; ④识别实验室间的差异;
⑤为参考物质赋值,并评价他们在特定测量程序中应用的适用性。 3、类型
①校准实验室间比对计划
这类计划也称测量比对计划,它所采用的被测物品,是按顺序从一个实验室传送到下一个实验室,故其特征有:
a、被测物品的指定值或参考值由主导实验室提供,主导实验室应尽量由国家级的测量权威机构承担;
b、被测物品在传送过程中应确保被测物品的稳定性,因此必须进行校核,以保证其特
1
性及指定值不发生明显变化;
c、这类计划的周期往往较长,应严格控制其传送时间和测量时间,在实施过程中应及时向实验室反馈信息;
d、将各测量结果与主导实验室确定的参考值相比较,应考虑各参加实验室声明的测量不确定度。
②检测实验室间比对计划
这类计划是从样品源中随机抽出被测物品并同时分发给各实验室进行检测的能力验证计划,故其特征有:
a、被测物品是从样品源中随机抽取的;
b、提供给实验室的一批被测物品必须充分均匀,以保证识别出的离群值不是由被测物品间的差异所致;
c、将实验室返回的检测结果与公议值(中位值)进行比较,以表明该实验室的检测能力和所有参加实验室的整体能力。
③分割样品检测计划
这类计划中的对比数据系由少量实验室(通常为两个)组成的小组提供,它们作为检测服务的提供者接收评审。如把某种样品,在代表供方和代表顾客方之间分割,也许再保留一份给第三方以备复制。其目的是:识别不良的复现性或重复性,解释一次性偏移和验证相关纠正措施的有效性,一般把采用标准方法和先进设备的实验室数据作为参考值。
④定性计划
这类计划是为了评价实验室对特定实物的表征能力,如面料组份。该计划只是定性的,并不需采用实验间比对方式。
⑤已知值计划
这是一种特殊能力验证类型,不需要很多实验室参加,即通常所说的“盲样”试验,用已知参考值来评价实验室的检测能力。
⑥部分过程计划
这也是一种特殊类型,用来评价实验室检测全过程中某一部分的能力,如:转换给定数据部分的能力,抽样、制样部分的能力等,而不必进行实际的检测。
三、名词术语
1、给定值:对于给定目的具有适当不确定度,赋予特定量的值,有时该值是约定采用的。 2、公议值:从参加者提交的结果中获得的一个给定值。(如:对于大多数的实验室间检测计划,以中位值作为给定值)
3、参考值:由一个参考实验室提供的一个给定值。对于校准实验室来说,一般由最具权威、最高等级的实验室提供的给定值为参考值。
4、离群值:通过统计技术,被认为是明显不同的结果,如:对检测验证计划的Z比分数绝对值大于、等于3的值。
5、极端结果:明显不同于给定值的结果。如:离群值、虚设的否定(没有报出样品中
2
存在的参数)、虚假的肯定(报出了样品中没有的参数)、异常值和错误计算等。
6、均一对:不易区别的双份样,其检测预期结果是相同的,即两个样品完全相同或同一样品检测两次所得结果。
7、分割对:存在轻微差别两样品、即其检测结果稍有差异。
8、结果数量(N):参试实验室按照约定方法报告的有效检测结果的总数。 9、稳健(Robust)统计:是一种不易受到异常值影响的统计方法,在通常采用的统计方法中,计算一组数据的平均值容易受到异常值的影响,而稳健统计方法中用中位值代替平均值,用归一化(标准)IQR代替标准偏差。
10、中位值(Median):是一组数据的中间值,即有一半的结果高于它,一半的结果低于它。如果N是奇数,那么中位值是一个单一的中心值,即X(N1)2;如果N是偶数,中位值是两个中心值的平均,即XN 最大值 高四分位数值 Q3 中位值Q2 低四分位数值 Q1 最小值 2XN212。见图1
11、四分位间距(IQR):是指高四分位数值与低四分位数值的差值,其间包括了全部观察值的一半。数值越大,说明分散程度越大;反之,说明分散程度越小。高四分位数(Q3)指全部观察值
图1 中有四分之一的观察值比它大的一个值;低四分位数(Q1)是全部观察值中有四分之一的观察值比它小的一个值。故IQRQ3Q1。
12、标准(归一化)四分位间距(NIQR):是一个结果变异性的量度。它等于四分位间距(IQR)乘以系数0.7413,使之成为标准正态分布的平均数为零,标准差为1,即相当于正态分布的标准差(SD)。
13、稳健变异系数(Robust CV)它等于标准IQR(四分位间距)除以中位值,用百分比表示,也就是相当于经典的变异系数(标准差除以平均值)。
稳健CV=
0.7413(Q3Q1)0.7413IQR100%=100%
中位值中位值14、极大值(maximum):数据集当中的最大值。 15、极小值(minimum):数据集当中的最小值。
16、变动范围(Range):极大值减极小值的差,即R=Qmax-Qmin
17、实验室间Z比分数(ZB):衡量某实验室S值与S的中位值的偏离程度,即
ZB=
S中位值(S)
标准IQR(S)式中:S—结果对的标准化总和,SAB2。
18、实验室内Z比分数(ZW):衡量某实验室D与D的中位值的偏离程度,即
3
ZW=
D中位值得(D)
标准IQR(D)式中:D—结果对的标准化差,D或四、检测比对计划的总计统计量计算 1、中位值的确定
AB2BA [中位值(A)>中位值(B)] [中位值(B)>中位值(A)]
21)当结果数量为奇数时,那么中位值即为居中(中位值)的那个数的值。 即: X[(N1)/2]
2)当结果数量为偶数时,那么中位值为两个中心值的平均值。
X[N/2]X[N/21]即: X
22、四分位间距IQR
IQRQ3Q1
式中:Q3——高四分位,即尽可能有四分之一的结果高于该值
Q1——低四分位,即尽可能有四分之一的结果低于该值
注:在大多数情况下,Q1和Q3是通过数据值之间的内插法获得。
3、标准IQR
标准IQR0.7413IQR0.7413(Q3Q1) 关于因子K=0.7413的由来
在统计设计时,我们认为这些数据结果是遵循正态分布的,如图2
根据正态分布的密度函数公式为:
x2f(x)12e2 (1)
2又根据四分位间距定义,其Q3Q1中间包括了全部数据结果的一半,从x1到x2,其概率为50%,即
P(x1xx2)f(x)dxx1x212u2)2x2x2x1e2dx (令u2x) 121x1x2ee(dudu122xx (2)(1)(2)00x2(u2)2x1e(u2)2du 4
式中:(Zx)21Ze(u2)2du 称为标准正态分布函数,如若将积分下限-∞换成
0,则该积分称为拉普拉斯(laplace)函数,这两个函数值相差0.5,可事先按变量Z的取值编表备用,注意到(z)1(z)(可从图1中看出),同时,还可证得
P(xc)P(cxc) (C)(C)(C)1(C)
2(C)1如上题,已知数据在区间(c,c)中的概率为50%,求此区间。
P(xc)2(C)10.5(C)0.75
查《误差理论与应用》表2.2.3《标准正态分布函数表》
Cx20.6745
∴数据分布的四分位间距是[-0.6745,+0.6745],
即:x2x12C20.67451.3490,也就是说Q3Q1数据为1.349标准差,若要折算为1个标准差(SD)
则
1(Q3Q1)1.3490Q3Q1标准IQR ∴ 0.7413(Q3Q1)
1.34901 0.7413IQR标准IQR4、稳健Z比分数(Z值)的计算
1)对一个样品A的结果而言,其简单的稳健Z比分数为
ZA中位值(A)
标准IQR(A)式中:A——某一实验室对样品A测得的结果值;
中位值(A)——所有参加实验室对样品A测得结果的中位值;
标准IQR(A)——所有参加实验室对样品A测得结果的标准四分位间距。
由此反映的Z值,是实验室间变异和实验室内变异之综合体现。
2)对于具有从样品A和B两个样品中获得结果对时,计算Z值时,应遵从以下步骤: ①把样品A所有结果列出来,从而找出其中位值[中位值(A)] ②把样品B所有结果列出来从而找出其中位值[中位值(B)]
③计算结果对的标准化总和(用S表示)和标准化差值(用D表示),则
S
AB 25
式中:A、B—某一实验室所测得的A、B值
DAB2[中位值(A)>中位值(B)] [中位值(B)>中位值(A)]
或DBA2④通过计算每个实验室的结果对的标准化总和S及标准化差值D,就形成了新的一系列S和D。这样就可以得出所有的S和D的中位值和标准IQR,即中位值(S)。中位值(D)及标准IQR(S),标准IQR(D)等。
⑤Z值的计算
a、实验室间Z比分数ZB作为S的稳健Z比分数,即:
ZBS中位值(S)
标准IQR(S)b、实验室内Z比分数ZW作为D的稳健Z比分数,即:
ZWD中位值(D)
标准IQR(D)五、依据Z比分数(Z值)的判断
1、Z≤2——满意结果——认可时免查——置信度为:95%以内。
2、2<Z<3——可疑结果——自我检查测试程序,并找出原因——置信度为:(95~99)%之间。
3、Z≥3——不满意结果(离群值)——必须查原因,再验证,并制定纠正整改措施,停止使用CNAS标志——置信度为:99%以外。
六、举例:
1、测试结果汇总表,如表1
6
某物质微生物测试结果汇总表(按log10转换)
表1 序号 样品A结果 样品B结果 结果标准化总和(S) 结果标准化差值(D) ZB ZW 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
4.20 3.18 3.04 2.93 2.90 2.85 2.85 2.78 2.78 2.78 2.70 2.70 2.70 2.64 2.61 2.60 2.60 2.58 2.48 2.41 2.34 2.30 2.30 2.30 2.30 2.30 2.08 2.00 2.00 2.00 2.00 2.00 2.00 1.51 1.30 1.30 4.20 3.00 3.00 2.95 2.85 2.70 2.75 2.78 2.85 2.70 2.68 2.74 2.04 2.90 2.63 2.48 2.43 2.48 2.30 2.70 2.30 2.00 2.00 2.60 2.48 2.00 1.85 2.00 2.95 2.70 2.46 2.00 2.11 1.20 1.30 1.20 5.940 4.370 4.271 4.158 4.066 3.924 3.90 3.932 3.981 3.875 3.804 3.847 3.352 3.917 3.705 3.592 3.557 3.578 3.380 3.606 3.281 3.041 3.041 3.465 3.380 3.041 2.779 2.828 3.500 3.323 3.154 2.828 2.906 1.916 1.838 1.768 7
0 -0.127 -0.028 0.141 -0.035 -0.106 -0.071 0 0.049 -0.057 -0.014 0.028 -0.467 0.184 0.014 -0.085 -0.120 -0.071 -0.127 0.205 -0.028 -0.212 -0.212 0.212 0.127 -0.212 -0.163 0 0.672 0.495 0.325 0 0.078 -0.219 0 -0.071 3.70 1.29 1.14 0.97 0.83 0.61 0.66 0.65 0.69 0.53 0.42 0.49 -0.27 0.60 0.27 0.10 0.04 0.08 -0.23 0.12 -0.38 -0.75 -0.75 -0.10 -0.23 -0.75 -1.15 -1.07 -0.04 -0.31 -0.57 -1.07 -0.95 -2.47 -2.59 -2.70 0.16 -0.81 -0.05 1.24 -0.11 -0.65 -0.38 0.16 0.53 -0.27 0.05 0.37 -3.40 1.56 0.27 -0.49 -0.76 -0.38 -0.81 1.73 -0.05 -1.46 -1.46 1.78 1.13 -1.46 -1.08 0.16 5.29 3.94 2.64 0.16 0.76 -1.51 0.16 -0.38 2、经按大到小顺序排列为表2
表2 序号 样品A结果 样品B结果 结果标准化总和(S) 结果标准化差值(D) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
4.20 3.18 3.04 2.93 2.90 2.85 2.85 2.78 2.78 2.78 2.70 2.70 2.70 2.64 2.61 2.60 2.60 2.58 2.48 2.41 2.34 2.30 2.30 2.30 2.30 2.30 2.08 2.00 2.00 2.00 2.00 2.00 2.00 1.51 1.30 1.30 4.20 3.00 3.00 2.95 2.95 2.90 2.85 2.85 2.78 2.75 2.74 2.70 2.70 2.70 2.70 2.68 2.63 2.60 2.48 2.48 2.48 2.46 2.43 2.30 2.30 2.11 2.04 2.00 2.00 2.00 2.00 2.00 1.85 1.30 1.20 1.20 8 5.940 4.370 4.271 4.158 4.066 3.981 3.960 3.932 3.924 3.917 3.875 3.847 3.804 3.705 3.606 3.592 3.578 3.557 3.500 3.465 3.380 3.380 3.352 3.323 3.281 3.154 3.041 3.041 3.041 2.906 2.828 2.828 2.779 1.916 1.838 1.768 0.672 0.495 0.325 0.212 0.205 0.184 0.141 0.127 0.078 0.049 0.028 0.014 0 0 0 0 0 -0.014 -0.028 -0.028 -0.035 -0.057 -0.071 -0.071 -0.071 -0.085 -0.106 -0.120 -0.127 -0.127 -0.163 -0.212 -0.212 -0.212 -0.219 -0.467 注: 样品A 样品B
2.582.482.602.48中位值Q22.53 中位值Q22.54
222.082.002.78+2.754.04Q32.78,Q12.04 Q3=2.76,Q12.02
222标准IQR0.7413(Q3Q1) 0.74130.740.549
标准IQR0.7413(Q3Q1) 0.74130.740.549
CV标准IQR0.5490.549100%=100%CV100% 中位值2.532.54 21.6% 22.0%
标准化总和S 标准化差值D
3.5573.5000.0140.028中位值Q23.528 Q20.021
223.9243.9170.0780.049Q33.920 Q30.064
221.661.20Q13.041 Q10.113
2标准IQR0.7413(Q3Q1) 0.7413(3.9203.041) 0.74130.879 0.652CV
标准IQR0.7413(Q3Q1) 0.7413(0.0640.113) 0.74130.177 0.131
0.6520.131100% CV623.8% 3.528-0.021 18.5%
3、各统计量计算如表3
表3
统计量 结果数目 中位值 标准IQR值 Rubust CV值 最大值 最小值 变动范围
9
样品A 36个 2.53 0.549 22% 4.20 1.30 2.90 样品B 36个 2.54 0.549 21.6% 4.20 1.20 3.00 标准化总和(s) 36个 3.528 0.652 18.5% 5.940 1.768 4.172 标准化差值(D) 36个 -0.021 0.131 -623.8% 0.672 -0.467 1.139 4、总计统计量图表
1)实验室间Z值分布图,如图3;
4 1321 51014 68 7 9 412 3 203121301319251724291816201511262322-1 27 323328-2 36 35 34-3-4图3 实验室间Z值分布图
2)实验室内Z值分步图,如图4;
294303312 42533 91214202410719217 616183610511321 1 828323515-1 34 22 23 2627-2-3 13-4图4实验室内Z值分布图
10
3)测试结果尤登(youden)图,如图5。
B 4.0 ·1 ·· 29 ··· · 3.0 · ·· 30· · 31· ·· 2.5 · · · · · · 2.0 · · · · 13 1.5 ·35 ·34 36· 3.5 1.5 2.0 2.5 3.0 3.5 4.0 图5 youden图 A
对youden图说明
①含有明显系统误差分量的实验室(即ZB较大)将在椭圆的右上象限或左下象限,即那个样品的结果异常地高或低。如1、34、35、36。
②随机误差分量(即ZW变异)明显高于其他参加者的实验室将处于椭圆外,且通常在左上或右下象限,即一个样品结果过高,而另一个过低。如:13、29、30、31
③youden图只是说明数据,并不能用来评定结果是否为离群值或可疑值,那只能由Z比分数来确定。
七、校准计划的评定程序 1、概述
大家知道,检测实验室比对计划是从样品源中随机抽取被测物品并同时分给各参加实验室进行检测的能力验证计划,而校准实验室间的比对计划是所谓的测量比对计划。它所采用的被测量物品是按顺序从一个实验室依次传送到下一个实验室。另外,检测实验室是以中位值作为参照值的,而校准实验是以测量的最高权威机构,即主导实验室提供的参数值(或指定值)作为参照值。因而评定方法亦不同,在检测实验室间,是以实验室的Z比分数表明实验室的检测接近给定值的程度,而在校准实验室间,是以En值表明实验室是否是在参考值(或给定值)测量的特定不确定度内,其区别见表4。
11
分 类 内 容 样品 参照值 检测比对计划 校准比对计划 从样品源中随机抽取,并同时分发给各实确定一个样品后,按顺序从一个实验室依验室 次传递到下一个实验室 以所有参加实验室数据的中位值 Z比分数 以测量的最高权威机构,即主导实验室提供参考值 判断 Z≤2—满意值 2<Z<3—可疑值 Z≥3—离群值 En值 En≤1满意值 En>1不满意值 表4 检测/校准比对计划的区别
2、En值
①判断公式:当前,国家认可委使用En值评定来自实验室的各个结果。En代表标准化误差,其定义为:
EnxXU2labUref2
式中: x—参加实验室的测量结果;
X—参考实验室的测量结果;
Ulab—参加实验室报告的不确定度;
Uref—参考实验室报告的不确定度。
②判断原则:En≤1——满意值(或满意结果)
En>1——不满意值(或不满意结果)
即对于一个结果可接受的En值,应在-1到+1之间。当然越接近零越好。
③说明:
En值并不一定指明哪个实验室的结果最接近参考值。因为它与Ulab有关,当一个报出
小不确定度的实验室与一个报出大的不确定度(即工作准确度低)的实验室可能有一个相同的(或相近)的En值。
表5为1伏直流电压标准的实验室间比对结果实例。各实验室报出的不确定度和En值均列于表中,实验室4和实验室6的结果被认为不满意。 实验室编号 参考 1 2 3 4 5 6
实验室结果—参考值(V) U95(V) 0 -1 2 -3 2 0.5 -2.5 12
En —— -0.45 0.89 -0.95 1.41 0.28 -1.12 1 2 2 3 1 1.5 2 表5 1伏电压各实验室测试结果
④图形显示
在最终报告中会有报告结果及相关的不确定的图形。图6显示了表5中的结果。这些图形显示了每个参加实验室的结果与参考值之差(x-X),同时以其线段代表了实验室报告的不确定度。
由图可知,在数据中,实验室4比实验室3的数据更靠近参考值。但由于实验室4的不确定度比实验室3小,从En值来看,实验室3数据为满意,而实验室4为不满意。当然一个实验室为了确保En≤1,而报告的一个大的不确定度,如果其不确定度大于其被认可的不确定度,则通常要求实验室作出解释。
8642x-X(μV)1 伏特(DC)
0-2-4-6-8··rel1·2··45
·3实验室编号·6
图6 实验室数据及不确定度显示图八、如何确保能力验证计划的数据准确 1、产品标准
1)首先要识别和选用适用的试验方法;
2)有关试验方法的部门或国家标准要细读,并准确掌握; 3)按照标准,拟定检测细则。 2、统筹安排
1)主检(中心主任,项目负责人)要有一个统筹安排的计划,包括:参加人员,使用的仪器设备,所需的环境控制,试验的工作程序,确保整个试验过程受控;
2)要找出试验过程中的关键步骤,并倍加注意; 3)如果有多道工序,要切实做好各工序间衔接。 3、仪器设备
1)核查使用的仪器设备是否符合标准要求(准确度,灵敏度,阀值); 2)仪器设备必须是在有效检定周期内并合格; 3)仪器设备应由熟练人员严格按使用说明书正确操作。
13
4、试样
1)要保护好试样,严防污染;
2)在试样数量允许的情况下,可采用不同设备,不同人员作对比试验; 3)尽量留一些试样,以备出现可疑或离群数据时再测之用。 5、数据处理
1)正确读取仪器上的数据,严防读错,写错,注意核对; 2)数据处理严格按标准或有关规定进行; 3)上报数据与原始记录的数据一致。
14
2008-02-18
因篇幅问题不能全部显示,请点此查看更多更全内容