格布拉斯检验法:

格布拉斯检验法是用来做什么的?判断是否需要剔除可疑值。

可疑值一般会影响数据统计的结论,大部分情况下,可疑值的剔除基于经验行为,

假设一组平行数据:

0.997,1.235,1.221,1.148,1.276,1.129,1.461

可能0.997作为可疑值剔除,也可能1.461作为可疑值剔除,那是不是需要全部剔除呢?

这里就需要格布拉斯检验法,

首先要排序,但不需要严格排序,只要找出最大值和最小值即可,对应Excel的函数为“=MAX(数值)”和“=MIN(数值)”,此例可为:

最大值公式为:=MAX(0.997,1.235,1.221,1.148,1.276,1.129,1.461);结果为:1.461;

最小值公式为:=MIN(0.997,1.235,1.221,1.148,1.276,1.129,1.461);结果为:0.997。

第二步确定计算平均值、标准偏差并确定可疑值:

平均值为:=AVERAGE(0.997,1.235,1.221,1.148,1.276,1.129,1.461);结果为:1.210;

标准偏差:=STDEV.S(0.997,1.235,1.221,1.148,1.276,1.129,1.461);结果为:0.144;

将最大值和最小值与平均值比较,选择极差最大的值为可疑值,此处选择为:1.461。

第三步计算G值,公式如下:

即:G=(1.461-1.210)/0.144=1.743。

第四步确定置信区间,常用为0.95,确定数据量,本次数据量为7,查格布拉斯临界值表,得到G(n)如下:

确定G(n)为1.938,G

Q检验法:

适用于数据量<10个的时候,可疑值的判断。

首先排序,严格排序:


第一步需要排序,排序为上面的两个表格,因为怕图小,所以切开来上传的,参考的时候可以将两个图合在一起就是完整的排序思路。

第二步,选择可疑值,这里可以是人工筛选,也可以参照格布拉斯法选择可疑值。

依旧参考格布拉斯检验给出的数据,计算最大值和最小值的极差,Excel公式为:=MAX(0.997,1.235,1.221,1.148,1.276,1.129,1.461)-MIN(0.997,1.235,1.221,1.148,1.276,1.129,1.461)=0.464

第三步,如果确定可疑值为1.461,则按照Q检验法第一步中排序与1.461最相邻的一个值(1.235)进行极差计算,为0.226。

第四步,计算Q值,为两个极差相除,可疑值与邻近值的极差/最大值与最小值的极差,本例为:0.226/0.464=0.487。

第五步,确定置信区间,常用为0.95,确定数据量,本次数据量为7,查Q临界值表,得到Q(n)如下:

确定Q(n)为0.59,Q