格布拉斯检验法:
格布拉斯检验法是用来做什么的?判断是否需要剔除可疑值。
可疑值一般会影响数据统计的结论,大部分情况下,可疑值的剔除基于经验行为,
假设一组平行数据:
0.997,1.235,1.221,1.148,1.276,1.129,1.461
可能0.997作为可疑值剔除,也可能1.461作为可疑值剔除,那是不是需要全部剔除呢?
这里就需要格布拉斯检验法,
首先要排序,但不需要严格排序,只要找出最大值和最小值即可,对应Excel的函数为“=MAX(数值)”和“=MIN(数值)”,此例可为:
最大值公式为:=MAX(0.997,1.235,1.221,1.148,1.276,1.129,1.461);结果为:1.461;
最小值公式为:=MIN(0.997,1.235,1.221,1.148,1.276,1.129,1.461);结果为:0.997。
第二步确定计算平均值、标准偏差并确定可疑值:
平均值为:=AVERAGE(0.997,1.235,1.221,1.148,1.276,1.129,1.461);结果为:1.210;
标准偏差:=STDEV.S(0.997,1.235,1.221,1.148,1.276,1.129,1.461);结果为:0.144;
将最大值和最小值与平均值比较,选择极差最大的值为可疑值,此处选择为:1.461。
第三步计算G值,公式如下:
即:G=(1.461-1.210)/0.144=1.743。
第四步确定置信区间,常用为0.95,确定数据量,本次数据量为7,查格布拉斯临界值表,得到G(n)如下:
确定G(n)为1.938,G
Q检验法:
适用于数据量<10个的时候,可疑值的判断。
首先排序,严格排序:
第一步需要排序,排序为上面的两个表格,因为怕图小,所以切开来上传的,参考的时候可以将两个图合在一起就是完整的排序思路。
第二步,选择可疑值,这里可以是人工筛选,也可以参照格布拉斯法选择可疑值。
依旧参考格布拉斯检验给出的数据,计算最大值和最小值的极差,Excel公式为:=MAX(0.997,1.235,1.221,1.148,1.276,1.129,1.461)-MIN(0.997,1.235,1.221,1.148,1.276,1.129,1.461)=0.464
第三步,如果确定可疑值为1.461,则按照Q检验法第一步中排序与1.461最相邻的一个值(1.235)进行极差计算,为0.226。
第四步,计算Q值,为两个极差相除,可疑值与邻近值的极差/最大值与最小值的极差,本例为:0.226/0.464=0.487。
第五步,确定置信区间,常用为0.95,确定数据量,本次数据量为7,查Q临界值表,得到Q(n)如下:
确定Q(n)为0.59,Q