数据库技术Database Technology
电子技术与软件工程
Electronic Technology&Software Engineering 基于粗大误差判别准则的测量列数据的处理与优化
唐伟钟伟段国艳
(四川工程职业技术学院电气信息工程系四川省德阳市618000)
摘要:本文在对粗大误差判断理论依据的分析基础上,提出了实现粗大误差判别的智能算法,运用高级语言对算法进行编程实现测量列数据的优化处理和对包含粗大误差数据的定位和剔除。最后通过程序仿真验证,实现了粗大误差判断的快速性和精准性。
关键词:粗大误差剔除;粗大误差数据优化处理;粗大误差软件定位;测量数据自动处理
1引言
在测量数据中,无论是用仪器自动测量还是手动测量,总会包
含误差,如粗大误差、系统误差、随机误差,在这些误差中粗大误
差对测量数据的准确性危害最大,所以在测量结果中出粗大误差
并剔除尤为重要。然而关于误差的算法计算量巨大且复杂,因此,
通过软件程序实现粗大误差分析与处理将有效提高误差处理的速度
和准确性;因为测量误差跟测量条件和测量次数等有密切关系,不
同的粗大误差判据有不同的优势,所以研究根据等精度有限次的测
量次数选择不同的粗大误差处理算法,对数据的处理有着重要的意
义。
2误差及相关概念
误差是测得值与被测量的真值之间的差⑴,其数学表达式为
A x=x-x0,其中Ax为误差,x为测量值,X。为真值。在测量中,
真值本质上是不存在的,实际上常用满足规定精度的量值来代替真
值使用。根据误差的产生的原因,通常将误差分为系统误差、随机
误差、粗大误差。
在实际测量中,常用有限次测量数据的算术平均值丘作为被测
量真值的估计值。所以常将元作为真值使用,其计算公式为
残余误差是测得值与元的差,用V表示,第i次测量所得到的
残余误差\残余误差表示某次测量值偏离真值的程度。
测量的标准差估计值E,表示测量值的精度,E越小说明测量
的精度越高。常用公式(1)或(2)计算。
(1)
(2)
粗大误差是对测量结果的明显歪曲。产生粗大误差的原因主要是因为测量人员的疏忽造成读值或记录的
错误,也可能因为外界的原因造成,如振动、热冲击等引起测量仪器的示值改变。一旦发现粗大误差就应该被剔除⑴。判别粗大误差的方法有多种,同时各具优缺点。
3.13。准则(莱以特准则)
当同>3反时,则认为第i次对应的测得值为粗大误差。该准则的特点是在测量次数要充分大,测得值符合正态分布的前提下使用,如果测量次数较少则该准则只是一个近似的准则。
3.2肖维纳准则
粗大误差是明显超统计规律预期值的误差,如果测量值怡遵循公式(3)的计算结果,则说明引起该误差的测量值论为粗大误差⑴。
(3)入实际上是正态分布置信系数,可以通过查肖维纳准则表得到,也可以通过查正态分布积分表获得。
3.3t校验准则(罗曼诺夫斯基准则)
判别的依据是:先假设测量列中某个测得值芳为粗大误差,去掉台后再计算测量列的算术平均值元和(兔,若式(4)成立则说明勺含有粗大误差;否则,认为勺不含有粗大误差。
卜厂元|>KE(4)K是t分布的检验系数Kg,可以通过查t分布表得到。罗曼诺夫斯基准则的特点是对测得值个数要求少。
3.4格罗布斯准则
将测量值旨,(心1,2,3,厶…n)按测得值大小顺序排成顺序统计
180
电子技术与软件工程
Electronic  Technology  & Software  Engineering
数据库技术
Database  Technology
差判别算法,以给定的101个测量值为例,完成包含粗大误差数据
的剔除。
20.42, 20.30, 20.43, 21.40, 20.43, 20.42, 20.43, 20.39,20.40,20.40,20.42,20.43,20.42,20.43,20.41,20.43,20.43,20.42,20.25,20.42,20.41,20.40,20.42,20.43,21.00,20.32,20.45,20.39,20.49,20.45,20.30,20.21,20.63,20.09,20.50,20.52,20.39,20.39,20.20,20.53,20.45,20.48,20.40,20.44,20.40,20.43,20.42,20.43,26.43,20.42,20.65 o
20.35,20.42,20.43,20.39,20.40,20.42,20.43,20.39,20.31,20.40,20.43,21」
9,21.00,20.12,20.53,20.39,20.38,20.50,20.49,20.45,20.30,20.52,20.40,20.31,20.40,20.20,20.53,20.42,20.45,20.52,20.48,20.40,20.33,20.32,20.33,20.62,20.45,20.42,20.44,20.49,20.46,20.47,20.43,20.49,20.31,20.42,20.83,15.39,20.31,25.40,a6-20.39. a7-20.40. a8»20.40. al2»20.42. al 3-20.43. al4=20. 39.
«20-20.42. a26«20.42.
a32«20.40. «38-20.49. a44«20.52. a5O«2O. 30.
a56-20.52. a62«20. 33. a6S»20.53.»74-20.45. aS0-20.43. a86»20.43.al6-20.42. a22»20.39. a28-20.42. a34-20.43. «40-20.32. a46=20.31. a52-2O.2O. 45X20.50. a64»20. 33. ar0-20.45. a'6«20.40. a«2-20.31. «88-20.31.al7-20.43
a23«2O.31 a29=20.43
a35-2O.39 a41»20.45 a47=20.40 a53-20.53 a59-20.52 a65»2O.39 a'1-20.42 arr-20.44 aS3«20.40 a89-20.42al8-20 a24-20 a3O-2O  a36-20 a42-20 a48«20 a54-20 a60-20 a66»20 a72-20 arS-20 a84=20 a90-2041. al9-20.43.40. «25-20.45.53. a31-20.41.38. 437-20.50.39. >43-20.30.49. a49«20.45.42. a55-20.45.48. a61-20.40.39. a67-20.20.44. 473-20.49.46. a79»20.47.43. aS5-20.42.65. &91-20.83.
j«92.
sacc-38368.695. sub»0.008039xp«20.422.dx»0.090
the  rejected  data:a8S=20.S3conspi  cuous  data  terp-20.S30
location  NO.i«92. the  rejected  data  is  a91«20.83 in  the  rearrange  array,
the  rearranged  array:
aO-20.42. al-20.30. a2-2O
a3-20.43. 34=20.42. a5«2O
a9»20.42. al 0-20.43. —20.35. alS-20.40.a21«20.43.«27=20.25.a33-20.42.
a39>20.45.
a45=20.40.
a51-20.21.
a5r-20.63.
a63«20.32.
«69-20.62.
a?5-20.4&
a81>20.49.
a8r-20.42,j»91.
$acc*37934.805. sub=0.006254xp-20.4ir.dx-0.079
have  fill  shed  the  selection  of  conspi  cuous  data have  10 conspicuous  data:
«91-20.S3.a92-20.12. a93-20.09. a94-21.00. «95-21.00.a96-21.19. a97-21.40.a9S«26.43. a99-25.40. al00-15.39.
the  beles  that  have  been  excluded  gross  error  frow  original
91Teasurerent  value  are  ok.they  are:
org0=20.42. orgl«20. 30. org2»20.43. org3*4«>«20.43. org6=20. 39.org?»20.40. orgS»20.40. org9«l0«ll«20. 35八 '■ 42.orgl3«20.43. orgl4«20.39. ir«20.l 9=20.43. org20«20. 42. org21«22=23=20. 25«26«27»28«29«20.43
orgl2»20 orglS=20 org24«20org30»20 org36«20 org42«20 org4S«20 org54«20 org60«20 org66*20 org?2®20 org78«»20 orgS4»20 org90»20
<31-20.41. org32-20.40. org33・35-20.3938. org37»20. SO. org3S»39»40»20.32,org41»20.4539. org43«20. 30. org44«*20. 52. org45»20.40. org46»20. 31. org47«20.40
<49»20.45. org50«20. 30. 52»5 3-20. 55=20.45. org56»20.52. org57»58»20.50. org59=20. 52 4& org61-20.40. org62-20.33. org63-20. 32.65-20. 67«20. 20. org68»20.53. org69»?0»71-20.42
< :3=74»?5«76»77«20.79*20.47. orgS0»Sl=S2«S3«20.85-20.42. orgS6»20.43,org87«88»89«20.42 65.
主程序主要对粗大误差处理的子函数调用和处理后数据列的显 示,根据测量列数据的规模,主程序自动调用3。粗大误差判断算
法程序,在子程序中实现了对包含粗大误差的测量值的剔除和数据 列的重新排列,最后将坏值个数返回给主程序,并整理出来不包含
粗大误差的测量值。在Win-Turbo  C 环境下仿真运行,可以准确的
对测量数据列进行粗大误差的处理。仿真结果如图3所示。
4. 3仿真验证
图3:对101个测量值中的包含粗大误差的数据剔除仿真结果
量 X ⑴,-x (21
规定
&沪玉
6 ,
o-v  o 选取g 0(«,a)为判别粗大误差的临界值,其中n 为测量次数,Q 为显著度。若g (/)>g 0(^«), (i=l,2,3・・・n)则在运行结果中,xp 是平均值,dx 是标准差,j 是当前需要处理
的数据个数,每剔除一个包含粗大误差的测量值,j 就会自减1, a
是子程序处理过程中定义的数组名,org 代表原测量列数组。因为 篇幅所限,这里只给出了程序运行的后期结果。从程序运行的结果
可知,j=92时表示当前还剩92个测量数据,已经判断出9个测量 值包含粗大误差而被剔除,程序继续对剩下的92个数据进行计算
并判断,最后又剔除一个,剩下91个测量数据不包含粗大误差。
说明“)包含粗大误差。否则,“)则不含粗大误差。go (",Q )可以通 过程序自动查询格罗布斯准则表得到。在计算出x (i )为粗大误差后,
应该剔除“)并重新计算〒,反,测得值的个数n 。对测得值个数要
求不多,判断的可靠性要求较高的场合比较适用。
4粗大误差判别算法的C 语言编程实现
4. 1软件流程框图
根据不同的测量次数和要求,可选择不同的判断依据叫 最终
做出粗大误差的优化处理选择。主流程框图如图1所示。主程序根
据测量列的数据多少和具体要求选择相应的粗大误差处理子程序,
每个子程序负责将含有粗大误差的测得值挑选出来并返回给主程
序,主程序剔除含有粗大误差的数据后对测量数据列重新排列,然 后计算出元,乞。
4.2各子程序的特点
子程序流程样例如图2所示,本文以莱以特准则判据为例,其
余判据子程序处理流程类似图2。在每个子程序中含有计算壬,6
及比和残余误差,目的是使主程序简单。为了保证计算结果的正确
性,在程序中引入了算术平均值校核算法。每个子程序结构基本上
相同,保证了子程序的简洁性。子程序基本上分为4个模块及查表 模块,计算元,6,比及校核模块,判据比较和数据剔除与重排模块。
在数据剔除与重排时先将要剔除的数据暂存,再将数组从剔除点顺正则化长细比超限怎么调整
序搬移,从而构成一个新的数据列,然后将被剔除的数据放于数组 的最后,待下次计算时程序不将被剔除的数据包含进去,这样用最 简单的算法实现了数据的剔除与重排。
根据图1和图2流程图,采用C 语言实现主程序和3。粗大误
5结束语
本文针对误差处理计算量大的问题,用软件算法实现了对测量
数据列中包含有粗大误差的数据剔除,并完成对原始测量数据的重 新排列;同时为提高误差处理的准确性,根据等精度测量的次数,
采用不同的软件算法对测量数据处理,实现了对粗大误差精确的剔 除。根据文中提出的软件算法,通过程序仿真验证,软件程序计算
的快速性和运行结果的准确性达到了工程使用要求。同时该软件算 法程序也可以作为一个独立的粗大误差处理工具应用于科研和工程
测量中。
参考文献
[1] 费业泰•误差理论与数据处理(第4版)[M].北京:机械工业
出版社,2000.
[2] 谢自美.电子线路设计•实验•测试(第三版)[M].武汉:华
中科技大学出版社, 2006:2-5.
[3] 林洪桦.剔除异常数据的稳健性处理方法[J].中国计量学院
学报,2004, 15 (1): 20-24.作者简介
唐伟( 1976-),男。硕士研究生,讲师。研究方向为电源技术、 数据采集、通信技术。
钟伟(1974-),男,四川省德阳市人。硕士研究生学历,副教授。
研究方向为电子信息、嵌入式技术应用。
段国艳(1981-),男,四川省德阳市人。硕士研究生学历,讲师。
研究方向为虚拟仪器、通信技术。
181

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。