直方图的自动绘制及其应用的正确理解  


吴遵高
    直方图是一种广为人知的识别数据分布形态简易工具,在质量管理中几乎无人不晓。然而,在我国却未得到广泛的应用。原因有二:第一,绘制麻烦,费时费事(增加应用成本);第二,对其用途理解不够准确,夸大了其单独作用,事与愿违,伤害了使用信心。 本文就这两点,结合一个案例予以简要阐明。

    案例:某汽车厂的一个安全零部件的重要配合尺寸——花键齿轮的跨棒距为35.09500.076mm,即这一重要特性的期望值35.133mm,公差0.076mm,上规格限35.171mm,下规格限35.095mm。它由甲、乙两个配套厂供货,每月从两厂各进1000件,依据合同,按GB 2828AQL=0.15,检验水平Ⅱ,一次正常抽样检验验收。故分别从这两批中随机抽取80件,经逐个测量(测量系统经评价可接受,其重复性和再现性应小于公差的10%),数据如表一(甲)、表二(乙),都在公差范围内,均予接收。通常就此结束。

    但如果对这两组数据,即使采用最简单的统计分析——描述性统计(包括其图解法直方图),就会发现问题,促使改进,减少损失(额外成本)。然而,要实现这种分析,按书本介绍的方法,一个质量工程师,花费一个工作日,也未必完成的很好。这样高的成本,企业只能望而却步。若采用Excel所提供的工具,几分钟内,就能实现。
表一
35.131
35.123
35.135
35.143
35.143
35.147
35.116
35.131
35.142
35.124
35.127
35.119
35.118
35.125
35.127
35.116
35.128
35.130
35.134
35.130
35.130
35.130
35.144
35.132
35.132
35.129
35.149
35.140
35.152
35.128
35.146
35.120
35.137
35.140
35.148
35.132画直方图的四个步骤
35.129
35.136
35.130
35.139
35.121
35.126
35.121
35.130
35.133
35.133
35.130
35.151
35.119
35.127
35.112
35.145
35.123
35.128
35.139
35.137
35.140
35.136
35.122
35.124
35.139
35.136
35.125
35.131
35.134
35.137
35.134
35.126
35.148
35.137
35.134
35.140
35.140
35.128
35.126
35.142
35.123
35.121
35.139
35.138
表二
35.126
35.146
35.136
35.126
35.151
35.115
35.134
35.118
35.139
35.123
35.129
35.137
35.157
35.153
35.127
35.135
35.136
35.104
35.142
35.139
35.135
35.125
35.129
35.096
35.129
35.117
35.124
35.128
35.133
35.110
35.133
35.125
35.130
35.120
35.115
35.136
35.152
35.118
35.130
35.134
35.146
35.167
35.150
35.152
35.162
35.142
35.154
35.160
35.142
35.152
35.158
35.143
35.137
35.149
35.161
35.159
35.118
35.159
35.161
35.147
35.146
35.164
35.158
35.155
35.161
35.166
35.149
35.146
35.140
35.136
35.157
35.159
35.150
35.152
35.155
35.142
35.146
35.160
35.144
35.154
第一,绘图、计算:

    先将表一中的数据放入Excel表的一列中,如A1:A80,再用鼠标按以下步骤操作:

    工具数据分析描述统计依描述统计对话框的引导:选定输入区域 、输出单元格,选中汇总统计,置信度,单击确定,即得描述统计的数值输出;如法炮制,工具数据分析直方图依直方图对话框的引导:选定输入区域 、输出单元格,选中图表输出,单击确定即得直方图输出。

    对表二数据的操作与表一相同,所得到的统计分析结果如下:
表一(甲厂)数据的统计分析结果:


表二(乙厂)数据的统计分析结果:


第二,结果的解释:

    1 由直方图直观快速有效地转达如下信息:甲、乙两批产品的批质量及其反映的两个过程质量有明显的差别。甲好于乙,甲接近正常正态分布,乙不然,其5M1E已经改变,过程可能失控;

    2 产品特性(跨棒距)的估计:按置信度95%,由“统计描述”可知甲为35.132±0.002,即在区间35.13035.134间;乙为35.142±0.003,即在区间35.13935.145间。甲的区间包含了期望值35.133,乙远离期望值,按质量损失函数概念,乙厂“合格”产品会给用户和社会带来更多的损失(额外成本)。必须声明,这种估算必须在规定的置信度和精度要求下才有意义!其他参数也是这样。

    3 估算过程能力指数,用统计描述所得到的“平均”、“标准偏差”估算结果如下:
 
Cp
不合格品率 P
Cpk
不合格品率 P
   
1.42
20  (PPM)
1.39
22  (PPM)
 
0.81
1.6  (%)
0.64
3.0  (%)
 
÷
0.57
800
0.46
1364
 

    必须声明,过程能力指数及不合格品率只有在判定过程处在受控情况下,才有意义!
 
结束语:

    直方图属描述性统计的图解方法,与以定量方式揭示、汇总数据分布特性的统计方法相辅相成,它们一般不能正确估计总体特性(除非满足抽样有关的统计假定),通常是定量分析的初始步骤,并经常是使用其它统计方法的第一步。因此,要用它对过程性能作出较可信估计是不合适的。这一点在GB/T 19027-2001 idt ISO/TR 10017:1999 中有明确交待。描述性统计是该标准推荐的12种方法之一。其实本文的真实意图就是初步介绍描述性统计,不过是通过大家都熟悉的直方图引导而已。现将Excel中的描述统计,版存在的一些缺陷校正如下表:
35.131
 
 
 
35.123
1
 
总说明:本描述统计是对样本而言,也适用N>50的有限总体的描述。
35.135
 
 
校正内容简单注释:
35.143
平均
35.132
均值
35.143
标准误差
0.001
是抽样误差,即统计量——样本均值变异的测度。
35.147
中值
35.132
中位数
35.116
模式
35.13
众数
35.131
标准偏差
0.0089
标准差
35.142
样本方差
8E-05
方差
35.124
峰值
-0.484
峰度(与GB/T 4882 idt ISO 5479不一样,经与n有关变换就一致)
35.127
偏斜度
0.1078
偏度(与GB/T 4882 idt ISO 5479不一样,经与n有关变换就一致)
35.119
区域
0.04
极差
35.118
最小值
35.112
 
35.125
最大值
35.152
 
35.127
求和
2810.6
35.116
计数
80
样本量(或称样本大小)  n
35.128
最大(2)
35.151
第二个最大值(可有第三、第四……由你选)
35.130
最小(2)
35.116
第二个最小值(可有第三、第四……由你选)
35.134
置信度(95.0%)
0.002
置信度95%的置信区间半宽度,或精度或扩展不确定度U95(或Up)。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。