第三章 正态分布
一、教学大纲要求
(一) 掌握内容
1.正态分布的概念和特征
(1)正态分布的概念和两个参数;
(2)正态曲线下面积分布规律。
2.标准正态分布
标准正态分布的概念和标准化变换。
3.正态分布的应用
(1)估计频数分布;
(2)制定参考值范围。
(二) 熟悉内容
标准正态分布表。
(三) 了解内容
1.利用正态分布进行质量控制
2.正态分布是许多统计方法的基础
二、教学内容精要
(一)正态分布
1.正态分布
若的密度函数(频率曲线)为正态函数(曲线)
(3-1)
则称服从正态分布,记号~。其中、是两个不确定常数,是正态分布的参数,不同的、不同的对应不同的正态分布。
正态曲线呈钟型,两头低,中间高,左右对称,曲线与横轴间的面积总等于1。
2.正态分布的特征
服从正态分布的变量的频数分布由、完全决定。
(1)是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以为对称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于。
(2)描述正态分布资料数据分布的离散程度,越大,数据分布越分散,越小,数据分布越集中。也称为是正态分布的形状参数,越大,曲线越扁平,反之,越小,曲线越瘦高。
(二)标准正态分布
1.标准正态分布是一种特殊的正态分布,标准正态分布的, ,通常用(或Z)表示服从标准正态分布的变量,记为~N(0,)。
2.标准化变换:,此变换有特性:若服从正态分布,则就服从标准正态分布,故该变换被称为标准化变换。
3. 标准正态分布表
标准正态分布表中列出了标准正态曲线下从-∞到范围内的面积比例。
(三)正态曲线下面积分布
1.实际工作中,正态曲线下横轴上一定区间的面积反映该区间的例数占总例数的百分比,或变量值落在该区间的概率(概率分布)。不同范围内正态曲线下的面积可用公式3-2计算。
(3-2)
。
2.几个重要的面积比例
轴与正态曲线之间的面积恒等于1。正态曲线下,横轴区间内的面积为68.27%,横轴区间内的面积为90.00%,横轴区间内的面积为95.00%,横轴区间内的面积为99.00%。
(四)正态分布的应用
某些医学现象,如同质体的身高、红细胞数、血红蛋白量,以及实验中的随机误差,呈现为正态或近似正态分布;有些指标(变量)虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理。其中经对数转换后服从正态分布的指标,被称为服从对数正态分布。
1. 估计频数分布 一个服从正态分布的变量只要知道其均数与标准差就可根据公式(3-2)估计任意取值范围内频数比例。
2. 制定参考值范围
(1)正态分布法 适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。
(2)百分位数法 常用于偏态分布的指标。表3-1中两种方法的单双侧界值都应熟练掌握。
表3-1 常用参考值范围的制定
概率 (%) | 正态分布法 | 百分位数法 | ||||||
双侧 | 单 侧 | 双侧 | 单侧 | |||||
下 限 上 限 | 下 限 上 限 | |||||||
90 | ||||||||
95 | ||||||||
99 | ||||||||
3. 质量控制:为了控制实验中的测量(或实验)误差,常以作为上、下警戒值,以作为上、下控制值。这样做的依据是:正常情况下测量(或实验)误差服从正态分布。
4. 正态分布是许多统计方法的理论基础。检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。
三、典型试题分析
1.正态曲线下、横轴上,从均数到的面积为( )。
A.95% B.50% C.97.5% D.不能确定(与标准差的大小有关)
答案:B
[评析] 本题考点:正态分布的对称性
因为无论,取什么值,正态曲线与横轴间的面积总等于1,又正态曲线以为对称轴呈对称分布,所以左右两侧面积相等,各为50%。
2.若X服从以,为均数和标准差的正态分布,则X的第95百分位数等于( )。
A. B. C. D.
答案:B
[评析] 本题考点:正态分布的对称性和面积分布规律
正态分布曲线下范围内面积占90%,则外的面积为10%,又据正态分布的对称性得,曲线下横轴上小于等于范围的面积为95%,故X的第95百分位数等于。
3.若正常成人的血铅含量X 近似服从对数正态分布,拟用300名正常人血铅值确定99%参考值范围,最好采用公式( )计算。(其中Y=logX)
A. B.
C. D.
答案:D
[评析] 本题考点:对数正态分布资料应用正态分布法制定参考值范围
根据题意,正常成人的血铅含量X 近似对数正态分布,则变量X 经对数转换后所得新变量Y应近似服从正态分布,因此可以应用正态分布法估计Y 的99%参考值范围,再求反对数即得正常成人血铅含量X 的99%参考值范围。因血铅含量仅过大为异常,故相应的参考值范围应是只有上限的单侧范围。正态分布法99%范围单侧上限值是均数+2.33倍标准差。
4.正常成年男子红细胞计数近似正态分布,95%参考值范围为3.60~5.84。若一名成年男子测得红细胞计数为3.10,则医生判断该男子一定有病。
[评析] 本题考点:参考值范围的涵义
该成年男子不一定有病。因为参考值范围是指绝大多数正常人的指标值范围,故不在此范围内的对象也可能是正常人。
5.假定正常成年女性红细胞数近似服从均值为4.18,标准差为0.29的正态分布。令X代表随机抽取的一名正常成年女性的红细胞数,求:
(1) 变量X落在区间(4.00,4.50)内的概率;
(2) 正常成年女性的红细胞数95%参考值范围。
[评析] 本题考点:正态分布的应用
(1)根据题意,变量X近似服从正态分布,求变量X落在区间(4.00,4.50)内的概率,即是求此区间内正态曲线下的面积问题,因此,可以把变量X进行标准化变换后,借助标准正态分布表求其面积,具体做法如下:
变量落在区间(4.00,4.50)内的概率为0.5967。
(2)问题属于求某个指标的参考值范围问题,因为正常成年女性红细胞数近似服从正态分布,可以直接用正态分布法求参考值范围,又因该指标过高、过低都不正常,所以应求双侧参考值范围,具体做法如下:
下限为:
上限为:
95%的正常成年女性红细胞数所在的范围是。
6.调查得成都市1979年996名女学生月经初潮年龄的分布如下,本资料宜用何法确定其双侧99%参考值范围?试估计之。
年岁 10~ 11~ 12~ 13~ 14~ 15~ 16~ 17~ 18~ 19~ 20~ 合计
人数 7 44 153 244 269 191 61 16 8 1 2 996
累计频率% 0.7 5.1 20.5 45.0 72.0 91.2 97.3 98.9 99.7 99.8 100.0
[评析] 本题考点:参考值范围的制定
解:本题所给资料明显属于偏态分布资料,所以宜用百分位数法估计其参考值范围。又因此指标过大、过小均属异常,故此参考值范围应是双侧范围。
(1)求 首先要到第0.5百分位数所在组,根据累计频率第0.5百分位数在第1组,因此得=0,, =7, =1
代入第二章百分位数的计算公式得: =10+=10.71(岁)
(2)求P95.5 先求第95.5百分位数所在组为“18~”组,因此得
=985,, =8, =1
代入计算公式得:P95.5 =18+=18.25(岁)
成都市女学生月经初潮年龄的双侧99%参考值范围是10.71~18.25(岁)。
四、习 题
(一)单项选择题
1.标准正态分布的均数与标准差分别为( )。
A.0与1 B.1与0 C.0与0 D.1与1
2.正态分布有两个参数与,( )相应的正态曲线的形状越扁平。
A.越大 B.越小 C.越大 D.越小
3.3岁男童对数正态分布是一种( )分布。
A.正态 B.近似正态 C.左偏态 D.右偏态
4.正态曲线下、横轴上,从均数-1.96倍标准差到均数的面积为( )。
A.95% B.45% C.97.5% D.47.5%
5.标准正态分布曲线下中间90%的面积所对应的横轴尺度的范围是( )。
A.-1.64到+1.64 B.到+1.64
C.到+1.28 D.-1.28到+1.28
(二)名词解释
1.正态曲线
2.正态分布
3. 标准正态分布
4. 标准化变换
(三)简答题
1.简述医学中参考值范围的涵义及制定参考值范围的一般步骤。
2.正态分布、标准正态分布与对数正态分布的联系与区别。
3.对称分布在“ 1.96标准差”的范围内,也包括95%的观察值吗?
(四)计算题
1.假定 5岁男童的体重服从正态分布,平均体重=19.5(kg),标准差=2.3(kg)。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论