excel概率密度函数公式_正态分布基本概念及Excel实现
正态分布(也称为⾼斯分布)是统计中最常⽤的连续分布。正态分布在统计中⾄关重要,主要有以下三个原因:
商业中常见的许多连续变量的分布与正态分布⾮常相似。
正态分布可⽤于近似各种离散的概率分布。
由于正态分布与中⼼极限定理之间的关系,因此正态分布为其提供了经典统计推断的基础。
正态分布由图经典钟形表⽰。在正态分布中,您可以计算值以⼀定范围或间隔出现的概率。但是,由于将连续变量的概率测量为曲线下的⾯积,因此来⾃连续分布(例如正态分布)的特定值的确切概率为零。例如,时间(以秒为单位)被测量并且不计数。因此,您可以确定⽹络浏览器上视频下载时间在7到10秒之间的概率,或者下载时间在8到9秒之间的概率,或者下载时间在7.99到90秒之间的概率。8.01秒。但是,下载时间恰好为8秒的概率为零。正态分布具有⼏个重要的理论特性
它是对称的,因此其均值和中位数相等。
外观为钟形。
其四分位数间距等于1.33标准偏差。
因此,中间值的50%包含在低于平均值的标准偏差的三分之⼆和⾼于平均值的标准偏差的三分之⼆的范围内。
它具有⽆限范围(-oo
装满10,000瓶软饮料的量 实际上,许多变量的分布与正态分布的理论性质⾮常相似。表中的数据代表最近⼀天装满10.000升1升瓶中的软饮料量。感兴趣的连续变量,即软饮料的填充量,可以通过正态分布来近似。10,000瓶中的软饮料量的测量值在1.05⾄1.055升之间,并围绕该组对称分布,形成钟形图案。图显⽰了相对频率直⽅图和多边形,⽤于填充10,000个瓶⼦的数量分布。
10,000瓶软饮料中的相对频率直⽅图 对于这些数据,正态分布的前三个理论特性得到了近似满⾜。但是,第四范围不是⽆限的。装满瓶⼦的数量不能为零或⼩于0,也不能装满超出其容量的瓶⼦。从表中可以看到,每10,000个装满的瓶⼦中只有48个预期含有1.08
升或更⾼,并且相等的数字预计少于1.025升。
符号f(X)⽤于表⽰概率密度函数。正态分布的概率密度函数在公式中给出。
e =⽤2.71828近似的数学常数
π=⽤3.14159近似的数学常数
μ =平均值
σ =标准偏差
X =连续变量的任何值,其中-∞
尽 管公式看起来很复杂,但由于e和是数学常数,所以随机变量X的概率仅取决 于正态分布的两个参数-平均值μ和标准偏差σ。 每次指定μ和σ的特定值时,都会⽣成不同的正态概率分布。 图说明了这⼀原理。
标记为A和B的分布具有相同的平均值(μ),但具有不同的标准偏差。 分布A和C的标准偏差(σ)相同,但均值不同。 分布B和C对于μ和σ具有不同的值。 计算正态概率要计算正态概率,⾸先需要使⽤公式
所⽰的转换公式将正态分布变量X转换为标准化正态变量Z。 应⽤此公式可让您在正态概率表中查值,并避免了公式(1)可能需要的繁琐⽽复杂的计算。转换公式将计算出⼀个Z值,该值表⽰标准值单
位中的x值与平均值u的差。变量X具有平均值u和标准偏差σ,⽽标准化变量Z
始终具有平均值u = 0和标准偏差 σ = 1。然后,您可以使⽤表(累积标准化正态分布)来确定概率。例如,过去的数据表明下载视频的时间是正态分布的,平均时间为7秒,标准差为 σ = 2秒。从图中可以看到,
每个度量X都有⼀个对应的标准化度量Z,它是根据公式(2)(转换公式)计算得出的。因此,9秒的下载时间等于平均数之上的1个标准单位(1个标准偏差),因为Z =(9-7) /2= 11秒的下载时间等于-3个标准化单位(3个标准差)低于均值,因为Z =(1-7)/2= -3在上图中,标准偏差是测量单位。换句话说,9秒的时
间⽐7秒的平均时间⾼2秒(1个标准差)或更慢。同样,1秒的时间⽐平均时间低6秒(3个标准差)或更快。为进⼀步说明转换公式,假设另⼀个⽹站对于正态分布的视频具有下载时间,平均时间为= 4秒,标准偏差 = 1秒。下图显⽰了这种分布。
将这些结果与MyTVLab⽹站的结果进⾏⽐较,您会发现5秒的下载时间⽐平均下载时间⾼出1个标准差,因为Z =(5-4)/1= +1
1秒的时间⽐平均下载时间低3个标准偏差,因为
Z = (1-4)/1= -3计算出Z值后,您可以使⽤累积标准化正态分布中的值表(查正态概率。假设您想查MyTVLab⽹站的下载时间少于9秒。假设平均u = 7秒,标准偏差σ = 2秒,则将X = 9转换为标准单位。导致Z值为+1.00使⽤此值,您可以使⽤表查法线下的累积⾯积,该⾯积⼩于Z = +1.00(在其左侧)。要读取⼩于Z = +1.00的曲线下的概率或⾯积,请向下扫描表中的Z列,直到在1.0的Zrow中到感兴趣的Z值(⼗分之⼀)。接下来,阅读该⾏,直到与包含Z值的第100位的列相交为⽌。因此,在表的主体中,Z = 1.00的概率对应于⾏Z = 1.0与列Z = .00的交集。下表显⽰了该交集。
在交叉点处列出的概率为0.8413,这意味着下载时间少于9秒的可能性为84.13%。下图以图形⽅式显⽰了这种可能性。
从累积标准化正态分布确定⼩于Z的⾯积
excel中值公式函数但是,对于其他⽹站,您看到5秒的时间⽐4秒的平均时间⾼1个标准化单位。因此,下载时间少于5秒的概率也为0.8413。下图显⽰,不管正态分布变量的均值u和标准偏差σ如何,公式(2)都可以将X值转换为Z值。
演⽰两条法线下对应累积部分的⽐例转换
⽰例1
求P(X> 9)
MyTVLab⽹站的视频下载时间超过9秒的概率是多少?
解:下载时间少于9秒的概率为0.8413。因此,下载时间将超过9秒的概率是1-0.8413 = 0.1587。下图说明了此结果。
例2,
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论