正态分布N (μ,σ)参数区间估计
允许μ为任意的实数,σ为任意的正实数。
基于Wolfram Mathematica ,给出了正态分布N (μ,σ)抽样定理,从而得到参数μ,σ2,σ的区间估计。
在σ已知和未知情形下,通过均值分布、中位值分布、卡方分布三种方法估计总体均值μ,区间长度均值分布最短,卡方分布次之,中位值分布最长,但当样本量n 较大时,区间长度趋于接近。
在μ已知和未知情形下,通过卡方分布可以估计总体方差的置信区间,通过卡分布、卡方分布可以估计总体标准差的置信区间。
最后给出不同情形下不同方法的MMA 程序及运行结果。
抽样分布定理
引理1:X  Ν(μ,σ)⇔
X -μσ
Ν 0,1 .转换分布
TransformedDistribution
X -μσ
,X  正态分布
NormalDistribution [μ,σ]
NormalDistribution [0,1]
转换分布
TransformedDistribution [μ+X σ,X  正态分布
NormalDistribution [],假设
Assumptions →σ>0]
NormalDistribution [μ,σ]引理2:X  χ(ν)⇔X 2 χ2(ν).
转换分布
TransformedDistribution  X 2,X  卡分布
ChiDistribution [ν]
ChiSquareDistribution [ν]
转换分布
TransformedDistribution  X ,X  卡方分布
ChiSquareDistribution [ν]
ChiDistribution [ν]
引理3:X  Ν 0,1 ,Y  χ2(n )⇒X
t (n ).
=转换分布
TransformedDistribution
X
,
{X  正态分布
NormalDistribution [],Y  卡方分布
ChiSquareDistribution [n ]} ;
概率密度函数PDF [ ,x ]==⋯
PDF [学生t 分布
StudentTDistribution [n ],x ]//幂展开
PowerExpand //完全简化
FullSimplify [#,n >0&&x ≠0]&True
定理1:X i  Ν(μ,σ)⇒X -
Νμ,
σn
X -
-μσ
n
Ν 0,1 .
CharacteristicFunction  NormalDistribution [μ,σ],t n
n
;
特征函数
CharacteristicFunction  正态分布
NormalDistribution  μ,
σn
,t  ;
%⩵%%//完全简化
FullSimplify [#,n >0&&n ∈整数域
Integers ]&
True
定理2:X i  Ν(μ,σ)⇒ i =1
n
X i -μσ
2
=
∑i =1n (X i -μ)
2
σ2
χ2
(n )
σ
χ(n ).
转换分布
TransformedDistribution
X [i ]-μ
σ
,X [i ] 正态分布
NormalDistribution [μ,σ]
NormalDistribution [0,1]n =7;
=转换分布
TransformedDistribution  i =1n
Y [i ]2,
数组
Array [Y,n ] 联合分布
ProductDistribution [{正态分布
NormalDistribution [],n }]
ChiSquareDistribution [7]定理3:X i  Ν(μ,σ)⇒
(n -1)S 2
σ
2
χ2 n -1
σ
χ n -1 .
令Y i =X i -μσ
,则
(n -1)S 2
σ2
=
i =1n
2
=
i =1n
-
= i =1
n
Y i -Y  2
= i =1
n
Y i 2-2Y Y i +Y 2
= i =1
n
Y i 2
-2Y  i =1
n
Y i +n Y 2
= i =1
n
Y i 2-n Y 2
χ2
n -1 ⇒
σ
χ n -1 .
2    正态分布\\正态分布统计分析\\正态分布参数区间估计.nb
n =n0=35;
=转换分布
TransformedDistribution  i =1n
Y [i ]2
-1n
i =1
n
Y [i ]
2
,
数组
Array [Y,n ] 联合分布ProductDistribution [{正态分布
NormalDistribution [],n }] ;
Block  {n =n0},显示
Show  直方图
Histogram  伪随机变数
RandomVariate  ,2×106 ,500,"概率密度函数
PDF" ,
绘图
Plot [⋯
PDF [卡方分布
ChiSquareDistribution [n -1],x ],{x,5,65},绘图样式
PlotStyle →粗
Thick ]
定理4:X i  Ν(μ,σ)⇒
X -
-μS
n
t  n -1 .
根据定理1,得X i
Ν(μ,σ)⇒
X -
-μσ
n
Ν 0,1 ,根据定理3,得
(n -1)S 2
σ2
χ2 n -1 ,
根据引理3,
X -
-μσ
n
=
X -
-μS
n
t  n -1 .
定理5:F X
n +1
2
=正则化的不完全贝塔函数
BetaRegularized
1
2补余误差函数Erfc
-x +μ
2σ ,
1+n
2
,1+n 2
,n =2k +1.
次序分布
OrderDistribution  {正态分布
NormalDistribution [μ,σ],n },
n +12
;
累积分布函数
CDF [%,x ]//完全简化
FullSimplify
BetaRegularized  12Erfc ,1+n 2,1+n 2
推论:μ=x +
2σ反互补误差函数
InverseErfc  2正规化不完全贝塔函数的逆
InverseBetaRegularized  q,
1+n 2
,
1+n 2
.
In[2]:=
解方程Solve  正则化的不完全贝塔函数
BetaRegularized
1
2补余误差函数Erfc
-x +μ
2σ ,
1+n 2
,
1+n 2
⩵q,μ
Out[2]=
μ→x +
2σInverseErfc  2InverseBetaRegularized  q,1+n 2,1+n 2
定理6:-2 i =1n
对数
Log
12
补余误差函数Erfc
-X  i  +μ
2
σ
χ2 2n  .
正态分布\\正态分布统计分析\\正态分布参数区间估计.nb
3
In[5]:=
转换分布
TransformedDistribution  -2对数
Log
12
补余误差函数Erfc
-X +μ
,X  正态分布
NormalDistribution [μ,σ] ;
概率密度函数
PDF [%,x ]⩵⋯PDF [卡方分布ChiSquareDistribution [2],x ]//完全简化
FullSimplify [#,x >0]&
Out[6]=
True
**参数区间估计**In[7]:=
需要
Needs ["HypothesisTesting`"]
μ0=20;σ0=3;
X =伪随机变数RandomVariate [正态分布NormalDistribution [μ0,σ0],10001];
n =长度
Length [X ];S =标准偏差
StandardDeviation [X ];α=0.01;"参数的极大似然估计:"清除
Clear [μ,σ]
{μ1,σ1}={μ,σ}/.求分布参数
FindDistributionParameters [X,正态分布
NormalDistribution [μ,σ]]
"一、总体均值μ的区间估计""(一)均值分布U =X -
-μσ
n
N(0,1)——σ已知"
σ=σ0;Sw =σ
n ;m =平均值
Mean [X ];
"1.计算法"
Q =分位数
Quantile  正态分布
NormalDistribution [0,1],1-α 2 ;
{m -Sw Q,m +Sw Q }
"2.MeanCI"
MeanCI  X,KnownVariance →σ2,置信级别
ConfidenceLevel →1-α
"3.NormalCI"
NormalCI [m,Sw ,置信级别
ConfidenceLevel →1-α]
"区间长度:"L =2Sw Q
"相对区间长度:"r =L /m "(二)均值分布T =
X -μS
n
t (n -1)——σ未知"
"1.计算法"
Sw =S  n ;m =平均值
Mean [X ];
Q =分位数
Quantile  学生t 分布
StudentTDistribution [n -1],1-α 2 ;
{m -Sw Q,m +Sw Q }
4    正态分布\\正态分布统计分析\\正态分布参数区间估计.nb
"2.MeanCI"
MeanCI [X,KnownVariance →无
None,置信级别
ConfidenceLevel →1-α]
正则化统计"3.StudentTCI"
StudentTCI [m ,Sw ,n -2,置信级别
ConfidenceLevel →1-α]
"区间长度:"L =2Sw Q
"相对区间长度:"r =L /m
"(三)均值近似分布U =X -
-μσ
n
~N[0,1]——σ未知"
"1.计算法"
σ=σ1;Sw =σ
n ;m =平均值
Mean [X ];
Q =分位数
Quantile  正态分布
NormalDistribution [0,1],1-α 2 ;
{m -Sw Q,m +Sw Q }
"2.MeanCI"
MeanCI  X,KnownVariance →σ12,置信级别
ConfidenceLevel →1-α
"3.NormalCI"
NormalCI [m,Sw ,置信级别
ConfidenceLevel →1-α]
"区间长度:"L =2Sw Q
"相对区间长度:"r =L /m
"(四)中位值分布F X
n +12
=正则化的不完全贝⋯BetaRegularized [12补余误差函数
Erfc [-x +μ2σ],1+n 2,1+n
2],n =2k +1——σ已知""1.等尾区间:"
σ=σ0;x =中位数
Median [X ];
μL =x +
2σ反互补误差函数
InverseErfc  2正规化不完全贝塔函数的逆
InverseBetaRegularized  1-α 2,
1+n 2,
1+n 2
;
μU =x +
2σ反互补误差函数
InverseErfc  2正规化不完全贝塔函数的逆
InverseBetaRegularized  α 2,
1+n 2
,
1+n 2
;
{μL,μU }
"等尾区间长度:"L =μU -μL
"相对区间长度:"
r =
2L μU +μL "(五)中位值分布F X
n +1
2
=正则化的不完全贝⋯BetaRegularized [12补余误差函数
Erfc [-x +μ2σ ],1+n 2,1+n
2],n =2k +1——σ未知""1.等尾区间:"
σ=σ1;x =中位数
Median [X ];
正态分布\\正态分布统计分析\\正态分布参数区间估计.nb
5

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。