数学应用软件大型实验实验报告
实验序号: 日期:2012 年 6 月 20日
班级 | 信计100班 | 姓名 | 学号 | 201020310216 | |
实验 名称 | 中心极限定理的理论证明 | ||||
问题背景描述: 图中每一个黑点表示钉在板上的一颗钉子.每排钉子等距排列,下一排的每个钉子恰在上一排两相邻钉子之间.假设有排钉子,从入口中处放入小圆珠.由于钉板斜放,珠子在下落过程中碰到钉子后以的概率滚向左边,也以的概率滚向右边.如果较大,可以看到许多珠子从处滚到钉板底端的格子的情形如图所示,堆成的曲线近似于正态分布. 如果定义:当第次碰到钉子后滚向右边,令;当第次碰到钉子后滚向左边,令.则是独立的,且那么由图形知小珠最后的位置的分布接近正态.可以想象,当越来越大时接近程度越好.由于时,.因此,显然应考虑的是的极限分布.历史上德莫佛第一个证明了二项分布的极限是正态分布.研究极限分布为正态分布的极限定理称为中心极限定理. 图一: 中心极限定律揭示了正态分布的意义:在实际问题中,常常需要考虑许多随机因素所产生的总的影响,如测量误差、炮弹射击的落点与目标的偏差等。同时许多观察表明,若一个随机变量是由大量相关独立的随机因素的综合影响所构成的,而其中每一个随机因素的单独作用是微小的,则这样的随机变量通常服从或近似服从正态分布。这种现象就是中心极限定理产生的客观背景。 | |||||
实验目的: 中心极限定理的核心内容是只要n足够大,便可以把独立同分布的随机变量和的标准化当作正态变量,所以可以利用它解决很多实际问题,同时这还有助于解释为什么很多自然体的经验频率呈现出钟形曲线这一值得注意的事实,从而正态分布成为概率论中最重要的分布,这就奠定了中心极限定理的首要功绩。本次试验就是用具体的实验来进行验证大量随机变量的和近似服从正态分布,用100个(0,1)上的独立均匀分布的和的分布与它近似的正态分布进行比较,作图来验证中心极限定理。又再1000个数来比较两个图来验证中心极限定理。 | |||||
实验原理与数学模型: 实验原理: 中心极限定律,其内容是:当N足够大的时候,N个具有方差和均值的独立随机变量的代数和服从正态分布率。也就是说不管这N个随机变量原来服从什么分布率,只要他们具有方差和均值,他们的代数和总是近似服从正态分布,N越大,近似程度越高。 中心定理之一是林德贝格-勒维中心极限定理,它的内容是: 设是一列独立同分布的随机变量,记 =,,, 则中心极限定理成立,即 所以由定理的条件知,它也被称为同分布的中心极限定理,同时可知德莫佛-拉普拉斯中心极限定理是它的一种特殊情形。 中心极限定理的第二个就是德莫佛-拉普拉斯中心极限定理是历史上最早得到的中心极限问题的研究成果。它的内容是: 设为标准正态分布的分布函数,对,有 其中。这个定理可以简单地说成二项分布渐近正态分布,因此当n充分大时,可以利用该定理来计算二项分布的概率。 normrnd函数用法 正态分布(normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布,记为:则其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。因其曲线呈钟形,因此人们又经常称之为钟形曲线。我们通常所说的标准正态分布是μ = 0,σ = 1的正态分布。正态分布函数表达式。 均匀分布就是平均分布比如在区间(1,5)可以去任何值,就表示在(1,5)的取值概率是四分之一,也就是在该区间是均匀分布。 数学模型: 为了证明在n很大时,独立均匀分布的和的分布近似服从正态分布,可以分别构造独立均匀分布的同分布函数和正态分布函数,将取符合均匀分布的100个数,然后绘制图,观察两者的拟合度。 | |||||
实验所用软件及版本: matlab7.0.1 | |||||
主要内容(要点): 方法一: 一:用均匀分布函数生成随机数; 二:利用均匀分布的和的函数命令normpdf画出均匀分布; 三:利用均匀分布函数产生的100个数,计算出均值,标准差。 四:利用期望值和方差,运用正态分布函数normrnd产生正态分布随机数。 五:计算出正态分布产生的100个数的均值还有标准差。 六:利用正态分布函数normcdf画出正态分布图。 七:在图中比较两幅图的图形,得出结论。 方法二: 一:用rand生成区间(0,1)上均匀分布的100个随机数 二:用林德贝格-勒维中心极限定理内容,制作文件,列出程序,计算出符合 均匀分布和的分布的100个数,并画出图形。 三:利用rand所产生的100个数算出均值,标准差。 四:利用期望值和方差,运用正态分布函数normrnd产生正态分布随机数。 五:计算出正态分布产生的100个数的期望值还有方差。 六:利用求正态分布的分布函数值normcdf的命令,画出正态分布图。 七:比较均匀分布的和的分布的图和正态分布的图作比较,得出结论。 方法三: 一:利用均匀分布的和的分布和正态分布的分布函数来证明。 二:在图中画出两个图,比较他们的拟合程度。 | |||||
实验过程记录(含:基本步骤、主要程序清单及异常情况记录等): 问题一:用100个(0,1)上的独立均匀分布的和的分布与它近似的正态分布进行比较来进行验证大量独立随机变量的和近似服从正态分布。 方法一: r=unifrnd(0,1,1,100)%产生100个均匀分布的和的分布 r = Columns 1 through 9 0.5102 0.7140 0.5152 0.6059 0.9667 0.8221 0.3178 0.5877 0.1302 Columns 10 through 18 0.2544 0.8030 0.6678 0.0136 0.5616 0.4546 0.9049 0.2822 0.0650 Columns 19 through 27 0.4766 0.9837 0.9223 0.5612 0.6523 0.7727 0.1062 0.0011 0.5418 Columns 28 through 36 0.0069 0.4513 0.1957 0.7871 0.6186 0.0155 0.8909 0.7617 0.9070 Columns 37 through 45 0.7586 0.3807 0.3311 0.5041 0.5646 0.7672 0.7799 0.4841 0.8022 Columns 46 through 54 0.4710 0.2028 0.5796 0.6665 0.6768 0.9425 0.7701 0.7374 0.8663 Columns 55 through 63 0.9909 0.5039 0.6291 0.7926 0.4486 0.5244 0.1715 0.1307 0.2188 Columns 64 through 72 0.1055 0.1414 0.4570 0.7881 0.2811 0.2248 0.9089 0.0073 0.5887 Columns 73 through 81 0.5421 0.6535 0.3134 0.2312 0.4161 0.2988 0.6724 0.9383 0.3431 Columns 82 through 90 0.5630 0.1189 0.1690 0.2789 0.5568 0.4856 0.9522 0.2319 0.4787 Columns 91 through 99 0.5265 0.7927 0.1930 0.9096 0.9222 0.0133 0.7675 0.9473 0.8133 Column 100 0.9238 >> um=mean(r)%算出均值 um = 0.5308 >> sigma=std(r)%算出标准差 sigma = 0.2867 >> y=normrnd(mu,sigma,1,100)%产生1*100的正态分布的随机矩阵 y = Columns 1 through 9 -0.1564 0.7578 0.3263 0.5689 0.5421 0.4812 0.1872 0.2035 0.3677 Columns 10 through 18 0.1350 0.1723 0.8972 0.4910 0.1260 0.4632 0.1515 0.0882 0.4002 Columns 19 through 27 0.7484 0.5119 0.6632 0.1402 0.3430 0.3998 0.1272 0.0967 0.7420 Columns 28 through 36 0.4782 0.2901 0.7060 0.5414 0.1912 0.8591 0.5580 0.8990 0.8013 Columns 37 through 45 0.2789 0.1046 0.4541 0.3802 0.2331 0.6177 0.9018 0.3183 0.2322 Columns 46 through 54 0.4044 0.6651 0.2301 0.1306 0.4407 0.4563 0.6142 0.3043 0.4321 Columns 55 through 63 0.3504 0.4523 0.9152 0.3011 0.0887 0.6096 0.2160 0.4853 0.2951 Columns 64 through 72 0.6285 0.6335 0.4166 -0.1140 0.5130 0.9317 0.7670 0.0219 0.4525 Columns 73 through 81 0.2796 0.1813 0.1211 0.5578 0.3519 0.4910 0.3695 0.3417 0.5814 Columns 82 through 90 0.6838 1.0806 0.0859 0.1818 0.7726 0.3633 0.0790 0.5655 0.9204 Columns 91 through 99 0.6780 1.0362 0.6197 1.0096 0.3776 0.1482 0.4145 0.8163 0.1550 Column 100 0.6572 [m,v]=normstat(mu,sigma)%计算100个数的均值和标准差 m = 0.4750 v = 0.0822 x=0:0.01:1;y=normcdf(x,mu,sigam);plot(x,y,'-r')%画出正态分布图 hold on normplot(r)%画出均匀分布的和的分布图 图一:均匀分布的和的分布 由图可以看出,均匀分布的和的分布‘*’所画的线和正态分布‘-’所画的线重合度不高。 纠正: 图二:均匀分布的和的分布 图三:正态分布 结论: 由图二和图三可以看出,100个(0,1)上的独立均匀分布的和的分布与它近似的正态分布的图吻合。当n足够大时,服从均匀分布的和的分布通常服从或近似服从正态分布. 方法二: function y=fun(r)%编作文件 s=0;a=0.5;b=sqrt(1/12); for n=1:100 s=s+r; y=(s-n*a)./(sqrt(n)*b); end r=rand(1,100); normplot(r); legend('均匀分布的和的分布') 图四:均匀分布的和的分布 um=mean(r)%计算出均值 um = 0.5308 >> sigma=std(r)%计算出标准差 sigma = 0.2867 y=normrnd(mu,sigma,1,100)%产生1*100阶正态分布的随机矩阵 y = Columns 1 through 9 -0.1564 0.7578 0.3263 0.5689 0.5421 0.4812 0.1872 0.2035 0.3677 Columns 10 through 18 0.1350 0.1723 0.8972 0.4910 0.1260 0.4632 0.1515 0.0882 0.4002 Columns 19 through 27 0.7484 0.5119 0.6632 0.1402 0.3430 0.3998 0.1272 0.0967 0.7420 Columns 28 through 36 0.4782 0.2901 0.7060 0.5414 0.1912 0.8591 0.5580 0.8990 0.8013 Columns 37 through 45 0.2789 0.1046 0.4541 0.3802 0.2331 0.6177 0.9018 0.3183 0.2322 Columns 46 through 54 0.4044 0.6651 0.2301 0.1306 0.4407 0.4563 0.6142 0.3043 0.4321 Columns 55 through 63 0.3504 0.4523 0.9152 0.3011 0.0887 0.6096 0.2160 0.4853 0.2951 Columns 64 through 72 0.6285 0.6335 0.4166 -0.1140 0.5130 0.9317 0.7670 0.0219 0.4525 Columns 73 through 81 0.2796 0.1813 0.1211 0.5578 0.3519 0.4910 0.3695 0.3417 0.5814 Columns 82 through 90 0.6838 1.0806 0.0859 0.1818 0.7726 0.3633 0.0790 0.5655 0.9204 Columns 91 through 99 0.6780 1.0362 0.6197 1.0096 0.3776 0.1482 0.4145 0.8163 0.1550 Column 100 0.6572 [m,v]=normstat(mu,sigma)%计算出均值和标准差 m = 0.4750 v = 0.0822 x=0:0.01:1;y=normcdf(x,mu,sigam);plot(x,y,'-r')%画出正态分布的图 图五:正态分布 总结: 由图四和图五可以看出,100个(0,1)上的独立均匀分布的和的分布与它近似的正态分布的图吻合。当n足够大时,均匀分布的和的分布通常服从或近似服从正态分布。 方法三: 利用均匀分布的和的分布和正态分布的密度函数来证明 r=unifrnd(0,1,1,100);%生成100个符合均匀分布的和的分布 M=100; mu=100*0.5; sigma=sqrt(100/12); s=sum(r); mu=mean(r);%求随机数的平均值 sigma=std(r);%求均方差 [n,x] =hist (r,mu-5*sigma:sigma:mu+5*sigma); bar(x,n/M/sigma, 'r');%绘制直方图 hold on; h=mu-5*sigma:0.1*sigma:mu+5*sigma; %取100个点 t=exp(-(h-mu).^2/2/sigma^2)/sqrt(2*pi)/sigma;%标准正态分布表达式 plot(h,t,'k')%绘制数值曲线 图六:均匀分布的和的分布与正态分布 总结: 从图中可以看出,100个(0,1)上的独立均匀分布的和的分布与它近似的正态分布的图吻合。当n足够大时,均匀分布的和的分布通常服从或近似服从正态分布. 问题二: 用1000个(0,1)上的独立均匀分布的和的分布与它近似的正态分布进行比较来进行验证大量独立随机变量的和近似服从正态分布。 方法: r=unifrnd(0,1,1,1000);%产生1000符合个均匀分布的数 mu=mean(r)%计算出均值 mu = 0.4967 sigma=std(r)%计算出标准差 sigma = 0.2883 y=normrnd(mu,sigma,1,1000);%产生1*1000阶的符合正态分布的随机矩阵 mu=mean(y)%计算出均值 mu = 0.4837 sigma=std(y)%计算出标准差 sigma = 0.2833 x=0:0.001:1;z=normcdf(x,mu,sigma);plot(x,z,'-r');%画出正态分布的图 legend('正态分布') normplot(r);legend('均匀分布和的分布') 图七:正态分布 normplot(r);%画出均匀分布的图 legend('均匀分布和的分布') 图八:均匀分布的和的分布 总结: 由图七和图八可以看出,1000个(0,1)上的独立均匀分布的和的分布与它近似的正态分布的图吻合。当n足够大时,均匀分布的和的分布通常服从或近似服从正态分布. | |||||
实验结果报告与实验总结: 通过三种方法验证, 当N足够大的时候,N个具有方差和均值的独立均匀分布的和的分布服从正态分布率。N越大,近似程度越高。 | |||||
思考与深入: 以上我们验证了当n足够大并且服从均匀分布,均匀分布的和的分布近似服从正态分布。 那么当n足够大时,100个服从二项分布的随机数,我们也可以通过计算画图来验证。可以画出二项分布的图和正态分布的图,通过观察他们的拟合度,来验证当N足够大的时候,N个具有方差和均值的独立随机变量的代数和服从正态分布率。也就是说不管这N个随机变量原来服从什么分布率,只要他们具有方差和均值,他们的代数和总是近似服从正态分布,N越大,近似程度越高。 综上所诉,我们可以得出结论,大量独立随机变量的和近似服从正态分布。 中心极限定理意义重大,数理统计中的参数(区间)估计、假设检验、抽样调查等;进一步,中心极限定理为数理统计在统计学中的应用铺平了道路,用样本推断总体的关键在于掌握样本特征值的抽样分布,而中心极限定理表明只要样本容量足够地大,得知未知总体的样本特征值就近似服从正态分布。 正态分布在生活中运用也非常广泛,比如在学生的成绩中高分和不及格的都控制在5%以内,正态分布应该是体现在出题的科学性上吧,比如说一项产品的质量服从正态分布,则说明本产品高质量的产品量很高。 比如说在保险业,保险体现了“人人为我,我为人人”的互助思想,它以数理统计为依据。保险中的风险单位是发生一次风险事故可能造成标的物损失的范围,也就是遭受损失的人、场所或事物。风险单位是保险公司确定其能够承担的最高保险责任的计算基础。理想状态下的风险单位应独立同分布,这种现象的意义在于保险人可以据此向每个潜在的被保险人收取同样的保费。同时根据中心极限定理,含有n个风险单位的随机样本的平均损失符合正态分布,这个结论对保险费率的厘定极为重要。 中心极限定理在决策问题很好地运用,在决策问题中,以“集体决策的正确率是否一定大于个体决策的正确率”这一问题为出发点,利用特殊法与一般法并结合中心极限定理否定该说法,可以得出集体决策的正确率大于个体决策的充要条件。 在生产供应需求方面,为了防止商品供过于大于求及尽量满足社会需求度,分别利用中心极限定理可以求出了不同条件下的需求量、生产量及社会需求满意度。 中心极限定理还可以运用于抽样推断、质量检测等方面,中心极限定理很实用,可以解决很多问题。 | |||||
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论