0引言
数理统计是理工科院校数学与统计专业的必修专业课,是一门从随机数据中获取信息、发现规律并指导决策的科学。数理统计以概率论为基础,研究大量随机现象的统计规律,其主要内容有参数估计、假设检验、方差分析和回归分析。由于计算机的应用,数理统计在自然科学、工程技术、管理科学及人文社会科学中的应用越来越广泛和深入,而传统的“理论+推导+例题讲解”的上课方式已经无法满足数理统计的教学要求。随着大数据时代的到来,计算机技术的普及和各种统计软件的广泛应用,减少数理统计教学中复杂理论知识的讲解和繁复的证明,着重介绍模型的应用背景和应用实例,并介绍一款统计软件工具,力争每个实例都能以算法实现,就显得尤为重要了。
统计软件R是以一种S语言的扩展实现作图和数据分析的系统,是一个优秀的统计计算和可视化的软件。相对于目前广泛使用的商业统计SAS、SPSS软件而言,统计软件R最大的特点是:开源,版本更新快,有大量的用于各种任务的库。尤其是有许多使用统计软件R的各领域的学者源源不断地提供最新和最前沿的开源软件包可供使用。本文着重介绍统计软件R在数理统计教学中的探索与应用。
1统计软件R
1.1R软件的下载及安装
orientation中文
用户可根据自己计算机所用的操作系统,从R或其遍及各国的CRAN镜像站点选择对应的版本下载。目前R最新版文件命名形式已统一为-,直接运行,并选择安装目录及选装内容即可。R是一种解释型语言,输入的指令可以直接被执行。在提示符后可以以交互式的行命令方式一个个地输入指令,也可以创建一个脚本文件并以此方式运行所写的脚本文件。许多扩展的、新的开发包可以在“程序包”选单选择安装加载。
1.2与统计计算有关的常用函数
常用函数:max(),min(),which.max(),which.min (),length(),sum(),prod(),mean(),median(),var(), cov(),cor(),std(),quantile(),summary(),rev(),sort (),order(),rank()常与统计函数联用的两个重要的函数:apply(),sweep()
表1R中常用的分布函数
R软件在统计分析时为处理方便准确,提供了更概率分布R中对应的名字参数
β分布beta shapel1,shapel2,ncp
二项分布binom size,prob
卡方分布chisq df,ncp
指数分布exp Rate
F分布f df1,df2,ncp
T分布t df,ncp
正态分布norm mean,sd
均匀分布unif min,max
泊松分布pois Lambda
统计软件R在数理统计教学中的探索与应用
王丽丽赵娟
(合肥学院<;人工智能与大数据学院数学与统计系,安徽合肥230601)
【摘要】本文介绍了统计软件R在数理统计教学中的应用及统计软件R的可视化和统计计算的强大功能,列举了其在数理统计教学中的应用案例。并探讨了R对数理统计教学带来的积极作用。
【关键词】数理统计;统计软件R;可视化;统计推断;应用
中图分类号:O21-4;G642文献标识码:A DOI:10.19694/jki.issn2095-2457.2020.36.50
※基金项目:安徽省质量工程项目(2019jyxm0380);合肥学院质量工程项目(2019hfmkjc17);高等学校省级质量工程教学研究项目(2017jyxm0410);安徽省精品课程(2017kfk087);安徽省运筹学高水平教学团队(2018jxtd049);校级教研项目(2018hfjyxm44);校级教研项目(2018hfjyxm69)。
作者简介:王丽丽(1982—),女,安徽蚌埠人,副教授,硕士,研究方向为概率极限理论与统计模型。
赵娟(1980—),女,安徽宿州人,教授,硕士,研究方向为预测与决策。
128
Science&Technology Vision
科技视界
Science &Technology Vision 科技视界
gulumcan
为细致的有关概率函数。这些函数包括四类:d (密度函数),p (分布函数),q (分位数函数),r (随机数生成函数)。
2R 在数理统计教学中的探索与应用举例2.1
抽样分布中的应用实例及R 语言实现
数理统计第一章主要介绍基本概念理论,包括常见统计量如样本均值、方差、样本矩的计算;散点图、饼图、直方图、盒装图、茎叶图等的绘制;抽样分布、经验分布函数等的直观展示。R 具有便捷的数据可视化系统,除了常规的图形之外,还可作出美观、个性化的图案,如小提琴图,脸谱图等。在上课过程中,结合学生参加全国大学生市场调查与分析大赛的题目和调查问卷收集的数据,作出脸谱图,引起了学生极大的兴趣。附R-语言程序及执行结果如下:
upscale=c(2922,2436,2610,2549,2445)effective=c(1855,2014,2985,2578,2884)GRAS=c(2878,2769,2348,2235,2865)
intellect=c(2423,2183,2928,2868,2315)convenient=c(2913,2465,2534,1947,2944)name=c(“盒马生鲜”,”正大优鲜”,”永辉超级物种”,”京东生鲜”,”每日优鲜”)class=data.frame(upscale,effective,GRAS,intellect,convenient,row.names=name)
library(aplpack)
faces(pe =1,nrow.plot=2,ncol.plot=3,
main=”根据高端、性价比、安全可靠、智能方便绘制的脸谱图”,plot.faces=TRUE)
图1脸谱图
在脸谱图中,脸的长度、宽度、脸型及嘴的高度、宽度分别代表着品牌的高端、性价比高、安全可靠、智能及方便。
2.2
参数估计中的应用实例及R 语言实现
数理统计第二章主要介绍的是参数估计,包括点估计中的矩估计和极大似然估计、区间估计、估计量的评价标准和克拉默-拉奥不等式。
例:已知某人分别搭乘公共汽车和地铁上班所需的时间数据,假设其服从正态分布。假设分别有65分钟和58分钟可用,问应选取哪种交通工具上班?
解:输入数据,R-语言程序及计算结果如下:>x1<-c(46,45,88,72,40,50,55,58,62,46,65)>x2<-c(61,58,55,
65,59,68,69,59,60,63,57,67)>x1.bar<-mean(x1);x1.bar >x1.sigm <-sqrt (var (x1)*(length (x1)-1)/length (x1));x1.sigm >x2.bar<-mean(x2);x2.bar >x2.sigm <-sd (x2)*sqrt ((length (x2)-1)/length (x2));x2.sigm
>for(xx in c(65,58))
+cat(“时间限制”,xx,”时P(x<=”,xx,”)的估计:
乘公汽”,pnorm ((xx-x1.bar)/x1.sigm),”;乘地铁”,pnorm((xx-x2.bar)/x2.sigm),”\n”时间限制65时P(x<=65)的估计:乘公汽0.7233102;
乘地铁0.7699699
时间限制58时P(x<=58)的估计:乘公汽0.5295298;乘地铁0.1969957
京东python入门教程所以,假设有65分钟可用,应乘地铁上班;假设有58分钟可用,应乘公交车上班。2.3
假设检验中的应用实例及R 语言实现
数理统计第三章主要介绍的是假设检验。假设检验是统计推断的一个重要方面,包括参数假设检验和非参数假设检验。
例:厂家A、B、C 是生产某一产品的知名企业,在过去的一年里,它们的市场占有率分别是15%、35%、25%。厂家A 为了提高市场占有率,对该产品进行了改进。现进行抽样调查,对销售出的200件调查的结果如表2所示:
表2厂商销售量数据
依据调查数据对该产品的市场占有率是否发生变化做出判断,以便为厂家A 下一步的决策提供依据(显著性水平0.05)
解:设p 1,p 2,p 3分别为厂家A、B、C 的市场占有
生产厂家A B C 其他销售件数
怎样做网站42
67
49
sqlserver2008如何连接到服务器
42
129
率,现进行非参数假设检验:H0∶p1=0.15,p2=0.35,p3= 0.25R-语言程序及计算结果如下:
>x<-c(42,67,49,42)
>pd<-c(0.15,0.35,0.25,0.25)
&st(x,p=pd)
编辑器开发
Chi-squared test for given probabilities Data:x
X-squared=6.2286,df=3,p-value=0.101
所以,不拒绝H0,即现有数据不拒绝“市场占有率未变”这一论断。
2.4回归分析中的应用实例及R语言实现
数理统计第四章介绍的是两种非常重要的统计方法:方差分析和回归分析。
例:某企业逐年用于技术改造资金x(单位:万元)与产品销售利润的增加额y(单位:万元)资料如下:表3某企业技术改造投入与销售利润数据
若使利润增加额以95%的概率在100万~150万元之间,利用一元线性回归预测,技术改造资金应在何范围内?
解:①建立一元回归方程;②预测。R-语言程序及计算结果如下:
>x<-c(15,18,24,30,35,39,44,48,50)
>y<-c(48,57,70,86,129,124,131,136,153) >da<-data.fframe(x,y)
&<-lm(y~.,da)
>da.sum<-)
&<-lm(y~.,da)
>da.sum
Call:lm(formula=y~.,data=da) Codfficients:
Estimate Std.Error t value Pr(>|t|) (Intercept)4.72249.61760.4910.638 x  2.94220.268910.941  1.18e-05*** F-statistic:119.7on1and7DF,p-value:1.179e-05 >alpha<-0.05;qy<-qnorm(1-alpha/2)
>y1<-100;yu<-150
>a1<-(y1+qy*da.sum$sigma-da.sum$coefficients[[1]])/da.sum$coefficients[[2]]
>a2<-(yu-qy*da.sum$sigma-da.sum$ coefficients[[1]])/da.sum$coefficients[[2]]
>a1<-min(a1,a2);au<-max(a1,a2)
>aa<-if(any(yu-y1>=2*qy*da.sum$sigma))c (a1,au)else NA
>aa
[1]38.8666242.89261
即回归方程y⌢=4.7224+2.9422x
通过观察t检验和F检验的p值,可判断自变量和整个模型都是显著的。技术改造资金应在38.87万~42.89万之间,才能使利润增加额以95%的概率在100万~150万之间。
3结论
数理统计是一门应用性非常强的学科,在近几年的教学过程中,我们突出了数理统计基本思想的介绍,适当略去了复杂的公式推导和定理证明。着重介绍统计方法和模型的应用背景和应用实例,并引入统计软件R,力争每个实例都能以算法实现,以期全面改善教学效果。
通过两个学期的教学实践,我们发现使用R软件后,学生摆脱了烦琐的计算,R强大的互动性极大地激发了学生的学习兴趣。未来,我们将进一步探索R 在教学中的应用,使学生能够在领会各种统计方法的基本思想的基础上,自觉地、得心应手地借助R软件来解决遇到的各种实际问题。
【参考文献】
[1]盛骤,谢式千,潘承毅.概率论与数理统计[M].北京:高等教育出版社, 2008.
[2]徐付霞,李亚威.基于统计软件R的《数理统计》实验教学案例[J].高等数学研究,2018(21):61-64.
[3]闰朝晖.R软件在多元统计分析教学中的应用研究[J].科技创新导报, 2011(1):157-158.
[4]崔玉杰,刘喜波.R和Python软件在《概率论与数理统计》教学中应用初探[J].教育教学论坛,2017(12):192-193.
[5]宋述芳,迟乃荣,吕震宙.R语言在数理统计教学中的应用与延伸[J].教育教学论坛,2019(9):231-233.
[6]薛薇.基于R的统计分析与数据挖掘[M].北京:中国人民大学出版社,2012.
改造资金x151824303539444850利润增加额y48577086129124131136152
130
Science&Technology Vision
科技视界

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。