Stata软件入门教程
李昂然
浙江大学社会学系
Email: ********************
版本:2020/02/05
1. 导论
本教程将快速介绍Stata软件(版本16)的一些基本操作技巧和知识。对于详细的Stata介绍和入门,小伙伴们可以参考Stata官方的英文手册以及教程所提供的学习资料。跟其他大多数统计软件一样,Stata可以同时通过下拉菜单以及命令语句来操作。初学者可以通过菜单选项来逐步熟悉Stata,但是命令语句的使用是Stata用户的最佳选择。因此,本教程将着重介绍命令语句的使用。
对于中文用户来讲,在打开Stata之后,可以通过下拉菜单选项中的用户界面语言选择将中文设置为默认语言。同时,也可以在命令窗口中输入set locale ui zh_CN来设置中文显示。在选择完
variable什么意思中文语言后,记得重新启动Stata。需要提醒大家,虽然Stata用户界面可以显示中文,但是统计分析
的结果仍然将以英文显示。
本教程中使用的案列数据源自中国家庭追踪调查(China Family Panel Studies)。具体数据
出自本人于2019年发表于Chinese Sociological Review上“Unfulfilled Promise of Educational Meritocracy? Academic Ability and China’s Urban-Rural Gap in Access to Higher Education”一文中使用的数据。关于数据的具体问题,请联系本人。
同时,本教程提供相应的do file和数据文件给同学们下载,同学们可以根据do file复制本教程的
全部内容。下载地址为我个人网站:/teaching/
温馨提示:关于Stata操作的大多数疑问,都可以在官方手册上到答案。同时,在Stata中输入help [command]便可以查看关于命令使用的详细信息。
2. Stata用户界面
Stata的用户操作界面主要包括五个部分:(1)历史窗口、(2)结果窗口、(3)命令窗口、(4)变量窗口、(5)属性窗口。
以上为Mac版本Stata的用户界面。
(1)历史窗口显示已经执行过的命令语句,可以帮助用户回顾已经使用过的命令。如果命令输入
错误,窗口中会显示红的提示。
当遇到错误提示,仔细检查一下code。大多数时候,对命令语句的熟悉是在不断犯错中加深的,
所以,遇到错误提示,请淡定。
(2)结果窗口显示数据分析的结果。如果想要清除当前显示的结果,可以点击结果窗口,会出现
菜单选项,然后进行选择。
(3)命令窗口的使用很直接,无需介绍太多。记住一点,当从别处复制语句并粘贴到命令窗口时,如果语句有多行,Stata会逐行读取,如果语句中断,会出现错误提示。
(4)变量窗口显示数据中变量的基本信息。当点击变量左边的按钮时,变量的名称会自动出现在
命令窗口。
(5)属性窗口显示更多关于数据和变量的详细信息。可以在此处手动对变量的信息进行修改。
3. Stata浏览器以及Help功能
Stata浏览器的作用类似搜索引擎,提供对于Stata的全方位帮助。主要有两个作用:1)通过游览器,可以查询Stata用户手册中的各种信息。2)游览器可以连接网络,在网络中下载并安装其他骨灰级用户自己编写的命令语句(community-contributed commands)。
开启浏览器可以点击工具栏中的浏览器按钮,也可以在命令窗口输入view。
作为初学者,我认为Stata中最重要的命令是help。遇到任何关于命令的疑问时,只需输入help 加上命令语句便可。例如,如果我们不知道命令merge怎么使用,只需要输入help merge,在浏览器中便会出现关于merge的所有详细信息。
4. 数据使用、存储以及编辑
工作目录
在每次使用Stata之前,应该确认设置好工作目录(Working Directory)。工作目录可以通过点击文件->更改工作目录来修改,也可以通过在命令窗口输入cd修改。例如
cd "c:\angranli\Stata16"
记住,命令cd之后是文件所在的文件夹位置,Windows版本和Mac版本的输入格式是有差别,很容易犯错。
工作目录显示于命令窗口的下方:
也可以在命令窗口中输入pwd来检查当下的工作目录是哪个文件夹。
打开和导入数据
Stata的数据是.dta格式。直接双击数据文件就可以打开数据。在打开数据的同时,系统会默认数据所在文件夹为工作目录。也可以在命令窗口输入:
use "data.dta", clear
clear的意思是告诉系统先清除之前打开的数据,然后再打开新的数据。
大多数情况下,同学们会处理不同格式的数据。这个时候,我们需要在Stata中导入不同格式的数据,如.csv .sav .xlsx等等。点击文件->导入,便可进行选择导入不同格式数据。或者,可以在命令窗口输入import来导入数据。例如,import spss "data.sav"导入SPPS数据。
存储和导出数据
存储数据很直接,直接点击保存。也可以输入指令:
save "data.dta", replace
replace的意思是告诉系统存储时替代之前的数据,如果没有replace并且文件夹中已经存在相同名称的数据,会出现错误提示。
导出数据很简单,点击文件->导出,选择不同的导出格式。或者使用export指令,方法和import一样。
数据编辑
有时候,同学们需要手动输入数据。打开数据编辑器便可进行修改。记住,数据编辑器有两种模式:浏览和编辑。浏览模式下,只能看原始数据,不能改。修改需要打开编辑模式。浏览模式可以用browse来打开,编辑模式用edit打开。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论