STATA基本入门
前言
STATA是一个十分好用而且简单的统计软件包,透过轻松的数据输入方式,而且简单的指令,即可执行一般在计量经济学上常用的计量模型。除了计量模型外,STATA的软件包中也可执行统计学中的估计和检定,甚至是多变量分析中的各项分析工具。因此,STATA可以说是一个相当强而有力的统计软件。
一、安装
STATA所须的内存容量不大,只有4.03MB。此外,安装也相当简单,只要在〝SETUP〞上点两下,安装完成后再分别输入”Sn””Code””Key”即可开始使用。但是安装过程中有一点必须注意的是,如下图所示,有”Intercooled””Small”两个选项。一般而言,为了方便日后要设定较大的内存容量来处理大笔的资料,通常选择以”Intercooled”进行安装。
二、窗口介绍
安装完成后,点选桌面上STATA的图标,窗口画面如下图所示。为了使画
面美观,我们可以将画面拉到自己喜欢的地方,如下图所示。为了保存这个窗口画面,我们必须点选工具列上的”Prefs”下的”Save Windowing Preferences”。如此一来,以后开启STATA时都会以此窗口画面呈现。
接下来,我们依序介绍四个窗口的功用:
左上─Review:此一窗口用于记录在开启STATA后所执行过的所有指令。因此,若欲使用重复的指令时,只要在该指令上点选两下即可执行相同的指令;若欲使用类似的指令时,在该
指令上点一下,该指令即会出现在窗口”Stata Command”上,再进行修改即可。此外,STATA还可以将执行过的指令储存下来,存在一个do-file内,下次即可再执行相同的指令。
左下─Variables:此一窗口用于呈现某笔数据中的所有变量。换言之,当数据中的变量都有其名称时,变量名称将会出现在此一窗口中。只要数据有读进STATA中,变量名称就会出现。它的优点是(1)确认数据输入无误;(2)只要在某变量上点选两下,该变量即会出现在窗口”Stata Command”上。
右上─Stata Results:此一窗口用于呈现并记录指令执行后的结果。
右下─Stata Command:此一窗口用于输入所欲执行的指令。
Note:以上四个窗口都可以从”Fonts”去更改字体大小。
三、输入数据(Entering data
在本小节中,我们将介绍如何把数据读进STATA。但是在正式介绍之前,我们必须先对几个一般性的指令(general command)有所了解,说明如下:
cd:即change directory,简言之,告知STATA数据储存的地方。例如当数据储存在e槽的sample数据夹时,则必须先输入cd e:\sample
dir/ls:用来显示目录的内容。
set memory #m:设定内存的容量。例如:当有一笔庞大的数据要处理时,则可设定100mb的容量,此时可输入set memory 100m。(输入指令memory可以知道内存容量的大小以及使用情况。)
set matsize #:设定所需的变量个数。一般而言,不须对此部分进行设定,除非所欲处理的资料庞大或是当执行后出现matsize too small的讯息时再进行修改即可。内建为40
set more off/define的基本用法on:若欲执行结果以分页的型式呈现时,则输入set more on;若欲执行结果同时呈现时,则输入set more off
help:求助键。后面必须接的是指令。说明如何使用该指令,例如:help regress
search:求助键。后面可接任何文字。说明在何处可以到该文字。例如:search normal distribution
clear:清除键。用来删除所有数据。
接下来,根据数据类型或指令的不同,数据输入的方法可分成以下四种:
1、输入EXCEL数据
EXCEL的数据输入STATA的方式还可细分成以下两种:
EXCEL的数据输入STATA之前,必须先将数据存成csv 文件,再利用指令insheet来读数据。
Example
csv档的第一列有变量名称时:
cd e:\sample
dir
memory
set memory 10m
insheet using sample1-1.csv
csv档的第一列没有变量名称时:
insheet gender id race ses schtyp prgtype read write math science socst using sample1-2.csv
直接复制EXCEL上的数据,再到STATA选取”Window”下的”Data Editor”,点选后会出现”Stata Editor”工作表,再到”Edit”下选取”Paste”即可贴上数据。
2、输入ASCII 的数据型态
ASCII 的数据型态区分,将ASCII 的数据输入STATA的方式也有以下两种:
数据型态一:见
infile gender id race ses schtyp str10 prgtype read write math science socst
Note:记住文字的设定方式(str# variable name)。
数据型态二:见
第二种的数据型态通常须要codebook。如下表所示。
variable name
Column number
id
1-2
eng
3-4
math
5-6
sex
7
micro
8-9
macro
10-11
infix id 1-2 eng 3-4 math 5-6 gender 7 micro 8-9 macro 10-11
3、利用Do-file editor输入数据
将数据或是指令写入Do-file editor,再执行即可。例如:将下面数据复制并贴在Do-file editor(选取”Window”下的”Do-file editor”)上,再选择”do currnet file”执行即可。
cd e:\sample
input id female race ses str3 schtype prog read write math science socst
147 1 1 3 pub 1 47 62 53 53 61
108 0 1 2 pub 2 34 33 41 36 36
18 0 3 2 pub 3 50 33 49 44 36
153 0 1 2 pub 3 39 31 40 39 51
50 0 2 2 pub 2 50 59 42 53 61
51 1 2 1 pub 2 42 36 42 31 39
102 0 1 1 pub 1 52 41 51 53 56
57 1 1 2 pub 1 71 65 72 66 56
160 1 1 2 pub 1 55 65 55 50 61
136 0 1 2 pub 1 65 59 70 63 51
end
4、利用STATA的数据型态输入
除了以上三种方法之外,还可以开启之前以STATA储存的资料。
use sample1-6.dta
Note:此一指令亦可用在读取网络上的数据(use 网址)。
最后,将数据输入的相关指令整理成下表。
insheet
read ASCII (text) data created by a spreadsheet
infile
read unformatted ASCII (text) data
infix
read ASCII (text) data in fixed format
input
enter data from keyboard
use
load a Stata-format dataset
四、探索资料(Exploring data
为了更详细地呈现出在数据探索时所需使用的相关指令,我们利用sample4-1来说明指令的用法。首先,利用前节所提及的数据输入方法将sample4-1读进STATA
在正式分析数据之前,我们可以利用一个log档来储存之后所要执行的指令以及所得到的结果。指令的表示方法如下:

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。