R语⾔——read.table(读取外部数据)
使⽤R语⾔的时候,如果是少量数据,不妨使⽤c()或其他函数进⾏创建;但是对于⼤量数据,最好还是先通过其他更⽅便的软件创建数据⽂件,然后使⽤R读⼊这个⽂件。
前⽂说,.csv是⾮常好的数据⽂件格式,跨平台⽀持⾮常好。我在Excel或者SPSS中创建的数据,只要存为csv格式,就可以使⽤⼏乎任何数据处理软件对这些数据进⾏处理了。
R语⾔中读取外部⽂件的最基本函数是read.table(),先介绍read.table(),然后再介绍专门⽤来读csv的read.csv()。
敲⼊?read.table命令,就看到了关于数据输⼊函数的说明。对read.table,使⽤格式是这样的;
read.table(file, header = FALSE, sep ="", quote = "\"'",
dec = ".", row.names,col.names,
as.is = !stringsAsFactors,
na.strings = "NA", colClasses = NA, nrows= -1,
skip = 0, check.names = TRUE, fill =!blank.lines.skip,
strip.white = FALSE, blank.lines.skip =TRUE,
comment.char = "#",
allowEscapes = FALSE, flush =FALSE,
stringsAsFactors =default.stringsAsFactors(),
fileEncoding = "", encoding = "unknown",text)
参数很多,最常⽤的也就⼏个,重写如下:
read.table(file, header = FALSE, sep ="", quote = "\"'",
dec = ".", skip = 0,
strip.white = FALSE, blank.lines.skip =TRUE,
comment.char = "#")
tabletable
file表⽰要读取的⽂件。file可以是
①绝对路径或者相对路径,但是⼀定要注意,因为在R语⾔中\是转义符,所以路径分隔符必须写成\\,⽐
如“C:\\myfile\\”或者
Sys.setenv(JAVA_HOME='C://Program Files/
②可以使剪切板的内容。
强烈推荐使⽤第三种⽅法,免去了记忆和书写⽂件路径的⿇烦,③使⽤file.choose(),弹出对话框,让你选择⽂件位置。强烈推荐使⽤第三种⽅法,免去了记忆和书写⽂件路径的⿇烦,特别是能够避免因数据⽂件位置移动带来的错误!例如:read.table(file.choose(),...)。
特别是能够避免因数据⽂件位置移动带来的错误!
header来确定数据⽂件中第⼀⾏是不是标题。默认F,即认为数据⽂件没有标题,也即认为第⼀⾏就开始是数据了!例如:姓名年龄收⼊
⼩六 12 350
如果header=F,读进来的第⼀⾏数据是“姓名年龄收⼊”,header=T,读进来的第⼀⾏是“⼩六 12 350”。
sep指定分隔符,默认是空格。quote是引号,默认就是双引号。dec是⼩数点的表⽰,默认就是⼀个点。skip是确定是否跳过某些⾏。strip.white确定是否消除空⽩字符。blank.lines.skip确定是否跳过空⽩⾏。comment.char指定⽤于表⽰注释的引导符号。
⼀般情况下,我们只需要默认值就够了。
下⾯是⼀个简单的例⼦,本例⼦中,⾸⾏是标题⽽不是数据,使⽤\t进⾏分割⽽不是空格。读取后的数据变量设为mydata。所以,可以写出读取⽅式为:
mydata<-read.table(file.choose(),header=T,sep="\t")
其中,T和TRUE的效果是⼀样的,正如F和FALSE的效果是⼀样的。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论