R语⾔学习——R读取txt、csv、xls和xlsx格式⽂件
最近项⽬中运⽤到了R读取⽂件数据,所以把相关好⽤的、经过验证的⽅法总结了⼀下,有效避免下次⼊坑。
1. R读取txt⽂件
使⽤R读取txt⽂件直接使⽤read.table()⽅法进⾏读取即可,不需要加载额外的包。
read.table("/home/",header=T,na.strings = c("NA"))
1
注意,此处的na.strings = c("NA") 的意思是⽂件中的缺失数据都是⽤NA进⾏表⽰;在读取⽂本⽂件时,默认的分割符
号为空格。具体的参数设置可参照如下:
read.table(file, header = FALSE, sep = "", quote = "\"'", dec = ".", numerals = c("allow.loss", "warn.loss", "no.loss"), row.names, col.names, as.is = !stringsA
2. R读取csv⽂件
使⽤R读取csv⽂件和读取txt⽂件很类似,使⽤的是read.csv()⽅法,两者参数的使⽤⼤部分是⼀样的。
read.csv("/home/slave/test.csv", header=T, na.strings=c("NA"))
在读取csv⽂件时,分割符为“,”(这句基本是废话,⼤家懂得);具体的参数设置可参考如下:
read.csv(file, header = TRUE, sep = ",", quote = "\"", dec = ".", fill = TRUE, comment.char = "", ...)
3. R读取xls和xlsx⽂件
读取xls和xlsx有很多⽅法,但是这⾥⾯的很多⽅法也不是特别好⽤,例如RODBC包中的读取xls⽅法就不太好⽤,有
时还会出现各种各样的问题。在进⾏了⼀番⼊坑探索之后,到了两个相对好⽤的读取xls⽂件的包,下⾯我将分别进
⾏说明。
gdata
其中sheet=1 参数的意思是读取第⼀个sheet中的内容;na.strings=c("NA","#DIV/0!") 将"NA" 和 "#DIV/0!" 都作为缺失数据表⽰,read.xls()
⽅法的具体参数设置可参考如下:
read.xls()⽅法只是gdata 包中的⼀个⽅法,gdata 包中还有⼀些有⽤的⽅法,例如xls 转csv ,xls 转txt 等,在这⾥进⾏⼀些列举:python怎么读取xls文件
gdata 包有着很多的功能,但是它对其他的包的依赖很多,可能会出现各种不可预知的问题,下⾯介绍⼀个较少依赖的包。
readxl
这块需要注意的⼀点是na="NA"
和其他读取时的格式略有不同,下⾯列出了具体的参数设置:
注意:以上的两个⽅法都可以对xls 和xlsx 进⾏读取。
⾄此,已将我们在R中常⽤到的读取⽂件数据⽅法以及介绍完毕,下⾯就让我们⼀起动⼿实验吧。^_^参考:install.packages("gdata")
library(gdata)read.xls("/home/slave/test.xls",sheet=1,na.strings=c("NA","#DIV/0!"))read.xls(xls, sheet=1, verbose=FALSE, pattern, na.strings=c("NA","#DIV/0!"), ..., method=c("csv","tsv","tab"), perl="perl")xls2csv(xls, sheet=1, verbose=FALSE, blank.lines.skip=TRUE, ..., perl="perl") xls2tab(xls, sheet=1, verbose=FALSE, blank.lines.skip=TRUE, ..., perl=install.packages("readxl")library(readxl) read_excel("/home/slave/test.xls",sheet=1,na="NA")
read_excel(path, sheet = 1, col_names = TRUE, col_types = NULL, na = "", skip = 0)
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论