如何在R语⾔中读取数据
读取数据有以下⼏种⽅式:
1.最常⽤的是采⽤读取表格数据的函数 read.table()以及read.csv().。这些函数读取⼀种以⾏列的格式存储数据的⽂本⽂件,然后在R中返回⼀个数据框。
3.source()是读取R的重要函数,如果你有R代码例如函数或者其他东西写成的⽂件,都可以⽤source()将其中的代码读⼊R中。
4.dget()也可以⽤来读取R代码⽂件, 但它读取的是逆句法分析过后以⽂本⽂件储存的 R 对象 。
5.load()和unserialize()⽤于把⼆进制对象读⼊R
写⼊数据有以下⼏种⽅式,它们与读取数据⼀⼀对应:
第⼀个参数file,很明显是⽂件或者链接的名称,通常你提供的⽂件名都应当是字符串 ,它是你电脑上⼀
个特定⽂件的路径。
第⼆个参数header是⼀个逻辑标志,表明第⼀⾏是否是表头 ⽐如 第⼀⾏写了所有的变量名 那么这并不是实际数据的⼀部分 只是提供了标记的⾏ 你要告诉 read.table 函数 第⼀⾏是否包含变量名 还是直接就是数据 第三个 参数是sep,表⽰分隔符 ,它是⼀个字符串 ⽤于标⽰每⼀列是如何分隔的 假如你有⼀个⽂件⽤逗号分隔 那么分隔符就是逗号 有的时候会碰到分隔符是冒号、制表符或者空格的⽂件 这时候你就要告诉
read.table 函数分隔符是什么了
第四个参数是colClasses ,应当是⼀个字符向量 其长度应当与数据集的列数相等 这个字符向量表⽰ 数据集中每⼀列数据的类 这么说吧 第⼀列数据是数值型的 第⼆列数据是逻辑型 第三列数据是因⼦ 诸如此类colClass 不是⼀个必须的向量 但它会告诉 read.table() 每⼀列数据的类型 。
第五个参数是nRows,它 是数据集中数据的⾏数 虽然不是必须的但有时也会⽤到。
第六个参数是comment.char,它 是字符串 表明⽂件中⽤于注释的字符 默认通常是井号 所有在注释符号后⾯的字符都会被忽略。
第七个参数是skip ,它指定了从⽂件开头往下忽略多少⾏ 有的时候⽂件开头可能有⼀些头信息或者⾮
数据区域 你想要跳过那些部分 所以你可以告诉 read.table 函数去跳过⽐如开头的 10 ⾏或者是 100 ⾏ 然后从那⾥再开始读取数据
parameter数据类型最后⼀个参数是stringAsFactors,默认为 TRUE 它的作⽤是 通过它可以选择是否把字符变量编码成因⼦ 所以这是默认操作 每次 read.table() 遇到⼀列看起来像字符变量的数据 它就会假设你希望读⼊的 是⼀个因⼦变量 如果你不想把这⼀列设成因⼦变量 那么你可以把 stringAsFactors 设置为 FALSE
当你在使⽤的时候,你可以直接传⼊⽂件名,它会⾃动调配好剩下的部分。
read.table() 是等价的 除了 read.csv() 的默认分隔符是逗号 ⽽ read.table() 的默认分隔符是空格外。 另外 read.csv() 会默认把 header 参数设置为 TRUE
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论