r语⾔lm函数_R语⾔常见函数知识点梳理与解析精选分析⽬ 录
1、str() 显⽰数据集和变量类型,并简要展⽰数据集情况
2、subset()  取⼦集
3、which.min(), which.max()和which()
4、pmin( )/ pmax( )
5、complete.cases( ) 判断对象中是否数据完全
6、grep()出所数据框中元素所在的列值(仅数据框中)
7、assign()通过变量名的字符串来赋值
8、 split()根据因⼦变量拆分数据框/向量
9、unique()返回 x 但是省去重复的数值
10、round(),floor()和ceiling()
11、sign() 符号函数
12、%in% 检验x是否为集合y中的元素(x%in%y )
13、ls( )⽤来列出现存的所有对象
常见函数列表
14、数据管理相关
15、字符串处理函数
16、因⼦
17、数学计算
frequency函数计算频数18、数组相关
19、逻辑运算
20、控制结构相关
21、⾃定义函数相关
22、输⼊输出
23、⼯作环境
24、简单统计量
25、时间序列
【往期回顾】
数据预处理
第⼀部分:数据预处理
R语⾔ | 第⼀部分:
⽣成数据
R语⾔|第2讲:
讲:⽣成数据
R语⾔常⽤的数据输⼊与输出⽅法 | 第三讲
R语⾔数据管理与dplyr、tidyr | 第4讲
R语⾔ 控制流:for、while、ifelse和⾃定义函数function|第5讲
正 ⽂
1、str() 显⽰数据集和变量类型,并简要展⽰数据集情况
> data(mtcars)> str(mtcars)'data.frame':  32 obs. of  11 variables: $ mpg : num  21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ... $ cyl : num  6 6 4 6 8 6 8
2、subset()  取⼦集
条件筛选后,mtcars_df数据集为20 obs.
> data(mtcars)> str(mtcars)'data.frame':  32 obs. of  11 variables: #……省略部分内容 $ wt  : num  2.62 2.88 2.32 3.21 3.44 ... #……省略部分内容> mtcars_df  3)> 3、which.min(), which.max()和which()
which(), which.max(), which.min()返回的是位置(索引)
which(x, arr.ind = FALSE, useNames = TRUE)
x是⼀个向量或者数组;arr.ind = FALSE 默认返回数组索引
> set.seed(1)> x > x [1] -0.6264538  0.1836433 -0.8356286  1.5952808  0.3295078 -0.8204684  0.4874291 [8]  0.7383247  0.5757814 -0.3053884> which
> y > which(y > 5) #显⽰x>5的所有数值[1]  6  7  8  9 10 > which(y > 5,arr.ind = TRUE) #显⽰x>5的所有数值的位置    row col[1,]  1  2[2,]  2  2[3,]  3  2[4,]  4  2 4、pmin( )/ pmax( )
把多个等长度的向量按元素逐个对⽐,返回所有向量的第K个元素中最⼩(最⼤)值
> x > y > > pmin(x,y)[1] 1 2 1 3 4> pmax(x,y)[1] 2 5 3 4 5
5、complete.cases( ) 判断对象中是否数据完全
complete.case()可以判断对象中是否数据完全,然后返回TRUE, FALSE。这⼀函数在去除数据框中缺失值时很有⽤。
> x 1,> x    [,1][1,]    1[2,]    2[3,]  NA[4,]    4> complete.cases(x)[1]  TRUE  TRUE FALSE  TRUE> x[complete.cases(x),][1] 1 2 4
6、grep()出所数据框中元素所在的列值(仅数据框中)
> x > x  X1 X21  1 NA2  2  4> grep(1,x)[1] 1> grep(2,x)[1] 1> grep(4,x)[1] 2
7、assign()通过变量名的字符串来赋值
> assign("x",c(1:10))> x [1]  1  2  3  4  5  6  7  8  9 10
8、 split()根据因⼦变量拆分数据框/向量
split(x,f);x 可以为向量或者数据框,f 为对应的因⼦,函数以列表的形式返回
> x = data.frame(matrix(1:10,nrow = 5))> MorFM = c("Female","Male","Female","Female","Female")> split(x,MorFM)$Female  X1 X21  1  63  3  84  4  95  9、unique()返回 x 但是省去重复的数值
> x <- c(1:5,2:10,3,5)> x [1]  1  2  3  4  5  2  3  4  5  6  7  8  9 10  3  5> unique(x) [1]  1  2  3  4  5  6  7  8  9 10
10、round(),floor()和ceiling()
round()四舍五⼊取整;floor()向下取整;ceiling()向上取整
> round(3.5)[1] 4> floor(3.5)[1] 3> ceiling(3.5)[1] 4
11、sign() 符号函数
sign()根据其参数向量中的数值是正值、零、负值将其分别转化为1,0,-1
> set.seed(1)> x <- rnorm(20)> x [1] -0.62645381  0.18364332 -0.83562861  1.59528080  0.32950777 -0.82046838 [7]  0.48742905  0.73832471  0.5757
12、%in% 检验x是否为集合y中的元素(x%in%y )
> y > 5%in%y[1] TRUE> 4%in%y[1] FALSE
13、ls( )⽤来列出现存的所有对象
pattern是⼀个具名参数,可以列出所有名称中含有字符串“s”的对象。
> library(ggplot2)> ls("package:ggplot2", pattern="geom_.a")[1] "geom_bar"    "geom_label"  "geom_map"    "geom_path"  "geom_raster"
其他函数列表
14、数据管理相关vector:向量numeric:数值型向量logical:逻辑型向量character;字符型向量list:列表data.frame:数据框c:连接为向量或列表length:求长度subset:求⼦集seq,from:to,sequence:等差序列rep:重复NA:缺失值NULL:空对象
sort,order,unique,rev:排序unlist:展开列表attr,attributes:对象属性mode,typeof:对象存储模式与类型names:对象的名字属性15、字符串处理函数character:字符型向量nchar:字符数substr:取⼦串format,format C:把对象⽤格式转换为字符串paste,strsplit:连接或拆分charmatch,pmatch:字符串匹配grep,sub,gsub:模式匹配与替换
16、因⼦
factor:因⼦codes:因⼦的编码levels:因⼦的各⽔平的名字nlevels:因⼦的⽔平个数cut:把数值型对象分区间转换为因⼦table:交叉频数表split:按因⼦分组aggregate:计算各数据⼦集的概括统计量tapply:对“不规则”数组应⽤函数17、数学计算+, -, *, /, ^, %%,
%/%:四则运算ceiling,floor,round,signif,trunc,zapsmall:舍⼊ max,min,pmax,pmin:最⼤最⼩值range:最⼤值和最⼩值sum,prod:向量元素和积cumsum,cumprod,cummax,cummin:累加、累乘sort:排序approx和approx fun:插值diff:差分sign:符号函数18、数组相关array:建⽴数组matrix:⽣成矩阵data.matrix:把数据框转换为数值型矩阵i:矩阵的下三⾓部分vec:⽣成矩阵或向量 t:矩阵转置cbind:把列合并为矩阵rbind:把⾏合并为矩阵diag:矩阵对⾓元素向量或⽣成对⾓矩阵aperm:数组转置nrow, ncol:计算数组的⾏数和列数dim:对象的维向量dimnames:对象的维名row/colnames:⾏名或列名%*%:矩阵乘法crossprod:矩阵交叉乘积(内积)outer:数组外积kronecker:数组的Kronecker积apply:对数组的某些维应⽤函数tapply:
对“不规则”数组应⽤函数sweep:计算数组的概括统计量aggregate:计算数据⼦集的概括统计量scale:矩阵标准化matplot:对矩阵各列绘图cor:相关阵或协差阵Contrast:对照矩阵row:矩阵的⾏下标集col:求列下标集19、逻辑运算,<=,>=,==,!=:⽐较运算
符!,&,&&,|,||,xor():逻辑运算符 logical:⽣成逻辑向量all,any:逻辑向量都为真或存在真ifelse
():⼆者择⼀match,%in%:查unique:出互不相同的元素which:到真值下标集合duplicated:到重复元素20、控制结构相关if,else,ifelse,switch:分⽀for,while,repeat,break,next:循环apply,lapply,sapply,tapply,sweep:替代循环的函数。21、⾃定义函数相关function:函数定义source:调⽤⽂件call:函数调⽤22、输⼊输出cat,print:显⽰对象 sink:输出转向到指定⽂
件 dump,save,dput,write:输出对象 scan,read.table,load,dget:读⼊23、⼯作环境ls,objects:显⽰对象列表rm, remove:删除对象 q,quit:退出系统 .First,.Last:初始运⾏函数与退出运⾏函数。options:系统选
项 ?,help,help.start,apropos:帮助功能 data:列出数据集24、简单统计量sum, mean, var, sd, min, max, range, median,
IQR(四分位间距)等为统计量sort,order,rank与排序有关,其它还有ave,fivenum,mad,quantile,stem等25、时间序列ts:时间序列对象diff:计算差分time:时间序列的采样时间window:时间窗
说明:本⽂中前半部分内容为作者⾃⾏整理,后半部分内容引⾃⽹络,稍作整理(蓝⾊标记部分是笔者认为⽐较常见和使⽤的函数)。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。