R常用--688IT编程网

一、数据管理

vector：向量

numeric：数值型向量

logical：逻辑型向量

character；字符型向量

list：列表

data.frame：数据框

c：连接为向量或列表

length：求长度

subset：求子集

seq，from:to，sequence：等差序列

rep：重复

NA：缺失值

NULL：空对象

sort，order，unique，rev：排序

unlist：展平列表

attr，attributes：对象属性

mode，typeof：对象存储模式与类型

names：对象的名字属性

二、字符串处理

character：字符型向量

nchar：字符数

substr：取子串

format，format C：把对象用格式转换为字符串

paste，strsplit：连接或拆分

charmatch，pmatch：字符串匹配

grep，sub，gsub：模式匹配与替换

三、复数

complex，Re，Im，Mod，Arg，Conj：复数函数

四、因子

factor：因子

codes：因子的编码

levels：因子的各水平的名字

nlevels：因子的水平个数

cut：把数值型对象分区间转换为因子

table：交叉频数表

split：按因子分组

aggregate：计算各数据子集的概括统计量

tapply：对“不规则”数组应用函数

数学相关计算

一、计算

+, -, *, /, ^, %%, %/%：四则运算

ceiling，floor，round，signif，trunc，zapsmall：舍入

max，min，pmax，pmin：最大最小值

range：最大值和最小值

sum，prod：向量元素和积

cumsum，cumprod，cummax，cummin：累加、累乘

sort：排序

approx和approx fun：插值

diff：差分

sign：符号函数

二、数学函数

abs，sqrt：绝对值，平方根

log, exp, log10, log2：对数与指数函数

sin，cos，tan，asin，acos，atan，atan2：三角函数

sinh，cosh，tanh，asinh，acosh，atanh：双曲函数

beta，lbeta，gamma，lgamma，digamma，trigamma，tetragamma，pentagamma，choose ，lchoose：与贝塔函数、伽玛函数、组合数有关的特殊函数

fft，mvfft，convolve：富利叶变换及卷积

polyroot：多项式求根

poly：正交多项式

spline，splinefun：样条差值

besselI，besselK，besselJ，besselY，gammaCody：Bessel函数

deriv：简单表达式的符号微分或算法微分

三、数组

array：建立数组

matrix：生成矩阵

data.matrix：把数据框转换为数值型矩阵

cbind：把列合并为矩阵

rbind：把行合并为矩阵

diag：矩阵对角元素向量或生成对角矩阵

aperm：数组转置

nrow, ncol：计算数组的行数和列数

dim：对象的维向量

dimnames：对象的维名

row/colnames：行名或列名

%*%：矩阵乘法

crossprod：矩阵交叉乘积（内积）

outer：数组外积

kronecker：数组的Kronecker积

apply：对数组的某些维应用函数

tapply：对“不规则”数组应用函数

sweep：计算数组的概括统计量

aggregate：计算数据子集的概括统计量

scale：矩阵标准化

matplot：对矩阵各列绘图

cor：相关阵或协

差阵

Contrast：对照矩阵

row：矩阵的行下标集

col：求列下标集

四、线性代数

solve：解线性方程组或求逆

eigen：矩阵的特征值分解

svd：矩阵的奇异值分解

backsolve：解上三角或下三角方程组

chol：Choleski分解

qr：矩阵的QR分解

chol2inv：由Choleski分解求逆

五、逻辑运算

<，>，<=，>=，==，!=：比较运算符

!，&，&&，|，||，xor()：逻辑运算符

logical：生成逻辑向量

all，any：逻辑向量都为真或存在真

ifelse()：二者择一

match，%in%：查

unique：出互不相同的元素

which：到真值下标集合

duplicated：到重复元素

六、优化及求根

optimize，uniroot，polyroot：一维优化与求根

程序设计

一、控制结构

if，else，ifelse，switch：分支

for，while，repeat，break，next：循环

apply，lapply，sapply，tapply，sweep：替代循环的函数。

二、函数方面

function：函数定义

source：调用文件

call：函数调用

C，.Fortran：调用C或者Fortran子程序的动态链接库

Recall：递归调用

browser，debug，trace，traceback：程序调试

options：指定系统参数

missing：判断虚参是否有对应实参

nargs：参数个数 stop：终止函数执行

eval，expression：表达式计算

system.time：表达式计算计时

invisible：使变量不显示

menu：选择菜单（字符列表菜单）

其它与函数有关的还有：delay，sponse，deparse，do.call，dput，environment ，，formals，format.info，interactive，

is.finite，is.function，is.language，is.recursive ，match.arg，match.call，match.fun，act，name，parse，substitute，sys.parent ，warning，machine

三、输入输出

cat，print：显示对象

sink：输出转向到指定文件

dump，save，dput，write：输出对象

scan，read.table，load，dget：读入

四、工作环境

ls，objects：显示对象列表

rm, remove：删除对象

q，quit：退出系统

.First，.Last：初始运行函数与退出运行函数。

options：系统选项

?，help，help.start，apropos：帮助功能

data：列出数据集

统计分析

一、统计分布

每一种分布有四个函数：d――density（密度函数），p――分布函数，q――分位数函数，r――随机数函数。

比如，正态分布的这四个函数为dnorm，pnorm，qnorm，rnorm

列出各分布后缀，前面加前缀d、p、q或r就构成函数名：

norm：正态

c++trunc函数

t：t分布

f：F分布

chisq：卡方（包括非中心）

unif：均匀

exp：指数

weibull：威布尔

gamma：伽玛

beta：贝塔

lnorm：对数正态

logis：逻辑分布

cauchy：柯西

binom：二项分布

geom：几何分布

hyper：超几何

nbinom：负二项

pois：泊松

signrank：符号秩，

wilcox：秩和

tukey：学生化极差

二、简单统计量

sum, mean, var, sd, min, max, range, median, IQR（四分位间距）等为

统计量

sort，order，rank与排序有关，其它还有ave，fivenum，mad，quantile，stem等

三、统计检验

R中已实现的有st，st，t.test

四、多元分析

cor，cov.wt，var：协方差阵及相关阵计算

biplot，biplot.princomp：多元数据biplot图

cancor：典则相关

princomp：主成分分析

hclust：谱系聚类

kmeans：k-均值聚类

cmdscale：经典多维标度其它有dist，mahalanobis，b

五、时间序列

ts：时间序列对象

diff：计算差分

time：时间序列的采样时间

window：时间窗

六、统计模型

lm，glm，aov：线性模型、广义线性模型、方差分析

文件操作

一、文件执行：

在用R生成一个PDF文档后，如果想去打开它，你可能会在文件夹里到再点开。再或者我们想调用系统中的其它程序来做点事情，可能要打开cmd敲点命令。实际上这都可以在R内部完成。举例来说用pandoc转换na.md成docx再打开它。

system('pandoc d:\\rspace\\na.md -o d:\\rspace\\na.docx')

<('d:\\rspace\\na.docx')

二、网络浏览：

browseURL：浏览某个指定的网页

download.file：下载网络文件到本地

三、文件操作

list.dirs：显示目录下的文件夹

list.files：显示目录下的文档

file.append：文档添加

file.symlink(from, to)

file.show：显示文档内容

file.info：显示文档信息

file.edit：编辑文档

zip：压缩文件

unzip：解压缩文件

四、运算进度条

在一个大循环运算时，如果可以看到目前的进度是比较方便的，txtProgressBar和setTxtProgressBar函数可以帮助做到这一点

语言的数学运算和一些简单的函数整理如下：

向量可以进行那些常规的算术运算，不同长度的向量可以相加，这种情况下最短的向量将被循环使用。

> x <- 1:4

> a <- 10

> x * a

[1] 10 20 30 40

> x + a

[1] 11 12 13 14

> sum(x) #对x中的元素求和

[1] 10

> prod(x) #对x中的元素求连乘积

[1] 24

> prod(2:8) #8的阶乘

[1] 40320

> prod(2:4) #4的阶乘

[1] 24

> max(x) #x中元素的最大值

[1] 4

> min(x) #x中元素的最小值

[1] 1

> which.max(x) #返回x中最大元素的下标

[1] 4

> which.min(x) #返回x中最小元素的下标

[1] 1

> x <- 4:1 #对向量x重新赋值

> x

[1] 4 3 2 1

> which.min(x)

[1] 4

> which.max(x)

[1] 1

> range(x) #与c(min(x), max(x))作用相同

[1] 1 4

> mean(x) #x中元素的均值

[1] 2.5

> median(x) #x中元素的中位数

[1] 2.5

> var(x) #x中元素的的方差（用n-1做分母）

[1] 1.666667

> x

[1] 4 3 2 1

> rev(x) #对x中的元素取逆序

[1] 1 2 3 4

> sort(x) #将x中的元素按升序排列；

[1] 1

2 3 4

> x

[1] 4 3 2 1

> cumsum(x) #求累积和，返回一个向量，它的第i个元素是从x[1]到x[i]的和

[1] 4 7 9 10

> cumsum(rev(x))

[1] 1 3 6 10

> y <- 11:14

> pmin(x,y) #返回一个向量，它的第i个元素是x[i], y[i], . . .中最小值

[1] 4 3 2 1

> x <- rev(x) #重新赋值

> pmin(x,y)

[1] 1 2 3 4

> pmax(x,y) #返回一个向量，它的每个元素是向量x和y在相应位置的元素的最大者

[1] 11 12 13 14

> cumprod(x) #求累积（从左向右）乘积

[1] 1 2 6 24

> cummin(x) #求累积最小值（从左向右）

[1] 1 1 1 1

> cummax(x) #求累积最大值（从左向右）

[1] 1 2 3 4

> match(x, y) #返回一个和x的长度相同的向量，表示x中与y中元素相同的元素在y中的位置（没有则返回NA）

[1] NA NA NA NA

> y[c(2,4)] <- c(2,4)

> y

[1] 11 2 13 4

> match(x, y)

[1] NA 2 NA 4

> na.omit(match(x,y))

[1] 2 4

attr(,"na.action")

[1] 1 3

attr(,"class")

[1] "omit"

> na.fail(match(x,y)) #na.fail(x) 如果x包含至少一个NA则返回一个错误消息

错误于na.fail.default(match(x,y)) : 对象里有遺漏值

which（）函数返回一个包含x符合条件（当比较运算结果为真（TRUE）的下标的向量，在这个结果向量中数值i说明x[i] == a（这个函数的参数必须是逻辑型变量）

> which( x == 2)

[1] 2

> which( x <= 2)

[1] 1 2

求组合数

> choose(4,2)

[1] 6

> choose(3,1)

[1] 3

> choose(-3,1)

[1] -3

> choose(-4,2)

[1] 10

> y <- c(1:4, rep(4,1))

> y

[1] 1 2 3 4 4

> unique(y) #如果y是一个向量或者数据框，则返回一个类似的对象但是去掉所有重复的元素（对于重复的元素只取一个）

[1] 1 2 3 4

> table(y) #返回一个表格，给出y中重复元素的个数列表(尤其对于整数型或者因子型变量)

1 2 3 4

1 1 1 2

> subset(x, x>2) #返回x中的一个满足特定条件...的子集

[1] 3 4

> sample(x, 2) #从x中无放回抽取size个样本，选项replace= TRUE表示有放回的抽样

[1] 1 2

> sample(x, 2, replace = TRUE) #有放回的抽样

[1] 2 3

R中用来处理数据的函数太多了而不能全部列在这里。读者可以到所有的基本数学函数(log, exp, log10, log2, sin, cos, tan, asin, acos, atan, abs, sqrt,. . . ), 专业函数(gamma,digamma, beta, besselI, . . . )，同样包括各种统计学中有用的函数。

向量（vector）

1、seq()：产生有规律的数列，间距省略时默认值为1。

例1：seq(10, 20, 0.5)

例2：seq(0, by = 0.03, length = 15)

2、rep()：产生有规律的数列，重复第一个变量若干次。

例1：rep(1:3, 1:3)

例2：rep(1:3, rep(2, 3))

例3：rep(1:3, length = 10)

3、向量运算：一般是对应元素之间的运算，所以两个或多个向量运算时，要求它们包含的元素个素相同（或一个是另一个的

整数倍）。

例1：a <- 1:3; b <- 4:6; a * b; b^a

例2：a <- 1:3; b <- 4:9; a * b; b^a

4、获取向量某一个或多个子集，负号"-"表示删除的向量元素。。

例1：x <- c(3, 4, 5, 2, 6); x[1:2]; x[-(1:2)]

例2：x <- c(3, 4, 5, 2, 6); x[c(1, 2, 4, 1)]; x[-c(1, 2, 4, 1)]

例3：xx <- seq(1, by = 3, length = 10); xx[xx > 13]

例4：x <- 1:20; y <- -9:11; x[y > (1)] #注意产生结果最后一个是"NA"

5、向量的主要运算函数

例1：xx <- c(2, 6, 10, 8, 4)

sum(xx) #和

max(xx) #最大值

min(xx) #最小值

range(xx) #取值范围

mean(xx) #平均值

var(xx) #方差

sort(xx) #从小到大排序

rev(xx) #反排列，所以从大到小排序应该是rev(sort(xx))

rank(xx) #单元值大小顺序

prod(xx) #乘积，所以阶乘是prod(1:n)

例2：x <- seq(1, 15, 2)

append(x, 20:30, after = 5) #插入数据

append(x, 20:30) #参数after缺省默认从向量的最后插入值

replace(x, c(2, 4, 6), -1) #替换函数

例3：state.name

match(c('Ohio', 'Wyoming'), state.name) #完全匹配函数

pmatch(c('Oh', 'Wy'), state.name) #部分匹配函数

state.name[pmatch(c('Oh', 'Wy'), state.name)]

例4：yy <- -9:10

all(yy > 0) #判断所有

all(yy > -10)

any(yy == 0) #判断部分

any(yy > 0)

any(yy < -10)

对一般数据进行运算的常用函数：

1、round() #四舍五入

例： x <- c(3.1416, 15.377, 269.7)

round(x, 0) #保留整数位

round(x, 2) #保留两位小数

round(x, -1) #保留到十位

2、signif() #取有效数字(跟学过的有效数字不是一个意思)

例：略

3、trunc() #取整

floor() #向下取整

ceiling() #向上取整

例： xx <- c(3.60, 12.47, -3.60, -12.47)

trunc(xx)

floor(xx)

ceiling(xx)

4、logb(a, b) #以b为底的对数，省略b表示自然对数

log() #自然对数

log10() #以10为底的常用对数

例： logb(8, 2)

log(8); logb(8)

log10(100); logb(100, 10)

5、sqrt() #平方根

exp() #指数

6、sin() #正弦

cos() #余弦

tan() #正切

asin() #反正弦

acos() #反余弦

atan() #反正切

sinh() #双曲正弦

tanh() #双曲正切

7、nchar() #字符长度

688IT编程网

R常用

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

R常用

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式