字符1字符2
A1B1
A2B2
A3B3
A4B4
A5B5
A6B6
A7B7
A8B8
这时,我们需要使⽤⽂本合并类函数,⽐如CONCATENATE
如果我们想提取⼀列中的部分⽂字,可以使⽤MID函数。MID函数的⽤法是MID(text, start_num, num_chars)。这⾥,text是需要提取的单元
格,start_num指从哪⼀位开始提取(start_num>=1),num_chars表⽰⼀共提取多少位。
⽐如,有这样⼀列:
image
我们的需求是去掉⼯作经验⼀栏中的“经验”⼆字,并且保留其余的⽂字。不难发现,“经验”⼆字全部为前两个字。所以我们可以使⽤MID函数对这⼀列除去“经验”的⽂字进⾏提取。⾸先编写第⼆⾏的⽂本提取:=MID(F2,3,6),表⽰提取F2的内容,从第3位开始提取,提取的总长度为6。然后再⽤⾃动补全(将⿏标移动⾄G2单元格右下⾓,出现+号指针,并且双击右下⾓),将整个G列填充,结果如下图:
新手入门excel表格制作打印
[图⽚上传失败...(image-8848b4-1609657966384)]
如果我们想将⼀列中的指定字符替换成想要的字符,可以使⽤SUBSTITUTE函数。SUBSTITUTE函数的⽤法是SUBSTITUTE(text, old_text, new_text,
instance_num),这⾥,text是要被替换的单元格,old_text是将要被替换的指定字符串,new_text是想要替换的⽬标字符串,instance_num是指被替换字符串如果出现多次,替换第⼏个出现的字符串,如果为空,则默认全部替换。
⽐如,有这样⼀列:
image
我们的需求是将此列中所有内容为1的单元格替换为“本科及以上”。所以,我们可以使⽤SUBSTITUTE函数,对于⽂本替换列,我们输
⼊=SUBSTITUTE(H2,1,"本科及以上"),并且使⽤⾃动填充,即可得到结果:
image
如果我们想验证某⼀列中是否存在指定字符串(数据验证),可以使⽤FIND函数。FIND函数的⽤法是FIND(find_text, within_text, start_num),这⾥,find_text是指要查的字符串,within_text是要在其中搜索的字符串单元格,start_num是指开始搜索的位置,如果忽略,start_num默认为1。
⽐如有这样⼀列:
image
我们的需求是判断此列中是否存在“数据分析”这⼀关键字。所以,我们⾸先使⽤FIND函数,对于数据验证列,我们输⼊=FIND("数据分
析",J2,1),并且使⽤⾃动填充,可以得到结果:
image.png
我们可以看到,由于有⼀些类别中并⾮存在“数据分析”关键字,所以结果中会有错误#VALUE!。对于这样的情况,我们可以进⼀步使
⽤ISNUMBER函数来同⼀格式。如果单元格内容为数字,ISNUMBER函数返回TRUE,否则返回FALSE。在FIND函数外再嵌套ISNUMBER函数,我们可以得到结果:
image.png
其实,掌握了函数的使⽤⽅法,我们可以根据具体需求使⽤不同种类的函数。微软官⽅也提供了全部函数的使⽤指
南:support.microsoft/zh-cn/office/excel-
%E5%87%BD%E6%95%B0%EF%BC%88%E6%8C%89%E5%AD%97%E6%AF%8D%E9%A1%BA%E5%BA%8F%EF%BC%89-
b3944572-255d-4efb-bb96-c6d90033e188。
数学函数
前⽂中提到的三个函数都是对⽂本数据进⾏处理(查、提取、替换),所以会使⽤⽂本函数进⾏处理。⽂本函数更多的是对⽂本进⾏清洗、格式化。对于数值型数据,我们可以使⽤数学函数,进⾏⼀定的统计计算。我们⼤致可以将数学函数分为⼏类:
| 类型 | 关键字 |
| :---: | :----: | :----: |
| 基本换算 | SQRT(平⽅根), POWER(幂运算)|
| 基础统计 | SUM(求和),AVERAGE(平均值)|
| 类型转换 | INT (求整),EVEN(求最近的偶数)|
这些计算都是基本的数值运算,下⾯的例⼦展⽰了他们的⽤法:
image
运算的结果是:
image
需要留意的是,数学函数的输⼊参数既可以是⼿动输⼊的数值数据(⾮单元格数据),也可以是单元格数据。⽐如,统计求和函数SUM()可以统计⼀列单元格的总和:
image.png
在之前的章节中,我们提到了集中趋势指标和离散趋势指标。我们可以利⽤数学函数来计算以下⼯资表的各种指标:
image
计算结果如下:
image.png
处理重复数据
在真实的资料分析⼯作中,数据的预处理是指数据的清洗、格式化、去重、排序和基础计算。这⼀步很可能会占据整个分析⼯作50%以上的时间。为什么数据预处理如此地重要呢?是因为如果数据预处理没有做好,⽐如存在⼀些缺失值、异常值,那么最后的数据分析结果的准确性会直接受到影响,从⽽造成错误的统计结果和结论。之前的章节已经介绍了如何处理缺失值和异常值。对于缺失值、异常值可以进⾏删除或者填充平均值的⽅法进⾏处理。那么对于重复数据,应该如何处理呢?
⾸先我们需要定位重复数据。EXCEL已经提供了定位重复数据的功能。在开始菜单中到条件格式,选择突出显⽰单元格规则中的重复值,重复的数据就会被⾼亮:

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。