excel处理⼏⼗万⾏数据_分享两个⽤Excel处理数据的神技巧Hello,⼤家好。今天,勾勾请来了取经⼉⽼师,来分享两个 Excel 中超赞的技巧,绝对能提升你的⼯作效率!
作者简介:
取经⼉⼁前⼩⽶、⽹易数据分析师
Excel 作为最常⽤的 Office 办公软件之⼀,拥有强⼤的数据处理能⼒,各⾏业不同岗位的同学都离不开 Excel。对于数据分析师⽽
⾔,Excel 更是每天必⽤的⼯具。
这⾥我分享两个 Excel 独特且重要的技巧:vlookup 函数及透视表功能。
这两个技巧对数据分析师来说⾮常实⽤,⽽且是 Excel 典型代表,其他数据⼯具很少有像 vlookup 这样互动性强⼜便捷的函数。⽽透视表被很多 BI ⼯具模仿,因为它靠简单拖曳就可完成数据统计,如果使⽤得当,可以帮助我们节约不少⼯作时间,提⾼⼯作效率。
0 1巧⽤ vlookup 函数
vlookup 函数功能,即通过表格⾸列查该函数指定需要查询的值,并返回当前表格中指定列的数值。函数表达式如下所⽰:
1. vlookup(查值,数据表,列序数,匹配条件)
下⾯通过⼀个案例帮你来理解这个函数。
现有⼀列记录了⽤户注册省份名称的数据,希望你可以补充省份对应的“省份简称”和“省会城市”数据。
这种情况下,如果你没有掌握 vlookup 函数,就需要⼀⾏⾏地⼿动添加,需要处理的数据量少还好说,但如果需要补充的数据源有⼏⼗万⾏,那该怎么办?⼿动处理会变成⼀场噩梦。
这时,通过 vlookup 函数,就可以瞬间解决这个问题。
第⼀步,我们需要制作⼀个省份、简称、省会的映射表,如图所⽰。
第⼆步,添加 vlookup 函数,按照前⾯我们讲的格式填写 4 个参数,如图所⽰。
第1个参数 M8 指的是要查单元格的值。
第2个参数 F:H 指的是要查的位置。
第3个参数数字 2,表⽰要返回的值的区域中的列号。
excel vlookup函数怎么用第4个参数设置为 FALSE 是表⽰严格匹配才返回,如果设置为 TRUE 或 1 则表⽰模糊匹配。
接下来只需要复制函数到 N 列的每个对应的单元格,瞬间省份的简称就填写到对应位置上了,见下图。
可以看到,通过上⾯的操作,我们⾮常便捷地完成了通过表格⾸列(即 F 列)查该函数指定需要查询的值(如"⼭东省"这个值),并返回当前表格中指定列(即 G 列)的数值(即"鲁")。
这就是 vlookup 函数最常⽤的⼀个应⽤场景。即给出查询内容,在指定区域查询对应内容,然后返回。
下⾯我们看 vlookup的另外⼀种应⽤场景,连续数值划分区间。
现假设有⼀列记录了 10 万条 App ⽤户注册年龄的数据,我们希望能够按年龄段进⾏划分(⽐如:0~7 岁、8~18 岁、19~24 岁、25~35岁、36~50 岁、51 岁以上等),以便统计各年龄段⽤户的分布情况。⾯对这样的需求,vlookup 仍然能够轻松实现,下⾯我们⼀步步完成数据的统计。
第⼀步,先按需求准备划分的年龄段,输⼊两列数据。第⼀列是划分段最⼩值,第⼆列填写分段名称,这⾥要注意上个分段和下个分段的数据连续性,即下个分段最⼩值是上个分段最⼤值加 1。以“0~7 岁”为例,“0”为该分组下限,“7”为下个分组上线减 1。
第⼆步,输⼊ vlookup 函数, 填写 4 个参数,然后按回车键就会输出正确的结果,如图所⽰。
上⾯介绍了两个 vlookup 常⽤案例,也是数据分析师⽇常处理数据经常遇到的场景,⼀个快速匹配,⼀个是连续数值分段。⼯作中,使⽤vlookup 函数的场景我们经常遇到,希望你能够活学活⽤,利⽤它实实在在地提⾼我们的⼯作效率。
0 2巧⽤透视表
接下来我们学习第⼆个技巧。同 vlookup 函数⼀样,透视表在我们的⼯作中也⾮常的重要。
你可以把透视表理解为数据处理的"最后⼀公⾥",它可以很⽅便通过⿏标“点点点”完成数据的分组统计、排序、求平均、⾏列计算占⽐等常⽤数据分析功能,并且如果原始数据更新,透视表的数据也会同步更新。
这对我们进⾏数据分析整理⽆异于提供了⼀个便捷的⼯作⽅式和⼿段,下⾯我们通过⼀个例⼦来介绍 Excel 透视表的常⽤功能。
数据源包括 4 列数据,分别是⽤户注册 ID、性别、省份、App 使⽤时长。我们希望了解该 App 对不同性别⽤户的吸引⼒,以及⼥性⽤户在不同地区的覆盖情况。我们看透视表如何完成分析⽬标。
针对这个⽬标,我们可以统计下⾯两个数据:
1. 不同性别⽤户数量差异、⼈均 App 使⽤时长、总使⽤时长占⽐;
2. ⼥性⽤户在不同省份的数量、⼥性⽤户⼈均 App 使⽤时长,以及⼥性⽤户总使⽤时长占⽐。
第⼀步,⽣成透视表。使⽤Ctrl+A 快捷键,将数据源全部选中,然后点击菜单栏“插⼊”->“数据透视表”。
你可以看到透视表主要包括字段列表、透视表区域,以及筛选器等,三者有着不同的作⽤。
第⼆步,将“性别”字段拖⼊“⾏”区域。将“App 使⽤时长”字段拖⼊两次到“值”区域, 第⼀次,将值字段设置为求平均值;第⼆次,将值字段设置为求和。
值。
App 使⽤时长拖⼊值区域,并设置相应统计⽅式,我们便可得到想要的结果。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论