数据分析完整过程演示——气温数据分析
原创 2015-11-19 ccccfys spss统计分析
在11月17日,仍然需要穿上背心才能避免出汗,这就是广州。北方的朋友可能很难想象这是啥感觉!但今天就是如此,虽然广州一直以来都很热,可是今年似乎比去年,前年都更热。这是我的感觉,那么感觉对不对呢?我们点数据来验证一下吧!(我将带领大家通过这个简单的例子走一遍数据分析的流程)
一、确定调查方向
数据,我们需要什么样的数据呢?我们想要比较今年是不是比往年热,那么怎么比呢?个人觉得今年和去年同一天进行比较比较容易理解,因为我在感觉今年比去年热的时候,也是比较的去年同期。所以这个比较方法我觉得靠谱所以应该到今年,去年,前年这三年的每日气温数据。确定好要的数据是什么,再去寻,就比较容易了,起码我知道该在搜索引擎中搜索哪些关键字了。
二、收集数据
查数据,如果不是有人给你指路,或者你有丰富的数据搜索经验,这将是一个非常繁杂的过程,网上有些数据是比较规范的,但是也有很多数据是不规
范的,而且来源很多。到了你想要的数据,这并不意味着你可以很容易地将它下载到本地,如果有编写爬虫的经验,那么这将会容易一些,但是我想大多数人和我一样,不会爬虫。(我正在合适的材料学习爬虫,因为我觉得这项技能很重要)这样的话就需要大量重复的操作才能获取到足够的我们需要的数据。你要不停地复制粘贴,切换浏览器与Excel的界面。对于我们要的天气数据,如果你能到整年数据在一个表中的数据源,那么恭喜你,只用复制粘贴3次,我到的数据源是按月给出的,所以要复制粘贴(3×11=33)次。因为还没有今年12月的数据,所以前两年对应月份也不要了。
基于已经拥有的经验,经过一小段时间的查,到了我想要的数据源“2345天气预报”,百度可以搜到这个网站。到你想了解的城市的历史数据开始复制粘贴。
三、整理清洗数据
复制粘贴得到的数据格式还不完全符合我们的需要,因此我们需要进行数据的清洗和整理。
比如要将日期和星期分离,当然也可以不分离,但是那样不规范。要将单位去掉,以便能够在坐标轴上以数值显示,否则被识别为字符串。对这个例子来说我们要做的有:
1)通过Excel的分列功能,拆分日期和星期。
countif函数计算百分比用快捷键Ctrl+H调出替换菜单,将℃这个符号替换为空白。
经过上述步骤,处理后的数据就能够进行分析了,整理好的数据结构如下图:
四、分析数据
做好数据整理以后,就要开始进行分析了。我们打算做三个方面的分析;1)通过折线图直接比较三年每日气温;
2)计算今年气温高于往年同日的天数及所占比率;
3)计算每年温度的和,并比较这三年数据;
我们一个一个来分析。
通过折线图直接比较三年每日气温,由于做出这种效果过程复杂,没有写出具体的步骤,以后会做成视频分享出来。我们来看效果图:
可以看到,今年后半年红的线大多数情况下都高于蓝和天蓝的线,而红表示2015年。这里反映了至少2015年下半年,是要比过去两年的下半年更
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论