制作疫情数据可视化图表——一张图看懂全球疫情
根据Worldometer网站最新统计数据,截至北京时间4月12日23时,全球新冠肺炎确诊病例已达1803633例,死亡110835例。
 
全球疫情如何能更直观的查看?
必不可少的工具就是数据可视化了。下面是截止到4月5日制作的仪表盘看板供大家参考。
 
我们在查看数据可视化之前先了解一下数据分析。
完整的数据分析主要包括了六大步骤,它们依次为:分析设计、数据收集、数据处理、数据分析、数据展现、报告撰写等,所以也叫数据分析六步曲。
01
分析设计
首先要明确数据分析目的以及确定分析思路。
国内疫情基本控制,国际疫情爆发期,大家关注的热点转移到了国际.疫情控制要打好外防内控组合拳。本次新冠疫情可视化思路为国际疫情查看以及国内输入病例分布等。
02
数据收集
数据收集是按照确定的数据分析框架,收集相关数据的过程,它为数据分析提供了素材和依据。
北京疫情最新数据这里的数据包括一手数据与二手数据,一手数据主要指可直接获取的数据,如公司内部的数据库、市场调查取得的数据等;二手数据主要指经过加工整理后得到的数据,如统计局在互联网上发布的数据、公开出版物中的数据等。
本次数据来自于网络国内公开数据。字段有国家、日期、确诊病例、死亡病例、治愈病例。以及各国内输入病例数据城市、输入病例数量。
03
数据处理
数据处理是指对采集到的数据进行加工整理,形成适合数据分析的样式,保证数据的一致性和有效性。它是数据分析前必不可少的阶段。
数据处理主要包括数据清洗、数据转化、数据抽取、数据合并、数据计算等处理方法。一般的数据都需要进行一定的处理才能用于后续的数据分析工作,即使再“干净”的原始数据也需要先进行一定的处理才能使用。
这里我们进行了哪些数据处理呢?
首先:增加了数据计算字段:死亡率=死亡病例/确诊病例(累计);治愈率=治愈病例/确诊病例(累计)。
再一个是:各国国家发现病例的时间不同,我们无法很好的同期比较,这里我们选取疫情TOP国家,以病例超过100例那天同设定为起始第一天。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。