从Python取数到BI分析,它只用10分钟就做出了疫情可视化

女生的网名这么多〃 提交于 2020-02-26 13:50:58

最近大家最关心的事情是什么?那肯定是疫情了,不能出门的感觉真的很难受有没有?

我的内心和该腾讯员工一样:

 

 

为什么会变成这个样子阿!不吃野味会死吗?(此处省略无数字....)

可是生活还是要继续,我们能做的就是不添乱,自我防护。

为了让大家能更了解疫情,我在这里用数据可视化分析出了全国的疫情情况。

根据国家卫健委所公布的数据,我们可以看到重灾区依然是整个湖北省,浙江广东因为人流量较大的原因,也已经变成了重点区域。

 

 

一、数据哪里来?

网站的数据是定时更新的,可能上午看到的数据,下午就会更新,而且差异很大。而通过Excel进行数据汇总时,效率不高,很难做到完全同步。

 

 

因此我在考虑,利用Python进行抓包,并封装成为.exe文件,点击就可以自动下载数据,并以csv格式,进行结构化的存储,方便大家的各种使用。

 

这个工具每运行一次,就会从“腾讯新闻”疫情实时播报网站上,抓取并更新一次数据,并存储到你的电脑D盘(C盘往往需要更高权限读写)。

下载完成的csv文件格式如下:

 

 

 

其实,这个数据无论对企业、个人,还是对我们了解疫情变化发展趋势,都是非常实用。而且我看到网上有很多人,会从不同维度分析问题,作为基础数据也将很有帮助。

二、拿什么分析?

上面说了,拿Excel之类的工具进行数据分析最大的坏处就是数据不能同步,得需要手动录入,而且熟悉数据行业的人应该都知道,Excel遇到大数据就会卡死。

其实,分析工具更多的价值在于辅助分析过程中数据的处理,能够将结论以可视化的方式直观展,最终解决问题。如果在功能上能做到避免写公式写代码,易上手易用,那就更好了。

Python和Matplotlib都能进行可视化的分析,但是需要一定的代码基础,不会代码的人还是占了大多数。于是我想到了BI,即商业智能。

在这里,我用的是FineBI,一款企业级的数据分析工具,具有丰富的可视化和前端分析操作,能可视化地进行数据钻取,数据切片和数据旋转等多维分析操作;同时内置ETL,实时数据分析,同时对大数据能够做到飞速处理,业务人员分析数据再也不用等IT!

FineBI做的数据可视化:

 

 

 

 

在这里,帆软还特别推出了app版疫情跟踪,让企业及时了解每一位员工的身体变化:

 

 

 

三、数据可视化

有了数据,又有了数据分析工具FineBI,接下来就是成果展示了,有了数据直接拖拽就可以生成可视化,10分钟即可搞定~

1、全国动态热力图

关于此次疫情的整体情况大家都应该很清楚了,这里就不放数据了,给大家做一个从开始到现在各地区的疫情变化地图吧。

 

 

2、各城市感染气泡图

X轴为前后两天数据对比(两天时间各地区确诊增长速度),Y轴为100万人确诊率,气泡大小为当日确诊人数。

 

 

  • 一象限(右上角):百万人确诊比率和增长率都大于平均值,是比较严重的地区,如图上的重庆
  • 二象限(左上角):百万人确诊率大于平均值,增长率小于平均值,说明相对其他省形式有缓解,如浙江
  • 三象限(左下角):两个指标都低于平均值,属于相对其他地区算比较正常,如广西
  • 四象限(右下):增速快,确诊率低于平均值,属于需要提高警惕注意的地区,如江西

 

 

 

 

 

 

从气泡图中可以看出,浙江广东河南安徽这些省,已经变成了除湖北之外的第二重灾区,疫情已经到了刻不容缓的地步。

四、总结

疫情到现在也这么久了,中间也发生了很多让人惋惜和愤怒的事情,但是归根到底,绝大多数人的初衷就是结束这场没有硝烟的战争。

我们普通群众能做的就是安心在家,做好自身防护,相信国家能带领我们取得胜利,就像03年的那个事情一样。

关注我,并转发该文章,私信回复“BI”,即可获得FineBI个人永久免费版~

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!