浦东机场

数据可视化:python调用pyecharts库绘制航线专题图

跟風遠走 提交于 2019-11-28 20:57:14
写在前面 这学期上了数据通讯这门课,其中有一个作业是要求爬取某一天各重要城市到上海虹桥以及上海浦东两机场的航班信息,然后进行可视化、数据分析。在这一份作业用到的可视化工具是python的pyecharts库,其中一幅图的效果如下: 事实上这航线图是可以动的,只是截了个屏,下面具体说一下怎么操作。用到的库除了pyecharts,还有numpy、panda. 第一步 获取数据 要做数据的可视化,首先肯定要获取数据。我是采用C#+selenium动态爬取携程网上的10月30号的数据,selenium通过调用命令模拟人与浏览器的交互,效果不错。爬取下来的数据放在了一个文件夹里,每个城市到上海的存入一个文本文档中。 第二步 数据处理 在这里我是用numpy+pandas处理数据的,没安装这两个包的先安装再进行操作。 1.读取原始数据 import numpy as np import pandas as pd import os df = pd . read_fwf ( r "C:\Users\58381\Desktop\data\北京—上海.txt" , encoding = "utf-8" , header = None , names = [ "航班号" , "飞机机型" , "出发时间" , "出发机场" , "到达时间" , "到达机场" , "出发城市" ] ) for