编写一个AQI分析的Orange插件
原创文章,欢迎分享 ! http://my.oschina.net/u/2306127/blog/613875 最近空气污染严重,也为了演练一下Orange插件编写和数据处理的学习成果,准备开发一个AQI数据获取和分析的插件。目前做出来的一个样子如下,还有点酷吧?[下一步完善后,会将源码共享,目前暂不拿来误人,感兴趣的可交流] 研究过程中,也发现一个重要的趋势: 北京的空气质量在整个华北平原地区,几乎任何时候都是最好的! 这里主要介绍研究过程,目前结论只是初步观察,后面研究再提供相应的分析图表。 过程中遇到的问题和处理办法,与大家分享,也有一些未决的问题,看哪位牛人可以解决: 1、从网页上抓取AQI数据 数据来源用的 http://aqicn.org 。使用requests这个库进行数据抓取,功能很强,尤其是可以自定义Header。如果不自定义header,由于这个网站采用了反抓取技术,只返回过期的老数据,是无法得到最新的数据的。代码如下: #Get AQI data from web,by a region. def getaqidata(left,right,bottom,top): aqi_url = geturl(left,right,bottom,top) aqi = requests.get(aqi_url,headers=gethead()) raqi = aqi