python爬虫2
学习任务 获取去哪儿网的出发地列表 获取旅游景点列表 获取景点产品列表 存储数据 1 获取出发地站点 (1)访问touch.qunar.com (2)按F12,单击自由行,在自由行页面点击搜索框 (3)单击任意一个城市,切换到headers,查看request URL如下所示。但是需要工具还原编码咋们才能知道这是啥(dep参数表示出发地,query表示目的地)。推荐网站 http://www.jsons.cn/urlencode/ ,解码效果下面图2 3 实现 (1)首先获得出发地站点,因为最终需要获得整个自由行的产品列表。 自由行首页中点击左侧的出发点站点,然后获取目标URL如图二 1 import requests 2 url="https://touch.dujia.qunar.com/depCities.qunar" 3 4 5 strhtml=requests.get(url) 6 print(strhtml) 7 dep_dict=strhtml.json() 8 print(dep_dict) 9 for dep_item in dep_dict['data']: 10 for dep in dep_dict['data'][dep_item]: 11 print(dep) View Code (2)获得目的地。根据上面的分析,json工具解码以后通过拼接可得URL。