福金

广西互联网金融平台系列-Scrapy爬虫爬取大户人家-福金贷

自作多情 提交于 2019-12-09 16:58:08
一、背景 广西这么多平台当中,跟国有企业挂钩的不少,像林海金融、福金贷、金投互联网等平台。其中福金贷的上线还得到广西电视台的报道,这么有实力的平台,数据是怎么样的? 二、目的 这一次就想看看大户人家的数据 三、代码示例 方式:在标的列表页是用JS点击-跳转到详情页面的,遇到这种渲染方式,我也只能采用scrapy结合selenium的方式进行数据抓取了。但是经过勘察分析,发现JS渲染的跳转地址和详情页url地址一致,那就不用跳来跳去了,正则匹配一下,把坐标提取出来再组合url就行了。 class GxfjdSpider(scrapy.Spider): name = 'gxfjds' allowed_domains = ['www.gxfjd.net'] start_urls = ['https://www.gxfjd.net/boot/invest/420/1'] def parse(self, response): print(response) """ 将当前列表页的每条标的链接拿到 并传给detail进行深入爬取 已知页码可以在url中循环 就不用翻页了 """ total = response.css('table.newpro-table tr.leftTime') for x in total: target_js = x.css('td.button a::attr