【爬虫学习笔记day64】7.6. scrapy-redis实战--尝试改写新浪网分类资讯爬虫2
文章目录 7.6. scrapy-redis实战--尝试改写新浪网分类资讯爬虫2 将已有的新浪网分类资讯Scrapy爬虫项目,修改为基于RedisSpider类的scrapy-redis分布式爬虫项目 items.py文件 settings.py文件 spiders/sina.py 执行: 7.6. scrapy-redis实战–尝试改写新浪网分类资讯爬虫2 将已有的新浪网分类资讯Scrapy爬虫项目,修改为基于RedisSpider类的scrapy-redis分布式爬虫项目 注:items数据直接存储在Redis数据库中,这个功能已经由scrapy-redis自行实现。除非单独做额外处理(比如直接存入本地数据库等),否则不用编写pipelines.py代码。 items.py文件 # items.py # -*- coding: utf-8 -*- import scrapy import sys reload ( sys ) sys . setdefaultencoding ( "utf-8" ) class SinaItem ( scrapy . Item ) : # 大类的标题 和 url parentTitle = scrapy . Field ( ) parentUrls = scrapy . Field ( ) # 小类的标题 和 子url subTitle =