Scrapy框架实战-妹子图爬虫
Scrapy这个成熟的爬虫框架,用起来之后发现并没有想象中的那么难。即便是在一些小型的项目上,用scrapy甚至比用requests、urllib、urllib2更方便,简单,效率也更高。废话不多说,下面详细介绍下如何用scrapy将妹子图爬下来,存储在你的硬盘之中。关于Python、Scrapy的安装以及scrapy的原理这里就不作介绍,自行google、百度了解学习。 一、开发工具 Pycharm 2017 Python 2.7 Scrapy 1.5.0 requests 二、爬取过程 1、创建mzitu项目 进入"E:\Code\PythonSpider>"目录执行scrapy startproject mzitu命令创建一个爬虫项目: 1 scrapy startproject mzitu 执行完成后,生产目录文件结果如下: 1 ├── mzitu 2 │ ├── mzitu 3 │ │ ├── __init__ .py 4 │ │ ├── items.py 5 │ │ ├── middlewares.py 6 │ │ ├── pipelines.py 7 │ │ ├── settings.py 8 │ │ └── spiders 9 │ │ ├── __init__ .py 10 │ │ └── Mymzitu.py 11 │ └── scrapy.cfg 2