爬虫06 /scrapy框架
目录 爬虫06 /scrapy框架 1. scrapy概述/安装 2. 基本使用 3. 全栈数据的爬取 4. 五大核心组件/对象 5. 适当提升scrapy爬取数据的效率 6. 请求传参 爬虫06 /scrapy框架 1. scrapy概述/安装 异步的爬虫框架 高性能的数据解析,持久化存储,全栈数据的爬取,中间件,分布式 Twisted:就是scrapy的异步机制 框架:就是一个集成好了各种功能且具有很强通用性的一个项目模板。 环境安装: Linux: pip3 install scrapy Windows: a. pip3 install wheel b. 下载twisted http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted c. 进入下载目录,执行 pip3 install Twisted-18.9.0-cp36-cp36m-win_amd64.whl d. pip3 install pywin32 e. pip3 install scrapy 2. 基本使用 1. 创建工程 新建一个工程:scrapy startproject proName settings.py:当前工程的配置文件 spiders:爬虫包,必须要存放一个或者多个爬虫文件(.py) 切换到工程目录:cd proName 创建一个爬虫文件:scrapy