Scrapy原理讲解

跟風遠走 提交于 2020-01-18 16:24:26

一.scrapy爬虫流程

在这里插入图片描述

scheduler拿到从spiders里面拿到需要爬取的URL并通过Scrapy Engine将其交给下载中间件处理交给Downloader下载。
Downloader通过下载中间件将数据交给引擎,引擎通过爬虫中间件,将数据交给爬虫。
爬虫提取数据交给引擎,引擎通过Pipeline进行数据的存储。
spider通过提取的url地址构造request对象通过爬虫中间交给引擎交给调度器

二 .scrapy项目

在这里插入图片描述

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!