scrapy框架学习
- 一 什么是scrapy? - Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,非常出名,非常强悍。所谓的框架就是一个已经被集成了各种功能(高性能异步下载,队列,分布式,解析,持久化等)的具有很强通用性的项目模板。 - 安装 - linux: pip3 install scrapy - windows: - 1) pip3 install wheel - 2) 下载Twisted ( http: / / www.lfd.uci.edu / ~gohlke / pythonlibs / #twisted ) - 3) 进入下载目录, 执行 pip3 install Twisted‑ 17.1 . 0 ‑cp35‑cp35m‑win_amd64.whl - 4) pip3 install pywin32 - 5) pip3 install scrapy - 二 使用 - 1) 创建项目:scrapy startproject 项目名称 - 2) 创建应用程序: - 先进入项目目录: cd 项目名 - scrapy genspider 应用名 爬取网页的起始url: - 生成的初始文件 # -*- coding: utf-8