【scrapy】【五】scrapy项目二

人盡茶涼 提交于 2020-01-26 00:20:44

1、多个url

在之前的基础上,添加多个url进行爬取,

第一种是将需要爬取的网站都列出来,在start_urls中

#在basic.py中
start_urls={
'网址1',
'网址2',
'网址3',

}

 第二种是如下写法:

start_urls=[i.strip() for i in open('todo.urls.txt').readlines()]

 

2、双向爬取(水平、垂直爬取)

水平爬取就是next page或者多个url进行爬取

垂直爬取是某个网页下某个目标的爬取

示例:

首先复制一下之前写的爬虫文件,basic.py

cp basic.py manual.py

【未完待续】

 

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!