1.python基础
基础包括python语法基础,变量,循环嵌套等等,可以在菜鸟python菜鸟教程
2. 基本库
入门一般用到urllib和urllib2即可
3.正则表达式
正在表达式用于匹配网页中所需要的元素,可到我之前写的30分钟入门正则表达式学习。
4. 网页抓取框架
最常用框架scrapy
5.高级爬虫
来源:CSDN
作者:AlexMYH
链接:https://blog.csdn.net/AlexMYH/article/details/80379565
基础包括python语法基础,变量,循环嵌套等等,可以在菜鸟python菜鸟教程
入门一般用到urllib和urllib2即可
正在表达式用于匹配网页中所需要的元素,可到我之前写的30分钟入门正则表达式学习。
最常用框架scrapy
来源:CSDN
作者:AlexMYH
链接:https://blog.csdn.net/AlexMYH/article/details/80379565