淘宝爬取图片和url

泄露秘密 提交于 2019-12-05 04:02:01

刚开始爬取了 百度图片和搜狗图片

但是图片不是很多,随后继续爬取淘宝图片,但是淘宝反爬比较厉害 之前的方法不能用

记录可行的 淘宝爬取 利用selenium爬取

https://cloud.tencent.com/developer/article/1151774

github

https://github.com/Python3WebSpider/TaobaoProduct

(需要修改代码,自己扫码登陆 继续爬)看issues

注意:爬多了 肯能出现滑块验证 使用开发者模式避免

利用pyquery进行搜索   就不需要正则表达式了

使用方法

https://www.cnblogs.com/gj5379/p/8514535.html

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!