python爬虫实战:下载百度文库文档

[亡魂溺海] 提交于 2020-04-20 22:02:07

最近在写/毕/业/论/文,想搜一篇致谢参考一下,我想复制一下,结果。。

百度文库的内容不可以批量复制,只能一点点复制,实在太麻烦了。
在这里插入图片描述
就试着Ctrl+Shift+i看下文字部分可不可以被选中,结果竟然可以。
在这里插入图片描述
在这里插入图片描述
这里头的文字部分是可以被选中的,可以看到class namereader-word-layer,因此理论上是可以通过爬虫直接获取的,接下来就尝试使用class来获取,结果还不错,非常迅速的download下来了,省去了-下载券,效果如下:
在这里插入图片描述
代码非常简单,通过url访问后,获取class下的内容就行了,源码公众号回复【百度文库】就可以获取啦~so easy(切莫商用,请自娱自乐!
在这里插入图片描述







发布了20 篇原创文章 · 获赞 3 · 访问量 1570
标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!