爬虫从入门到放弃 - 纯新手学习-爬虫基本数据库安装
1.安装好前期必备的库 - requests 向网页发出请求 解释器自带的urllib 和re selenium 用于向有js渲染的网页发起请求 from selenium import webdriver driver = webdriver.Chrome() # 生成一个driver对象,并打开谷歌浏览器 selenium需要打开网页,不方便 from selenium import webdriver driver = webdriver.PhantomJS() # 生成一个driver对象 pip3 install lxml 也可以去python官网下载whl文件,下载好的文件链接,whl结尾的用pip3 install 链接 直接安装 3.beautifulsoup 也是一个网页解析库 依赖于lxml,也就是要先安装lxml这个库 >>> from bs4 import BeautifulSoup # 导入BeautifulSoup >>> soup = BeautifulSoup(‘(html)(/html)‘,‘lxml‘) 为什么是bs4,因为别人写模块的时候定义了一个包就叫ps4,里卖弄存放着这个模块。可以去官网查看源代码 4.pyquery 解析库 pip3 install pyquery >>> from pyquery import PyQuery as