模拟浏览器爬取信息
> #模拟chrome 浏览器打开网址 并进行爬取东西 from splinter import Browser b=Browser('浏览器名') #打开浏览器 #需要安装对应的驱动 > #访问网站的网址 b.visit('访问的网址') > #find_by_css()查询 click点击 b.find_by_css('body > div.register_layer > div.register_bg >a').click() > #输出文本 b.find_by_css('#container_jobList > ul > li:nth-child(1)').text #
#切换窗口
#打开第二个窗口 二级页面
b.windows.current=b.windows[1] #指定当前操作窗口
b.windows[0].close_others() #关闭除了指定窗口外的其他窗口
b.find_by_css(’#page-con > input’).fill(5) #输入页码
b.find_by_css(’#page-con > span.go_jump’).click() #点击跳转
为了防止访问的时间太快,被发现,可加入time
import time
time.sleep(4) #4秒后运行
文章来源: https://blog.csdn.net/weixin_45047545/article/details/90369434