splinter

匿名 (未验证) 提交于 2019-12-02 23:34:01

模拟浏览器爬取信息

 > #模拟chrome 浏览器打开网址 并进行爬取东西  from splinter import Browser b=Browser('浏览器名')     #打开浏览器    #需要安装对应的驱动  > #访问网站的网址  b.visit('访问的网址')  > #find_by_css()查询       click点击  b.find_by_css('body > div.register_layer > div.register_bg >a').click()    > #输出文本  b.find_by_css('#container_jobList > ul > li:nth-child(1)').text   #  

#切换窗口
#打开第二个窗口 二级页面
b.windows.current=b.windows[1] #指定当前操作窗口

b.windows[0].close_others() #关闭除了指定窗口外的其他窗口

b.find_by_css(’#page-con > input’).fill(5) #输入页码
b.find_by_css(’#page-con > span.go_jump’).click() #点击跳转

为了防止访问的时间太快,被发现,可加入time
import time
time.sleep(4) #4秒后运行

文章来源: https://blog.csdn.net/weixin_45047545/article/details/90369434
标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!