python3使用selenium获取数据的简单使用

浪子不回头ぞ 提交于 2019-12-19 03:05:59

先安装python第三方库selenium
安装之后需要安装浏览器驱动 我使用的是谷歌,驱动下载地址:http://chromedriver.storage.googleapis.com/index.html
我谷歌浏览器版本为在这里插入图片描述
所以我下载的是在这里插入图片描述
下载好之后exe放在在这里插入图片描述在这里插入图片描述目录下

from selenium import webdriver 
import  re


def getdata(url):
    wd = webdriver.Chrome()  # 实例化
    wd.get('https://sou.zhaopin.com/?jl=801&kw='+url+'&kt=3&sf=0&st=0')  # 在浏览器中输入百度网址
    pagesource = wd.page_source
    wd.close()

    reste = """<p class="contentpile__content__wrapper__item__info__box__job__saray">([\s\S]*?)</p>"""
    regex = re.compile(reste, re.IGNORECASE)
    mylist = regex.findall(pagesource)
    for mylisto in mylist:
        print(mylisto)

print(getdata(".net"))

在这里插入图片描述
获取到得是智联招聘的薪资信息

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!