python爬虫:Requests库(一)

别说谁变了你拦得住时间么 提交于 2020-01-26 23:46:53

python爬虫:Requests库(一)

from mooc网络爬虫与信息提取

下面是爬虫的基本框架

import requests


def get_test_html(url):
    try:
        r = requests.get(url, timeout=30)  # 如果时间超过30则报错
        r.raise_for_status()  # 返回的是访问状态,200则成功,否则将会报错
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return '发生异常'


if __name__ == '__main__':
    url = 'http://www.baidu.com'
    print(get_test_html(url))

基本方法的展示


post 提交的数据放到form表单里,如果data只是一个字符串则在data里面
在这里插入图片描述

requests库的一些基本方法与属性

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

kwargs里包含的参数

params

在这里插入图片描述

data

在这里插入图片描述

json

在这里插入图片描述

headers

在这里插入图片描述

cookies auth files 等

在这里插入图片描述

timeout

在这里插入图片描述

proxies 代理

在这里插入图片描述
在这里插入图片描述

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!