urllib库
urllib库 urllib 库是 Python 中一个最基本的网络请求库。可以模拟浏览器的行为,向指定的服务器发送一个请求,并可以保存服务器返回的数据。 urlopen函数: 在 Python3 的 urllib 库中,所有和网络请求相关的方法,都被集到 urllib.request 模块下面了,以先来看下 urlopen 函数基本的使用: from urllib import request resp = request.urlopen('http://www.baidu.com') print(resp.read()) 实际上,使用浏览器访问百度,右键查看源代码。你会发现,跟我们刚才打印出来的数据是一模一样的。也就是说,上面的三行代码就已经帮我们把百度的首页的全部代码爬下来了。一个基本的url请求对应的python代码真的非常简单。 以下对 urlopen 函数的进行详细讲解: url :请求的url。 data :请求的 data ,如果设置了这个值,那么将变成 post 请求。 返回值:返回值是一个 http.client.HTTPResponse 对象,这个对象是一个类文件句柄对象。有 read(size) 、 readline 、 readlines 以及 getcode 等方法。 urlretrieve函数: 这个函数可以方便的将网页上的一个文件保存到本地