Python 爬虫---百度首页
#这个是urllib2的前身 import urllib.request #把自己伪装成浏览器,防止被封。。。 ua_headers = {"User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36"} #通过urllib2.Request()方法构造一个请求对象 request = urllib.request.Request("http://www.baidu.com/",headers = ua_headers) #向指定的url地址发送请求,并返回服务器响应的类文件对象 response = urllib.request.urlopen(request) #服务器返回的类文件对象支持Python文件对象的操作方法 #read()方法就是读取文件里的全部内容,返回字符串 html = response.read() #打印响应的内容 print(html) 结果: D:\Python3Work\u1\venv\Scripts\python.exe D:/Python3Work/u1/爬虫基础/urllib2的使用.py b'<!DOCTYPE html>\n<!--STATUS