python网络爬虫与信息提取mooc------爬取实例
实例一--爬取页面 1 import requests 2 url="https//itemjd.com/2646846.html" 3 try: 4 r=requests.get(url) 5 r.raise_for_status() 6 r.encoding=r.apparent_encoding 7 print(r.text[:1000]) 8 except: 9 print("爬取失败") 正常页面爬取 实例二--爬取页面 1 import requests 2 url="https://www.amazon.cn/gp/product/B01M8L5Z3Y" 3 try: 4 kv={'user-agent':'Mozilla/5.0'} 5 r=requests.get(url,headers=kv) 6 r.raise_for_status() 7 r.encoding=r.apparent_encoding 8 print(r.text[1000:2000]) 9 except: 10 print("爬取失败") 对访问用户名有限制,模拟浏览器对网站请求 实例三--爬取搜索引擎 1 #百度的关键词接口:http://www.baidu.com/s?wd=keyword 2 #360的关键词接口:http://www.so.com/s?q=keyword 3