python爬取静态数据并存储json

匿名 (未验证) 提交于 2019-12-02 22:51:08
 import requests  import chardet  from bs4 import BeautifulSoup  import json ''' 遇到python不懂的问题,可以加Python学习交流群:1004391443一起学习交流,群文件还有零基础入门的学习资料 ''' user_agent='Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 SE 2.X MetaSr 1.0'  headers={'User-Agent':user_agent}  r=requests.get('http://seputu.com/',headers=headers)  r.encoding=chardet.detect(r.content)['encoding']  soup=BeautifulSoup(r.text,features='html.parser')  content=[]  for mulu in soup.find_all(class_='mulu'):      h2=mulu.find('h2')      if(h2!=None):          h2_title=h2.string          list=[]          for a in mulu.find(class_='box').find_all('a'):              href=a.get('href')              box_title=a.get('title')              print(href,'|||',box_title)              list.append({'href':href,'box_title':box_title})              pass          content.append({'title':h2_title,'content':list})          pass      pass  with open('1.json','w') as fp:      json.dump(content, fp=fp,indent=4)

文章来源: https://blog.csdn.net/fei347795790/article/details/91439559
标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!