团队项目总结
开发内容: 首先我们选择使用Python脚本语言开发这个项目 代码:1.使用python的request库先获取网页内容下来(目标网址首页 url: https://movie.douban.com/top250) 2.解析html文件,提取出我们要提取的信息 import os import requests from bs4 import BeautifulSoup from requests.exceptions import RequestException """ Author: Damon 功能: 爬取豆瓣网Top250电影信息保存到本地 """ # 目标网址 URL = "https://movie.douban.com/top250?start={}" # 按照爬取顺序保存每个电影的网址 entity_url = [] def save_data(result): """ 保存爬取信息到本地 :return: None """ f = open('movice.txt', "a", encoding="utf8") f.write("========================================================================================================\n") f.write(