简单爬取腾讯新闻内容方法封装

做~自己de王妃 提交于 2020-01-10 11:24:50
import urllib.request
import re


def get_new_qq(url, pat, file):
    data = urllib.request.urlopen(url).read().decode("gbk", "ignore").strip()
    res = re.compile(pat).findall(data)
    with open(file, "w") as f:
        f.write(str(res))
        return res


if __name__ == '__main__':
    url = "https://www.qq.com/?pgv_ref=1"
    pat = "<li><a .*>(.*)</a></li>"
    file = "../腾讯新闻.txt"
    print(get_new_qq(url, pat, file))
标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!