lxml中的xpath股票信息提取

倖福魔咒の 提交于 2020-03-10 10:58:09

  lxml中的xpath股票信息提取:

import urllib.request
import lxml
import lxml.etree
import re
def  download(url):
    headers={"User-Agent":"Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0);"}
    request = urllib.request.Request(url, headers=headers)  # 请求,修改,模拟http.
    data = urllib.request.urlopen(request).read()  # 打开请求,抓取数据
    #data=data.decode("gbk").encode("utf-8")#乱码
    mytree=lxml.etree.HTML(data)
    datalist=mytree.xpath("//*[@id=\"datalist\"]//tr//td//text()")
    print(datalist)
    for  linedata in datalist:
        print(linedata)

download("http://quote.stockstar.com/fund/stock_3_1_2.html")

 

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!