lxml
#安装 pip3 install lxml ( pip install lxml ) #导入 from lxml import etree # https://www.cnblogs.com/gaochsh/p/6757475.html #XPath的基本语法知识: 1) // 双斜杠 定位根节点,会对全文进行扫描,在文档中选取所有符合条件的内容,以列表的形式返回。 2) / 单斜杠 寻找当前标签路径的下一层路径标签或者对当前路标签内容进行操作 3) /text() 获取当前路径下的文本内容 4) /@xxxx 提取当前路径下标签的属性值 5) | 可选符 使用|可选取若干个路径 如//p | //div 即在当前路径下选取所有符合条件的p标签和div标签。 6) . 点 用来选取当前节点 7) .. 双点 选取当前节点的父节点 #另外还有starts-with(@属性名称,属性字符相同部分),string(.)两种重要的特殊方法后面将重点讲