python3爬虫基础-pyquery解析库

删除回忆录丶 提交于 2019-12-03 00:51:36

简介

看名称和jQuery比较接近,对没错,pyQuery允许您对XML文档进行jQuery查询。API尽可能类似于jQuery。pyquery使用lxml进行快速XML和html操作。支持CSS选择器,操作在查找和操作HTML上是非常便捷的。

安装和使用

直接使用pip即可安装

pip install pyquery

URL初始化

# -*- coding: utf-8 -*-
from pyquery import PyQuery as pq                           # 引入 pyquery 并设置别名
html_obj = pq('<html>this is test</html>')                  # html字符初始化对象
url_obj = pq(url='http://www.python.org',encoding='gbk')    # URL初始化对象
local_obj = pq(filename='test.html',encoding='gbk')         # 本地文件初始化对象

print(html_obj)                                             # 所有内容
print(url_obj('head'))                                      # 根据CSS标签类型选择
print(local_obj('#ID_01 .class_01 p'))                      # 根据CSS选择器来选择

==更多选择器请参考博文==

  • 《jQuery基础 - 常用基本属性》
  • 《jQuery基础 - 选择器》
  • 《jQuery基础 - 筛选器》

官方文档

https://pyquery.readthedocs.io/en/latest/
标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!