pyquery 的用法 --爬虫解析库
如果你对 Web 有所涉及,如果你比较喜欢用 CSS 选择器,如果你对 jQuery 有所了解,那么这里有一个更适合你的解析库 ——pyquery 。 接下来,我们就来感受一下 pyquery 的强大之处。 1. 准备工作 在开始之前,请确保已经正确安装好了 pyquery 。若没有安装 pip install pyquery 。 2. 初始化 像 Beautiful Soup 一样,初始化 pyquery 的时候,也需要传入 HTML 文本来初始化一个 PyQuery 对象。它的初始化方式有多种,比如直接传入字符串,传入 URL ,传入文件名,等等。下面我们来详细介绍一下。 字符串初始化 首先,我们用一个实例来感受一下: html = ''' <div> <ul> <li class="item-0">first item</li> <li class="item-1"><a href="link2.html">second item</a></li> <li class="item-0 active"><a href="link3.html"><span class="bold">third item</span></a></li> <li class="item-1 active"><a href="link4.html">fourth item</a></li> <li