Jsoup-爬取实战
文章目录 Jsoup 导入依赖 获取信息 数据筛选 Jsoup Jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。 爬虫可以用于搜索引擎,内容检索,数据采集分析等,十分强大,不过不要为所欲为( 盗电影、音乐 ),要合理利用。 Jsoup官网 中文文档 导入依赖 不会maven可参考我的另一篇博客 < dependency > < groupId > org.jsoup </ groupId > < artifactId > jsoup </ artifactId > < version > 1.10.2 </ version > </ dependency > 获取信息 以在CSDN搜索jsoup为例,请求该URL,查看你所需信息标签的id或class,用Jsoup返回浏览器Document对象,然后可以用js的方法获取对象和操作。 package com . wzl . utils ; import org . jsoup . Jsoup ; import org . jsoup . nodes . Document ; import org . jsoup . nodes . Element ; import org . jsoup .