Jsoup从一个文件加载一个文档

*爱你&永不变心* 提交于 2020-01-27 03:28:46

在我们的磁盘里有一个HTML文件,我们需要对它进行解析从中抽取数据或进行修改。

使用静态 Jsoup.parse(File in, String charsetName, String baseUri) 方法:

File input = new File("/file/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://baidu.com/");

解说
A:
parse(File in, String charsetName, String baseUri) 这个方法用来加载和解析一个HTML文件。如在加载文件的时候发生错误,将抛出IOException,应作适当处理。
B:
baseUri 参数用于解决文件中URLs是相对路径的问题。如果不需要可以传入一个空的字符串。
C:
另外还有一个方法parse(File in, String charsetName) ,它使用文件的路径做为 baseUri。 这个方法适用于如果被解析文件位于网站的本地文件系统,
    且相关链接也指向该文件系统。

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!