跳转到主要内容
首页 易学教程

Main navigation

  • 首页
  • 技术文章
  • 外文分享
  • 科技资讯
  • VPS/服务器 测评
  • 福利社
  • 工具箱
  • IP地址查询
  • 易学文档
  • 问答

User account menu

  • 登录
  1. 技术文章
  2. jsoup( HTML parser ) cookbook

jsoup( HTML parser ) cookbook

由 风流意气都作罢 提交于 2019-12-12 20:17:36

【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>>

Introduction

  1. Parsing and traversing a Document

Input

  1. Parse a document from a String
  2. Parsing a body fragment
  3. Load a Document from a URL
  4. Load a Document from a File

Extracting data

  1. Use DOM methods to navigate a document
  2. Use selector-syntax to find elements
  3. Extract attributes, text, and HTML from elements
  4. Working with URLs
  5. Example program: list links

Modifying data

  1. Set attribute values
  2. Set the HTML of an element
  3. Setting the text content of elements

Cleaning HTML

  1. Sanitize untrusted HTML (to prevent XSS)

Cookbook 目录

入门

  1. 解析和遍历一个html文档

输入

  1. 解析一个html字符串
  2. 解析一个body片断
  3. 从一个URL加载一个Document对象
  4. 根据一个文件加载Document对象

数据抽取

  1. 使用dom方法来遍历一个Document对象
  2. 使用选择器语法来查找元素
  3. 从元素集合抽取属性、文本和html内容
  4. URL处理
  5. 程序示例:获取所有链接

数据修改

  1. 设置属性值
  2. 设置元素的html内容
  3. 设置元素的文本内容

HTML清理

  1. 消除不受信任的html (来防止xss攻击)

 

来源:oschina

链接:https://my.oschina.net/u/3069003/blog/1935091

标签
htmlparser
jsoup
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈!
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!

问题没有解决?去提问,寻求大牛帮助

提问


热门标签

风险投资 plc v8js zcat 数据访问层 权威 Laravel5.2之URL生成和存储 chat 边缘分布 搬瓦工 类似 黑镜 byte-unixbench sshj dist-zilla 短信转移 热加载 iOS10 UI教程视图的几何形状 和如何分区 静态synchronized方法 presentviewcontroller 砝码 NDK错误 海洋动物 创业板 clientid Lubuntu B树索引 plotnine collectionbase spring validator c# ksm npn型三极管 roc曲线 svn安装 plack gen-server swiftlint 文件流传输 推挽 搬瓦工 无法换ip VFront 货币国际化 moonsharp for-of-loop querydsl gnome-keyring-daemon 一键搬瓦工手机 搬瓦工open手机 信用卡支付方式

Footer menu

  • 免责声明

本站部分内容来自互联网,其发布内容言论不代表本站观点,如果其链接、内容的侵犯您的权益,烦请联系我们(Email:learnzhaoshang@gmail.com),我们将及时予以处理。

E-learn.cn | 备案号:苏ICP备2021010369号-1