HTML解析器--jsoup

API: 点击打开链接

jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。

jsoup的主要功能如下:

1. 从一个URL,文件或字符串中解析HTML;
2. 使用DOM或CSS选择器来查找、取出数据;
3. 可操作HTML元素、属性、文本;
jsoup是基于MIT协议发布的,可放心使用于商业项目。
jsoup 的主要类层次结构如下图所示:
HTML解析器--jsoup_第1张图片
接下来我们专门针对几种常见的应用场景举例说明jsoup 是如何优雅的进行HTML 文档处理的。


找了好久!




方法详细

1、public String nodeName() 得到节点名

2、public String tagName() 得到元素的标签名 如div

3、public Element tagName(String tagName) 改变元素的标签 。如:el.tagName("div") 把一个标签改变为一个

标签。

4、public Tag tag() 得到元素的Tag

5、public boolean isBlock()测试元素是否是块级元素。

6、public String id() 得到元素的id属性

7、public Element attr(String attributeKey, String attributeValue) 设置元素的属性值。如果该键已存在,则替换掉以前的值;否则就新增。

8、public Map dataset() 得到元素的HTML5自定义数据属性。元素中每个以"data-"开头的键的属性都包含在数据集范围内。

如这个元素


你可能感兴趣的:(android)