jsoupa-解析遍历一个HTML

解析个遍历一个HTML文档

String html ="First parse"
            +"

Parsed HTML into a doc.

"; Document doc =Jsoup.parse(html);
jsoup解析器能够尽最大可能从html文档来创建一个干净的解析结果,无论html的格式是否完整。
jsoup可以处理如下异常情况
*)没有关闭的标签(比如

Lorem

Ipsum parses to

Lorm

Ipsum

) *)隐式标签(比如它可以自动将Table data 包装成
....) *)创建可靠的文档结果(html标签包含head和body,在head值出现恰当的元素)
一个文档的对象模型
*)文档由多个Elements和TextNodes组成(以及其他辅助nodes)
其继承结构如下
Document继承Element继承NodeTextNode继承Node
*)一个Element包含一个子节点集合,并拥有一个父Element。
还提供一个唯一的子元素过滤列表

  

 
 
 
 
 
 
 

 

 
 
 
 



来自为知笔记(Wiz)



转载于:https://www.cnblogs.com/ssgao/p/7395658.html

你可能感兴趣的:(jsoupa-解析遍历一个HTML)