HtmlParse:一款超轻量级的HTML文件解析和爬取工具

HtmlParse 是一款基于windwos平台的HTML文档解析工具,可快速构建DOM树,从而轻松实现网页元素的爬取工作。DOM树就是一个HTML文档的节点树,每个节点由:标签(Tag)、属性(Attribute)、文本(Text)三个值来描述。 所谓的HTML文档解析,指的就是如何构建一颗DOM

你可能感兴趣的:(HtmlParse:一款超轻量级的HTML文件解析和爬取工具)