htmlparser visitor用法 自定义标签 大文件快速读取,并分析,彻底解决 outofmemery错误

 

 

visitor提取html中的自定义标签内容,在大的html文件提取时,extractAllNodesThatMatch这个会显示内存溢出,因此采用以下的方法

 

 

 

 

读取文件,大型的文件,比如几十兆以上的

 

你可能感兴趣的:(java,HtmlParser)