JAVA jsoup

概述

jsoup是JAVA HTML 解析器
可以解析HTML
这样就不用自己写正则表达式了 再说我也不是很会写
下载
导入的方法我也写过了

用法

Document

首先先要新建个这个对象

    String url = "https://jsoup.org";
    Document document = Jsoup.connect(url).get();
    System.out.println(document);

这样就把url的全部html给打印出来了
比用httpClient方便很多,不过那个还是有个最强的维护session的功能,不知道这个由没有
当然了 也可以这么用

Document document = Jsoup.parse(html);

其中html就是html字符串

.text()

System.out.println(document.text());

这么写 就可把文本解析出来

element

HTML就是由一个一个element (元素)构成了
以前称tag(标签)

    Element element = document.getElementById();
    Elements elements = document.getElementsByClass();

一堆方法可以把需要的选出来 不再赘述

    element.attr();
    element.text();

这样选
还支持css选择器

element.select()

不再赘述
总之很好用 暂时不需要学正则表达式了

你可能感兴趣的:(JAVA jsoup)