使用Jsoup模拟登陆并爬取网站

Map map = new HashMap<>();
Document document = Jsoup.connect(url).data(map).post();
            Elements elements = document.getElementsByTag("b");
            for (Element element : elements) {
                System.out.println(element.text());
            }

爬取过程中,不要忽略表单隐藏域Hidden中的值,有些网站用这个防止爬虫。

你可能感兴趣的:(爬虫)