[Jsoup] Jsoup概述

Jsoup简介

[Jsoup] Jsoup概述_第1张图片

1. 背景:我第一次接触Jsoup的时候是在11年、相信做过一些数据挖掘的同学都听说过几种爬虫框架、比如当时风靡的htmlParser。Jsoup的创始人Jonathan Hedley在2009年正式推出了基于java语言的开源框架Jsoup。Jsoup相对htmlParser入手简单、在操作DOM上尤其是在操作DOM的特定数据上尤为突出。jsoup相对httpclient在模拟模拟浏览器方面较弱。

2. Jsoup来自官方的释义:是一款Java的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。


3. Externallinks

   ① Jsoup官网:http://jsoup.org/
   ② Github地址:https://github.com/jhy/jsoup
   ③ jar包及API下载:https://jsoup.org/download

[Jsoup] Jsoup概述_第2张图片
  4. 作者介绍
  Jonathan HedleyWeb scale工程师、Technology Leader。
  美国亚马逊公司技术主管、location位于美国华盛顿州,西雅图。
  Jonathan Hedley的个人站主页:https://jhy.io/

5. 许可状态

Jsoup基于MIT许可协议(The MIT License)发布、遵循MIT协议可用于商业使用。


6. Jsoup提供技术支持的项目

Hibernate Validator Engine、google的OpenRefine data-wrangling tool


7. 最新release版本

jsoup release1.10.2(2017-Jan-02)



本文原创由`bluetata`发布于blog.csdn.net、转载请务必注明出处。



[Jsoup] Jsoup概述_第3张图片

你可能感兴趣的:([01],网络爬虫,[01],Jsoup,[Jsoup],in,action)