Gecco 1.1.2 发布,易用的轻量化爬虫

Gecco 1.1.2 发布了。该版本主要做了如下修改:

    1.@Gecco不填写matchUrl时,支持匹配所有格式url的通用抓取

    2.默认使用UniqueSpiderScheduler队列管理避免重复HttpRequest的抓取

    3.修改table tr列表不能解析的问题

 

    4.增加@Ajax请求支持Html格式内容解析

 

    5.更新fastjson,jsoup,cglib最新版本
    6.jsonp判断方式修改
    7.@Html支持outer
    8.修改jd的demo
    9.相同matchUrl 给出警告
    10.修改UniqueSpiderScheduler判断唯一性的bug(尽快更新) 

你可能感兴趣的:(java,爬虫,gecco)