基于Mongodb OPIC策略 布隆过滤器 Jsoup Crawler4j源码自己写的一个爬虫框架
本人大三学生,最近突然对爬虫感兴趣,于是搜了搜Github找到了一个比较简单的爬虫框架Crawler4j当然我是学JAVA的,读了好久源码,想尝试着修改一下,写一个比较简单的自己的框架。当然,里面有很多抄袭的源码,更重要的抄袭了大神的思想,,但毕竟是学习,以提高自己能力为主,自己动手改一改,至少是把源码读懂了七七八八吧。。而且自我感觉多读源码对自己的编程能力还是有提高的。。进入正题,,因为本人实在