搜索文章收藏

1. 利用 Heritrix 构建特定站点爬虫

http://www.ibm.com/developerworks/cn/opensource/os-cn-heritrix/#iratings

2. 使用 HttpClient 和 HtmlParser 实现简易爬虫

http://www.ibm.com/developerworks/cn/opensource/os-cn-crawler/

3.理解 SPARQL

使用语义 Web 建立微型日志博客

http://www.ibm.com/developerworks/cn/education/xml/x-sparql/index.html

4.我爱自然语言处理

中科院NPL组

http://www.52nlp.cn/

5.跟着学学算法

http://www.cnblogs.com/huangxincheng/

你可能感兴趣的:(搜索文章收藏)