爬虫文档 工具大全

最近由于在学习爬虫,找了很多材料来看,现在是把相关觉得适合初学者的博客和网站记下来

作为笔记,方便后续的总结和查看

1,全部的爬虫框架,多语言

http://www.itdaan.com/keywords/PHP%E7%88%AC%E8%99%AB%E6%A1%86%E6%9E%B6Beanbun%E4%BD%BF%E7%94%A8.html

2,beanbun

http://www.php.cn/php-weizijiaocheng-390759.html

3,由于之前有用到xpath,于是乎又只能去看了一遍xpath,语法挺简单,但是要学完所有函数好像还挺多的

http://www.w3school.com.cn/xpath/xpath_functions.asp

一下是用的phpspider 写的一段东西

比起正则,我更喜欢xpath这个匹配方法,谁叫我是正则渣渣呢。

你可能感兴趣的:(IT)