Drupal采集网站需要用到的模块

使用Feeds和Feeds XPath Parser结合,定时读取各个API的数据,添加到不同的节点。

Feeds XPath Parser可以解析HTML或者XML文档

Feeds不能以POST方式提交数据,在请求API的时候可以创建一个模块,请求并返回API的XML格式数据,交给Feeds模块处理。

Feeds Spider(蜘蛛)模块可以分析一个页面中的所有连接

Feeds Crawler(爬虫)模块可以自动分析分页面

你可能感兴趣的:(drupal,php,采集)