火车采集器使用PHP插件配置循环标签的方法

*参数说明:
*LabelUrl - 当前采集的页面的Url地址
*$LabelCookie - 当前采集页面,服务器返回的Cookie信息。

  • 特别注意:如果是处理列表页,默认页,多页时会有以下两个标签
    LabelArray['Html'] 网页的源代码,没有经过采集器处理的,直接下载后的数据.修改这里的数据,请将新值赋予LabelArray['Html']
    $LabelArray['PageType'] 值可能为 List, Content ,Pages, Save 分别代表处理列表页,默认页,多页,保存时
    • List 列表页
    • Content 默认页
    • Pages 多页
    • Save 保存时

根据以上参数可以推断,我们需要在$LabelArray['Html'] 中对原标签进行处理

例如(替换):
插件中:
if(LabelArray['PageType']=="Content")
{
LabelArray['Html']);
}
else if(LabelArray['PageType']==JsonData[initDataObj][goods][skus] as specs = normalPrice = groupPrice = skuId = shuxing = "";
foreach (spec) {
spec[spec_key].':'.shuxing = spe;
}
shuxing.'
单价:'.sku[groupPrice].'skuId:'.LabelArray['Html']=''.LabelArray['Html'];
}

遇到的坑:

测试时在else if(LabelArray['PageType']=="List")中处理

一个插件文件需要在对应的配置中选择才会执行,例如插件有请求处理,结果处理,但是火车头配置中至选了结果处理插件,则请求的部分不会执行

                                 交流采集技术可加微信:flutter_code  联系我

你可能感兴趣的:(火车采集器使用PHP插件配置循环标签的方法)