PHP微信公众号文章爬虫

整理了一下前段时间写的php微信公众号文章的爬虫,解决了微信的防=防盗链机制,这里对图片进行了统一管理。代码使用tp3框架写的,可以根据实情换成tp5或者laravel框架的代码。

 

爬虫的参数可自行修改,我这里是项目需要,传的验证参数

/**
     * 进入url手动采集文章逻辑
     *
     */

    public function manual($centent_url,$cateidstring,$status)

    {
        $request = trim($centent_url);

        //地址验证(不完整的验证,后补)
        if (empty($request)){

            $resdata["r"]=3;
            return $resdata;
            exit;
        }
        //抓取文章内容

        $html = $this->getUrlContent($request);
        $result = array();
        //抓取文章主要内容
        preg_match_all("/id=\"js_content\">(.*)

你可能感兴趣的:(PHP学习整理笔记)