php按序提取HTML代码片段中的文字与图片路径

使用场景:
提取百度编辑器内容或HTML代码片段中的文字与图片路径
代码示例如下:

 /**
     * HTML内容处理  根据不同类型做相应的处理
     * @param $sContent
     * @param $iMessageType 0 提取图片和文字 1 提取文本 
     * @return string
     */
    public function dealContent($sContent, $iMessageType = 0)
    {
        set_time_limit(0);
        ini_set('memory_limit', '1024M');

        //HTML 代码内容处理,去掉 ,替换",'等英文标签
        $sContent = $this->initContentDeal($sContent);
        if($iMessageType == 1) {//纯文本内容-提取编辑器内的文字内容-去掉HTML标签
            $sContent = strip_tags(trim($sContent));
            $sContent = str_replace(["\r","\s","\t"], '', $sContent);
        } else {//图文内容,先按序提取HTML代码片段中的图片和文字,在转成纯文本
            //1.先按序提取HTML代码片段中的图片和文字
            $aTxtAndImga = $this->extractTextAndImagesFromHtml($sContent);
            //2.图片转文字
            $aContent = [];
 

你可能感兴趣的:(php,html)