正则选择性匹配

遇到这样一个需求:给定一个关键字,匹配一段话或一篇文章中的文字,把匹配的文字做标红处理。
一开始用php自带的str_replace函数对匹配的关键字做替换:

$replace = '' . $keyword . '';
str_replace($replace, $needle, $content);

但是遇到问题是现在内容格式的html格式的,如果html属性中有命中关键字的话,font标签会放入这些标签中的后显示会变乱,特别是img标签图片不能显示,a标签超链接错误。

123dsfsd
 fsfsd
fsdf1123123ds

现在需要一个正则能匹配不包括title和href属性里的123,可以这样写

$replace = '' . $keyword . '';
$Pattern = "/" . $keyword . "(?![^<]*>)/";
$content = preg_replace($keywordPattern, $replace, $content);

(?!exp)为零宽度负预测先行断言,断言此位置的后面不能匹配表达式exp。123(?![^<]*>) 表示匹配后面不能有>(但是<***>除外)的123,这样就成功排除掉html标签中的命中关键字。下图中gif图片img标签中的title字没有做替换处理,显示正常。
 

你可能感兴趣的:(php,html,php)