正则表达式的威力--轻松消除HTML代码

      正则表达式再次让我震撼,寥寥数行代码就可以完成普通代码不易实现的功能,至少是实现起来比较复杂的功能。

一、清楚内容中的Javsscript 代码

 1  Function ClearJSCode(originCode)
 2 
 3    Dim reg
 4 
 5    set reg  =  New RegExp
 6 
 7    reg.Pattern  =   " <SCRIPT[^<]*</SCRIPT> "
 8    reg.IgnoreCase  =  True
 9    reg.Global  =  True
10 
11    clearJSCode  =  reg.Replace(originCode,  "" )
12 
13  End Function
14 

 二、清除内容中的HTML代码

 1  Function ClearHTMLCode(originCode)
 2 
 3      Dim reg 
 4      set reg  =   new  RegExp 
 5 
 6      reg.Pattern  =   " <[^>]*> "
 7      reg.IgnoreCase  =  True
 8      reg.Global  =  True
 9   
10      ClearHTMLCode  =  reg.Replace(originCode,  "" )
11 
12  End Function
13 


现在好多网站的内容都是使用采集程序生成的,使用上边的代码就可以轻松的将内容中的HTML和JS代码清除掉。

你可能感兴趣的:(正则表达式)