正则表达式

[\u4e00-\u9fa5]+      汉字
[\u4e00-\u9fa5]+\w.*[, 。:“‘、]?[\u4e00-\u9fa5][。]?
<a\s+href="(.*?)".*?>    URL
/<(?:(?:\/?[A-Za-z][^>=\s]*(?:[=\s](?:(?!['"])[\s\S]*?|'[^']*'|"[^"]

*"))*)|(?:!--[\s\S]*?--))>/g    HTML正则
<a\s+\w.*?>\w.*?</a>    URL正则

[a-zA-Z]+://([-]*[.]?[a-zA-Z0-9_/-?!&%])* http URL正则。提取httpURL
<!--([^-]|-[^-]|--[^>])*-->      注释进行正则

[:space:]*(href|src)[:space:]*=[:space:]*([^ >]+)      ---------href= 正则

([a-zA-Z0-9_\-\.]+@[a-zA-Z0-9_\-\.]+\.[a-zA-Z]{2,5})      ----------邮箱正则

你可能感兴趣的:(正则表达式)