C#正则表达式_简单梳理_Emoji表情字符处理

A-最近一直有接触到正则表达式,现对其做简单梳理:

private const RegexOptions OPTIONS = RegexOptions.IgnoreCase | RegexOptions.Compiled;
public
const string EMAIL = @"^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$"; public const string URL = @"^(http|https|ftp|rtsp|mms):(\/\/|\\\\)[A-Za-z0-9%\-_@]+\.[A-Za-z0-9%\-_@]+[A-Za-z0-9\.\/=\?%\-&_~`@:\+!;]*$"; /// /// 判断是否为电子邮件 /// /// /// public static bool IsEmail(string input) { if (string.IsNullOrWhiteSpace(input)) return false; return Regex.IsMatch(input, EMAIL, OPTIONS); } /// /// 判断是否为URL /// /// /// public static bool IsUrl(string input) { if (string.IsNullOrWhiteSpace(input)) return false; return Regex.IsMatch(input, URL, OPTIONS); }

 

备注:

public const string EMAIL = @"^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$";
[\w-]+: 匹配除下划线任意单字字符和"-"组成的字符集,出现1次或多次;
(\.[\w-]+)*:匹配.和除下划线任意单字字符和"-"组成的字符集,出现零次或多次,"\."表示对.进行转义,把它当成字符串处理.

C#中不需要再字符串中使用: /正则/ 包夹正则表达式。

 B-20180713遇到关于字符串中Emoji表情字符,添加数据库报错情况:

C#正则表达式_简单梳理_Emoji表情字符处理_第1张图片

 

使用C#正则表达式获取emoji字符的方式为:   Regex.Replace(content, @"\p{Cs}", "")

备注:"\p{Cs}" 匹配unicode字符;

详细说明见:https://technet.microsoft.com/zh-cn/interopmigration/20bw873z(v=vs.100)

https://technet.microsoft.com/zh-cn/interopmigration/az24scfc(v=vs.100)

 

主要参考资料地址: http://www.cnblogs.com/zhangxiaoyong/p/6043283.html

C# 正则表达式大全

 

前言

在网上看到一个不错的简易版正则匹配和替换的工具,现在补充进来,感觉还不错,效果如下(输入验证中文汉字的正则表达式)

C#正则表达式_简单梳理_Emoji表情字符处理_第2张图片

   在线下载   密码:5tpt

注:好像也是一位园友写的,但是找不到地址了,有看到的可以留言告知下,thx

文章导读

     正则表达式的本质是使用一系列特殊字符模式,来表示某一类字符串。正则表达式无疑是处理文本最有力的工具,而.NET提供的Regex类实现了验证正则表达式的方法。Regex 类表示不可变(只读)的正则表达式。它还包含各种静态方法,允许在不显式创建其他类的实例的情况下使用其他正则表达式类。

基础梳理

说明:

由于在正则表达式中“ \ ”、“ ? ”、“ * ”、“ ^ ”、“ $ ”、“ + ”、“(”、“)”、“ | ”、“ { ”、“ [ ”等字符已经具有一定特殊意义,如果需要用它们的原始意义,则应该对它进行转义,例如 希 望在字符串中至少有一个“ \ ”,那么正则表达式应该这么写: \\+ 。

RegEx类常用的方法

①静态Match方法
 
使用静态Match方法,可以得到源中第一个匹配模式的连续子串。
 
静态的Match方法有2个重载,分别是
 
Regex.Match(string input, string pattern);
Regex.Match(string input, string pattern, RegexOptions options);
第一种重载的参数表示:输入、模式
 
第二种重载的参数表示:输入、模式、RegexOptions枚举的“按位或”组合。
 
RegexOptions枚举的有效值是:
Complied表示编译此模式
CultureInvariant表示不考虑文化背景
ECMAScript表示符合ECMAScript,这个值只能和IgnoreCase、Multiline、Complied连用
ExplicitCapture表示只保存显式命名的组
IgnoreCase表示不区分输入的大小写
IgnorePatternWhitespace表示去掉模式中的非转义空白,并启用由#标记的注释
Multiline表示多行模式,改变元字符^和$的含义,它们可以匹配行的开头和结尾
None表示无设置,此枚举项没有意义
RightToLeft表示从右向左扫描、匹配,这时,静态的Match方法返回从右向左的第一个匹配
Singleline表示单行模式,改变元字符.的意义,它可以匹配换行符
 
注意:Multiline在没有ECMAScript的情况下,可以和Singleline连用。Singleline和Multiline不互斥,但是和ECMAScript互斥。
 
 
②静态的Matches方法
 
这个方法的重载形式同静态的Match方法,返回一个MatchCollection,表示输入中,匹配模式的匹配的集合。
 
 
③静态的IsMatch方法
 
此方法返回一个bool,重载形式同静态的Matches,若输入中匹配模式,返回true,否则返回false。
可以理解为:IsMatch方法,返回Matches方法返回的集合是否为空。

RegEx类的实例

⑴字符串替换

//例如我想把如下格式记录中的NAME值修改为WANG
string line = "ADDR=1234;NAME=ZHANG;PHONE=6789";
Regex reg = new Regex("NAME=(.+);");
string modified = reg.Replace(line, "NAME=WANG;");
//修改后的字符串为 ADDR=1234;NAME=WANG;PHONE=6789

⑵字符串匹配

string line = "ADDR=1234;NAME=ZHANG;PHONE=6789";
Regex reg = new Regex("NAME=(.+);");
//例如我想提取line中的NAME值
Match match = reg.Match(line);
string value = match.Groups[1].Value;
Console.WriteLine("value的值为:{0}", value);

⑶Match实例

//文本中含有"speed=30.3mph",需要提取该速度值,但是速度的单位可能是公制也可能是英制,mph,km/h,m/s都有可能;另外前后可能有空格。
string line = "lane=1;speed=30.3mph;acceleration=2.5mph/s";
Regex reg = new Regex(@"speed\s*=\s*([\d\.]+)\s*(mph|km/h|m/s)*");
Match match = reg.Match(line);
//那么在返回的结果中match.Groups[1].Value将含有数值,而match.Groups[2].Value将含有单位。
var 值 = match.Groups[1].Value;//此处方便演示,在实际开发中请勿使用中文命名变量
var 单位 = match.Groups[2].Value;
Console.WriteLine("speed的值为:{0} speed的单位是:{1}", 值,单位);

⑷解码gps的GPRMC字符串

//就可以获得经度、纬度值,而以前需要几十行代码。
Regex reg = new Regex(@"^\$GPRMC,[\d\.]*,[A|V],(-?[0-9]*\.?[0-9]+),([NS]*),(-?[0-9]*\.?[0-9]+),([EW]*),.*");

提取[]的值

string pattern1 = @"(?is)(?<=\[)(.*)(?=\])";
string result1 = new Regex(pattern1).Match("sadff[xxx]sdfdsf").Value;

提取()的值

string pattern2 = @"(?is)(?<=\()(.*)(?=\))";
string result2 = new Regex(pattern2).Match("sad(f)dsf").Value;

提取()的值

string pattern3 = @"(?is)(?<=\{)(.*)(?=\})";
string result3 = new Regex(pattern3).Match("sadff[{xxx]sdfd}sf").Value;

 

命名空间说明

System.Text.RegularExpressions命名空间的说明

该名称空间包括8个类,1个枚举,1个委托。他们分别是: 

Capture: 包含一次匹配的结果;
CaptureCollection: Capture的序列;
Group: 一次组记录的结果,由Capture继承而来;
GroupCollection:表示捕获组的集合
Match: 一次表达式的匹配结果,由Group继承而来;
MatchCollection: Match的一个序列;
MatchEvaluator: 执行替换操作时使用的委托;
RegexCompilationInfo:提供编译器用于将正则表达式编译为独立程序集的信息
RegexOptions 提供用于设置正则表达式的枚举值
Regex类中还包含一些静态的方法:
Escape: 对字符串中的regex中的转义符进行转义;
IsMatch: 如果表达式在字符串中匹配,该方法返回一个布尔值;
Match: 返回Match的实例;
Matches: 返回一系列的Match的方法;
Replace: 用替换字符串替换匹配的表达式;
Split: 返回一系列由表达式决定的字符串;
Unescape:不对字符串中的转义字符转义。

正则常用表达式 

㈠校验数字的表达式

            //数字
            Regex reg = new Regex(@"^[0-9]*$");
            //n位的数字
            Regex reg = new Regex(@"^\d{n}$");
            //至少n位的数字
            Regex reg = new Regex(@"^\d{n,}$");
            //m-n位的数字
            Regex reg = new Regex(@"^\d{m,n}$");
            //零和非零开头的数字
            Regex reg = new Regex(@"^(0|[1-9][0-9]*)$");
            //非零开头的最多带两位小数的数字
            Regex reg = new Regex(@"^([1-9][0-9]*)+(.[0-9]{1,2})?$");
            //带1-2位小数的正数或负数
            Regex reg = new Regex(@"^(\-)?\d+(\.\d{1,2})?$");
            //正数、负数、和小数
            Regex reg = new Regex(@"^(\-|\+)?\d+(\.\d+)?$");
            //有两位小数的正实数
            Regex reg = new Regex(@"^[0-9]+(.[0-9]{2})?$");
            //有1~3位小数的正实数
            Regex reg = new Regex(@"^[0-9]+(.[0-9]{1,3})?$");
            //非零的正整数
            Regex reg = new Regex(@"^[1-9]\d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^\+?[1-9][0-9]*$");
            //非零的负整数
            Regex reg = new Regex(@"^\-[1-9][]0-9″*$ 或 ^-[1-9]\d*$");
            //非负整数
            Regex reg = new Regex(@"^\d+$ 或 ^[1-9]\d*|0$");
            //非正整数
            Regex reg = new Regex(@"^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$");
            //非负浮点数
            Regex reg = new Regex(@"^\d+(\.\d+)?$ 或 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$");
            //非正浮点数
            Regex reg = new Regex(@"^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 或 ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$");
            //正浮点数
            Regex reg = new Regex(@"^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ 或 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$");
            //负浮点数
            Regex reg = new Regex(@"^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ 或 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$");
            //浮点数
            Regex reg = new Regex(@"^(-?\d+)(\.\d+)?$ 或 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$");

㈡校验字符的表达式

            //汉字
            Regex reg = new Regex(@"^[\u4e00-\u9fa5]{0,}$");
            //英文和数字
            Regex reg = new Regex(@"^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$");
            //长度为3-20的所有字符
            Regex reg = new Regex(@"^.{3,20}$");
            //由26个英文字母组成的字符串
            Regex reg = new Regex(@"^[A-Za-z]+$");
            //由26个大写英文字母组成的字符串
            Regex reg = new Regex(@"^[A-Z]+$");
            //由26个小写英文字母组成的字符串
            Regex reg = new Regex(@"^[a-z]+$");
            //由数字和26个英文字母组成的字符串
            Regex reg = new Regex(@"^[A-Za-z0-9]+$");
            //由数字、26个英文字母或者下划线组成的字符串
            Regex reg = new Regex(@"^\w+$ 或 ^\w{3,20}$");
            //中文、英文、数字包括下划线
            Regex reg = new Regex(@"^[\u4E00-\u9FA5A-Za-z0-9_]+$");
            //中文、英文、数字但不包括下划线等符号
            Regex reg = new Regex(@"^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$");
            //可以输入含有^%&’,;=?$\”等字符
            Regex reg = new Regex(@"[^%&’,;=?$\x22]+");
            //禁止输入含有~的字符
            Regex reg = new Regex(@"[^~\x22]+");

㈢特殊需求表达式

            //Email地址
            Regex reg = new Regex(@"^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$");
            //域名
            Regex reg = new Regex(@"[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?");
            //InternetURL
            Regex reg = new Regex(@"[a-zA-z]+://[^\s]* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$");
            //手机号码
            Regex reg = new Regex(@"^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$");
            //电话号码(“XXX-XXXXXXX”、”XXXX-XXXXXXXX”、”XXX-XXXXXXX”、”XXX-XXXXXXXX”、”XXXXXXX”和”XXXXXXXX)
            Regex reg = new Regex(@"^($$\d{3,4}-)|\d{3.4}-)?\d{7,8}$");
            //国内电话号码(0511-4405222、021-87888822)
            Regex reg = new Regex(@"\d{3}-\d{8}|\d{4}-\d{7}");
            //身份证号(15位、18位数字)
            Regex reg = new Regex(@"^\d{15}|\d{18}$");
            //短身份证号码(数字、字母x结尾)
            Regex reg = new Regex(@"^([0-9]){7,18}(x|X)?$ 或 ^\d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$");
            //帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线)
            Regex reg = new Regex(@"^[a-zA-Z][a-zA-Z0-9_]{4,15}$");
            //密码(以字母开头,长度在6~18之间,只能包含字母、数字和下划线)
            Regex reg = new Regex(@"^[a-zA-Z]\w{5,17}$");
            //强密码(必须包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间)
            Regex reg = new Regex(@"^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$");
            //日期格式
            Regex reg = new Regex(@"^\d{4}-\d{1,2}-\d{1,2}");
            //一年的12个月(01~09和1~12)
            Regex reg = new Regex(@"^(0?[1-9]|1[0-2])$");
            //一个月的31天(01~09和1~31)
            Regex reg = new Regex(@"^((0?[1-9])|((1|2)[0-9])|30|31)$");
            //钱的输入格式:
            //有四种钱的表示形式我们可以接受:”10000.00″ 和 “10,000.00”, 和没有 “分” 的 “10000” 和 “10,000”
            Regex reg = new Regex(@"^[1-9][0-9]*$");
            //这表示任意一个不以0开头的数字,但是,这也意味着一个字符”0″不通过,所以我们采用下面的形式
            Regex reg = new Regex(@"^(0|[1-9][0-9]*)$");
            //一个0或者一个不以0开头的数字.我们还可以允许开头有一个负号
            Regex reg = new Regex(@"^(0|-?[1-9][0-9]*)$");
            //这表示一个0或者一个可能为负的开头不为0的数字.让用户以0开头好了.把负号的也去掉,因为钱总不能是负的吧.下面我们要加的是说明可能的小数部分
            Regex reg = new Regex(@"^[0-9]+(.[0-9]+)?$");
            //必须说明的是,小数点后面至少应该有1位数,所以”10.”是不通过的,但是 “10” 和 “10.2” 是通过的
            Regex reg = new Regex(@"^[0-9]+(.[0-9]{2})?$");
            //这样我们规定小数点后面必须有两位,如果你认为太苛刻了,可以这样
            Regex reg = new Regex(@"^[0-9]+(.[0-9]{1,2})?$");
            //这样就允许用户只写一位小数。下面我们该考虑数字中的逗号了,我们可以这样
            Regex reg = new Regex(@"^[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$");
            //1到3个数字,后面跟着任意个 逗号+3个数字,逗号成为可选,而不是必须
            Regex reg = new Regex(@"^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$");
            //备注:这就是最终结果了,别忘了”+”可以用”*”替代。如果你觉得空字符串也可以接受的话(奇怪,为什么?)最后,别忘了在用函数时去掉去掉那个反斜杠,一般的错误都在这里
            //xml文件
            Regex reg = new Regex(@"^([a-zA-Z]+-?)+[a-zA-Z0-9]+\\.[x|X][m|M][l|L]$");
            //中文字符的正则表达式
            Regex reg = new Regex(@"[\u4e00-\u9fa5]");
            //双字节字符
            Regex reg = new Regex(@"[^\x00-\xff] (包括汉字在内,可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1))");
            //空白行的正则表达式,可用来删除空白行
            Regex reg = new Regex(@"\n\s*\r");
            //HTML标记的正则表达式
            Regex reg = new Regex(@"<(\S*?)[^>]*>.*?|<.*? />");// (网上流传的版本太糟糕,上面这个也仅仅能部分,对于复杂的嵌套标记依旧无能为力)
            //首尾空白字符的正则表达式
            Regex reg = new Regex(@"^\s*|\s*$或(^\s*)|(\s*$)");// (可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式)
            //腾讯QQ号
            Regex reg = new Regex(@"[1-9][0-9]{4,}"); //(腾讯QQ号从10000开始)
            //中国邮政编码
            Regex reg = new Regex(@"[1-9]\d{5}(?!\d)");// (中国邮政编码为6位数字)
            //IP地址
            Regex reg = new Regex(@"\d+\.\d+\.\d+\.\d+");// (提取IP地址时有用)
            //IP地址
            Regex reg = new Regex(@"((?:(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d)\\.){3}(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d))");

使用demo

正则的使用可以分为验证方法和匹配方法两种

因上文对正则已经做了比较详细的讲解,故在此不多做赘述,直接贴出使用demo

  1 public class Validator
  2   2         {
  3   3             #region 匹配方法
  4   4             ///   
  5   5             /// 验证字符串是否匹配正则表达式描述的规则  
  6   6             ///   
  7   7             /// 待验证的字符串  
  8   8             /// 正则表达式字符串  
  9   9             /// 是否匹配  
 10  10             public static bool IsMatch(string inputStr, string patternStr)
 11  11             {
 12  12                 return IsMatch(inputStr, patternStr, false, false);
 13  13             }
 14  14 
 15  15             ///   
 16  16             /// 验证字符串是否匹配正则表达式描述的规则  
 17  17             ///   
 18  18             /// 待验证的字符串  
 19  19             /// 正则表达式字符串  
 20  20             /// 匹配时是否不区分大小写  
 21  21             /// 是否匹配  
 22  22             public static bool IsMatch(string inputStr, string patternStr, bool ifIgnoreCase)
 23  23             {
 24  24                 return IsMatch(inputStr, patternStr, ifIgnoreCase, false);
 25  25             }
 26  26 
 27  27             ///   
 28  28             /// 验证字符串是否匹配正则表达式描述的规则  
 29  29             ///   
 30  30             /// 待验证的字符串  
 31  31             /// 正则表达式字符串  
 32  32             /// 是否验证空白字符串  
 33  33             /// 是否匹配  
 34  34             public static bool IsMatch(string inputStr, string patternStr, bool ifValidateWhiteSpace)
 35  35             {
 36  36                 return IsMatch(inputStr, patternStr, false, ifValidateWhiteSpace);
 37  37             }
 38  38 
 39  39             ///   
 40  40             /// 验证字符串是否匹配正则表达式描述的规则  
 41  41             ///   
 42  42             /// 待验证的字符串  
 43  43             /// 正则表达式字符串  
 44  44             /// 匹配时是否不区分大小写  
 45  45             /// 是否验证空白字符串  
 46  46             /// 是否匹配  
 47  47             public static bool IsMatch(string inputStr, string patternStr, bool ifIgnoreCase, bool ifValidateWhiteSpace)
 48  48             {
 49  49                 if (!ifValidateWhiteSpace && string.IsNullOrWhiteSpace(inputStr))//.NET 4.0 新增IsNullOrWhiteSpace 方法,便于对用户做处理
 50  50                     return false;//如果不要求验证空白字符串而此时传入的待验证字符串为空白字符串,则不匹配  
 51  51                 Regex regex = null;
 52  52                 if (ifIgnoreCase)
 53  53                     regex = new Regex(patternStr, RegexOptions.IgnoreCase);//指定不区分大小写的匹配  
 54  54                 else
 55  55                     regex = new Regex(patternStr);
 56  56                 return regex.IsMatch(inputStr);
 57  57             }
 58  58             #endregion
 59  59 
 60  60             #region 验证方法
 61  61             ///   
 62  62             /// 验证数字(double类型)  
 63  63             /// [可以包含负号和小数点]  
 64  64             ///   
 65  65             /// 待验证的字符串  
 66  66             /// 是否匹配  
 67  67             public static bool IsNumber(string input)
 68  68             {
 69  69                 //string pattern = @"^-?\d+$|^(-?\d+)(\.\d+)?$";  
 70  70                 //return IsMatch(input, pattern);  
 71  71                 double d = 0;
 72  72                 if (double.TryParse(input, out d))
 73  73                     return true;
 74  74                 else
 75  75                     return false;
 76  76             }
 77  77 
 78  78             ///   
 79  79             /// 验证整数  
 80  80             ///   
 81  81             /// 待验证的字符串  
 82  82             /// 是否匹配  
 83  83             public static bool IsInteger(string input)
 84  84             {
 85  85                 //string pattern = @"^-?\d+$";  
 86  86                 //return IsMatch(input, pattern);  
 87  87                 int i = 0;
 88  88                 if (int.TryParse(input, out i))
 89  89                     return true;
 90  90                 else
 91  91                     return false;
 92  92             }
 93  93 
 94  94             ///   
 95  95             /// 验证非负整数  
 96  96             ///   
 97  97             /// 待验证的字符串  
 98  98             /// 是否匹配  
 99  99             public static bool IsIntegerNotNagtive(string input)
100 100             {
101 101                 //string pattern = @"^\d+$";  
102 102                 //return IsMatch(input, pattern);  
103 103                 int i = -1;
104 104                 if (int.TryParse(input, out i) && i >= 0)
105 105                     return true;
106 106                 else
107 107                     return false;
108 108             }
109 109 
110 110             ///   
111 111             /// 验证正整数  
112 112             ///   
113 113             /// 待验证的字符串  
114 114             /// 是否匹配  
115 115             public static bool IsIntegerPositive(string input)
116 116             {
117 117                 //string pattern = @"^[0-9]*[1-9][0-9]*$";  
118 118                 //return IsMatch(input, pattern);  
119 119                 int i = 0;
120 120                 if (int.TryParse(input, out i) && i >= 1)
121 121                     return true;
122 122                 else
123 123                     return false;
124 124             }
125 125 
126 126             ///   
127 127             /// 验证小数  
128 128             ///   
129 129             /// 待验证的字符串  
130 130             /// 是否匹配  
131 131             public static bool IsDecimal(string input)
132 132             {
133 133                 string pattern = @"^([-+]?[1-9]\d*\.\d+|-?0\.\d*[1-9]\d*)$";
134 134                 return IsMatch(input, pattern);
135 135             }
136 136 
137 137             ///   
138 138             /// 验证只包含英文字母  
139 139             ///   
140 140             /// 待验证的字符串  
141 141             /// 是否匹配  
142 142             public static bool IsEnglishCharacter(string input)
143 143             {
144 144                 string pattern = @"^[A-Za-z]+$";
145 145                 return IsMatch(input, pattern);
146 146             }
147 147 
148 148             ///   
149 149             /// 验证只包含数字和英文字母  
150 150             ///   
151 151             /// 待验证的字符串  
152 152             /// 是否匹配  
153 153             public static bool IsIntegerAndEnglishCharacter(string input)
154 154             {
155 155                 string pattern = @"^[0-9A-Za-z]+$";
156 156                 return IsMatch(input, pattern);
157 157             }
158 158 
159 159             ///   
160 160             /// 验证只包含汉字  
161 161             ///   
162 162             /// 待验证的字符串  
163 163             /// 是否匹配  
164 164             public static bool IsChineseCharacter(string input)
165 165             {
166 166                 string pattern = @"^[\u4e00-\u9fa5]+$";
167 167                 return IsMatch(input, pattern);
168 168             }
169 169 
170 170             ///   
171 171             /// 验证数字长度范围(数字前端的0计长度)  
172 172             /// [若要验证固定长度,可传入相同的两个长度数值]  
173 173             ///   
174 174             /// 待验证的字符串  
175 175             /// 长度范围起始值(含)  
176 176             /// 长度范围结束值(含)  
177 177             /// 是否匹配  
178 178             public static bool IsIntegerLength(string input, int lengthBegin, int lengthEnd)
179 179             {
180 180                 //string pattern = @"^\d{" + lengthBegin + "," + lengthEnd + "}$";  
181 181                 //return IsMatch(input, pattern);  
182 182                 if (input.Length >= lengthBegin && input.Length <= lengthEnd)
183 183                 {
184 184                     int i;
185 185                     if (int.TryParse(input, out i))
186 186                         return true;
187 187                     else
188 188                         return false;
189 189                 }
190 190                 else
191 191                     return false;
192 192             }
193 193 
194 194             ///   
195 195             /// 验证字符串包含内容  
196 196             ///   
197 197             /// 待验证的字符串  
198 198             /// 是否包含英文字母  
199 199             /// 是否包含数字  
200 200             /// 是否包含汉字  
201 201             /// 是否匹配  
202 202             public static bool IsStringInclude(string input, bool withEnglishCharacter, bool withNumber, bool withChineseCharacter)
203 203             {
204 204                 if (!withEnglishCharacter && !withNumber && !withChineseCharacter)
205 205                     return false;//如果英文字母、数字和汉字都没有,则返回false  
206 206                 StringBuilder patternString = new StringBuilder();
207 207                 patternString.Append("^[");
208 208                 if (withEnglishCharacter)
209 209                     patternString.Append("a-zA-Z");
210 210                 if (withNumber)
211 211                     patternString.Append("0-9");
212 212                 if (withChineseCharacter)
213 213                     patternString.Append(@"\u4E00-\u9FA5");
214 214                 patternString.Append("]+$");
215 215                 return IsMatch(input, patternString.ToString());
216 216             }
217 217 
218 218             ///   
219 219             /// 验证字符串长度范围  
220 220             /// [若要验证固定长度,可传入相同的两个长度数值]  
221 221             ///   
222 222             /// 待验证的字符串  
223 223             /// 长度范围起始值(含)  
224 224             /// 长度范围结束值(含)  
225 225             /// 是否匹配  
226 226             public static bool IsStringLength(string input, int lengthBegin, int lengthEnd)
227 227             {
228 228                 //string pattern = @"^.{" + lengthBegin + "," + lengthEnd + "}$";  
229 229                 //return IsMatch(input, pattern);  
230 230                 if (input.Length >= lengthBegin && input.Length <= lengthEnd)
231 231                     return true;
232 232                 else
233 233                     return false;
234 234             }
235 235 
236 236             ///   
237 237             /// 验证字符串长度范围(字符串内只包含数字和/或英文字母)  
238 238             /// [若要验证固定长度,可传入相同的两个长度数值]  
239 239             ///   
240 240             /// 待验证的字符串  
241 241             /// 长度范围起始值(含)  
242 242             /// 长度范围结束值(含)  
243 243             /// 是否匹配  
244 244             public static bool IsStringLengthOnlyNumberAndEnglishCharacter(string input, int lengthBegin, int lengthEnd)
245 245             {
246 246                 string pattern = @"^[0-9a-zA-z]{" + lengthBegin + "," + lengthEnd + "}$";
247 247                 return IsMatch(input, pattern);
248 248             }
249 249 
250 250             ///   
251 251             /// 验证字符串长度范围  
252 252             /// [若要验证固定长度,可传入相同的两个长度数值]  
253 253             ///   
254 254             /// 待验证的字符串  
255 255             /// 是否包含英文字母  
256 256             /// 是否包含数字  
257 257             /// 是否包含汉字  
258 258             /// 长度范围起始值(含)  
259 259             /// 长度范围结束值(含)  
260 260             /// 是否匹配  
261 261             public static bool IsStringLengthByInclude(string input, bool withEnglishCharacter, bool withNumber, bool withChineseCharacter, int lengthBegin, int lengthEnd)
262 262             {
263 263                 if (!withEnglishCharacter && !withNumber && !withChineseCharacter)
264 264                     return false;//如果英文字母、数字和汉字都没有,则返回false  
265 265                 StringBuilder patternString = new StringBuilder();
266 266                 patternString.Append("^[");
267 267                 if (withEnglishCharacter)
268 268                     patternString.Append("a-zA-Z");
269 269                 if (withNumber)
270 270                     patternString.Append("0-9");
271 271                 if (withChineseCharacter)
272 272                     patternString.Append(@"\u4E00-\u9FA5");
273 273                 patternString.Append("]{" + lengthBegin + "," + lengthEnd + "}$");
274 274                 return IsMatch(input, patternString.ToString());
275 275             }
276 276 
277 277             ///   
278 278             /// 验证字符串字节数长度范围  
279 279             /// [若要验证固定长度,可传入相同的两个长度数值;每个汉字为两个字节长度]  
280 280             ///   
281 281             /// 待验证的字符串  
282 282             /// 长度范围起始值(含)  
283 283             /// 长度范围结束值(含)  
284 284             ///   
285 285             public static bool IsStringByteLength(string input, int lengthBegin, int lengthEnd)
286 286             {
287 287                 //int byteLength = Regex.Replace(input, @"[^\x00-\xff]", "ok").Length;  
288 288                 //if (byteLength >= lengthBegin && byteLength <= lengthEnd)  
289 289                 //{  
290 290                 //    return true;  
291 291                 //}  
292 292                 //return false;  
293 293                 int byteLength = Encoding.Default.GetByteCount(input);
294 294                 if (byteLength >= lengthBegin && byteLength <= lengthEnd)
295 295                     return true;
296 296                 else
297 297                     return false;
298 298             }
299 299 
300 300             ///   
301 301             /// 验证日期  
302 302             ///   
303 303             /// 待验证的字符串  
304 304             /// 是否匹配  
305 305             public static bool IsDateTime(string input)
306 306             {
307 307                 DateTime dt;
308 308                 if (DateTime.TryParse(input, out dt))
309 309                     return true;
310 310                 else
311 311                     return false;
312 312             }
313 313 
314 314             ///   
315 315             /// 验证固定电话号码  
316 316             /// [3位或4位区号;区号可以用小括号括起来;区号可以省略;区号与本地号间可以用减号或空格隔开;可以有3位数的分机号,分机号前要加减号]  
317 317             ///   
318 318             /// 待验证的字符串  
319 319             /// 是否匹配  
320 320             public static bool IsTelePhoneNumber(string input)
321 321             {
322 322                 string pattern = @"^(((0\d2|0\d{2})[- ]?)?\d{8}|((0\d3|0\d{3})[- ]?)?\d{7})(-\d{3})?$";
323 323                 return IsMatch(input, pattern);
324 324             }
325 325 
326 326             ///   
327 327             /// 验证手机号码  
328 328             /// [可匹配"(+86)013325656352",括号可以省略,+号可以省略,(+86)可以省略,11位手机号前的0可以省略;11位手机号第二位数可以是3、4、5、8中的任意一个]  
329 329             ///   
330 330             /// 待验证的字符串  
331 331             /// 是否匹配  
332 332             public static bool IsMobilePhoneNumber(string input)
333 333             {
334 334                 string pattern = @"^((\+)?86|((\+)?86)?)0?1[3458]\d{9}$";
335 335                 return IsMatch(input, pattern);
336 336             }
337 337 
338 338             ///   
339 339             /// 验证电话号码(可以是固定电话号码或手机号码)  
340 340             /// [固定电话:[3位或4位区号;区号可以用小括号括起来;区号可以省略;区号与本地号间可以用减号或空格隔开;可以有3位数的分机号,分机号前要加减号]]  
341 341             /// [手机号码:[可匹配"(+86)013325656352",括号可以省略,+号可以省略,(+86)可以省略,手机号前的0可以省略;手机号第二位数可以是3、4、5、8中的任意一个]]  
342 342             ///   
343 343             /// 待验证的字符串  
344 344             /// 是否匹配  
345 345             public static bool IsPhoneNumber(string input)
346 346             {
347 347                 string pattern = @"^((\+)?86|((\+)?86)?)0?1[3458]\d{9}$|^(((0\d2|0\d{2})[- ]?)?\d{8}|((0\d3|0\d{3})[- ]?)?\d{7})(-\d{3})?$";
348 348                 return IsMatch(input, pattern);
349 349             }
350 350 
351 351             ///   
352 352             /// 验证邮政编码  
353 353             ///   
354 354             /// 待验证的字符串  
355 355             /// 是否匹配  
356 356             public static bool IsZipCode(string input)
357 357             {
358 358                 //string pattern = @"^\d{6}$";  
359 359                 //return IsMatch(input, pattern);  
360 360                 if (input.Length != 6)
361 361                     return false;
362 362                 int i;
363 363                 if (int.TryParse(input, out i))
364 364                     return true;
365 365                 else
366 366                     return false;
367 367             }
368 368 
369 369             ///   
370 370             /// 验证电子邮箱  
371 371             /// [@字符前可以包含字母、数字、下划线和点号;@字符后可以包含字母、数字、下划线和点号;@字符后至少包含一个点号且点号不能是最后一个字符;最后一个点号后只能是字母或数字]  
372 372             ///   
373 373             /// 待验证的字符串  
374 374             /// 是否匹配  
375 375             public static bool IsEmail(string input)
376 376             {
377 377                 ////邮箱名以数字或字母开头;邮箱名可由字母、数字、点号、减号、下划线组成;邮箱名(@前的字符)长度为3~18个字符;邮箱名不能以点号、减号或下划线结尾;不能出现连续两个或两个以上的点号、减号。  
378 378                 //string pattern = @"^[a-zA-Z0-9]((?
379 379                 string pattern = @"^([\w-\.]+)@([\w-\.]+)(\.[a-zA-Z0-9]+)$";
380 380                 return IsMatch(input, pattern);
381 381             }
382 382 
383 383             ///   
384 384             /// 验证网址(可以匹配IPv4地址但没对IPv4地址进行格式验证;IPv6暂时没做匹配)  
385 385             /// [允许省略"://";可以添加端口号;允许层级;允许传参;域名中至少一个点号且此点号前要有内容]  
386 386             ///   
387 387             /// 待验证的字符串  
388 388             /// 是否匹配  
389 389             public static bool IsURL(string input)
390 390             {
391 391                 ////每级域名由字母、数字和减号构成(第一个字母不能是减号),不区分大小写,单个域长度不超过63,完整的域名全长不超过256个字符。在DNS系统中,全名是以一个点“.”来结束的,例如“www.nit.edu.cn.”。没有最后的那个点则表示一个相对地址。   
392 392                 ////没有例如"http://"的前缀,没有传参的匹配  
393 393                 //string pattern = @"^([0-9a-zA-Z][0-9a-zA-Z-]{0,62}\.)+([0-9a-zA-Z][0-9a-zA-Z-]{0,62})\.?$";  
394 394 
395 395                 //string pattern = @"^(((file|gopher|news|nntp|telnet|http|ftp|https|ftps|sftp)://)|(www\.))+(([a-zA-Z0-9\._-]+\.[a-zA-Z]{2,6})|([0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}))(/[a-zA-Z0-9\&%_\./-~-]*)?$";  
396 396                 string pattern = @"^([a-zA-Z]+://)?([\w-\.]+)(\.[a-zA-Z0-9]+)(:\d{0,5})?/?([\w-/]*)\.?([a-zA-Z]*)\??(([\w-]*=[\w%]*&?)*)$";
397 397                 return IsMatch(input, pattern);
398 398             }
399 399 
400 400             ///   
401 401             /// 验证IPv4地址  
402 402             /// [第一位和最后一位数字不能是0或255;允许用0补位]  
403 403             ///   
404 404             /// 待验证的字符串  
405 405             /// 是否匹配  
406 406             public static bool IsIPv4(string input)
407 407             {
408 408                 //string pattern = @"^(25[0-4]|2[0-4]\d]|[01]?\d{2}|[1-9])\.(25[0-5]|2[0-4]\d]|[01]?\d?\d)\.(25[0-5]|2[0-4]\d]|[01]?\d?\d)\.(25[0-4]|2[0-4]\d]|[01]?\d{2}|[1-9])$";  
409 409                 //return IsMatch(input, pattern);  
410 410                 string[] IPs = input.Split('.');
411 411                 if (IPs.Length != 4)
412 412                     return false;
413 413                 int n = -1;
414 414                 for (int i = 0; i < IPs.Length; i++)
415 415                 {
416 416                     if (i == 0 || i == 3)
417 417                     {
418 418                         if (int.TryParse(IPs[i], out n) && n > 0 && n < 255)
419 419                             continue;
420 420                         else
421 421                             return false;
422 422                     }
423 423                     else
424 424                     {
425 425                         if (int.TryParse(IPs[i], out n) && n >= 0 && n <= 255)
426 426                             continue;
427 427                         else
428 428                             return false;
429 429                     }
430 430                 }
431 431                 return true;
432 432             }
433 433 
434 434             ///   
435 435             /// 验证IPv6地址  
436 436             /// [可用于匹配任何一个合法的IPv6地址]  
437 437             ///   
438 438             /// 待验证的字符串  
439 439             /// 是否匹配  
440 440             public static bool IsIPv6(string input)
441 441             {
442 442                 string pattern = @"^\s*((([0-9A-Fa-f]{1,4}:){7}([0-9A-Fa-f]{1,4}|:))|(([0-9A-Fa-f]{1,4}:){6}(:[0-9A-Fa-f]{1,4}|((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3})|:))|(([0-9A-Fa-f]{1,4}:){5}(((:[0-9A-Fa-f]{1,4}){1,2})|:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3})|:))|(([0-9A-Fa-f]{1,4}:){4}(((:[0-9A-Fa-f]{1,4}){1,3})|((:[0-9A-Fa-f]{1,4})?:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:))|(([0-9A-Fa-f]{1,4}:){3}(((:[0-9A-Fa-f]{1,4}){1,4})|((:[0-9A-Fa-f]{1,4}){0,2}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:))|(([0-9A-Fa-f]{1,4}:){2}(((:[0-9A-Fa-f]{1,4}){1,5})|((:[0-9A-Fa-f]{1,4}){0,3}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:))|(([0-9A-Fa-f]{1,4}:){1}(((:[0-9A-Fa-f]{1,4}){1,6})|((:[0-9A-Fa-f]{1,4}){0,4}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:))|(:(((:[0-9A-Fa-f]{1,4}){1,7})|((:[0-9A-Fa-f]{1,4}){0,5}:((25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(\.(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)){3}))|:)))(%.+)?\s*$";
443 443                 return IsMatch(input, pattern);
444 444             }
445 445 
446 446             ///   
447 447             /// 身份证上数字对应的地址  
448 448             ///   
449 449             //enum IDAddress  
450 450             //{  
451 451             //    北京 = 11, 天津 = 12, 河北 = 13, 山西 = 14, 内蒙古 = 15, 辽宁 = 21, 吉林 = 22, 黑龙江 = 23, 上海 = 31, 江苏 = 32, 浙江 = 33,  
452 452             //    安徽 = 34, 福建 = 35, 江西 = 36, 山东 = 37, 河南 = 41, 湖北 = 42, 湖南 = 43, 广东 = 44, 广西 = 45, 海南 = 46, 重庆 = 50, 四川 = 51,  
453 453             //    贵州 = 52, 云南 = 53, 西藏 = 54, 陕西 = 61, 甘肃 = 62, 青海 = 63, 宁夏 = 64, 新疆 = 65, 台湾 = 71, 香港 = 81, 澳门 = 82, 国外 = 91  
454 454             //}  
455 455 
456 456             ///   
457 457             /// 验证一代身份证号(15位数)  
458 458             /// [长度为15位的数字;匹配对应省份地址;生日能正确匹配]  
459 459             ///   
460 460             /// 待验证的字符串  
461 461             /// 是否匹配  
462 462             public static bool IsIDCard15(string input)
463 463             {
464 464                 //验证是否可以转换为15位整数  
465 465                 long l = 0;
466 466                 if (!long.TryParse(input, out l) || l.ToString().Length != 15)
467 467                 {
468 468                     return false;
469 469                 }
470 470                 //验证省份是否匹配  
471 471                 //1~6位为地区代码,其中1、2位数为各省级政府的代码,3、4位数为地、市级政府的代码,5、6位数为县、区级政府代码。  
472 472                 string address = "11,12,13,14,15,21,22,23,31,32,33,34,35,36,37,41,42,43,44,45,46,50,51,52,53,54,61,62,63,64,65,71,81,82,91,";
473 473                 if (!address.Contains(input.Remove(2) + ","))
474 474                 {
475 475                     return false;
476 476                 }
477 477                 //验证生日是否匹配  
478 478                 string birthdate = input.Substring(6, 6).Insert(4, "/").Insert(2, "/");
479 479                 DateTime dt;
480 480                 if (!DateTime.TryParse(birthdate, out dt))
481 481                 {
482 482                     return false;
483 483                 }
484 484                 return true;
485 485             }
486 486 
487 487             ///   
488 488             /// 验证二代身份证号(18位数,GB11643-1999标准)  
489 489             /// [长度为18位;前17位为数字,最后一位(校验码)可以为大小写x;匹配对应省份地址;生日能正确匹配;校验码能正确匹配]  
490 490             ///   
491 491             /// 待验证的字符串  
492 492             /// 是否匹配  
493 493             public static bool IsIDCard18(string input)
494 494             {
495 495                 //验证是否可以转换为正确的整数  
496 496                 long l = 0;
497 497                 if (!long.TryParse(input.Remove(17), out l) || l.ToString().Length != 17 || !long.TryParse(input.Replace('x', '0').Replace('X', '0'), out l))
498 498                 {
499 499                     return false;
500 500                 }
501 501                 //验证省份是否匹配  
502 502                 //1~6位为地区代码,其中1、2位数为各省级政府的代码,3、4位数为地、市级政府的代码,5、6位数为县、区级政府代码。  
503 503                 string address = "11,12,13,14,15,21,22,23,31,32,33,34,35,36,37,41,42,43,44,45,46,50,51,52,53,54,61,62,63,64,65,71,81,82,91,";
504 504                 if (!address.Contains(input.Remove(2) + ","))
505 505                 {
506 506                     return false;
507 507                 }
508 508                 //验证生日是否匹配  
509 509                 string birthdate = input.Substring(6, 8).Insert(6, "/").Insert(4, "/");
510 510                 DateTime dt;
511 511                 if (!DateTime.TryParse(birthdate, out dt))
512 512                 {
513 513                     return false;
514 514                 }
515 515                 //校验码验证  
516 516                 //校验码:  
517 517                 //(1)十七位数字本体码加权求和公式   
518 518                 //S = Sum(Ai * Wi), i = 0, ... , 16 ,先对前17位数字的权求和   
519 519                 //Ai:表示第i位置上的身份证号码数字值   
520 520                 //Wi:表示第i位置上的加权因子   
521 521                 //Wi: 7 9 10 5 8 4 2 1 6 3 7 9 10 5 8 4 2   
522 522                 //(2)计算模   
523 523                 //Y = mod(S, 11)   
524 524                 //(3)通过模得到对应的校验码   
525 525                 //Y: 0 1 2 3 4 5 6 7 8 9 10   
526 526                 //校验码: 1 0 X 9 8 7 6 5 4 3 2   
527 527                 string[] arrVarifyCode = ("1,0,x,9,8,7,6,5,4,3,2").Split(',');
528 528                 string[] Wi = ("7,9,10,5,8,4,2,1,6,3,7,9,10,5,8,4,2").Split(',');
529 529                 char[] Ai = input.Remove(17).ToCharArray();
530 530                 int sum = 0;
531 531                 for (int i = 0; i < 17; i++)
532 532                 {
533 533                     sum += int.Parse(Wi[i]) * int.Parse(Ai[i].ToString());
534 534                 }
535 535                 int y = -1;
536 536                 Math.DivRem(sum, 11, out y);
537 537                 if (arrVarifyCode[y] != input.Substring(17, 1).ToLower())
538 538                 {
539 539                     return false;
540 540                 }
541 541                 return true;
542 542             }
543 543 
544 544             ///   
545 545             /// 验证身份证号(不区分一二代身份证号)  
546 546             ///   
547 547             /// 待验证的字符串  
548 548             /// 是否匹配  
549 549             public static bool IsIDCard(string input)
550 550             {
551 551                 if (input.Length == 18)
552 552                     return IsIDCard18(input);
553 553                 else if (input.Length == 15)
554 554                     return IsIDCard15(input);
555 555                 else
556 556                     return false;
557 557             }
558 558 
559 559             ///   
560 560             /// 验证经度  
561 561             ///   
562 562             /// 待验证的字符串  
563 563             /// 是否匹配  
564 564             public static bool IsLongitude(string input)
565 565             {
566 566                 ////范围为-180~180,小数位数必须是1到5位  
567 567                 //string pattern = @"^[-\+]?((1[0-7]\d{1}|0?\d{1,2})\.\d{1,5}|180\.0{1,5})$";  
568 568                 //return IsMatch(input, pattern);  
569 569                 float lon;
570 570                 if (float.TryParse(input, out lon) && lon >= -180 && lon <= 180)
571 571                     return true;
572 572                 else
573 573                     return false;
574 574             }
575 575 
576 576             ///   
577 577             /// 验证纬度  
578 578             ///   
579 579             /// 待验证的字符串  
580 580             /// 是否匹配  
581 581             public static bool IsLatitude(string input)
582 582             {
583 583                 ////范围为-90~90,小数位数必须是1到5位  
584 584                 //string pattern = @"^[-\+]?([0-8]?\d{1}\.\d{1,5}|90\.0{1,5})$";  
585 585                 //return IsMatch(input, pattern);  
586 586                 float lat;
587 587                 if (float.TryParse(input, out lat) && lat >= -90 && lat <= 90)
588 588                     return true;
589 589                 else
590 590                     return false;
591 591             }
592 592             #endregion
593 593         }
View Code

 

 注:感谢 Sam Xiao 对RegEx类的实例用法作出补充

转载于:https://www.cnblogs.com/lxhbky/p/7596479.html

你可能感兴趣的:(C#正则表达式_简单梳理_Emoji表情字符处理)