今天使用了正则表达式从文本中捕获目标数据,虽然之前有一定的基础,但是现在忘的差不多了,感觉自己纯手写的正则表达式很容易出错,浪费很多时间。后来使用了这个正则表达式匹配网站,效率提高了很多。下面就来具体介绍一下如何使用。
目录
1.使用介绍
2.正则表达式例子
2.1 Python例子
2.2 C#例子
之前我写的两篇文章可以学学基础:
【C#进阶三】C#正则表达式的使用及常用案例(Regex.IsMatch、Regex.Match,match.NextMatch、Regex.Matches、Regex.Replace等)(实践篇)_c# regex.matches_Chenasuny的博客-CSDN博客
【C#进阶二】C#中的正则表达式知识总结(字符转义/字符类/ 定位点/ 分组构造 /数量词/反向引用构造/替换构造/替代/正则表达式选项)(理论篇)_c# 正则表达式 分组构造_Chenasuny的博客-CSDN博客
regex101是一个在线的正则表达式测试和学习工具,可以帮助用户测试和调试正则表达式。以下是使用regex101的基本步骤:
1.打开regex101的网站:regex101: build, test, and debug regex
2. 在左侧的输入框中输入要匹配的文本。
3. 在上方的正则表达式输入框中输入你的正则表达式。
4. 选择正则表达式的语法类型(如PCRE、JavaScript等)。
5. 点击“Run”按钮,查看正则表达式是否匹配输入的文本。
6. 如果正则表达式有错误,regex101会在右侧的解释器窗口中显示错误信息。
7. 如果需要进一步调试和测试正则表达式,可以在右侧的“Test String”窗口中输入更多测试字符串,并查看正则表达式的匹配情况。
8. 在右侧的“Substitution”窗口中可以输入替换字符串,测试正则表达式的替换效果。
9. 在右侧的“Explanation”窗口中可以查看正则表达式的解释和分析,帮助学习正则表达式的语法和规则。
如果没有匹配上,也就是正则表达式有问题,可以进入Debug模式
所以用起来还是非常方便的,大家使用正则表达式的时候可以去使用。
正则表达式由特殊字符、普通字符和元字符组成,用于匹配字符串中的特定模式。例如,可以使用正则表达式来匹配email地址、电话号码、网址等等。正则表达式具有非常灵活和强大的语法,可以通过组合和嵌套不同的元字符和模式,实现各种高级文本处理功能。
假设我们有一个字符串列表,每个字符串包含一个email地址,我们想要从中提取出所有的email地址,先用regex101写好正则表达式。
我们可以使用Python内置的re模块和正则表达式来实现:
import re
# 定义正则表达式
pattern = r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b'
# 输入字符串列表
text_list = ['[email protected]', '[email protected]', '[email protected]', 'foo@bar']
# 遍历每个字符串,提取email地址
for text in text_list:
# 使用re.findall()方法查找匹配项
matches = re.findall(pattern, text)
if matches:
print(matches)
运行以上代码,输出结果为:
['[email protected]'] ['[email protected]'] ['[email protected]']
这个例子中,我们定义了一个正则表达式,用于匹配email地址。然后,我们遍历输入的字符串列表,使用re.findall()方法查找每个字符串中所有匹配的email地址,并打印出来。
假设我们有一个字符串,包含一些电话号码,我们想要从中提取出所有的电话号码。
我们可以使用C#内置的正则表达式类(Regex)和正则表达式来实现:
using System;
using System.Text.RegularExpressions;
class Program
{
static void Main()
{
// 定义正则表达式
string pattern = @"(\d{3})-(\d{3}-\d{4})";
// 输入字符串
string input = "John's phone number is 123-456-7890. Mary's phone number is 111-222-3333.";
// 使用Regex.Matches()方法查找匹配项
MatchCollection matches = Regex.Matches(input, pattern);
// 遍历所有匹配项,输出电话号码
foreach (Match match in matches)
{
Console.WriteLine(match.Value);
}
}
}
运行以上代码,输出结果为:
Copy code123-456-7890 111-222-3333
上面的代码定义了一个正则表达式,用于匹配电话号码。然后,使用Regex.Matches()方法查找输入字符串中所有匹配的电话号码,并遍历所有匹配项,输出电话号码。需要注意的是,在C#中使用正则表达式时,需要使用@符号将正则表达式字符串标记为原始字符串,以避免转义字符的影响。
欢迎关注公众号【智能建造小硕】(分享计算机编程、人工智能、智能建造、日常学习和科研经验等,欢迎大家关注交流。)