爬虫神器,regex101正则表达式测试和学习工具(内含使用教程、Python和C#正则表达式代码示例)

今天使用了正则表达式从文本中捕获目标数据,虽然之前有一定的基础,但是现在忘的差不多了,感觉自己纯手写的正则表达式很容易出错,浪费很多时间。后来使用了这个正则表达式匹配网站,效率提高了很多。下面就来具体介绍一下如何使用。

目录

1.使用介绍

2.正则表达式例子

2.1 Python例子

2.2 C#例子


之前我写的两篇文章可以学学基础:

 【C#进阶三】C#正则表达式的使用及常用案例(Regex.IsMatch、Regex.Match,match.NextMatch、Regex.Matches、Regex.Replace等)(实践篇)_c# regex.matches_Chenasuny的博客-CSDN博客

【C#进阶二】C#中的正则表达式知识总结(字符转义/字符类/ 定位点/ 分组构造 /数量词/反向引用构造/替换构造/替代/正则表达式选项)(理论篇)_c# 正则表达式 分组构造_Chenasuny的博客-CSDN博客

1.使用介绍

regex101是一个在线的正则表达式测试和学习工具,可以帮助用户测试和调试正则表达式。以下是使用regex101的基本步骤:

爬虫神器,regex101正则表达式测试和学习工具(内含使用教程、Python和C#正则表达式代码示例)_第1张图片

1.打开regex101的网站:regex101: build, test, and debug regex

2. 在左侧的输入框中输入要匹配的文本。

3. 在上方的正则表达式输入框中输入你的正则表达式。

4. 选择正则表达式的语法类型(如PCRE、JavaScript等)。

5. 点击“Run”按钮,查看正则表达式是否匹配输入的文本。

6. 如果正则表达式有错误,regex101会在右侧的解释器窗口中显示错误信息。

7. 如果需要进一步调试和测试正则表达式,可以在右侧的“Test String”窗口中输入更多测试字符串,并查看正则表达式的匹配情况。

8. 在右侧的“Substitution”窗口中可以输入替换字符串,测试正则表达式的替换效果。

9. 在右侧的“Explanation”窗口中可以查看正则表达式的解释和分析,帮助学习正则表达式的语法和规则。

如果没有匹配上,也就是正则表达式有问题,可以进入Debug模式

爬虫神器,regex101正则表达式测试和学习工具(内含使用教程、Python和C#正则表达式代码示例)_第2张图片

爬虫神器,regex101正则表达式测试和学习工具(内含使用教程、Python和C#正则表达式代码示例)_第3张图片

爬虫神器,regex101正则表达式测试和学习工具(内含使用教程、Python和C#正则表达式代码示例)_第4张图片

所以用起来还是非常方便的,大家使用正则表达式的时候可以去使用。

2.正则表达式例子

正则表达式由特殊字符、普通字符和元字符组成,用于匹配字符串中的特定模式。例如,可以使用正则表达式来匹配email地址、电话号码、网址等等。正则表达式具有非常灵活和强大的语法,可以通过组合和嵌套不同的元字符和模式,实现各种高级文本处理功能。

2.1 Python例子

假设我们有一个字符串列表,每个字符串包含一个email地址,我们想要从中提取出所有的email地址,先用regex101写好正则表达式。

爬虫神器,regex101正则表达式测试和学习工具(内含使用教程、Python和C#正则表达式代码示例)_第5张图片

我们可以使用Python内置的re模块和正则表达式来实现:

import re

# 定义正则表达式
pattern = r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b'

# 输入字符串列表
text_list = ['[email protected]', '[email protected]', '[email protected]', 'foo@bar']

# 遍历每个字符串,提取email地址
for text in text_list:
    # 使用re.findall()方法查找匹配项
    matches = re.findall(pattern, text)
    if matches:
        print(matches)

运行以上代码,输出结果为:

['[email protected]']
['[email protected]'] 
['[email protected]']

这个例子中,我们定义了一个正则表达式,用于匹配email地址。然后,我们遍历输入的字符串列表,使用re.findall()方法查找每个字符串中所有匹配的email地址,并打印出来。

2.2 C#例子

假设我们有一个字符串,包含一些电话号码,我们想要从中提取出所有的电话号码。

爬虫神器,regex101正则表达式测试和学习工具(内含使用教程、Python和C#正则表达式代码示例)_第6张图片

我们可以使用C#内置的正则表达式类(Regex)和正则表达式来实现:

using System;
using System.Text.RegularExpressions;

class Program
{
    static void Main()
    {
        // 定义正则表达式
        string pattern = @"(\d{3})-(\d{3}-\d{4})";

        // 输入字符串
        string input = "John's phone number is 123-456-7890. Mary's phone number is 111-222-3333.";

        // 使用Regex.Matches()方法查找匹配项
        MatchCollection matches = Regex.Matches(input, pattern);

        // 遍历所有匹配项,输出电话号码
        foreach (Match match in matches)
        {
            Console.WriteLine(match.Value);
        }
    }
}

运行以上代码,输出结果为:

Copy code123-456-7890 111-222-3333

上面的代码定义了一个正则表达式,用于匹配电话号码。然后,使用Regex.Matches()方法查找输入字符串中所有匹配的电话号码,并遍历所有匹配项,输出电话号码。需要注意的是,在C#中使用正则表达式时,需要使用@符号将正则表达式字符串标记为原始字符串,以避免转义字符的影响。

欢迎关注公众号【智能建造小硕】(分享计算机编程、人工智能、智能建造、日常学习和科研经验等,欢迎大家关注交流。)

你可能感兴趣的:(学习经验,正则表达式,regex101)