pandas 通过正则表达式查询和筛选

str.contains():包含一个特定的字符串
参数na:缺少值NaN处理
参数case:大小写我的处理
参数regex:使用正则表达式模式

可以通过str.contains()的参数na来指定替换NaN结果的值。
print(df_nan[‘name’].str.contains(‘li’, na=False))

默认情况下,区分大小写。如果参数case为False,则case被忽略。
print(df[‘name’].str.contains(‘LI’, case=False))

果参数ragex为False,则确定是否包含第一个参数的字符串本身。
print(df[‘name’].str.contains('i.e’, regex=False))
例如,如果要判断是否包含正则表达式的特殊字符,例如?,。,
,则需要设置regex = False。当然,可以指定一个正则表达式模式,以转义\?等特殊字符。

str.contains()等同于re.search(),并且可以在flags参数中指定正则表达式标志。

str.endswith():以特定字符串结尾
str.startswith():以特定的字符串开头
str.match():匹配正则表达式模式
要提取部分匹配的行,可以使用pandas的(str.xxx())方法,根据指定条件提取的字符串方法。

你可能感兴趣的:(test,文本转换,5G,pandas,正则表达式,python)