NLP(自然语言处理——1)---常用的字符串和正则表达式

NLP研究:(常用的一些命令)
字符串操作:
(1)去掉空格及字符
s='hello, world'
print(s.strip())
#结果hello, world!
print(s.lstrip('hello,'))
#结果 world
print(s.rstrip('!'))
#结果hello, world
(2)连接字符串
sstr1='syrcat'
sstr2='append'
sstr1+=sstr2
print(sstr1)
#结果是syrcatappend
(3)查找字符
sstr1='strarfas'
sstr2='ra'
npos=sstr1.index(sstr2)
print(npos)
#结果是2print(sstr1.split(','))
(4)比较字符串
sstr1='syrcat'
sstr2='appen'
print(cmp(sstr1,sstr2))
print(cmp(sstr2,sstr2))
print(cmp(sstr1,sstr1))
(5)字符串的大小写转换
ssty1.upper()#全部转换成大写
sstr1.lower()#全部转换成小写
(6)翻转字符串
sstr1='asfasga'
sstr1=sstr1[::-1]
#结果是agsafsa
(7)查找字符串
sstr1='abcdefg'
sstr2='cde'
print(sstr1.find(sstr2))
#结果是2
(8)分割字符串
sstr1='ab,cde,fgh,ijk'
sstr2=','
sstr1=sstr1[sstr1.find(sstr2)+1:]
print(sstr1)
#或者


python 的正则表达式


https://regexr.com/这个是一个网站可以验证所有的正则付豪(选中以后,文字会被选中为高亮模式)
.  所有的,除了换行符
\d 所有的数字
\d{3} 三个数字在一起的
\D除数学以外的所有
\s换行
\S除了换行
\w是a-z,A-Z数字和——
\W除了w的
?匹配前一个字符的一次或者0次,例如abc?结果可以是ab ,abc
*匹配前一个字符0次或者无限次
+匹配前一个字符无限次
[]单个字符

NLP(自然语言处理——1)---常用的字符串和正则表达式_第1张图片

你可能感兴趣的:(NLP(自然语言处理——1)---常用的字符串和正则表达式)