Python将多个空格换为一个空格.md

Python将多个空格换为一个空格

最近在文本预处理时遇到这个问题,解决方法如下:

import re
str1 = '  rwe fdsa    fasf   '
str1_after = re.sub(' +', '', str1)
print(str1_after)

进一步的,可以将多个数字转换为特定符号,如‘num’,这一步在自然语言预处理中也常用,因为有时候我们并不关心是什么数,只关心是不是数字。

import re
str1 = '我的电话18888888888,邮箱[email protected]'
str1_after = re.sub('\d+', 'num', str1)
print(str1_after)

你可能感兴趣的:(python中文)