NLP学习过程记录(2)——字符串操作及正则表达式

一、字符串操作

1、去除空格及特殊符号

s = “hello world!"

  • s.strip()为默认去掉左右空格
  • s.lstrip("hello")去掉左侧
  • s.lstrip("!")去掉右侧

2、连接字符串(参考:https://blog.csdn.net/Demo_3/article/details/68955311)

  • “+”连接:
  • str_1.jion("str_2"):
  • 使用字符串格式化进行处理:

3、查找字母

str_1 = "r"
str_2 = "strchr"
print(str_2.index(str_1))
>>>2
#返回位置数字

也可以用find()方法

  • find()方法在查找不到是会返回-1不报错,不影响后面的过程
  • index()方法会报错

4、大小写转化

str_1 = "abcABC"
print(str_1.upper())
print(str_1.lower())
>>>ABCABC
>>>abcabc

更多参考:https://www.jb51.net/article/141376.htm

二、正则表达式

http://note.youdao.com/noteshare?id=89c2fba3b83cbb554c69f87371047909&sub=CD60296879A44DBCBFA5A7D2326B7DE0

你可能感兴趣的:(NLP学习过程)