用一些例子来进行说明
情况一
删除指定字符串
下面的例子中,删去“学位授予单位:”
author_unit = "学位授予单位:西南财经大学"
author_unit = author_unit.replace("学位授予单位:","")
print(author_unit)
#结果为 西南财经大学
具体replace()函数可参见:
replace()函数详解——菜鸟教程
情况二
查找获取指定字符串
目的想要拿到学位授予年份后面的年份:(详情看注释)
代码
author_unit_text ="【学位授予单位】:西南财经大学【学位级别】:硕士【学位授予年份】:2013【分类号】:F832.51;F224;G206"
result_find = ""
flag = 0 #用于控制提取’:‘后的文字
begain = author_unit_text.find('【学位授予年份】',0) #返回找到的数组后一个位置,数组序号
for k in range(begain, len(text)):
if text[k] == ':': #为了不提取到引号
flag = 1
continue
if flag == 1:
if text[k] == '\n' or text[k] == '\t' or text[k] == '\r' or \
text[k] == '】':
continue
if text[k] == ' ' and text[k + 1] == ' ':
continue
if text[k] != '【':
result_find = result_find + text[k]
if text[k] == '【' and k != begain: #查到下一个【终止循环
break
print(result_find)
输出即为所要查找文字
具体find()函数可参见
find()函数详解——菜鸟教程
情况三
可以用空格进行切分的情况,比如切分中英文人名:
如何去掉字符串中某一空格后的内容
“情况四”
合并一个数组,数组中的元素都为字符串,目的是合并为一个长的字符串。并在每个单词间插入空格
比如
col = [“Tom”,“is”,“a”,“boy”]
str = ' ' #空格
cols = str.join(cols)
得到结果:
cols = Tom is a boy