008 字符串处理技巧

001 去除特定字符/以特定字符分割

str.split()  # 可以去除字符串“两端”的空格
str.replace(' ', '')  # 可以去除字符串“中间”的空格
str.split('/')  # 将字符串通过/进行分割

示例

movie = '''
1994 / 美国 / 犯罪 剧情
'''
movie = movie.strip()
# 得到得结果就是1994 / 美国 / 犯罪 剧情
movie = movie.replace(' ', '')
# 得到的结果就是1994/美国/犯罪剧情
movie = movie.split('/')
# 这一行表示将字符串通过/进行分割,得到的是一个列表
# 得到的结果是['1994', '美国', '犯罪剧情']

002 startswith / endswith 内容判断

可以判断一个字符串是否以特定的字符开始。例如,在爬虫中,需要拼接url,但是有的url带了https://www.zhihu.com,有的却不带。

origin_url = 'https://www.zhihu.com'
url_list = ['/question/36539555/answer/595275293', '/question/308663552/a
nswer/577063117', 'https://www.zhihu.com/special/20743868']

for i in range(len(url_list)):
    if not url_list[i].startswith('http'):
    # 这一行表示如果url_list[i]不是以http开头的话,那么就执行if内部的语句
    url_list[i] = origin_url + url_list[i]

print(url_list)
# 得到的最终结果是
['https://www.zhihu.com/question/36539555/answer/595275293', \
'https://www.zhihu.com/question/308663552/answer/577063117', \ 
'https://www.zhihu.com/special/20743868']

当然有startswith,自然而然会有endswith

url_list = ['https://pic2.zhimg.com/50/v2‐5502c54842dceeb2e8901e884407a7f
d_fhd.jpg', 'https://www.zhihu.com/special/20743868']
for url in url_list:
    if url.endswith('jpg'):
    # 这一行表示如果url是以jpg结尾的话,就执行if内部的语句
    url_list.remove(url)
print(url_list)
# 最终结果是['https://www.zhihu.com/special/20743868']

003 文字拼接

将一堆字符串按照规定连接符拼接起来

dining_list = ['酱香排骨', '鸡蛋饼', '东坡肉']
tag = '-'.join(dining_list)
# 这一行表示用'-'符号将tag这个列表中的每个值连接起来,得到的是一个字符串
# 最终结果是'酱香排骨-鸡蛋饼-东坡肉'

持续更新...

你可能感兴趣的:(008 字符串处理技巧)