关于Python中数据处理函数strip()和split()函数的使用

    先来从英文的词义上简单理解一下strip:v. 除去,撕掉。也就是说strip的作用就是用来去除字符串上的某些子字符串的(Python中是没有严格的字符的定义,而是将其统称为了字符串,对于‘a’,我们可以理解为仅包含一个字符的字符串,但是呢,字符串是由字符组成的)。split:v. 分离,分裂,使分裂,它的作用就是用来分割字符串的,将其分割为多个子字符串,并且以列表的形式进行返回。

接下来直接上例子:

0. strip()函数原型:

Python中的简单的代码介绍:def strip(self, __chars: str | None = ...) -> str: ...

设字符串为string,要删除的字符为token,则函数string.strip(token)的含义则表示删除string开头或结尾的token字符串。

1. 三种形式:string.strip(token):删除string字符串中开头(left)、结尾处(right)的token字符串

string.lstrip(token):删除string字符串中开头处(left)的含有token字符串(该字符串可以与token的顺序不一致)

string.rstrip(token):删除string字符串中结尾处(right)的含有token字符串(该字符串可以与token的顺序不一致)

2. 当token为空时,默认删除空白符(含'\n','\r','\t',' '),当非空时,根据指定的token进行删除

# 例 1

print('==========删除左or右的token空白字符串:不考虑顺序==========')
string = '       I Love You     '
print(string.strip())
print(string.lstrip())
print(string.rstrip())
# 例 2
print('==========删除左右含有token的非空白字符串:不考虑顺序==========')
string_2 = '132abc312'
print(string_2.strip('123'))
print(string_2.lstrip('123'))
print(string_2.rstrip('123'))

看输出:

==========删除左or右的token空白字符串:不考虑顺序==========
I Love You
I Love You     (这里才是结尾哦!)
       I Love You
==========删除左右含有token的非空白字符串:不考虑顺序==========
abc
abc312
132abc

看完strip()后,我们看split()方法:

3. 字符串split(分割)方法的使用:

split的作用一般就是用来分割数据的,最常见的两种形式就是string.split('\n') or string.split('\t')

以上两种常见的方法用来获取比较规范化的数据列表。注意!!! string.split()返回的是一个列表

接下来直接上例子:

# 例 3 删除空白符
print('==========删除空白符==========')
string_3 = '\nKDD\nSIGIR\nWSDM\nWWW\nNIPS'
print(string_3)
print(string_3.split())

# 例 4 指定所要删除的字符,如'\t'
print('==========指定所要删除的字符,如制表符==========')
string_4 = '\tKDD\tSIGIR\tWSDM\tWWW\tNIPS'
print(string_4)
print(string_4.split('\t'))

# 例 5 按某一个字符分割,且分割指定次数n.
print('==========按某一个字符分割,且分割指定次数n==========')
string_5 = ('www.baidu.com')
print(string_5)
print(string_5.split('.',1))
print(string_5.split('w',3))

# 例 6 按某一字符(或字符串)分割,且分割n次,并将分割的完成的字符串(或字符)赋给新的(n+1)个变量
print('按某一字符(或字符串)分割,且分割n次,并将分割的完成的字符串(或字符)赋给新的n+1)个变量')
string_6 = ('www.google.com')
str1, str2 = string_6.split('.', 1)
print(str1)
print(str2)

看输出:

==========删除空白符==========

KDD
SIGIR
WSDM
WWW
NIPS
['KDD', 'SIGIR', 'WSDM', 'WWW', 'NIPS']
==========指定所要删除的字符,如制表符==========
        KDD     SIGIR   WSDM    WWW     NIPS
['', 'KDD', 'SIGIR', 'WSDM', 'WWW', 'NIPS']
==========按某一个字符分割,且分割指定次数n==========
www.baidu.com
['www', 'baidu.com']
['', '', '', '.baidu.com']
按某一字符(或字符串)分割,且分割n次,并将分割的完成的字符串(或字符)赋给新的n+1)个变量
www
google.com

这两个方法其实是比较简单的,经常用作于数据的处理,将数据转化为方便操作的形式。

以上就是strip()方法和split()方法的简单介绍,感谢大家的阅读~

你可能感兴趣的:(推荐算法,python,list)