python_对字符串的处理

python_对字符串的处理_第1张图片
  • 字符串删除

    strip

  • 函数原型
    声明:s为字符串,rm为要删除的字符序列
    s.strip(rm) 删除s字符串中开头、结尾处,位于 rm删除序列的字符
    s.lstrip(rm) 删除s字符串中开头处,位于 rm删除序列的字符
    s.rstrip(rm) 删除s字符串中结尾处,位于 rm删除序列的字符
    注意:
    1.当rm为空时,默认删除空白符(包括'\n', '\r', '\t', ' ')
    例如:
    代码如下:

a = '     123'
a.strip()
'123'
a='\t\tabc
''abc"
a = 'sdff\r\n'
a.strip()'
sdff'

2.这里的rm删除序列是只要边(开头或结尾)上的字符在删除序列内,就删除掉。
例如 :
代码如下:

a = '123abc'
a.strip('21')
'3abc'   
结果是一样的
 a.strip('12')
'3abc'
  • Python中的strip用于去除字符串的首尾字符,同理,lstrip用于去除左边的字符,rstrip用于去除右边的字符。
    这三个函数都可传入一个参数,指定要去除的首尾字符。
    需要注意的是,传入的是一个字符数组,编译器去除两端所有相应的字符,直到没有匹配的字符,比如:
 theString= 'saaaay yes no yaaaass'
print  theString.strip('say')

theString依次被去除首尾在['s','a','y']数组内的字符,直到字符不在数组内。所以,输出的结果为: yes no比较简单吧,lstrip和rstrip原理是一样的。
注意:当没有传入参数时,是默认去除首尾空格的。

theString= 'saaaay yes no yaaaass'
print  theString.strip('say')
print theString.strip('say ')#say后面有空格
print theString.lstrip('say')
print theString.rstrip('say')
运行结果: 
yes no 
es no 
yes no yaaaass 
saaaay yes no
  • 字符串与数字间的转换

  • 字符串转换成数字:
import string
a = "18
 b = string.atoi(a)#默认10进制转换,可指定string.atoi(a,16)
  • 数字转换成字符串
c = 20
d = "%i"%c # 10进制表示
e = "0x%X"%c #16进制表示
  • 字符串连接

方法1: 用字符串的join方法
a = ['a','b','c','d']
content = ''content = ''.join(a)print content
方法2: 用字符串的替换占位符替换
a = ['a','b','c','d']
content = ''content = '%s%s%s%s' % tuple(a)print content
想要了解更多,请看python字符串连接

  • 字符串截取

我们可以通过索引来提取想要获取的字符,可以把python的字符串也做为字符串的列表就更好理解

  • python的字串列表有2种取值顺序

  • 1是从左到右索引默认0开始的,最大范围是字符串长度少1
    s = 'ilovepython'
    s[0]的结果是i

  • 2是从右到左索引默认-1开始的,最大范围是字符串开头
    s = 'ilovepython'
    s[-1]的结果是n
    上面这个是取得一个字符,如果你的实际要取得一段子串的话,可以用到变量[头下标:尾下标],就可以截取相应的字符串,其中下标是从0开始算起,可以是正数或负数,下标可以为空表示取到头或尾。
    比如
    s = 'ilovepython'
    s[1:5]的结果是love
    当使用以冒号分隔的字符串,python返回一个新的对象,结果包含了以这对偏移标识的连续的内容,左边的开始是包含了下边界,比如上面的结果包含了s[1]的值l,而取到的最大范围不包括上边界,就是s[5]的值p
    想要了解更多,请看python字符串截取

  • 字符串替换

字符串替换可以用内置的方法和正则表达式完成。1用字符串本身的replace方法:
a = 'hello word'
b = a.replace('word','python')
print b
2用正则表达式来完成替换:
import re
a = 'hello word'
strinfo = re.compile('word')
b = strinfo.sub('python',a)
print b
想要了解更多,请看python 字符串替换

  • 字符串比较

cmp方法比较两个对象,并根据结果返回一个整数。cmp(x,y)如果X< Y,返回值是负数 如果X>Y 返回的值为正数。
sStr1 = 'strch'
sStr2 = 'strchr'
print cmp(sStr1,sStr2)##-1

  • 字符串相加

我们通过操作符号+来进行字符串的相加,不过建议还是用其他的方式来进行字符串的拼接,这样效率高点。
原因:在循环连接字符串的时候,他每次连接一次,就要重新开辟空间,然后把字符串连接起来,再放入新的空间,再一次循环,又要开辟新的空间,把字符串连接起来放入新的空间,如此反复,内存操作比较频繁,每次都要计算内存空间,然后开辟内存空间,再释放内存空间,效率非常低。
sStr1 = 'strch'
sStr2 = 'strchr'
newstr = sStr1 + sStr2
print newstr

  • 字符串查找

python 字符串查找有4个方法,1 find,2 index方法,3 rfind方法,4 rindex方法。

  • 1 find()方法:
    info = 'abca'
    print info.find('a')##从下标0开始,查找在字符串里第一个出现的子串,返回结果:0
    info = 'abca'
    print info.find('a',1)##从下标1开始,查找在字符串里第一个出现的子串:返回结果3
    info = 'abca'
    print info.find('333')##返回-1,查找不到返回-1

  • 2 index()方法:
    python 的index方法是在字符串里查找子串第一次出现的位置,类似字符串的find方法,不过比find方法更好的是,如果查找不到子串,会抛出异常,而不是返回-1
    info = 'abca'
    print info.index('a')
    print info.index('33')

  • 字符串分割

字符串分割,可以用split,rsplit方法,通过相应的规则来切割成生成列表对象
info = 'name:haha,age:20$name:python,age:30$name:fef,age:55'
content = info.split('$')
print content

  • 字符串翻转

通过步进反转[::-1]
a = 'abcd'
b = a[::-1]##[::-1]通过步进反转
print b

  • 字符串编码

通过字符串的decode和encode方法

  • encode([encoding,[errors]]) ,其中encoding可以有多种值,比如gb2312 gbk gb18030 bz2 zlib big5 bzse64等都支持。errors默认值为"strict",意思是UnicodeError。可能的值还有'ignore', 'replace', 'xmlcharrefreplace', 'backslashreplace' 和所有的通过codecs.register_error注册的值。

  • S.decode([encoding,[errors]]) 下面是字符串编码应用:
    a = '你好'
    b = 'python'
    print a.decode('utf-8').encode('gbk')##decode方法把字符串转换为unicode对象,然后通过encode方法转换为指定的编码字符串对象
    print b.decode('utf-8')##decode方法把字符串转换为unicode对象

  • 字符串追加和拼接

通过字符串的占位符来进行字符串的拼接

  #1 元组拼接
  m = 'python'
  astr = 'i love %s' % m  
  print astr
  #2 字符串的format方法
  m = 'python'
  astr = "i love {python}".format(python=m)
  print astr
  #3 字典格式化字符串
  m = 'python'astr = "i love %(python)s " % {'python':m}
  print astr
  • 字符串复制

通过变量来进行赋值

  fstr = 'strcpy'
  sstr = fstr
  fstr = 'strcpy2'
  print sstr
  • 字符串长度

通过内置方法len()来计算字符串的长度,注意这个计算的是字符的长度。

  aa = 'afebb'
  bb = '你'
  print len(aa)
  print len(bb)
  • 字符串大小写

通过下面的upper(),lower()等方法来转换大小写

  • S.upper()#S中的字母大写

  • S.lower() #S中的字母小写

  • S.capitalize() #首字母大写

  • S.istitle() #S是否是首字母大写的

  • S.isupper() #S中的字母是否便是大写

  • S.islower() #S中的字母是否全是小写

  • 字符串去空格

通过strip(),lstrip(),rstrip()方法去除字符串的空格

  • S.strip()去掉字符串的左右空格

  • S.lstrip()去掉字符串的左边空格

  • S.rstrip()去掉字符串的右边空格

  • 字符串其他方法

字符串相关的其他方法:count(),join()方法等。

  • S.center(width, [fillchar]) #中间对齐
  • S.count(substr, [start, [end]]) #计算substr在S中出现的次数
  • S.expandtabs([tabsize]) #把S中的tab字符替换没空格,每个tab替换为tabsize个空格,默认是8个
  • S.isalnum() #是否全是字母和数字,并至少有一个字符
  • S.isalpha() #是否全是字母,并至少有一个字符
  • S.isspace() #是否全是空白字符,并至少有一个字符S.join()#S中的join,把列表生成一个字符串对象
  • S.ljust(width,[fillchar]) #输出width个字符,S左对齐,不足部分用fillchar填充,默认的为空格。
  • S.rjust(width,[fillchar]) #右对齐 S.splitlines([keepends]) #把S按照行分割符分为一个list,keepends是一个bool值,如果为真每行后而会保留行分割符。
  • S.swapcase() #大小写互换

你可能感兴趣的:(python_对字符串的处理)