在python中也有类似于c中的printf()的格式输出标记。在python中格式化输出字符串使用的是%运算符,通用的形式为

  • 格式标记字符串%  要输出的值组

其中,左边部分的”格式标记字符串“可以完全和c中的一致。右边的'值组'如果有两个及以上的值则需要用小括号括起来,中间用短号隔开。重点来看左边的部分。左边部分的最简单形式为:

  • %cdoe

其中的code有多种,不过由于在python中,所有东西都可以转换成string类型,因此,如果没有什么特殊需求完全可以全部使用’%s‘来标记。比如:

  • '%s %s %s' % (1, 2.3, ['one', 'two', 'three'])

它的输出为'1 2.3 ['one', 'two', 'three']',就是按照%左边的标记输出的。虽然第一个和第二值不是string类型,一样没有问题。在这个过程中,当电脑发现第一个值不是%s时,会先调用整型数的函数,把第一个值也就是1转成string类型,然后再调用str()函数来输出。

前面说过还有一个repr()函数,如果要用这个函数,可以用%r来标记。除了%s外,还有很多类似的code:

  • 整型数:%d

  • 无符号整型数:%u

  • 八进制:%o

  • 十六进制:%x   %X

  • 浮点数:%f

  • 科学记数法: %e   %E

  • 根据数值的不同自动选择%e或%f: %g

  • 根据数值的不同自动选择%E或%f: %G

就跟前面说用\进行转义一样,这里用%作为格式标记的标识,也有一个%本身应该如何输出的问题。如果要在”格式标记字符串“中输出%本身,可以用%%来表示
上面说的只是格式标记的最简间的形式,来看复杂一点的:

  • ‘%6.2f’ % 1.235

在这种形式中,在f的前面出现了一个类似小数的6.2它表示的意思是,总共输出的长度为6个字符,其中小数2位。还有更复杂的:

  • ‘%06.2f’ % 1.235

在6的前面多了一个0,表示如果输出的位数不足6位就用0补足6位。这一行的输出为‘001.24’,可以看到小数也占用一位。类似于这里0这样的标记还有-、+。

其中,-表示左对齐,+表示在正数前面也标上+号,默认是不加的。最后来看最复杂的形式:

  • ‘%(name)s:%(score)06.1f’ %{'score':9.5, 'name':'newsim'}

这种形式只用在要输出的内容为dictionary(一种python的数据类型)时,小括号中的(name)和(score)对应于后面的键值对中的键。前面的例子可以看到,”格式标记字符串“中标记的顺序和"要输出的值组"中的值是一一对应的,有顺序,一对一,二对二。而在这种形式中,则不是,每个格式标记对应哪个值由小括号中的键来指定。这行代码的输出为:'newsim:0009.5'。

 

有时候在%6.2f这种形式中,6和2也不能事先指定,会在程序运行过程中再产生,那怎么输入呢,当然不能用%%d.%df或%d.%d%f。可以用%*.*f的形式,当然在后面的”要输出的值组“中包含那两个*的值。比如:'%*.*f' % (6, 2, 2.345)就相当于'%6.2f' % 2.345。




Table 3.1. 字符串格式化代码

格式 描述
%% 百分号标记
%c 字符及其ASCII码
%s 字符串
%d 有符号整数(十进制)
%u 无符号整数(十进制)
%o 无符号整数(八进制)
%x 无符号整数(十六进制)
%X 无符号整数(十六进制大写字符)
%e 浮点数字(科学计数法)
%E 浮点数字(科学计数法,用E代替e)
%f 浮点数字(用小数点符号)
%g 浮点数字(根据值的大小采用%e或%f)
%G 浮点数字(类似于%g)
%p 指针(用十六进制打印值的内存地址)
%n 存储输出字符的数量放进参数列表的下一个变量中





str='python String function'

生成字符串变量str='python String function'


字符串长度获取:len(str)

例:print '%s length=%d' % (str,len(str))


字母处理

全部大写:str.upper()

全部小写:str.lower()

大小写互换:str.swapcase()

首字母大写,其余小写:str.capitalize()

首字母大写:str.title()


print '%s lower=%s' % (str,str.lower())

print '%s upper=%s' % (str,str.upper())

print '%s swapcase=%s' % (str,str.swapcase())

print '%s capitalize=%s' % (str,str.capitalize())

print '%s title=%s' % (str,str.title()) 

格式化相关

获取固定长度,右对齐,左边不够用空格补齐:str.ljust(width)

获取固定长度,左对齐,右边不够用空格补齐:str.ljust(width)

获取固定长度,中间对齐,两边不够用空格补齐:str.ljust(width)

获取固定长度,右对齐,左边不足用0补齐

print '%s ljust=%s' % (str,str.ljust(20))

print '%s rjust=%s' % (str,str.rjust(20))

print '%s center=%s' % (str,str.center(20))

print '%s zfill=%s' % (str,str.zfill(20))

                          字符串搜索相关

搜索指定字符串,没有返回-1:str.find('t')

指定起始位置搜索:str.find('t',start)

指定起始及结束位置搜索:str.find('t',start,end)

从右边开始查找:str.rfind('t')

搜索到多少个指定字符串:str.count('t')

上面所有方法都可用index代替,不同的是使用index查找不到会抛异常,而find返回-1

print '%s find nono=%d' % (str,str.find('nono'))

print '%s find t=%d' % (str,str.find('t'))

print '%s find t from %d=%d' % (str,1,str.find('t',1))

print '%s find t from %d to %d=%d' % (str,1,2,str.find('t',1,2))

#print '%s index nono ' % (str,str.index('nono',1,2))

print '%s rfind t=%d' % (str,str.rfind('t'))

print '%s count t=%d' % (str,str.count('t'))

                           字符串替换相关

替换old为new:str.replace('old','new')

替换指定次数的old为new:str.replace('old','new',maxReplaceTimes)

print '%s replace t to *=%s' % (str,str.replace('t', '*'))

print '%s replace t to *=%s' % (str,str.replace('t', '*',1))

                       字符串去空格及去指定字符

去两边空格:str.strip()

去左空格:str.lstrip()

去右空格:str.rstrip()

去两边字符串:str.strip('d'),相应的也有lstrip,rstrip

str=' python String function '

print '%s strip=%s' % (str,str.strip())

str='python String function'

print '%s strip=%s' % (str,str.strip('d'))

按指定字符分割字符串为数组:str.split(' ')


默认按空格分隔

str='a b c de'

print '%s strip=%s' % (str,str.split())

str='a-b-c-de'

print '%s strip=%s' % (str,str.split('-'))

                            字符串判断相关

是否以start开头:str.startswith('start')

是否以end结尾:str.endswith('end')

是否全为字母或数字:str.isalnum()

是否全字母:str.isalpha()

是否全数字:str.isdigit()

是否全小写:str.islower()

是否全大写:str.isupper()

str='python String function'

print '%s startwith t=%s' % (str,str.startswith('t'))

print '%s endwith d=%s' % (str,str.endswith('d'))

print '%s isalnum=%s' % (str,str.isalnum())

str='pythonStringfunction'

print '%s isalnum=%s' % (str,str.isalnum())

print '%s isalpha=%s' % (str,str.isalpha())

print '%s isupper=%s' % (str,str.isupper())

print '%s islower=%s' % (str,str.islower())

print '%s isdigit=%s' % (str,str.isdigit())

str='3423'

print '%s isdigit=%s' % (str,str.isdigit())

还有其他常见的Python字符串处理 函数的话不定期更新。



name = "my name is jiachen"

#首字母大写

print (name.capitalize())

#统计字母出现次数

print (name.count('a'))

#居中打印

print (name.center(50,'-'))

#字符串装换成bytes类型

print (name.encode('utf-8'))

#判断以什么结尾

print (name.endswith('en'))

#将tab转多少个空格

print (name.expandtabs())

#查找字符开头索引

print (name.find('y'))

#格式化字符串

#name = "my name is {name} and i am {year} old"

#print (name.format(name='jiachen',year=27))

#print (name.format_map({'name':'jiachen','year':27}))

#是否为数字或字母

print ('abc123'.isalnum())

#是否为字母

print ('Abc'.isalpha())

#是否为十进制

print ('1'.isdecimal())

#是否为整数

print ('11'.isdigit())

#判断是不是一个合法的表示符(变量名)

print ('a1A'.isidentifier())

#是否为小写

print ('Abc'.islower())

#是否只有数字

print ('213'.isnumeric())

#是否为空格

print (' '.isspace())

#是否每个首字母大写

print ('My Name Is'.istitle())

#是否能打印,tty file drive file

print ('My Name Is'.isprintable())

#是否都为大写

print ('My'.isupper())

#拼接字符串

print ('+'.join('abc'))

#长50不够用*号后面补上

print (name.ljust(50,'*'))

#长50不够用*号前面补上

print (name.rjust(50,'*'))

#变小写

print ('Alex'.lower())

#变大写

print ('alex'.upper())

#从左边去掉空格回车

print (' jiachen  '.lstrip())

#从右边去掉空格回车

print (' jiachen  '.rstrip())

#去掉头尾空格

print (' jiachen  '.strip())

#

p = str.maketrans('abcdef','123456')

print ('jiachen'.translate(p))

#字符串替换

print ('jaaaiachen'.replace('a','x',1))

#从右侧查找

print ('jiachen'.rfind('e'))

#分割成列表

print ('jiachen'.split('a'))

#匹配换行符,分割成列表

print ('1+2\n+3+4'.splitlines())

#反转大小写

print ('Jiachen'.swapcase())

#变成一个title

print ('jiachen'.title())

#不够50就前面补零

print ('jiachen'.zfill(50))













1、去空格及特殊符号


s.strip().lstrip().rstrip(',')


2、复制字符串


#strcpy(sStr1,sStr2)

sStr1 = 'strcpy'

sStr2 = sStr1

sStr1 = 'strcpy2'

print sStr2


3、连接字符串


#strcat(sStr1,sStr2)

sStr1 = 'strcat'

sStr2 = 'append'

sStr1 += sStr2

print sStr1


4、查找字符


#strchr(sStr1,sStr2)

# < 0 为未找到sStr1 = 'strchr'

sStr2 = 's'

nPos = sStr1.index(sStr2)

print nPos


5、比较字符串


#strcmp(sStr1,sStr2)

sStr1 = 'strchr'

sStr2 = 'strch'

print cmp(sStr1,sStr2)


6、扫描字符串是否包含指定的字符


#strspn(sStr1,sStr2)

sStr1 = '12345678'

sStr2 = '456'

#sStr1 and chars both in sStr1 and sStr2

print len(sStr1 and sStr2)


7、字符串长度


#strlen(sStr1)

sStr1 = 'strlen'

print len(sStr1)


8、将字符串中的大小写转换


S.lower() #小写 

S.upper() #大写 

S.swapcase() #大小写互换 

S.capitalize() #首字母大写 

String.capwords(S) #这是模块中的方法。它把S用split()函数分开,然后用capitalize()把首字母变成大写,最后用join()合并到一起 

#实例:

#strlwr(sStr1)

sStr1 = 'JCstrlwr'

sStr1 = sStr1.upper()

#sStr1 = sStr1.lower()

print sStr1


9、追加指定长度的字符串


#strncat(sStr1,sStr2,n)

sStr1 = '12345'

sStr2 = 'abcdef'

n = 3

sStr1 += sStr2[0:n]

print sStr1


10、字符串指定长度比较


#strncmp(sStr1,sStr2,n)

sStr1 = '12345'

sStr2 = '123bc'

n = 3

print cmp(sStr1[0:n],sStr2[0:n])


11、复制指定长度的字符


#strncpy(sStr1,sStr2,n)

sStr1 = ''

sStr2 = '12345'

n = 3

sStr1 = sStr2[0:n]

print sStr1


12、将字符串前n个字符替换为指定的字符


#strnset(sStr1,ch,n)

sStr1 = '12345'

ch = 'r'

n = 3

sStr1 = n * ch + sStr1[3:]

print sStr1


13、扫描字符串


#strpbrk(sStr1,sStr2)

sStr1 = 'cekjgdklab'

sStr2 = 'gka'

nPos = -1

for c in sStr1:

    if c in sStr2:

        nPos = sStr1.index(c)

        break

print nPos


14、翻转字符串


#strrev(sStr1)

sStr1 = 'abcdefg'

sStr1 = sStr1[::-1]

print sStr1


15、查找字符串


#strstr(sStr1,sStr2)

sStr1 = 'abcdefg'

sStr2 = 'cde'

print sStr1.find(sStr2)


16、分割字符串


#strtok(sStr1,sStr2)

sStr1 = 'ab,cde,fgh,ijk'

sStr2 = ','

sStr1 = sStr1[sStr1.find(sStr2) + 1:]

print sStr1

#或者

s = 'ab,cde,fgh,ijk'

print(s.split(','))


17、连接字符串


delimiter = ','

mylist = ['Brazil', 'Russia', 'India', 'China']

print delimiter.join(mylist)


18、PHP 中 addslashes 的实现


def addslashes(s):    

d = {'"':'\\"', "'":"\\'", "\0":"\\\0", "\\":"\\\\"}    

return ''.join(d.get(c, c) for c in s)

s = "John 'Johny' Doe (a.k.a. \"Super Joe\")\\\0"

print sprint addslashes(s)

19、只显示字母与数字


def OnlyCharNum(s,oth=''):

    s2 = s.lower();

    fomart = 'abcdefghijklmnopqrstuvwxyz0123456789'

    for c in s2:

        if not c in fomart:

            s = s.replace(c,'');

    return s;

print(OnlyStr("a000 aa-b"))


20、截取字符串


str = '0123456789′

print str[0:3] #截取第一位到第三位的字符

print str[:] #截取字符串的全部字符

print str[6:] #截取第七个字符到结尾

print str[:-3] #截取从头开始到倒数第三个字符之前

print str[2] #截取第三个字符

print str[-1] #截取倒数第一个字符

print str[::-1] #创造一个与原字符串顺序相反的字符串

print str[-3:-1] #截取倒数第三位与倒数第一位之前的字符

print str[-3:] #截取倒数第三位到结尾

print str[:-5:-3] #逆序截取,具体啥意思没搞明白?


21、字符串在输出时的对齐 


S.ljust(width,[fillchar]) 

#输出width个字符,S左对齐,不足部分用fillchar填充,默认的为空格。 

S.rjust(width,[fillchar]) #右对齐 

S.center(width, [fillchar]) #中间对齐 

S.zfill(width) #把S变成width长,并在右对齐,不足部分用0补足


22、字符串中的搜索和替换 


S.find(substr, [start, [end]]) 

#返回S中出现substr的第一个字母的标号,如果S中没有substr则返回-1。start和end作用就相当于在S[start:end]中搜索 

S.index(substr, [start, [end]]) 

#与find()相同,只是在S中没有substr时,会返回一个运行时错误 

S.rfind(substr, [start, [end]]) 

#返回S中最后出现的substr的第一个字母的标号,如果S中没有substr则返回-1,也就是说从右边算起的第一次出现的substr的首字母标号 

S.rindex(substr, [start, [end]]) 

S.count(substr, [start, [end]]) #计算substr在S中出现的次数 

S.replace(oldstr, newstr, [count]) 

#把S中的oldstar替换为newstr,count为替换次数。这是替换的通用形式,还有一些函数进行特殊字符的替换 

S.strip([chars]) 

#把S中前后chars中有的字符全部去掉,可以理解为把S前后chars替换为None 

S.lstrip([chars]) 

S.rstrip([chars]) 

S.expandtabs([tabsize]) 

#把S中的tab字符替换没空格,每个tab替换为tabsize个空格,默认是8个


23、字符串的分割和组合


S.split([sep, [maxsplit]]) 

#以sep为分隔符,把S分成一个list。maxsplit表示分割的次数。默认的分割符为空白字符 

S.rsplit([sep, [maxsplit]]) 

S.splitlines([keepends]) 

#把S按照行分割符分为一个list,keepends是一个bool值,如果为真每行后而会保留行分割符。 

S.join(seq) #把seq代表的序列──字符串序列,用S连接起来


24、字符串的mapping,这一功能包含两个函数 


String.maketrans(from, to) 

#返回一个256个字符组成的翻译表,其中from中的字符被一一对应地转换成to,所以from和to必须是等长的。 

S.translate(table[,deletechars]) 

# 使用上面的函数产后的翻译表,把S进行翻译,并把deletechars中有的字符删掉。需要注意的是,如果S为unicode字符串,那么就不支持 deletechars参数,可以使用把某个字符翻译为None的方式实现相同的功能。此外还可以使用codecs模块的功能来创建更加功能强大的翻译表。


25、字符串还有一对编码和解码的函数 


S.encode([encoding,[errors]]) 

# 其中encoding可以有多种值,比如gb2312 gbk gb18030 bz2 zlib big5 bzse64等都支持。errors默认值为"strict",意思是UnicodeError。可能的值还有'ignore', 'replace', 'xmlcharrefreplace', 'backslashreplace' 和所有的通过codecs.register_error注册的值。这一部分内容涉及codecs模块,不是特明白 

S.decode([encoding,[errors]])


26、字符串的测试、判断函数,这一类函数在string模块中没有,这些函数返回的都是bool值


S.startswith(prefix[,start[,end]]) 

#是否以prefix开头 

S.endswith(suffix[,start[,end]]) 

#以suffix结尾 

S.isalnum() 

#是否全是字母和数字,并至少有一个字符 

S.isalpha() #是否全是字母,并至少有一个字符 

S.isdigit() #是否全是数字,并至少有一个字符 

S.isspace() #是否全是空白字符,并至少有一个字符 

S.islower() #S中的字母是否全是小写 

S.isupper() #S中的字母是否便是大写 

S.istitle() #S是否是首字母大写的


27、字符串类型转换函数,这几个函数只在string模块中有


string.atoi(s[,base]) 

#base默认为10,如果为0,那么s就可以是012或0x23这种形式的字符串,如果是16那么s就只能是0x23或0X12这种形式的字符串 

string.atol(s[,base]) #转成long 

string.atof(s[,base]) #转成float

这里再强调一次,字符串对象是不可改变的,也就是说在python创建一个字符串后,你不能把这个字符中的某一部分改变。任何上面的函数改变了字符串后,都会返回一个新的字符串,原字串并没有变。其实这也是有变通的办法的,可以用S=list(S)这个函数把S变为由单个字符为成员的list,这样的话就可以使用S[3]='a'的方式改变值,然后再使用S=" ".join(S)还原成字符串