string 模块预定义的字符串:
PythonWin 2.7.1 (r271:86832, Nov 27 2010, 18:30:46) [MSC v.1500 32 bit (Intel)] on win32.
Portions Copyright 1994-2008 Mark Hammond - see 'Help/About PythonWin' for further copyright information.
>>> import string
>>> string.uppercase
'ABCDEFGHIJKLMNOPQRSTUVWXYZ'
>>> string.ascii_letters
'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'
>>> string.lowercase
'abcdefghijklmnopqrstuvwxyz'
>>> string.digits
'0123456789'
>>>
for循环的else语句是一个可选项,它只在for循环完整的结束,没有遇到break时执行。
>>> x = [1,2,3,4,5]
>>> for item in range(0, len(x)):
... print x[item]
... else:
... print "The last value of item is ", item
...
1
2
3
4
5
The last value of item is 4
>>>
2. 连接符(+)
字符串的join():
>>> ''.join(('1','2','3','4'))
'1234'
>>>
3. 编译时字符串连接
Python的语法允许你在源码中把几个字符串连在一起写,以此来构建新的字符串。通过这种方法可以把长的字符串分成几部分写,而不用加反斜杠。这种写法的好处是可以把注释加进来。
>>> foo = "Hello" " " "World" "!"
>>> foo
'Hello World!'
>>>
4. 普通字符串转化为Unicode字符串。
如果把一个普通字符串和一个Unicode字符串做连接处理,Python会在连接操作前先把普通字符串转化为Unicode字符串。
重复操作符包含了原有字符串的多个拷贝的新串。
>>> "Anders!!!" * 3
'Anders!!!Anders!!!Anders!!!'
6.4 只适用于字符串的操作符
6.4.1 格式化操作符(%)
Python支持两种格式的输入参数:第一种是元组,第二种是字典形式。
>>> "%s %s" % ("Anders", "Fan")
'Anders Fan'
>>> "%(Anders)s %(Fan)s" % {"Anders":"Anders", "Fan":"Fan"}
'Anders Fan'
>>>
6.4.2 字符串模版:更简单的替代品
新式的字符串模版的优势是不用去记住所有相关细节的,Template对象有个方法substitute()。
>>> from string import Template
>>> s = Template("There are ${HowMany} ${Lang}!")
>>> print s.substitute(HowMany = "100M", Lang = "Money")
There are 100M Money!
>>> print s.substitute(HowMany = '2', Lang = 'brothers')
There are 2 brothers!
>>>
6.4.3 原始字符串操作符(r/R)
在原始字符串里,所有字符都是直接按照字面意思来使用,没有转义字符或不能打印的字符。
>>> '\n'
'\n'
>>> print '\n'
>>> r'\n'
'\\n'
>>> print r'\n'
\n
>>>
6.4.4 Unicode字符串操作符(u/U)
u/U用来把标准字符串或者包含Unicode字符的字符串转换成完全的Unicode字符串对象。
Unicode操作符必须出现在原始字符串操作符的前面。
>>> u'abc'
u'abc'
>>> u'\u1234'
u'\u1234'
>>> u'abc\u1234\n'
u'abc\u1234\n'
>>> print u'abc'
abc
>>> ur'Hello \n World!'
u'Hello \\n World!'
>>>
6.5 内建函数
6.5.1 标准类型函数
cmp():根据字符串的ASCII码值进行比较。
>>> cmp("abc", "lmn")
-1
>>> cmp("xyz", 'abc')
1
>>> cmp('lmn', 'lmn')
0
>>>
6.5.2 序列类型函数
len() 返回字符串的字符数
>>> len(string.letters)
52
max() and min()
返回最大或者最小字符
>>> max(string.digits)
'9'
>>> min(string.digits)
'0'
>>>
enumerate()
>>> s = "Anders Fan"
>>> for item, value in enumerate(s):
... print item, ' ', value
...
0 A
1 n
2 d
3 e
4 r
5 s
6
7 F
8 a
9 n
>>>
zip()
>>> first, second = "Anders", "Fan "
>>> zip(first, second)
[('A', 'F'), ('n', 'a'), ('d', 'n'), ('e', ' '), ('r', ' '), ('s', ' ')]
>>>
6.5.3 字符串类型函数
raw_input():提示用户输入并将这个输入返回。
str() and unicode()函数都是工厂函数,产生相对应的类型的对象。
isinstance()函数判断一个对象的类型。
chr()函数用一个range(256)范围内的整数做参数,返回一个对应的字符。
unichr()函数跟chr()一样,返回的Unicode字符。
ord()函数是chr()函数或unichr()函数的配对函数,它以一个字符作为参数,返回对应的ASCII数值,或者Unicode数值。
>>> chr(123)
'{'
>>> unichr(123)
u'{'
>>> ord('A')
65
>>> ord(u'\u1234')
4660
>>>