一、实验目的
- 字符串的3种表示
- 字符串的分割、连接、大小写转换、搜索等常用操作
二、知识要点
1.字符串的三种表示法
字符串可以通过单引号('...')
或双引号("...")
来进行表示,如果你想要分几行输入字符串,并且希望行尾的换行符自动包含到字符串当中,可以使用三对引号:·"""..."""
或 '''...'''
,例如:
a = 'test1' #单引号
b = "test2" #双引号
a_1 = '第一行\
第一行结尾' #多行一行输出
b_1 = '第一行 \n 第二行' #换行
c = """
test3
test4
""" #多行文本
d = '''
test5
test6
''' #多行文本
print("a=", a)
print("a_1=", a_1)
print("b=", b)
print("b_1=", b_1)
print("c=", c)
print("d=", d)
输出为:
a= test1
a_1= 第一行 第一行结尾
b= test2
b_1= 第一行
第二行
c=
test3
test4
d=
test5
test6
Process finished with exit code 0
在字符串中可以通过在一行的结尾输入
\
再换行达到多行文本最终输出一行的效果,而通过在字符串中输入\n
可以达到换行的目的。转义字符如下表所示:
转义字符 | 描述 |
---|---|
(在行尾时) | 续行符 |
\ | 反斜杠符号 |
' | 单引号 |
" | 双引号 |
\a | 响铃 |
\b | 退格(Backspace) |
\e | 转义 |
\000 | 空 |
\n | 换行 |
\v | 纵向制表符 |
\t | 横向制表符 |
\r | 回车 |
\f | 换页 |
\oyy | 八进制数,yy代表的字符,例如:\o12代表换行 |
\xyy | 十六进制数,yy代表的字符,例如:\x0a代表换行 |
\other | 其它的字符以普通格式输出 |
2.字符串方法
方法 | 描述 |
---|---|
string.capitalize() | 把字符串的第一个字符大写 |
string.center(width) | 返回一个原字符串居中,并使用空格填充至长度 width 的新字符串 |
string.count(str, beg=0, end=len(string)) | 返回 str 在 string 里面出现的次数,如果 beg 或者 end 指定则返回指定范围内 str 出现的次数 |
string.decode(encoding='UTF-8', errors='strict') | 以 encoding 指定的编码格式解码 string,如果出错默认报一个 ValueError 的 异 常 , 除非 errors 指 定 的 是 'ignore' 或 者'replace' |
string.encode(encoding='UTF-8', errors='strict') | 以 encoding 指定的编码格式编码 string,如果出错默认报一个ValueError 的异常,除非 errors 指定的是'ignore'或者'replace' |
string.endswith(obj, beg=0, end=len(string)) | 检查字符串是否以 obj 结束,如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束,如果是,返回 True,否则返回 False. |
string.expandtabs(tabsize=8) | 把字符串 string 中的 tab 符号转为空格,tab 符号默认的空格数是 8。 |
string.find(str, beg=0, end=len(string)) | 检测 str 是否包含在 string 中,如果 beg 和 end 指定范围,则检查是否包含在指定范围内,如果是返回开始的索引值,否则返回-1 |
string.format() | 格式化字符串 |
string.index(str, beg=0, end=len(string)) | 跟find()方法一样,只不过如果str不在 string中会报一个异常. |
string.isalnum() | 如果 string 至少有一个字符并且所有字符都是字母或数字则返回 True,否则返回 False |
string.isalpha() | 如果 string 至少有一个字符并且所有字符都是字母则返回 True,否则返回 False |
string.isdecimal() | 如果 string 只包含十进制数字则返回 True 否则返回 False. |
string.isdigit() | 如果 string 只包含数字则返回 True 否则返回 False. |
string.islower() | 如果 string 中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回 True,否则返回 False |
string.isnumeric() | 如果 string 中只包含数字字符,则返回 True,否则返回 False |
string.isspace() | 如果 string 中只包含空格,则返回 True,否则返回 False. |
string.istitle() | 如果 string 是标题化的(见 title())则返回 True,否则返回 False |
string.isupper() | 如果 string 中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是大写,则返回 True,否则返回 False |
string.join(seq) | 以 string 作为分隔符,将 seq 中所有的元素(的字符串表示)合并为一个新的字符串 |
string.ljust(width) | 返回一个原字符串左对齐,并使用空格填充至长度 width 的新字符串 |
string.lower() | 转换 string 中所有大写字符为小写. |
string.lstrip() | 截掉 string 左边的空格 |
string.maketrans(intab, outtab]) | maketrans() 方法用于创建字符映射的转换表,对于接受两个参数的最简单的调用方式,第一个参数是字符串,表示需要转换的字符,第二个参数也是字符串表示转换的目标。 |
max(str) | 返回字符串 str 中最大的字母。 |
min(str) | 返回字符串 str 中最小的字母。 |
string.partition(str) | 有点像 find()和 split()的结合体,从 str 出现的第一个位置起,把 字 符 串 string 分 成 一 个 3 元 素 的 元 组 (string_pre_str,str,string_post_str),如果 string 中不包含str 则 string_pre_str == string. |
string.replace(str1, str2, num=string.count(str1)) | 把 string 中的 str1 替换成 str2,如果 num 指定,则替换不超过 num 次. |
string.rfind(str, beg=0,end=len(string) ) | 类似于 find()函数,不过是从右边开始查找. |
string.rindex( str, beg=0,end=len(string)) | 类似于 index(),不过是从右边开始. |
string.rjust(width) | 返回一个原字符串右对齐,并使用空格填充至长度 width 的新字符串 |
string.rpartition(str) | 类似于 partition()函数,不过是从右边开始查找 |
string.rstrip() | 删除 string 字符串末尾的空格. |
string.split(str="", num=string.count(str)) | 以 str 为分隔符切片 string,如果 num 有指定值,则仅分隔 num+ 个子字符串 |
[string.splitlines(keepends]) | 按照行('\r', '\r\n', \n')分隔,返回一个包含各行作为元素的列表,如果参数 keepends 为 False,不包含换行符,如果为 True,则保留换行符。 |
string.startswith(obj, beg=0,end=len(string)) | 检查字符串是否是以 obj 开头,是则返回 True,否则返回 False。如果beg 和 end 指定值,则在指定范围内检查. |
[string.strip(obj]) | 在 string 上执行 lstrip()和 rstrip() |
string.swapcase() | 翻转 string 中的大小写 |
string.title() | 返回"标题化"的 string,就是说所有单词都是以大写开始,其余字母均为小写(见 istitle()) |
string.translate(str, del="") | 根据 str 给出的表(包含 256 个字符)转换 string 的字符,要过滤掉的字符放到 del 参数中 |
string.upper() | 转换 string 中的小写字母为大写 |
string.zfill(width) | 返回长度为 width 的字符串,原字符串 string 右对齐,前面填充0 |
3.字符串运算
操作符 | 描述 | 实例 |
---|---|---|
+ | 字符串连接 | >>>a + b 'HelloPython' |
* | 重复输出字符串 | >>>a * 2 'HelloHello' |
[] | 通过索引获取字符串中字符 | >>>a[1] 'e' |
[ : ] | 截取字符串中的一部分 | >>>a[1:4] 'ell' |
in | 成员运算符 - 如果字符串中包含给定的字符返回 True | >>>"H" in a True |
not in | 成员运算符 - 如果字符串中不包含给定的字符返回 True | >>>"M" not in a True |
r/R | 原始字符串 - 原始字符串:所有的字符串都是直接按照字面的意思来使用,没有转义特殊或不能打印的字符。 原始字符串除在字符串的第一个引号前加上字母"r"(可以大小写)以外,与普通字符串有着几乎完全相同的语法。 | >>>print r'\n' \n >>> print R'\n' \n |
% | 格式字符串 | 下一条 |
4.字符串格式化
Python 支持格式化字符串的输出 。尽管这样可能会用到非常复杂的表达式,但最基本的用法是将一个值插入到一个有字符串格式符 %s 的字符串中。例如:
print "My name is %s and weight is %d kg!" % ('Zara', 21)
>>My name is Zara and weight is 21 kg!
字符串格式化符号如下表所示:
符 号 | 描述 |
---|---|
%c | 格式化字符及其ASCII码 |
%s | 格式化字符串 |
%d | 格式化整数 |
%u | 格式化无符号整型 |
%o | 格式化无符号八进制数 |
%x | 格式化无符号十六进制数 |
%X | 格式化无符号十六进制数(大写) |
%f | 格式化浮点数字,可指定小数点后的精度 |
%e | 用科学计数法格式化浮点数 |
%E | 作用同%e,用科学计数法格式化浮点数 |
%g | %f和%e的简写 |
%G | %F 和 %E 的简写 |
%p | 用十六进制数格式化变量的地址 |
格式化操作符辅助指令:
符号 | 功能 |
---|---|
* | 定义宽度或者小数点精度 |
- | 用做左对齐 |
+ | 在正数前面显示加号( + ) |
在正数前面显示空格 | |
# | 在八进制数前面显示零('0'),在十六进制前面显示'0x'或者'0X'(取决于用的是'x'还是'X') |
0 | 显示的数字前面填充'0'而不是默认的空格 |
% | '%%'输出一个单一的'%' |
(var) | 映射变量(字典参数) |
m.n. | m 是显示的最小总宽度,n 是小数点后的位数(如果可用的话) |
三、实验内容
1.字符串常用函数使用:
1.1 split()
和join()
split() 分割任意字符串, join() 使用指定字符连接多个字符串,两者通常配合使用
- 代码:
s = 'hello world boy#zhe#nan,good'
print(s.split()) # 无参数
print(s.split("#")) # 定义分割符号
print(s.split("#", 1)) # 定义分割段数
print("-".join(s.split("#"))) #使用"-"替换"#"
- 结果:
['hello', 'world', 'boy#zhe#nan,good']
['hello world boy', 'zhe', 'nan,good']
['hello world boy', 'zhe#nan,good']
hello world boy-zhe-nan,good
- 分析:
split() 方法语法:
str.split(str="", num=string.count(str)).
其中:
- str -- 分隔符,默认为所有的空字符,包括空格、换行(\n)、制表符(\t)等。
- num -- 分割次数。默认为 -1, 即分隔所有。
1.2 title()
该方法返回"标题化"的字符串,就是说所有单词都是以大写开始。
- 代码:
str = "this is string example....wow!!!"
print (str.title())
- 结果:
This Is String Example....Wow!!!
1.3 upper()
将字符串中的小写字母转为大写字母。
- 代码:
str = "this is string example....wow!!!"
print ("str.upper() : ", str.upper())
- 结果:
str.upper() : THIS IS STRING EXAMPLE....WOW!!!
1.4 lower()
将字符串中的大写字母转为小写字母。
- 代码:
str = "This Is String Example....Wow!!!"
print ("str.lower() : ", str.lower())
- 结果:
this is string example....wow!!!
1.5 swapcase()
返回大小写交换版本。
- 代码:
s = "My name is Zhang"
print(s.swapcase())
- 结果
mY NAME IS zHANG
1.6 isalnum()
检查所有字符是否只有字母和数字'
- 代码
s_1 = "test1"
s_2 = "test 2"
print(s_1.isalnum(), s_2.isalnum())
``
+ 结果
```python
True False
1.7 isalpha()
检查所有字符中是否只有字母
- 代码:
s_3 = "test1"
s_4 = "test "
s_5 = "test"
print(s_3.isalpha(), s_4.isalpha(), s_5.isalpha())
- 结果:
False False True
1.8 strip()
、lstrip()
、rstrip()
strip()
移除字符串头尾指定的字符(默认为空格或换行符)或字符序列。
注意:该方法只能删除开头或是结尾的字符,不能删除中间部分的字符。
rstrip()
删除 string 字符串末尾的指定字符(默认为空格)。
lstrip()
截掉字符串左边的空格或指定字符。
- 代码:
s = ' a bc\n'
print("s.strip()=", s.strip()) # 无参
print("s.strip(\"a \")=", s.strip("a ")) # 有参
s_1 = ' www.baidu.com '
print("s_1.lstrip()=", s_1.lstrip()) # 无参
print("s_1.lstrip(\"wu \")=", s_1.lstrip("wu ")) # 有参
print("s_1.rstrip()=", s_1.rstrip()) # 无参
print("s_1.rstrip(\"com \")=", s_1.rstrip("com ")) # 有参
- 结果:
s.strip()= a bc
s.strip("a ")= bc
s_1.lstrip()= www.baidu.com
s_1.lstrip("wu ")= .baidu.com
s_1.rstrip()= www.baidu.com
s_1.rstrip("com ")= www.baidu.
Process finished with exit code 0
参数中包括的最后一个结尾的字符就是截取的部分,例如:
s_3 = 'abcdefg'
print(s_3.strip('cbaf'))
>>defg
由于没有输入g
,字符f
并没有截取
1.9 find()
,startwith()
,endwith()
find()
搜索字符串里的文本或子字符串,没有找到则返回 -1。
startwith(value)
检查字符串是否以value
开头,是则返回true,否则返回false
endwith(value)
检查字符串是否以value
结尾,是则返回true,否则返回false
- 代码:
s = "faulty for a reason"
print(s.find("for"))
print(s.find("fora"))
print(s.startswith("fa"))
print(s.startswith("fas")) # 检查字符串是否以 fa 开头
print(s.endswith("reason"))
print(s.endswith("reasons")) # 检查字符串是否以 reason 结尾
- 结果:
7
-1
True
False
True
False
四、实验结果
1.回文检查
回文是一种无论从左还是从右读都一样的字符序列。比如 “madam”。在这个例子中,我们检查用户输入的字符串是否是回文,并输出结果。
- 代码:
s = input("请输入一串字符串:")
z = s[::-1]
if s == z:
print("是回文")
else:
print("不是回文")
- 结果:
请输入一串字符串:asda
不是回文
请输入一串字符串:abcba
是回文
2.单词计数
对用户输入的一行文本进行单词计数
- 代码:
s = input("请输入一段句子(英文):")
print("这段句子中有%d个单词" % (len(s.split(" "))))
- 结果:
请输入一段句子(英文):my name is zhagn
这段句子中有4个单词