前⾯两节课,我们介绍了函数和字符串。在讲解今天的内容之前,先来回答⼀个可能会让⼤家感到费解的问题:为什么字符串类型( str )可以通过调⽤⽅法的⽅式进⾏操作,⽽之前我们⽤到的数值类型 (如 int 、 float )却没有可以调⽤的⽅法。在 Python 中,数值类型是标量类型,也就是说这种类型的变量没有可以访问的内部结构;⽽字符串类型是⼀种结构化的、⾮标量类型,所以才会有⼀系列的⽅法可供调⽤。如果对这⼀点感到困惑,那就继续学习吧,等学习完⾯向对象编程的知识后,你就能找到这些问题的答案了。
接下来我们通过⼀些案例来为⼤家讲解函数和字符串的应⽤。
经典⼩案例
例⼦ 1 :设计⼀个⽣成指定⻓度验证码的函数。
说明 :验证码由数字和英⽂⼤⼩写字⺟构成。
import random
ALL_CHARS = '0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'
def generate_code(code_len=4):
"""⽣成指定⻓度的验证码
:param code_len: 验证码的⻓度(默认4个字符)
:return: 由⼤⼩写英⽂字⺟和数字构成的随机验证码字符串
"""
code = ''
for _ in range(code_len):
# 产⽣0到字符串⻓度减1范围的随机数作为索引
index = random.randrange(0, len(ALL_CHARS))
# 利⽤索引运算从字符串中取出字符并进⾏拼接
code += ALL_CHARS[index]
return code
我们⽤下⾯的代码⽣成 10 组随机验证码来测试上⾯的函数。
for _ in range(10):
print(generate_code())
上⾯的函数其实还有⼀种更为简单的写法,直接利⽤ random 模块的随机抽样函数从字符串中取出指定数量的字符,然后利⽤字符串的 join ⽅法将选中的那些字符拼接起来。此外,可以利⽤ Python 标准库中的 string 模块来获得数字和英⽂字⺟的字⾯常量。
import random
import string
ALL_CHARS = string.digits + string.ascii_letters
def generate_code(code_len=4):
"""⽣成指定⻓度的验证码
:param code_len: 验证码的⻓度(默认4个字符)
:return: 由⼤⼩写英⽂字⺟和数字构成的随机验证码字符串
"""
return ''.join(random.choices(ALL_CHARS, k=code_len))
说明 : random 模块的 sample 和 choices 函数都可以实现随机抽样, sample 实现⽆放回抽样,这意味着抽样取出的字符是不重复的; choices 实现有放回抽样,这意味着可能会重复选中某些字
符。这两个函数的第⼀个参数代表抽样的总体,⽽参数 k 代表抽样的数量。
例⼦ 2 :设计⼀个函数返回给定⽂件名的后缀名。
说明 :⽂件名通常是⼀个字符串,⽽⽂件的后缀名指的是⽂件名中最后⼀个 . 后⾯的部分,也称为⽂件的扩展名,它是某些操作系统⽤来标记⽂件类型的⼀种机制,例如在Windows 系统上,后缀名 exe 表示这是⼀个可执⾏程序,⽽后缀名 txt 表示这是⼀个纯⽂本⽂件。需要注意的是,在Linux和 macOS 系统上,⽂件名可以以 . 开头,表示这是⼀个隐藏⽂件,像 .gitignore 这样的⽂件名, . 后⾯并不是后缀名,这个⽂件没有后缀名或者说后缀名为 '' 。
def get_suffix(filename):
"""获取⽂件名的后缀名
:param filename: ⽂件名
:return: ⽂件的后缀名
"""
# 从字符串中逆向查找.出现的位置
pos = filename.rfind('.')
# 通过切⽚操作从⽂件名中取出后缀名
return filename[pos + 1:] if pos > 0 else ''
可以⽤下⾯的代码对上⾯的函数做⼀个简单的测验。
print(get_suffix('readme.txt')) # txt
print(get_suffix('readme.txt.md')) # md
print(get_suffix('.readme')) #
print(get_suffix('readme.')) #
print(get_suffix('readme')) #
上⾯的 get_suffix 函数还有⼀个更为便捷的实现⽅式,就是直接使⽤ os.path 模块的 splitext 函数,这个函数会将⽂件名拆分成带路径的⽂件名和扩展名两个部分,然后返回⼀个⼆元组(下节课会讲到元组),⼆元组中的第⼆个元素就是⽂件的后缀名(包含 . ),如果要去掉后缀名中的 . ,可以做⼀个字符串的切⽚操作,代码如下所示。
from os.path import splitext
def get_suffix(filename):
return splitext(filename)[1][1:]
例⼦ 3 :在终端中显示跑⻢灯(滚动)⽂字。
说明 :实现跑⻢灯⽂字的原理⾮常简单,把当前字符串的第⼀个字符放到要输出的内容的最后
⾯,把从第⼆个字符开始后⾯的内容放到要输出的内容的最前⾯,通过循环重复这个操作,就可
以看到滚动起来的⽂字。两次循环之间的间隔可以通过 time 模块的 sleep 函数来实现,⽽清除屏
幕上之前的输出可以使⽤ os 模块的 system 函数调⽤系统清屏命令来实现。
import os
import time
content = '北 京 欢 迎 你 为 你 开 天 辟 地 '
while True:
# Windows清除屏幕上的输出
# os.system('cls')
# macOS清除屏幕上的输出
os.system('clear')
print(content)
# 休眠0.2秒(200毫秒)
time.sleep(0.2)
content = content[1:] + content[0]
提示 :我们之前建议⼤家暂时⽤ VS Code 来编写 Python 代码,如果你已经提前开始使⽤ PyCharm
了,需要提醒⼤家, PyCharm 的运⾏窗⼝⽆法⽤上⾯的⽅式做清屏处理。建议在 “ 命令⾏提示
符 ” 或 “ 终端 ” ( PyCharm 中的 “Terminal” 相当于就是 Windows 系统的 “ 命令⾏提示符 ” 或 macOS 系统
的 “ 终端 ” )中运⾏该程序。