今天跟大家聊聊字符串的格式化这部分内容。乍一听“格式化”这三个字,有的初学者可能会懵:难道这是要清空字符串的节奏?
其实不是的,恰恰相反,格式化字符串是为了让字符串变的更美观、更灵活。接下来就给大家详细介绍格式化字符串的概念以及具体用法。
格式化字符串是将现有的字符串按照指定模板嵌入,再生成固定格式的新字符串。
为什么要这样做呢?主要还是开发上很多场景需要用到:比如在某度进行关键字搜索问题时,每次发送不同的关键字返回不同结果,但其实发给后台的链接格式是一样的,也就是模板一致,只是里面的关键字参数不同,也就是俗称的套娃。比如下图所示:
任何网站基本都是遵循这样的规律进行开发,所以这就是为什么需要学习字符串的格式化处理。
在Python中提供了两种方法来格式化字符串,先说第一种:使用 % 操作符,语法格式如下:
'%[-][+][0][m][.n]格式化字符'%exp
参数说明:
- –:可选参数,用于指定左对齐,正数前方无符号,负数前方加负号。
- +:可选参数,用于指定右对齐,正数前方加正号,负数前方加负号。
- 0:可选参数,表示右对齐,正数前方无符号,负数前方加负号,用 0 填充空白处(一般与 m 参数一起使用)。
- m:可选参数,表示占有宽度。
- .n:可选参数,表示小数点后保留的位数。
- 格式化字符:用于指定要格式化的字符是什么类型,常见的格式化字符类型及表示方法如下表所示。
格式化字符 | 说明 | 格式化字符 | 说明 |
---|---|---|---|
%s | 字符串 | %o | 八进制整数 |
%d 或者 %i | 十进制整数 | %e | 指数(基底写为e) |
%x | 十六进制整数 | %E | 指数(基底写为E) |
%f 或者 %F | 浮点数 | %% | 字符% |
- exp:要转换的项。如果要指定多个,需要通过元组的形式进行指定。
是不是看到这么多参数和格式化字符,瞬间感到很复杂呢?
其实一点也不难,我们可以把这些参数拆开来看,既然里面很多参数都是可选的,也就是可有可无,那就先把这些参数全部去掉再看,语法就变成了 ‘%格式化字符’%exp,接下来看看代码示例,如下图所示:
看完上图代码,是不是感觉简单多了,至于那些可选参数则可以根据实际需求进行添加。比如上图代码中出现的小数有多位,如果只想保留两位有效数字,那就可以用到可选参数 .n,代码如下图所示:
同理,其余的可选参数,比如 m 占有宽度,指的是格式化字符串当前占有的宽度是多少字符。还是以刚才的浮点数格式化为例,‘3.14’ 本身占据 4 个字符的宽度,我们也可以设置的更宽,代码如下图所示:
其余的可选参数以及格式化字符类型用法就不再逐一演示了,大家有空可以自己多练练。
说明:由于使用 % 操作符是早期Python中提供的方法,自从Python2.6版本开始,字符串对象提供了 format() 方法对字符串进行格式化。现在Python社区也推荐使用这种方法。所以建议大家重点学习 format() 方法的使用。
format() 方法语法格式如下:
str.format(args)
参数说明:
- str:用于指定字符串的显示样式(即模板)。
- args:用于指定要转换的项,如果有多项,则用逗号分隔。
下面重点介绍创建模板。在创建模板时,需要使用 “{}” 和 “:” 指定占位符,语法格式如下:
{[index][:[[fill]align][sign][#][width][.precision][type]}
参数说明:
- index:可选参数,用于指定要设置格式的对象在参数列表中的索引位置,索引值从 0 开始。如果省略,则根据值的先后顺序自动分配。
- fill:可选参数,用于指定空白处填充的字符。
- align:可选参数,用于指定对齐方式(值为 “<” 时表示内容左对齐;值为 “>” 时表示内容右对齐;值为 “^” 时表示内容居中),需要配合 width 一起使用。
- sign:可选参数,用于指定有无符号数(值为 “+” 表示正数加正号,负数加负号;值为 “-” 表示正数不变,负数加负号;值为空格表示正数加空格,负数加负号)。
- #:可选参数,用于对二进制数、八进制数和十六进制数,如果加上 #,表示会显示 0b/0o/0x 前缀,否则不显示前缀。
- width:可选参数,用于指定所占宽度。
- .precision:可选参数,用于指定保留的小数位数。
- type:可选参数,用于指定类型。
format() 方法中常用的格式化字符如下表所示:
格式化字符 | 说明 | 格式化字符 | 说明 |
---|---|---|---|
s | 对字符串类型格式化 | b | 将十进制整数自动转换成二进制表示再格式化 |
d | 十进制整数 | o | 将十进制整数自动转换成八进制表示再格式化 |
c | 将十进制整数自动转换成对应的 Unicode 字符 | x 或者 X | 将十进制整数自动转换成十六进制表示再格式化 |
e 或者 E | 转换为科学计数法表示再格式化 | f 或者 F | 转换为浮点数(默认小数点后保留6位)再格式化 |
经历过上面的 % 操作符繁多的可选参数,再看到 format() 方法, 相信大家心里至少不会再懵。依葫芦画瓢,我们也先不看这些可选参数,统统划掉,语法就只剩下 ‘{}’.format(args)。代码示例如下图所示:
如果要格式化多个多个值,可以用到 index 可选参数,代码示例如下图所示:
看到上图,有的小伙伴可能会好奇:既然省略了,也可以格式化多个值,那为什么要多此一举,再弄个 index 参数呢?其实有的场景下,是需要使用索引的,比如下图代码所示:
说明:当一个模板中,出现多个占位符时,指定索引位置的规范需统一,即全部采用手动指定,或者全部采用自动,否则会报错,如下图所示。
再看一个可选参数 align,用来指定对齐方式,需要结合 width 宽度一起使用,代码示例如下图所示:
以此类推,其余的可选参数及格式化字符类型,大家日后都可以根据自己的实际开发按需取用,就不再做演示了。
以上就是给大家介绍的格式化字符串所有内容,里面需要着重理解并且熟练使用的就是 format() 方法。当然如果有小伙伴喜欢使用 % 操作符这种方法也完全可以使用。两种方法中都有很多可选参数,建议大家业余要多练习,不要死记硬背。