Python 字符串 ~ 定义字符串

C/C++/Java 等编程语言不通之处,Python 并不会区分字符和字符串,所有的字符都是字符串,比如:

>> greet = 'Hello Python'
>> greet
'Hello Python'
>> greet = "Hello Python"
>> greet
'Hello Python'

在 Python 中,我们可以使用单引号或双引号来定义字符串,如果字符串的值本身包含单引号,我们通常使用双引号定义字符串;反之,则使用单引号:

>> print("She's a teacher.")
She's a teacher.
>> print('Student: "Good Morning, teacher!"')
Student: "Good Morning, teacher!"

对于上述问题,除了使用单引号定义包含双引号的字符串,以及使用双引号定义包含单引号的字符串,也可以使用转义符。

转义符是一种特殊的字符,这些字符都是一些不能显示的 ASCII 字符,使用 \ 加上一个可以显示的字符来定义。虽然从肉眼看转义字符包含了两个字符,但在计算机解析以后却只包含一个字符。

在编程语言中,使用 \ 定义转义字符;在 URL 中使用 % 定义转义字符。

>> print('She\'s a teacher.')
She's a teacher.
>> print("Student: \"Good Morning, teacher!\"")
Student: "Good Morning, teacher!"

Python 中的转义符合 C 语言保持一致,常用的转义字符及其含义总结如下:

转义字符 含义
\a 响铃
\b 退格,将当前位置移到前一列
\f 换页,将当前位置移到下页开头
\n 换行,将当前位置移到下一行开头
\r 回车,将当前位置移到本行开头
\t 水平制表符
\v 垂直制表符
\\ 一个反斜杠
\' 一个单引号
\" 一个双引号

现在,我们知道 Python 在遇到 \ 时,会认为这是一个转义符,Python 会将 \ 与紧跟其后的一个字符一起处理。但有的时候,我们却并不希望 Python 这么做,比如:

>> import os
>> path = "C:\users\admin\.jupyter"
SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \uXXXX escape

上述的 \u 经过转义,被认为是 unicode 字符,而 sers 又不属于合法的 Unicode 编码,因此会产生语法错误。

解决办法一,即使用 \\ 来表示一个反斜杠:

>> import os
>> path = "C:\\users\\admin\\.jupyter"
>> os.path.isdir(path)
True

除了使用转义符,更便捷的方式是使用原始字符串,即 Raw String 。使用原始字符串,只需要在字符串的最前面加上一个 r 即可:

>> import os
>> path = r'C:\users\admin\.jupyter'
>> os.path.isdir(path)
True

原始字符串将会抑制所有的转义,打印字符中所有的 \

定义字符串时,如果字符串混合了单引号、双引号、换行符、制表符等特殊字符,如果使用转义字符的方式,将会非常麻烦。这个时候,我们可以借助 Python 的三引号定义字符串:

s = '''Signature: "os.path.isdir(path, /)"

Docstring: 'Return true if the pathname refers to an existing directory.'
Type:      'builtin_function_or_method'

eg: os.path.isdir('C:\\users\\admin\.jupyter')
'''
print(s)

运行结果:

使用三单引或三双引定义多行字符串时,所有的引号、换行符、制表符等特殊字符,都将作为普通字符,并且不受代码缩进规则的限制。

最后,再为大家补充一个 Python 字符串经常被忽略的小特性,即两个相连的字符串会自动组成一个新的字符串:

>> s = "Hello" "Python"
>> s
'HelloPython'
>> s = ("If the implementation is hard to explain, it's a bad idea."
"If the implementation is easy to explain, it may be a good idea."
"Namespaces are one honking great idea -- let's do more of those!")
>> print(s)
If the implementation is hard to explain, it's a bad idea.If the implementation is easy to explain, it may be a good idea.Namespaces are one honking great idea -- let's do more of those!

上述特性经常被用于处理较长的字符串,并且每行代码不能超过特定的字符数限制。

你可能感兴趣的:(Python 字符串 ~ 定义字符串)