字符串是一个有序的字符的集合。

一、字符串常量

编写方法:

单引号:'f"uck'

双引号:"f'uck"

三引号:"""fuck""",'''fuck'''

转义字符:"f\tc\nuc\0k"

Raw字符串:r"C:\new\test.spm"

Byte字符串:b'fu\x01uk'


以下是使用字符串常量表达式创建

实例    1.单双引号是一样的

        >>> 'fuck',"fuck"

        ('fuck', 'fuck')

        >>> 'fuc"k',"fuc'k"

        ('fuc"k', "fuc'k")

        >>> 'fuc\'k',"fuc\""

        ("fuc'k", 'fuc"')

    2.用转义序列代表特殊字节,每个转义字符代表一个字节

        >>> s='a\tb\nc'

        >>> print(s)

        a       b

        c

        >>> len(s)

        5

        >>>

        >>> s='a\0b\0c'   #  \0标识null(零字符),将八进制编码转义为一个数字

        >>> s

        'a\x00b\x00c'

        >>> print(s)

        abc

    3.raw字符串抑制转义

        myfile=open('C:\new\text.txt','w')打开一个文件时,会被\n和\t替换,此处就使用字母r在引号前使用,抑制转义。

        myfile=open(r'C:\new\text.txt','w')

    4.字符串块:三重引号,编程多行文本数据非常便捷。        

        >>> s="""fuck

        ... you

        ... you

        ... you

        ... you"""

        >>>

        >>> s

        'fuck\nyou\nyou\nyou\nyou'

        >>> print(s)                            #print的友好格式

        fuck

        you

        you

        you

        you

        >>>


二、字符串应用

    1.基本操作

        >>> len('abcdef')        #计算字符串长度

        6

        >>> 'abc'+'def'            #合并字符串

        'abcdef'

        >>> 'fuck'*4                #重复打印字符串

        'fuckfuckfuckfuck'

        >>>

        >>> s='fuck'                #定义一个变量x去获取一个序列(这里是字符串)的元素,并对每一个元素执行一个或多个语句操作。

        >>> for x in s:print(x)

        ...

        f

        u

        c

        k

        >>> 

    2.索引和分片

    python中字符串是有序的集合,可以通过其位置获得他们的元素,字符串中的字符是通过索引提取的。  

python内置对象---字符串类型_第1张图片

            >>> s='fuck'

            >>> s[0],s[-2]            #正偏移、负偏移,偏移0就是字符串的第一个字符

            ('f', 'c')

            >>> s[1:2]                #分片,使用冒号分隔字符串,python返回一个新的对象,左边的偏移称下边界(包含下边界在内),右边的偏移称上边界(不包含上边界)。

            'u'                      #以上就是提取包含下边界偏移1,直到不包含上边界偏移2的元素

            >>>                          

            >>> s[:1]                #下边界默认值为0

            'f'

            >>> s[1:]                #上边界默认值为字符串长度

            'uck'

            >>> s[:-1]                #下边界默认值为0,下边界是-1(对应元素的最后一项)

            'fuc'

             >>>     

    3.扩展分片

    X[I:J:K]在X对象中,从偏移为I直到偏移为J-1,每隔K元素索引一次

        >>> X='123456789'

        >>> X[0:9:3]            #提取从偏移值0到8,间隔2个元素的元素

        '147'

        >>>

        >>> Y='hello'

        >>> Y[::-1]            #可以使用负数做步进,进行反转

        'olleh'

        >>>

    4.字符串转换

        >>> int('666')+334        #将字符串转换为数字

        1000

        >>> '666'+str(334)        #将数字转换为字符串

        '666334'

        >>> '666'+repr(334)      #将对象转换为字符串

        '666334'

        >>> ord('a')                    #将单个字符转换为ASCII码

        97

        >>> chr(97)                    #将ASCII码转换为对象的字符

        'a'

        >>> q=ord('12')

        Traceback (most recent call last):

          File "", line 1, in

        TypeError: ord() expected a character, but string of length 2 found            #ord()函数期望是一个字符,但是字符串有2个长度了

        >>>

    5.修改字符串

    字符串是一个有序的不可改变的特性,不可变是不可以在原处修改一个字符串。如

        >>> s="fuck"

        >>> s[0]="why"

        Traceback (most recent call last):

          File "", line 1, in

        TypeError: 'str' object does not support item assignment

        >>>

    若想更改字符串内容,可使用合并、分片工具来建立并复制给一个新的字符串对象。

        >>> x='fuck'

        >>> x='fuck'+'u'

        >>> x

        'fucku'

        >>> x=x[:3]+'you'+x[4]

        >>> x

        'fucyouu'

        >>>

    也可以通过replace函数更改字符串内容

        >>> x="fuck"

        >>> x=x.replace('ck','n')

        >>> x

        'fun'

        >>>

    6.字符串方法(函数)

    除了表达式运算符可以处理字符串外,还可以使用字符串方法,方法调用同时进行2次操作。

            a.属性读取,具有abject.attribute格式的表达式。读取abject对象的attribute属性。

            b.函数调用表达式,调用函数代码,传递零活更多用逗号隔开的参数对象,最后返回函数的返回值。

        1).字符串方法实例:修改字符串

        >>> s="fuck"

        >>> s=s.replace('ck','n')

        >>> s

        'fun'


        >>> s='xxxfuckxxxfuck'

        >>> where=s.find('fuck')        #find()方法返回子字符串出现的偏移,未找到返回-1

        >>> where

        3

        >>> s=s[:where]+'ooo'+s[(where+3):]

        >>> s

        'xxxoookxxxfuck'

        >>>

        >>> s='fuck'

        >>> L=list(s)        #将字符串打散为一个序列

        >>> L

        ['f', 'u', 'c', 'k']

        >>> L[0]='g'        #更改序列内容

        >>> L[1]='g'

        >>> L

        ['g', 'g', 'c', 'k']

        >>> s=''.join(L)    #通过设定NULL分隔符,join将列表字符串链接在一起

        >>> s

        'ggck'

        >>>

        >>> '000'.join(['f','u','c','k']) #通过设定000分隔符,将列表连接在一起

        'f000u000c000k'

        >>>

        2)字符串方法实例:文本解析

        分析结构并提取字串,为了提取固定偏移的字串,可以利用分片技术:

        >>> s='aaa bbb ccc'

        >>> L1=s[:3]

        >>> L2=[8:]

        >>> L2=s[8:]                #这组数据出现在固定偏移处,因此可以通过分片从原始字符串分出来,这种技术叫 解析。

        >>> L1

        'aaa'

        >>> L2

        'ccc'

        >>>


        >>> s='aaa bbb ccc'        #此字符串是有空格分隔的

        >>> L1=s.split()                #通过split()方法将一个字符串分隔为一个子字符串列表

        >>> L1

        ['aaa', 'bbb', 'ccc']

        >>>

        >>> s='fuck,u,ha'        #字符串中有,

        >>> L1=s.split(',')            #通过指定分隔符为  ,

        >>> L1

        ['fuck', 'u', 'ha']

        >>>

        >>> s='aaafuckbbbfuckccc'        #字符串重复出现fuck

        >>> L1=s.split('fuck')                #可以指定分隔符为fuck

        >>> L1

        ['aaa', 'bbb', 'ccc']

        >>>

        3)实际应用中常见的字符串方法

        >>> s='this is a test\n'            #定义一个字符串对象

        >>> s

        'this is a test\n'

        >>> s.rstrip()                    #去除结尾的空行

        'this is a test'

        >>> s.upper()                #转换为大写

        'THIS IS A TEST\n'

        >>> s.endswith('\n')        #测试结尾字符是否为\n

        True

        >>> s.startswith('th')        #测试开始字符是否为th

        True

        >>> s.find('is') != -1            #通过find方法测试变量s中是否存在is子串

        True

        >>> 'is' in s                        #可以通过in测试变量s中是否存在is子串

        True

        >>> str='\n'

        >>> s.endswith(str)        #给endswith()方法传入一个变量str来测试变量s是否存在str的值

        True

        >>> s[-len(str):]==str    #通过len函数测试变量s是否存在str的值

        True

        >>>


expandtabs用法

>>> a='name\tglass\tsex\tprogram\nxiaoming\tdgxin\tman\tjishu\nlifeng\tdgxin\tnan\tjishu\nyang\tmme\tnan\tjishu\t'

>>> v=a.expandtabs(20)    #遇到\t 不足20个字符自动补齐至20个字符

>>> print(v)

name                glass               sex                 program

xiaoming          dgxin               man                jishu

lifeng                dgxin               nan                 jishu

yang                 mme                nan                 jishu

>>>

>>> a='1234'

>>> a.isdecimal() #判断是否为数字

True

>>> a.isdigit()        #判断是否为数字

True

>>> a='二'

>>> a.isdecimal()

False

>>> a.isdigit()

False

>>> a='②'

>>> a.isdecimal()

False

>>> a.isdigit()

True

>>> a="1 "

>>> a.isspace()        #判断是否全部为空格

False

>>> a="   "

>>> a.isspace()        

True

>>>

>>> a="this is a test"

>>> a.title()                        #转换为标题格式,首字母都大写

'This Is A Test'

>>>

>>> a='this is a test'

>>> a

'this is a test'

>>> b='_'.join(a)            #指定分隔符来分隔字符串中所有字符

>>> b

't_h_i_s_ _i_s_ _a_ _t_e_s_t'

>>>

>>> a='  test  '

>>> a.rstrip()        #去除右边空格

'  test'

>>> a.lstrip()        #去除左边空格

'test  '

>>> a.strip()         #去除两端空格

'test'

>>>

>>> a="\ttest"

>>> a.strip()                #也可以去除空行和tab

'test'

>>> a="\ntest"

>>> print(a)


test

>>> b=a.strip()

>>> print(b)

test

>>> a='test'

>>> a.lstrip('t')            #去除左边的t

'est'

>>>

>>> a='test'

>>> a.lstrip('98yuit')            #会每个字符(应该是子序列)都去匹配对象test。 

'est'

>>>

>>> a.lstrip('98yuite')                #匹配到了子序列te

'st'

>>>

>>> s="this is a test"

>>> s.partition('s')            #根据s分一次字符串。会保留s

('thi', 's', ' is a test')

>>> s.split('s')                    #根据s分一次或N次字符串(默认全部分隔),会失去s

['thi', ' i', ' a te', 't']

>>> s.split('s',1)

['thi', ' is a test']

>>> s.split('s',2)

['thi', ' i', ' a test']

>>>

>>> a='this is a test'

>>> a.startswith('this')        #以什么开头

True    

>>> a.endswith('st')            #以什么结尾

True

>>>

>>> a='this Is a teST'

>>> a.swapcase()                #大写转小写,小写转大写

'THIS iS A TEst'

>>>