003_python的str切片,str常用操作方法,for循环,集合,深浅copy

基础数据类型

基础数据类型,有7种类型,存在即合理。

1.int 整数
主要是做运算的 。比如加减乘除,幂,取余 + - * / ** %...

2.bool布尔值
判断真假以及作为条件变量

3.str 字符串
存储少量的数据。‘太白’,'password'... 操作简单,便于传输。

4.list 列表
[1,2,'alex',{name:'zhang'}]存放大量的数据,大量的数据放到列表中便于操作

5.tuple 元组
也叫只读列表。(1,2,'alex',{name:'zhang'}) 一些重要的数据或者不想被更改的数据,使用元组

6.dict 字典
{‘name_list’:'[zhang,lisi]'},存储关系型的数据,查询速度非常快,二分查找。

7.set 集合
交集,并集,差集...

分别举例
int整型


i = 4
#转化成二进制的最小位数
print(i.bit_length())
'''
1   0000 0001
1   0000 0010
3   0000 0011
4   0000 0100
'''

执行输出: 3

数据类型转换:int --> str:n = str(1)
执行输出: 1

int --> bool:n = bool(1)

执行输出: True

str --> booln = bool('')

执行输出: False

空字符串是False,其他都是True

str 字符串索引与切片

先讲索引
字符串是有序的,有索引的,索引从0开始,默认取值是从左至右


s = 'python是最好的语言'
#取第一个字符
s1 = s[0]
#取索引值为2的元素
s2 = s[2]
#最后一个
s3 = s[-1]
print(s1)
print(s2)
print(s3)

执行输出:
p
t

切片
语法:
[起始索引:截止索引:步长]
步长默认为1,表示从头开始取
切片,也就是取连续的多个值

切片原则,顾头不顾尾
什么意思?举例说明


s = 'python是最好的语言'
s1 = s[0:2]
print(s1)

执行输出:
py

全取


s = 'python是最好的语言'
s1 = s[:]
print(s1)

执行输出:
python是最好的语言

切片会产生新的变量,在内存中,原字符串和切片后的字符串,是2个变量s4 = s[:]虽然结果是一样的,但它是2个变量

对字符串操作,都会产生新的变量,除了赋值以外。

取最后5个字符串


s = 'python是最好的语言'
s1 = s[-5:]
print(s1)

执行输出:
最好的语言

步长
默认步长为1
隔一个取1个,步长为2
反向取值,也就是从后向前取,步长为-1

隔1个,取一个

s = 'python是最好的语言'
s1 = s[::2]
print(s1)

执行输出:
pto是好语

反向取5个


s = 'python是最好的语言'
s1 = s[:-5:-1]
print(s1)

执行输出:
言语的好

反向全取


s = 'python是最好的语言'
s1 = s[::-1]
print(s1)

执行输出:
言语的好最是nohtyp

字符串常用操作方法

capitalize() 首字母大写,其他字母小写


s = 'laoshi'
s1 = s.capitalize()
print(s1)

执行输出:
Laoshi

upper() 全部大写、lower() 全部小写


s = 'laoshi'
s1 = s.upper()
s2 = s.lower()
print(s1)
print(s2)

执行输出:
LAOSHI
laoshi

比如验证码判断功能


code = 'aeQu'
your_code = input('请输入验证码:')
if your_code == 'aequ' or your_code == 'Aequ'...

如果不使用字符串内置方法,这需要写16个if,代码质量非常low
下面使用字符串内置方法


code = 'aeQu'
your_code = input('请输入验证码:')
if your_code.upper() == code.upper():
    print('验证码验证成功')

执行输出:

验证成功

代码优化一下


code = 'aeQu'.upper()
your_code = input('请输入验证码:').upper()
if your_code == code:
    print('验证码验证成功')

center() 居中


s = 'laoshi'
#总宽度为30,并且字符串居中,不足30,默认用空格填充
s1 = s.center(30)
#使用*填充
s2 = s.center(30,'*')
print(s1)
print(s2)

执行输出:

执行输出

如果宽度小于字符串,按照原来的字符串显示


s = 'laoshi'
s1 = s.center(3)
print(s1)

执行输出:
laoshi

swapcase() 大小写反转


s = 'LaoShi'
s1 = s.swapcase()
print(s1)

执行输出:
lAOsHI

title() 每个单词的首字母大写(非字母隔开)


s = 'xiao wusir*nanhai21shui'
s1 = s.title()
print(s1)

执行输出:Xiao Wusir*Nanhai21Shui

startswith() 判断以什么为开头,endswith() 以什么为结尾

startswith 的start和end参数是切片如果想取到最后,end参数,不需要指定。


s = 'xiao wusir*nanhai21shui'
s1 = s.startswith('a')
s2 = s.endswith('i')
#切片,取索引访问1~4,再判断是否以i开头
s3 = s.startswith('i',1,4)
#切片,取索引范围5~结束,结束位置参数没给,默认一直取到尾
s4 = s.startswith('w',5)
print(s1)
print(s2)
print(s3)
print(s4)

执行输出:
False
True
True
True

strip() 去除首尾的空格,换行符(\n),tab键(4个空格 用\t表示)


s = '\nlaoshi\t '
s1 = s.strip()
print(s1)

执行输出: laoshi

在input程序中,会经常使用


name = input('请输入用户名:')
if name == 'xiao':
    print('ok')

如果用户输入的,不小心包含了空格,会导致验证失败

下面加入strip()
即使输入有空格,也可以验证通过


name = input('请输入用户名:').strip()
if name == 'xiao':
    print('ok')

执行输出:


输入用户名

后续操作文件读取一行内容的时候,也会带有换行符,虽然你看不见,使用strip(),就可以去除了类似功能的2个的方法

lstrip() 去除左边的空格、换行符、tab键
rstrip() 去除右边的空格、换行符、tab键

strip()还可以去除指定的字符串


s = 'laoshijintianzalill'
#去除字符串l
s1 = s.strip('l')
print(s1)

执行输出:aoshijintianzali

解释一下执行过程 ☻→ string ← ☻

strip()相当于 ☻,就像吃豆游戏一样。

strip()会同时向左右2边,挨个挨个字符寻找字符串l 如果发现了l,就去除,如果没有发现,终止寻找,最后输入结果比如头部的lao 找到了字符串l,开始删除。再继续找下一个字符a,发现不匹配,终止寻找同时,尾部的lill,找到l,开始删除。继续找下一个,找到l,删除。再继续下一个,发现字符串i,不匹配,终止寻找最终输出: aoshijintianzali

find()通过元素找索引

还有一个函数index(),也是同样的功能不同的是,index()找不到,直接报错find()找不到时,会返回-1


s = 'xiaoxx'
s1 = s.find('a')
s2 = s.index('a')
print(s1)
print(s2)

执行输出: 2

count()寻找元素出现的个数,可切片


s = 'xiaomingtongxue'
s1 = s.count('x')
#从第5个索引一直到最后,寻找字符串o出现的次数
s2 = s.count('o',5)
print(s1)
print(s2)

执行输出:
2
1

replace() 替换


s = '我的老家在东北,东北有很多人'
#默认是全文替换
s1 = s.replace('东北','黑龙江')
#替换一次
s2 = s.replace('东北','黑龙江',1)
print(s1)
print(s2)

执行输出:
我的老家在黑龙江,黑龙江有很多人
我的老家在黑龙江,东北有很多人

替换,是从左至右的
如果想要替换中间某部分,需要用到正则表达式

split() 分割,将字符串转换为列表,默认按照空格分隔:


s = 'wo zai tai bei'
s1 = s.split()
print(s1)

执行输出:['wo', 'zai', 'tai', 'bei']

指定分割符


s = 'wo,zai,tai,bei'
s1 = s.split()
print(s1)

执行输出,效果同上

指定字符串a


s = 'awozaiataiabei'
s1 = s.split('a')
print(s1)

执行输出:
['', 'woz', 'i', 't', 'i', 'bei']

注意:如果关键字左边没有字符串,那么结果为[],也就是空字符串

结果不包含关键字,被剔除了

比如面试题:

有下面一段日志,包含了IP地址和时间...需要切割日志

216.244.66.227,[20/Mar/2018:17:03:52 +0800],"Mozilla/5.0"


114.215.45.101,[20/Mar/2018:17:16:30 +0800],"BUbiNG"

106.11.152.107,[20/Mar/2018:17:22:40
+0800],"YisouSpider"

可以用正则表达式,但是比较麻烦,有没有更简单的办法呢?用split(),指定逗号分割,就可以实现

format() 格式化输出这个很牛逼,一定要重点掌握!有三种用法:

第一种用法:


s = '我叫{},今年{},爱好{}'.format('MT',18,'打怪')
print(s)

执行输出:
我叫MT,今年18,爱好打怪

{}表示一个占位符

isalnum() 字符串由字母或数字组成
isalpha() 字符串只能由字母组成
isdigit()字符串只能由数字组成


name = 'jingsan123'
s1 = name.isalnum()
s2 = name.isalpha()
s3 = name.isdigit()
print(s1)
print(s2)
print(s3)

执行输出:
True
False
False

isdigit()比较常用,比如判断用户输入的,是否是数字。

或者将字符串转换为数字类型时,要判断字符串是否由纯数字组成,否则报错。


name = '123a'
if name.isdigit():
    name = int(name)
else:
    print('您输入的含有非数字元素')

执行输出:
您输入的含有非数字元素

len() 查看数据的长度


name = 'zhangsan'
print(len(name))

执行输出: 8

for循环

先来使用while循环,打印每一个字符串


s = 'abcdef'
count = 0
while count < len(s):
    print(s[count])
    count += 1

执行输出:
a
b
c
d
e
f

使用for循环完成上面的功能

s = 'abcdef'
for i in s:
    print(i)

执行程序,效果同上

for循环和while循环的区别在于
for 循环是有限循环
while 循环是无限循环

有些情况,在不需要终止条件的情况下,使用for循环
有终止条件的,使用while循环

for循环会自动停止 使用for循环实现九九乘法表:


for i in range(1, 10):
    for j in range(1, i + 1):
        print('{}x{}={}\t'.format(j, i, i * j), end='')
    print('\n')

执行输出:


1x1=1  
 
1x2=2   2x2=4  
 
1x3=3   2x3=6   3x3=9  
 
1x4=4   2x4=8   3x4=12  4x4=16 
 
1x5=5   2x5=10  3x5=15  4x5=20  5x5=25 
 
1x6=6   2x6=12  3x6=18  4x6=24  5x6=30  6x6=36 
 
1x7=7   2x7=14  3x7=21  4x7=28  5x7=35  6x7=42  7x7=49 
 
1x8=8   2x8=16  3x8=24  4x8=32  5x8=40  6x8=48  7x8=56  8x8=64 
 
1x9=9   2x9=18  3x9=27  4x9=36  5x9=45  6x9=54  7x9=63  8x9=72  9x9=81

作业

有变量name = "aleX leNb" 完成如下操作:

  1. 移除name变量对应的值两边的空格,并输出处理结果
  2. 移除name变量左边的'al'并输出处理结果
  3. 移除name变量右面的'Nb',并输出处理结果
  4. 移除name变量开头的a'与最后的'b',并输出处理结果

name = "aleX leNb"
s1 = name.strip()
s2 = name.lstrip('al')
s3 = name.rstrip('Nb')
s4 = name.lstrip('a').rstrip('b')
print(s1)
print(s2)
print(s3)
print(s4)

  1. 判断 name 变量是否以 "al" 开头,并输出结果
  2. 判断name变量是否以"Nb"结尾,并输出结果

s5 = name.startswith('al')
s6 = name.endswith('Nb')
print(s5)
print(s6)

  1. 将name变量对应的值中的 所有的"l" 替换为 "p",并输出结果
  2. 将name变量对应的值中的第一个'l'替换成'p',并输出结果

s7 = name.replace('l','p')
s8 = name.replace('1','p',1)
print(s7)
print(s8)

  1. 将 name 变量对应的值根据 所有的"l" 分割,并输出结果。
  2. 将name变量对应的值根据第一个'l'分割,并输出结果。

s9 = name.split('l')
s10 = name.split('l',1)
print(s9)
print(s10)

  1. 将 name 变量对应的值变大写,并输出结果
  2. 将 name 变量对应的值变小写,并输出结果

s11 = name.upper()
s12 = name.lower()
print(s11)
print(s12)

  1. 将name变量对应的值首字母'a'大写,并输出结果
  2. 判断name变量对应的值字母'l'出现几次,并输出结果
  3. 如果判断name变量对应的值前四位'l'出现几次,并输出结果

s13 = name.capitalize()
s14 = name.count('l')
s15 = name.count('l',4)
print(s13)
print(s14)
print(s15)

  1. 从name变量对应的值中找到'N'对应的索引(如果找不到则报错),并输出结果
  2. 从name变量对应的值中找到'N'对应的索引(如果找不到则返回-1)输出结果
  3. 从name变量对应的值中找到'X le'对应的索引,并输出结果

s16 = name.index('N')
s17 = name.find('N')
s18 = name.find('X le')
print(s16)
print(s17)
print(s18)

  1. 请输出 name 变量对应的值的第 2 个字符?
  2. 请输出 name 变量对应的值的前 3 个字符?
  3. 请输出 name 变量对应的值的后 2 个字符?
  4. 请输出 name 变量对应的值中 "e" 所在索引位置?

s19 = name[2]
s20 = name[:3]
s21 = name[-2:]
s22 = name.find('e')
s23 = name[:-1:]
print(s19)
print(s20)
print(s21)
print(s22)

23)获取子序列,去掉最后一个字符。如: oldboy 则获取 oldbo。


name = "oldboay"
#使用split对最后一个字符分割,并取第一个元素
s3 = name.split(name[-1])[0]
print(s3)


有字符串s = '123a4b5c'
1)通过对li列表的切片形成新的字符串s1,s1 = '123'
2)通过对li列表的切片形成新的字符串s2,s2 = 'a4b'
3)通过对li列表的切片形成新的字符串s3,s3 = '1345'
4)通过对li列表的切片形成字符串s4,s4 = '2ab'
5)通过对li列表的切片形成字符串s5,s5 = 'c'
6)通过对li列表的切片形成字符串s6,s6 = 'ba2'


s = '123a4b5c'
s1 = s[0:3]
s2 = s[3:6]
s3 = s[0]+s[2]+s[4]+s[6]
s4 = s[1]+s[3]+s[5]
s5 = s[-1]
s6 = s[5]+s[3]+s[1]
print(s1)
print(s2)
print(s3)
print(s4)
print(s5)
print(s6)


使用while和for循环分别打印字符串s='asdfer'中每个元素。


s = 'asdfer'
count = 0
while count < len(s):
    print(s[count])
    count += 1


实现一个整数加法计算器(两个数相加):
如:content = input('请输入内容:') # 如用户输入:5+9或5+ 9或5 + 9,然后进行分割再进行计算。

content = input('请输入内容:')
num = content.split('+')
sum = 0
for i in num:
    sum += int(i)

print(sum)

计算用户输入的内容中有几个整数(以个位数为单位)。
如:content = input('请输入内容:') # 如fhdal234slfh98769fjdla

count = 0
content = input('请输入内容:')
for i in content:
    if i.isdigit():
        count += 1

print(count)

集合

集合是无序的,不重复的数据集合,它里面的元素是可哈希的(不可变类型),但是集合本身是不可哈希(所以集合做不了字典的键)的。以下是集合最重要的两点:

去重,把一个列表变成集合,就自动去重了。

关系测试,测试两组数据之前的交集、差集、并集等关系。

1.集合的创建


set1 = set({1,2,'barry'})
set2 = {1,2,'barry'}
print(set1,set2)

执行输出
{1, 2, 'barry'} {1, 2, 'barry'}

2.集合的增


set1 = {'alex','wusir','ritian','egon','barry'}
set1.add('景女神')
print(set1)
 
#update:迭代着增加
set1.update('A')
print(set1)
set1.update('老师')
print(set1)
set1.update([1,2,3])
print(set1)

执行输出:
{'wusir', 'egon', 'alex', 'ritian', 'barry', '景女神'}
{'wusir', 'A', 'egon', 'alex', 'ritian', 'barry', '景女神'}
{'老', 'wusir', 'A', 'egon', 'alex', 'ritian', 'barry', '师', '景女神'}
{'老', 'wusir', 1, 2, 3, 'A', 'egon', 'alex', 'ritian', 'barry', '师', '景女神'}

3.集合的删


set1 = {'alex','wusir','ritian','egon','barry'}
 
set1.remove('alex') # 删除一个元素
print(set1)
 
set1.pop() # 随机删除一个元素
print(set1)
 
 
set1.clear() # 清空集合
print(set1)
 
del set1 # 删除集合

执行输出
{'ritian', 'wusir', 'egon', 'barry'}
{'wusir', 'egon', 'barry'}
set()

4.集合的其他操作:

交集。(& 或者 intersection)


set1 = {1,2,3,4,5}
set2 = {4,5,6,7,8}
print(set1 & set2)
print(set1.intersection(set2))

执行输出:
{4, 5}
{4, 5}

并集。(| 或者 union)


set1 = {1,2,3,4,5}
set2 = {4,5,6,7,8}
print(set1 | set2)
print(set2.union(set1))

执行输出
{1, 2, 3, 4, 5, 6, 7, 8}
{1, 2, 3, 4, 5, 6, 7, 8}

差集。(- 或者 difference)

set1 = {1,2,3,4,5}
set2 = {4,5,6,7,8}
print(set1 - set2)
print(set1.difference(set2)) 

执行输出
{1, 2, 3}
{1, 2, 3}

反交集。 (^ 或者 symmetric_difference)


set1 = {1,2,3,4,5}
set2 = {4,5,6,7,8}
print(set1 ^ set2)
print(set1.symmetric_difference(set2))

执行输出
{1, 2, 3, 6, 7, 8}
{1, 2, 3, 6, 7, 8}

子集与超集


set1 = {1,2,3}
set2 = {1,2,3,4,5,6}
 
print(set1 < set2)
print(set1.issubset(set2)) # 这两个相同,都是说明set1是set2子集。
 
print(set2 > set1)
print(set2.issuperset(set1)) # 这两个相同,都是说明set2是set1超集。

frozenset不可变集合,让集合变成不可变类型。


s = frozenset('barry')
print(s,type(s))

执行输出

frozenset({'b', 'a', 'r', 'y'})

深浅copy

1.先看赋值运算


l1 = [1,2,3,['barry','alex']]
l2 = l1
 
l1[0] = 111
print(l1)
print(l2)
 
l1[3][0] = 'wusir'
print(l1)
print(l2)

执行输出:
[111, 2, 3, ['barry', 'alex']]
[111, 2, 3, ['barry', 'alex']]
[111, 2, 3, ['wusir', 'alex']]
[111, 2, 3, ['wusir', 'alex']]

对于赋值运算来说,l1与l2指向的是同一个内存地址,所以他们是完全一样的。

2.浅拷贝copy


l1 = [1,2,3,['barry','alex']]
 
l2 = l1.copy()
print(l1,id(l1))
print(l2,id(l2))
l1[1] = 222
print(l1,id(l1))
print(l2,id(l2))
 
l1[3][0] = 'wusir'
print(l1,id(l1[3]))
print(l2,id(l2[3]))

执行输出
[1, 2, 3, ['barry', 'alex']] 2200143751176
[1, 2, 3, ['barry', 'alex']] 2200143750920
[1, 222, 3, ['barry', 'alex']] 2200143751176
[1, 2, 3, ['barry', 'alex']] 2200143750920
[1, 222, 3, ['wusir', 'alex']] 2200143749768
[1, 2, 3, ['wusir', 'alex']] 2200143749768

对于浅copy来说,第一层创建的是新的内存地址,而从第二层开始,指向的都是同一个内存地址,所以,对于第二层以及更深的层数来说,保持一致性。

3.深拷贝deepcopy


import copy
l1 = [1,2,3,['barry','alex']]
l2 = copy.deepcopy(l1)
 
print(l1,id(l1))
print(l2,id(l2))
 
l1[1] = 222
print(l1,id(l1))
print(l2,id(l2))
 
l1[3][0] = 'wusir'
print(l1,id(l1[3]))
print(l2,id(l2[3]))

执行输出
[1, 2, 3, ['barry', 'alex']] 1722671719688
[1, 2, 3, ['barry', 'alex']] 1722671719816
[1, 222, 3, ['barry', 'alex']] 1722671719688
[1, 2, 3, ['barry', 'alex']] 1722671719816
[1, 222, 3, ['wusir', 'alex']] 1722671720456
[1, 2, 3, ['barry', 'alex']] 1722671720200

对于深copy来说,两个是完全独立的,改变任意一个的任何元素(无论多少层),另一个绝对不改变。

你可能感兴趣的:(003_python的str切片,str常用操作方法,for循环,集合,深浅copy)