[Python]组合数据类型:集合,序列,字典

集合

1.用{}表示,元素间用逗号分隔。
{}或set()建立
2.S.add(x)
S.discard(x)
S.remove(x)
S.clear()
S.pop()
S.copy()
len(S)
x in S
x not in S
set(x)

因为集合里无重复元素,可用于数据去重。
集合可以转换成列表。list(s)

序列

序列是一维元素向量,元素类型可以不同,有先后关系,由序号引导。包括字符串,元组和列表类型。

x in s
x not in s
s+t
sn或ns
s[i]
s[i:j]或s[i:j:k]
len(s)
min(s)
max(s)
s.index(x)或s.index(x,i,j):返回序列s从i开始到j位置中第一次出现元素x的位置
s.count(x)

元组

元组是序列模型的一种扩展,一旦创建就不能被修改
用()或tuple()创建,元素间用逗号,分隔
可以使用或不使用小括号

列表

用方括号[]或list()创建,元素间用逗号,分隔
列表中各个元素类型可以不同,无长度限制
ls[i]=x
ls[i:j:k]=lt
del ls[i]
del ls[i:j:k]
ls +=it
ls*=n
ls.append(x) 在列表ls最后增加一个元素
ls.clear(x)
ls.copy()
ls.insert(i,x):在列表ls的第i位置增加元素x
ls.pop(i):将列表ls第i位置元素取出并删除该元素
ls.remove(x)
ls.reverse()

字典

键值对的集合
{}和dict()创建,键值对用冒号:表示
type(x):返回变量x的类型

del d[k]
k in d
d.keys()
d.values()
d.items()
d.get(k,)
d.pop(k,)
d.popitem()
d.clear()
len(d)

实例:jieba库的使用

文本词频统计

你可能感兴趣的:([Python]组合数据类型:集合,序列,字典)