组合数据类型
1.集合类型:不可变数据类型(元素唯一性),{,,} set()(空集)
集合操作符:并| 差- 交& 补^ 不同时存在 > >= < <=包含关系
增强操作符:S|=T S^=T S&=T
集合方法:S.add() S.discard() S.remove() S.clear () S.POP()
S.copy() len() x in s x not in s set(x) 类型转变
应用场景:判断元素是否在集合中、判断数据之间的关系、数据去重
2.序列类型: 具有先后关系的一组元素,元素类型可以不同,衍生(字符串,元组,列表)
处理方法:x in s ,x not in x ,st ,s+t ,s[i] ,s[i:j:k] ,len(s),min(s),max(s),s.index(),s.count(x)
字符串
元组 :不能被修改 () tuple() ,()可用可不用 tuple[]索引
列表:创建后可以随意修改 [,] /list()// =同一个列表赋值给不同的名字,但是没有真正的创建 ls[i]=x ls[i:j:k]=lt del ls[i] ls+=ls ls=t
ls.append() clear() copy() insert() pop() remove() reverse()反转
从0开始
接口处使用元组进行数据传递可以达到一定程度上保护数据的目的
3.字典:
映射:索引与数据之间的对应
键值对:{:}
d={“name1”:“sunyukun”,“name2”:“wanghancehn”}
In [2]: d[“name1”]
Out[2]: ‘sunyukun’
JIEBA LIB
精确模式
全模式:所有可能的词扫描出来
搜索引擎模式:
jieba.lcut()
7_文件的使用
打开——操作——关闭
open("",“rt”)
f.read() f.readline() f.readlines()
f.write() f.writelines() f.seek()
自动轨迹绘制
自动化思维:
接口化设计:
二维化思维:
一维数据的格式化:
数据的操作周期:存储——表示——操作
一维数据的表示:列表、集合
一维数据的存储:空格分隔不换行 、逗号分隔、一般采用特殊符号进行分割——数据中不能出现这些符号
txt=open(fname).read()
txt.split()
//f.write(’ '.join(ls))
二维数据表示:
for ……for^
CSV逗号分隔的格式
先行后列
二维数据处理:fo=open(fname) ls=[] for line in fo :ls.append()
wordcloud lib 统计单词出现次数,出现次数多的单词显示更大
配置参数对象
加载文件
输出