python第七周,二维数据的格式化和处理

二维数据的表示:

类表类型可以表示二维数据

[   [424,23423,2342],[131,535,3646]  ]

使用两层for循环可以便利每个元素

外层列表中每个元素可以对应一行,也可以对应一列

一维数据分为列表和集合类型,二维数据只有列表类型

CSV数据存储格式

国际通用的一二维数据存储格式,一般.csv扩展名,每行一个一维数据,采用逗号分隔,无空行

Excel软件可读入输出,一般编辑软件都可以产生,如果某个元素缺失,逗号仍要保留,

二维数据的表头可以作为数据存储,也可以另行存储,

一般索引习惯,ls[row][cokumn],先行后列

二维数据的处理:

从CSV格式的文件中读入数据

fo = open(fname)
ls = []
for line in fo:
    line = line.replace("\n","")
    ls.append(line.split(","))
fo.close()

二维数据的写入处理

ls = [[],[],[]]
f = open (fname,'w')
for item in ls:
    f.write(','.join(item) + '\n')
f.close()

二维数据的逐一处理:

ls = [[],[],[]]
for row in ls:
    for column in row:
        print(ls[row][column])

wordcloud库的使用:

cmd 命令行:pip install wordcloud

wordcloud.WordCloud()代表一个文本对应的词云

wordcloud库常规方法

w=wordcloud.WordCloud()

方法 描述
w.generate(txt)

向对象w中加载文本txt,

>>>w.generate("afwawfawf")

w.to_file(filename)

将词云输出为图像文件,.png或.jpg

>>>w.to_file("outfile.png")

配置对象参数:

参数 描述
width

指定词云对象生成图片的宽度,默认400像素

>>>w = wordcloud.WordCloud(width=600)

height 高度,默认200
min_font_size 指定词云中字体的最小字号,默认4号
max_font_size 最大字号,根据高度自动调节
fount_step 指定词云中字体字号的步进间隔默认为1
fount_path

指定字体文件的路径,默认None

>>>w =wordcloud.WordCloud(font_path="msyh.ttc")

max_words 指定词云最大单词数量,默认20
stop_words 指定词云的排除词列表,
mask

指定词云形状,默认为长方形,需要引用imread()函数

>>>from scipy.misc import imread

>>>mk = imread("pic.png")

>>>w = wordcloud.WordCloud(mask=mk)

background_color 指定词云图片的背景颜色,默认为黑色

 

 

 

你可能感兴趣的:(python第七周,二维数据的格式化和处理)