每天15分钟学习python(20)-数据运算及词云图制作

1.求和  sum()

对每一列的数据进行求和

import pandas as pd
data = pd.read_excel('表格名.xlsx')
a = data.sum()
print(a)

注:非数值的列会被连接在一起称为一个字符串。

单独列求和

import pandas as pd
data = pd.read_excel('表格名.xlsx')
a = data['列标签'].sum()
print(a)

2.求平均值  mean()

使用方法和求和是相同的,同类的还有求最大值 max() 求最小值min()

3.获取数值的分布情况,即数据个数,平均值,最值,方差,分位数(25%,50%,75%)

使用describe() 书写方式与求和相同,也可单独列求分布情况。

4.炫酷词云图

每天15分钟学习python(20)-数据运算及词云图制作_第1张图片

 这里需要安装一个库 Wordcloud

pip install Wordcloud

1.以空格作为分隔符,将文本隔为词语

2.同一个词语出现的次数越多,在图片中越大

3.对一些没有意义的词语会被自动过滤掉

4.中文需要导入相应的字体,否则会乱码

import Wordcloud
tex = 'Youth will come to an end,but memory will last forever.'
img_cloud = Wordcloud.WordCloud(background_color='white'
img_cloud.generate(txt)
img_cloud.to_file('词云.png')
print('已生成')

width 修改图片宽度

height 图片高度

min_font_size 修改字体最小字号

max_font_size修改字体最大字号

font_path  修改字体样式文件路径(即要导入的字体路径)

max_words 修改最大单词数量

background_color 修改背景颜色

我们可以自己尝试一下把英文改为中文

4.2我们也可以更改词云图的形状就像上面的那个桃心,我们需要传入mask参数,我们需要先下载好自己想生成的形状的图片,在中文的时候我们还需要jieba库,自动分割中文为词语

import Wordcloud
import jieba
import imageio
txt = """
我们的人生充满了不确定性,我们不断的努力进步,就是想成为自己想成为的人。加油我们的人生,加油朋友。
"""
data = jieba.lcut(txt)      #将文字分割成词语
data = "".join(data)  
im = imageio.imread("心形图片.png")  #读取我们下载好的形状图片
img_cloud =Wordcloud.WordCloud(mask = im "white",width = 900,height = 500,font_path ="字体.TTF")
img_cloud.generate(data)
img_cloud.to_file("词云.png")
print("已生成")

你可能感兴趣的:(初学,大数据)