简单数据可视化

1.stack unstac函数区别

unstack()函数是根据列名进行分类,stack函数是根据index标签进行了分类

2.groupby函数

df[](指输出数据的结果属性名称).groupby([df[属性],df[属性])(指分类的属性,数据的限定定语,可以有多个).mean()(对于数据的计算方式——函数名称)
举例如下:
print(df["评分"].groupby([df["地区"],df["类型"]]).mean())

还有一种表达方式df.groupby(' ')[' '].count()./value_counts()

3.seaborn库

Seaborn(seaborn是python中的一个可视化库,是对matplotlib进行二次封装而成,既然是基于matplotlib,所以seaborn的很多图表接口和参数设置与其很是接近)

导入库 import seaborn as sns

1、sns.stripplot分布散点图,其中有一个jitter参数表示散点图的各散点在回归模型中小幅度的分布;

2、sns.swarmplot分簇散点图;

3、sns.barplot()直方图;

4、sns.poinplot()点图;

5、sns.boxplot()盒图;
————————————————
版权声明:本文为CSDN博主「熊️兔」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_52669357/article/details/122821249

任务:可视化展示泰坦尼克号数据集中不同仓位等级的人生存和死亡人员的分布情况。(用柱状图试试)

import seaborn as sns
sns.set_theme(style="whitegrid")
pclass_sur = df.groupby(['Pclass'])['Survived'].value_counts()
pclass_sur

sns.countplot(x="Pclass", hue="Survived", data=df)
#sns.countplot(y="Pclass", hue="Survived", data=df) x,y出现任一

facet = sns.FacetGrid(text, hue="Survived",aspect=3)#网格
facet.map(sns.kdeplot,'Age',shade= True)#曲线
facet.set(xlim=(0, text['Age'].max()))
facet.add_legend()

你可能感兴趣的:(信息可视化,数据分析,数据挖掘)