sklearn教程:titanic泰坦尼克号数据集

文章目录

        • 数据集介绍
        • 导入数据集
          • info()显示数据类型和是否缺失
          • describe()数据描述性统计
        • 数据可视化-探索性分析EDA
          • 填充缺失值之后的可视化
          • 类别变量的相关关系

数据集介绍

这个数据集是基于泰坦尼克号中乘客逃生的,泰坦尼克号出事故,船上的乘客的一些信息被记录在这张表中。现在要根据这个数据预测这个人能否获救。共有891个样本。

  • 数据集属性
属性 含义
PassengerId 乘客ID
Survived 获救情况(1为获救,0为未获救)
Pclass 船舱等级(1/2/3等舱位)
Name 乘客姓名

你可能感兴趣的:(python机器学习和数据挖掘,sklearn,人工智能,python,pandas,ydata,数据分析,机器学习)