python的自带数据集_盘点 | Python自带的那些数据集

01

Seaborn自带数据集

在学习Pandas透视表的时候,大家应该注意到,我们使用的案例数据"泰坦尼克号"来自于seaborn自带的在线数据库,我们可以通过seaborn提供的函数load_dataset("数据集名称")来获取线上相应的数据,返回给我们的是一个pandas的DataFrame对象。

import seaborn as sns

df = sns.load_dataset('titanic')

df.sample(5)

python的自带数据集_盘点 | Python自带的那些数据集_第1张图片

返回的DataFrame对象非常便于我们更加深入地了解数据,示例代码:

df = sns.load_dataset("tips")

print("

[数据集基本信息]

")

print(df.info())

print("

[数值变量信息]

")

print(df.describe())

print("

[离散变量信息]

")

for name in df.dtypes[(df.dtypes == "category") | (df.dtypes == "object")].index:

print("{} 特征值 : 

你可能感兴趣的:(python的自带数据集)