Pandas实战100例 | 案例 2: 数据探索 - 查看和理解数据

案例 2: 数据探索 - 查看和理解数据

知识点讲解

在数据分析的早期阶段,对数据进行初步的探索是非常重要的。这包括查看数据的基本信息、统计摘要、以及数据的形状。

示例代码

查看数据的基本信息

# 显示 DataFrame 的基本信息,包括列名、非空值数量、数据类型等
df.info()

获取数据的统计摘要

# 显示数值型列的统计摘要,包括计数、均值、标准差、最小值、四分位数、最大值
df.describe()

查看数据的形状

# 显示 DataFrame 的行数和列数
print(df.shape)

查看列名

# 显示所有列名
print(df.columns)

查看前几行数据

# 显示前五行数据
print(df.head())

查看后几行数据

# 显示后五行数据
print(df.tail())

代码解释:

  1. df.info() 提供了 DataFrame 的概览,包括每列的名称、非空值数量和数据类型。
  2. df.describe() 显示数值型列的统计摘要。
  3. df.shape 返回一个包含行数和列数的元组。
  4. df.columns 显示所有列的名称。
  5. df.head()df.tail() 分别显示 DataFrame 的前五行和后五行数据。

这些操作有助于快速了解数据集的基本情况,是数据分析的重要初步步骤。

你可能感兴趣的:(Pandas实战100例,pandas,python,开发语言)