【Pandas】pandas Series describe

Pandas2.2 Series

Computations descriptive stats

方法 描述
Series.abs() 用于计算 Series 中每个元素的绝对值
Series.all() 用于检查 Series 中的所有元素是否都为 True 或非零值(对于数值型数据)
Series.any() 用于检查 Series 中是否至少有一个元素为 True 或非零值(对于数值型数据)
Series.autocorr() 用于计算 Series 的自相关系数
Series.between() 用于检查 Series 中的每个元素是否在指定的两个值之间(包括边界值)
Series.clip() 用于将 Series 中的元素限制在指定的上下限之间
Series.corr() 用于计算两个 Series 之间的相关系数
Series.count() 用于计算 Series 中非 NA/null 值的数量
Series.cov(other[, min_periods, ddof]) 用于计算两个 Series 之间的协方差
Series.cummax([axis, skipna]) 用于计算 Series 中元素的累积最大值
Series.cummin([axis, skipna]) 用于计算 Series 中元素的累积最小值
Series.cumprod([axis, skipna]) 用于计算 Series 中元素的累积乘积
Series.cumsum([axis, skipna]) 用于计算 Series 中元素的累积和
Series.describe([percentiles, include, exclude]) 用于生成 Series 对象的描述性统计信息的方法

pandas.Series.describe

pandas.Series.describe() 是 pandas 库中用于生成 Series 对象的描述性统计信息的方法。它会根据数据类型返回不同的统计量,对于数值型数据返回计数、平均值、标准差、最小值、四分位数和最大值;对于对象(如字符串)或布尔值则返回计数、唯一值数量、最常见值及其出现次数。

参数
  • percentiles: 默认为 [.25, .5, .75],可以自定义百分位数。
  • include: 指定要包含的数据类型,默认为数值类型。
  • exclude: 排除指定的数据类型。
示例
数值型数据
import pandas as pd

# 创建一个简单的数值型 Series
data = pd.Series([1, 2, 2, 3, 4, 5, 5, 5, 6, 7])

# 使用 describe 方法
description = data.describe()

print(description)

输出结果:

count    10.000000
mean      4.000000
std       1.943651
min       1.000000
25%       2.250000
50%       4.500000
75%       5.000000
max       7.000000
dtype: float64
字符串型数据
# 创建一个字符串类型的 Series
string_data = pd.Series(['apple', 'banana', 'apple', 'orange', 'banana', 'banana'])

# 使用 describe 方法
string_description = string_data.describe()

print(string_description)

输出结果:

count          6
unique         3
top       banana
freq           3
dtype: object
自定义百分位数
# 创建一个简单的数值型 Series
custom_percentiles_data = pd.Series([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])

# 使用 describe 方法并指定百分位数
custom_description = custom_percentiles_data.describe(percentiles=[.1, .9])

print(custom_description)

输出结果:

count    10.00000
mean      5.50000
std       3.02765
min       1.00000
10%       1.90000
50%       5.50000
90%       9.10000
max      10.00000
dtype: float64

通过这些示例可以看到,describe 方法能够快速提供关于数据集的基本统计信息,帮助我们了解数据的分布情况。

你可能感兴趣的:(Pandas,Series,pandas)