Pandas的Series的常见属性和方法介绍

目录

一、前言

二、Series的属性

2.1 values:返回Series的值数组

2.2 index:返回Series的索引数组

2.3 dtype:返回Series的数据类型

2.4 size:返回Series的大小

2.5 shape:返回Series的形状

2.6 name:返回Series的名称

三、Series的方法

3.1 head:返回Series的前几个元素,默认为前5个

3.2 tail:返回Series的后几个元素,默认为后5个

3.3 sort_index:根据索引排序

3.4 sort_values:根据值排序

3.5 describe:返回Series的统计信息

3.6 apply:对Series的每个元素应用一个函数

3.7 astype:将Series转换为指定的数据类型

3.8 unique:返回Series的唯一值

3.9 value_counts:返回Series中的每个值的出现次数

3.10 isnull:返回Series中的空值

3.11 fillna:用指定的值填充Series中的空值

3.12 replace:用指定的值替换Series中的特定值

四、总结


一、前言

当谈论数据分析和数据处理的时候,Pandas是一个非常重要的Python库。Pandas让数据的操作变得非常简单,而且它也提供了很多方便的功能,如数据清洗、数据重组、数据整合、数据分组等等。

在Pandas中,Series是其中一个重要的数据结构。它非常类似于一维数组,但是它还包含了标签,这意味着它可以用来处理时间序列数据,而且它也可以用来处理非数值型数据。下面是一些Series的属性和方法,以及它们的使用示例。

二、Series的属性

2.1 values:返回Series的值数组

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
print(s.values)
# 输出:[1 2 3]

2.2 index:返回Series的索引数组

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
print(s.index)
# 输出:Index(['a', 'b', 'c'], dtype='object')

2.3 dtype:返回Series的数据类型

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
print(s.dtype)
# 输出:int64

2.4 size:返回Series的大小

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
print(s.size)
# 输出:3

2.5 shape:返回Series的形状

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
print(s.shape)
# 输出:(3,)

2.6 name:返回Series的名称

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data, name='my_series')
print(s.name)
# 输出:my_series

三、Series的方法

3.1 head:返回Series的前几个元素,默认为前5个

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5}
s = pd.Series(data)
print(s.head())
# 输出:
# a    1
# b    2
# c    3
# d    4
# e    5
# dtype: int64

3.2 tail:返回Series的后几个元素,默认为后5个

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5}
s = pd.Series(data)
print(s.tail())
# 输出:
# a    1
# b    2
# c    3
# d    4
# e    5
# dtype: int64

3.3 sort_index:根据索引排序

import pandas as pd

data = {'b': 2, 'a': 1, 'c': 3}
s = pd.Series(data)
print(s.sort_index())
# 输出:
# a    1
# b    2
# c    3
# dtype: int64

3.4 sort_values:根据值排序

import pandas as pd

data = {'b': 2, 'a': 1, 'c': 3}
s = pd.Series(data)
print(s.sort_values())
# 输出:
# a    1
# b    2
# c    3
# dtype: int64

3.5 describe:返回Series的统计信息

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
print(s.describe())
# 输出:
# count    3.000000
# mean     2.000000
# std      1.000000
# min      1.000000
# 25%      1.500000
# 50%      2.000000
# 75%      2.500000
# max      3.000000
# dtype: float64

3.6 apply:对Series的每个元素应用一个函数

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
print(s.apply(lambda x: x ** 2))
# 输出:
# a    1
# b    4
# c    9
# dtype: int64

3.7 astype:将Series转换为指定的数据类型

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
s = s.astype(float)
print(s.dtype)
# 输出:float64

3.8 unique:返回Series的唯一值

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3, 'd': 2}
s = pd.Series(data)
print(s.unique())
# 输出:[1 2 3]

3.9 value_counts:返回Series中的每个值的出现次数

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3, 'd': 2}
s = pd.Series(data)
print(s.value_counts())
# 输出:
# 2    2
# 1    1
# 3    1
# dtype: int64

3.10 isnull:返回Series中的空值

import pandas as pd
import numpy as np

data = {'a': 1, 'b': np.nan, 'c': 3}
s = pd.Series(data)
print(s.isnull())
# 输出:
# a    False
# b     True
# c    False
# dtype: bool

3.11 fillna:用指定的值填充Series中的空值

import pandas as pd
import numpy as np

data = {'a': 1, 'b': np.nan, 'c': 3}
s = pd.Series(data)
s = s.fillna(0)
print(s)
# 输出:
# a    1.0
# b    0.0
# c    3.0
# dtype: float64

3.12 replace:用指定的值替换Series中的特定值

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
s = s.replace(2, 4)
print(s)
# 输出:
# a    1
# b    4
# c    3
# dtype: int64

四、总结

本文我们学习了Pandas中Series的一些属性和方法。Series是一个非常强大和灵活的数据结构,它让数据分析和数据处理变得非常简单。在实际的数据处理中,我们可以使用Series的各种属性和方法来有效地处理和分析数据。

你可能感兴趣的:(Python学习,pandas,python,数据分析)