利用python进行数据分析之:Series

利用python进行数据分析之:Series

  • Series是一种一维数组对象,由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。
  • Series的字符串表现形式为:索引在左边,值在右边。没有为数组指定索引,会自动创建一个0到N-1的整数型索引。
  • 通过Series的values和index属性获取数组的值和索引对象。
from pandas import Series,DataFrame

obj = Series([4,-2,3,8],index=['d','b','a','c'])

print(obj)

print(obj.values)

print(obj.index)

输出如下所示:

b   -2
a    3
c    8
dtype: int64
[ 4 -2  3  8]
Index(['d', 'b', 'a', 'c'], dtype='object')

通过索引的方式选取Series中的单个或一组值:

print(obj['a'])

print(obj[['a','b','d']])

输出如下所示:

3
a    3
b   -2
d    4
dtype: int64

NumPy数组运算(布尔型数组进行过滤、标量乘法、应用数学函数等)都会保留索引和值之间的链接:

print(obj[obj>0])

输出如下所示:

d    4
a    3
c    8
dtype: int64

可以将Series看成是一个定长的有序字典,是索引值到数据值的一个映射。

print('b' in obj)
print('e' in obj)

输出如下所示:
True
False

也可以通过字典创建Series:

from pandas import Series,DataFrame
dictData = {"苹果":10,"香蕉":5,"葡萄":23}
obj = Series(dictData)
print(obj)

输出如下所示:

苹果    10
香蕉     5
葡萄    23
dtype: int64

Series最重要的一个功能是:算术运算中会自动补齐不同索引的数据。

from pandas import Series,DataFrame
dictData = {"苹果":10,"香蕉":5,"葡萄":23}
obj = Series(dictData)
print(obj)


index = ["葡萄","苹果","香蕉"]
data = [1,2,6]

obj2 = Series(data,index)

obj3 = obj + obj2

print(obj3)

输出如下所示:

苹果    10
香蕉     5
葡萄    23
dtype: int64
苹果    12
葡萄    24
香蕉    11
dtype: int64

Series的索引可以通过赋值的方式修改:

from pandas import Series,DataFrame
dictData = {"苹果":10,"香蕉":5,"葡萄":23}
obj = Series(dictData)
print(obj)

obj.index = ["菠萝","石榴","葡萄"]
print(obj)

输出如下所示:

苹果    10
香蕉     5
葡萄    23
dtype: int64
菠萝    10
石榴     5
葡萄    23

你可能感兴趣的:(日常分享专栏,利用python进行数据分析,Series)