Series数据结构是pandas库中的一种基本数据结构,翻译成列表比较合适,因为他是一维的表格(相对于DataFrame是二维的表格)。这个数据结构形象直观地可以理解成是一张n行2列的简单数据表格,第一列就是索引(index),第二列就是值(values),这也正是Series数据结构的两个重要的属性。我们可以通过data.index和data.values两个属性值来访问和打印这两个属性参数。
我们可以使用pd.Series(list)方法来创建Series数据,list中的数据作为它的值value,而对于index,默认是从0开始的整数序列。如果需要修改index的值,可以对data.index参数进行赋值修改,如果不写或者不修改,默认就是0开始的整数序列。我们也可以在变量创建初始化的时候,在Series构造函数后面跟上index参数进行赋值操作。
特别要注意的是,Series数组的拼写第一个字母是大写的S,不要写成小写的s,不然会报错。
import pandas as pd
s_data1 = pd.Series([1,3,5,7])
print(s_data1)
print("***********************")
s_data1.index = ['u','v','w','x']
print(s_data1)
print("***********************")
data2_list = [3,4,5,6]
s_data2 = pd.Series(data2_list)
print(s_data2)
print("***********************")
s_data3 = pd.Series([1,2,3,4],index=['a','b','c','d'])
print(s_data3)
print("***********************")
print(s_data3.index)
print(s_data3.values)
运行后的输出结果如下:
0 1
1 3
2 5
3 7
dtype: int64
***********************
u 1
v 3
w 5
x 7
dtype: int64
***********************
0 3
1 4
2 5
3 6
dtype: int64
***********************
a 1
b 2
c 3
d 4
dtype: int64
***********************
Index(['a', 'b', 'c', 'd'], dtype='object')
[1 2 3 4]
[Finished in 5.3s]