python数据分析、挖掘初学(二):pandas中Series数据对象的生成和访问

pandas 是基于NumPy 的一种工具,数据统计包,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。

这里主要讲述pandas的基础数据结构,Series数据对象和DataFrame数据对象的生成和访问。

一、Series数据对象的生成
Series的生成方法   s=pd.Series(data,index=index)
Series的数据类型   list,ndarray,字典、常量

1.list数据类型创建Series对象:

import numpy as np
import pandas as pd

#list类型
s = pd.Series([1,56,13,-46,47],index=["a","b","c","d","e"])
print (s)

我们可以看到结果:

a     1
b    56
c    13
d   -46
e    47
dtype: int64

当我们输入的数据类型既有字符串又含有数字型时,dtype的返回值为object.当然我们的dtype和numpy中一样是可以指定的,直接在index后面添加dtype=" "即可。

2.ndarray 数据类型创建Series对象

import numpy as np
import pandas as pd
s=pd.Series(np.random.randn(5),index=["a","b","c","d","e"])
print (s)

显示如下:

a   -0.020002
b   -0.418771
c   -1.126058
d   -0.680494
e   -0.292003
dtype: float64

当我们不指定index索引的值时,Series会自动创建一个从0开始的检索值。

3.以字典数据类型创建Series对象


s=pd.Series({'a':0,'b':1,'c':2})
print(s)

注:当我们的字典中的数据和index的值有相同的数据时,Series会根据它在字典中对应的内容进行显示。

3.以常量数据类型创建Series对象

import numpy as np
import pandas as pd
s=pd.Series(5,index=["a","b","c","d","e"])
print(s)

当数值长度没有到达检索长度,则数值会重复循环出现,来适应索引的长度。

 

二、Series数据对象的访问

Series访问方法:s.values,s.index,索引访问,切片访问。

s.values 和s.index方法这不再介绍。

索引访问:我们可以使用s['a',……]来访问想要访问的索引值对应的数据值

切片访问:及s[……:……]来访问选定切片索引的数据值

 

你可能感兴趣的:(python基础学习)