1. Pandas的数据结构

Pandas有两种数据结构:Series和DataFrame。

首先要引入Pandas库和Numpy库

form pandas import Series,DataFrame
import pandas as pd
import numpy as np

1.1 Series

Series是一种类似于一维数组的对象,它是由一级数据以及一组与之相关的数据标签(即索引)组成。

1.1.1 创建Series的三种方法

1.通过list来创建Series

s1 = pd.Series([1,2,3,4])

2.通过numpy array来创建Series

s2=pd.Series(np.arange(10))

3.通过字典来创建Series

s3 = pd.Series({'1':1,"2":2,'3':3})

通常,我们希望创建的Series带有一个可以对各个数据点进行标记的索引:

s4= Series([4,5,8,1],index = ['D','A','C','F'])

1.1.2 Series的索引

Series的数据表现形式为:索引在左边,值在右边。

由于我们没有为数据指定索引,Pandas会自动生成一个0到N-1(N为数据的长度)的整数索引。可以通过Series的values和index属性来获取其数组表示形式的索引和对象

In [1]:
obj = Series([1,2,3,4,5])   ​
obj

Out[1]:
0    1
1    2
2    3
3    4
4    5
dtype: int64

可以通过索引的方式选取Series中的单个或一组值:

obj2['A']​
obj2[['C','F']]

1.1.3 Series的常用方法和属性

未完待续……

你可能感兴趣的:(1. Pandas的数据结构)