熊猫系列是数据结构中最重要的部分。熊猫系列可以定义为Excel工作表中的一列。我们可以使用SQL数据库,CSV文件和已存储的数据来创建系列。在Pandas中创建系列的方法有很多,但是,我们将以这两种方式进行练习:
——使用ndarray或numpy数组
——使用Python字典
在本熊猫系列教程结束时,我确定您可以在系列上创建并执行任何任务。配套课程请点击这里:
1.什么是Pandas Series?
Pandas Series可以认为是数据结构的基础。它基本上只不过是一维类似数组的结构,可用于处理和操作数据。令它与众不同的是它的索引属性,该属性具有令人难以置信的功能并且易变。配套课程请点击这里:
熊猫系列的参数:
data:这是您希望系列拥有的值。
index:这是与您用于系列的值相关的索引。
dtype:这指定系列中值的类型。
copy:复制输入的数据。
首先,我们导入pandas库。
>>> import pandas as pd
2.如何创建熊猫系列?
导入库后,在第二个代码框中,继续输入以下代码-
>>> dataflair_arr= pd.Series([2,3,-4,6])
这将创建您的系列。
要访问该系列,请对以下代码进行编码-
>>> dataflair_arr
输出-
0 2
1 3
2 -4
3 6
d类型:int64
2.1使用ndarray或numpy数组创建系列
我们还可以使用ndarray或numpy array创建一个序列:
首先,我们将导入numpy库:
>>> import numpy as np
这使我们将库称为np。初始化之后,我们创建一个numpy数组,然后将其变成一系列。
>>> npa = np.array(['d','a','t','a'])
>>> dataflair_ar= pd.Series(npa)
>>> dataflair_ar
第一行创建numpy数组,第二行将其转换为pandas系列。
2.2从python字典创建系列
我们可以从python 字典创建系列。 为此,我们首先需要创建一个字典:
>>> dataflair_dict = { 'Delhi': 12.9, 'Mumbai': 8.4, 'Kolkata': 9.7 }
要将这本词典变成熊猫系列,我们要做的就是:
>>> dataflair_arr3= pd.Series(dataflair_dict)
>>> dataflair_arr3
输出-
Delhi 12.9
Mumbai 8.4
Kolkata 9.7
dtype: float64
dtype:float64
3.如何更改熊猫系列的索引?
为了首先在熊猫系列中建立索引,我们将创建一个列表。配套课程请点击这里:
>>> num=[‘n1’,’n2’,’n3’,’n4’]
这是我们的列表,我们希望它成为值的索引(我们已提供)。因此,我们编写以下代码并运行它:
>>> dataflair_arr2= pd.Series([4,5,-2,2], index=num
>>> dataflair_arr2
4.如何对系列进行数学运算?
如果要将值检查为相应的索引,只需使用以下命令
>>> dataflair_arr2 [ 'n2' ]
这将返回值5。
我们可以使用参数来过滤一系列值。为此,我们来看下面的示例:
>>> dataflair_arr2 [ dataflair_arr2> 2 ]
这是什么意思?这基本上是告诉该系列您想要一个大于2的所有值的列表。配套课程请点击这里:
运行上面给出的代码,我们得到:
n1 4
n2 5
dtype:int64
因为4和5是pandas系列中唯一的值,所以大于2。如果系列中是否存在某个索引,请使用python本机代码中的'in'参数。
>>> ‘n3’ in dataflair_arr2
这将返回“ True”。
>>> dataflair_arr2*5
输出-
n1 20
n2 25
n3 -10
n4 10
d类型:int64
5.证明缺失值
让我们创建一个城市列表,并将其实现为一系列作为索引:
>>> cities=['Delhi', 'Kolkata', 'Mumbai', 'Chennai']
>>> dataflair_arr4=pd.Series(dict,index=cities)
>>> dataflair_arr4
你有注意到吗?钦奈(Chennai)是新添加的,在原始系列中没有任何价值。在此,金奈的值表示为NaN。
Delhi 12.9
Kolkata 9.7
Mumbai 8.4
Chennai NaN
dtype: float64
NaN是熊猫表示缺失值的方式。
6.如何在熊猫中添加两个系列?
是的,可以在熊猫中添加两个系列。
>>> dataflair_arr4 + dataflair_arr3
输出-
Chennai NaN
Delhi 25.8
Kolkata 19.4
Mumbai 16.8
dtype: float64
7.如何访问熊猫系列中的一系列元素?
假设我们要访问arr4的前2个元素。我们所要做的就是在pandas中使用range函数,我们可以借助':'来使用它。
访问前两个元素的代码为:
>>> dataflair_arr4 [ :2 ]
输出-
Delhi 12.9
Kolkata 9.7
dtype: float64
最后两个的代码是:
>>> dataflair_arr4 [ 2 :]
输出-
Mumbai 8.4
Chennai NaN
dtype: float64
因此,该函数基本上以series [x:y]的方式工作,其中x是范围的第一行的数字,y是范围的最后一行的数字。我们试试吧 :
>>> dataflair_arr4 [ 1 :3 ]
输出-
Kolkata 9.7
Mumbai 8.4
dtype: float64
摘要
现在,您可以在熊猫系列上创建并执行任何任务。学习系列概念成为大熊猫的主人是非常重要的。借助熊猫系列,您可以在其他两个数据结构中获得专业知识;数据框和面板。配套课程请点击这里:
更多文章和资料|点击下方文字直达 ↓↓↓
阿里云K8s实战手册
[阿里云CDN排坑指南]CDN
ECS运维指南
DevOps实践手册
Hadoop大数据实战手册
Knative云原生应用开发指南
OSS 运维实战手册