pandas的两大数据结构之——Series

pandas库的Scries对象用来表示一维数据结构,由两个相互关联的数组组成主数组用来存放数据,主数组的每个元素都有一个与之相关联的标签,这些标签存储在另外一个叫作Index的数组中

pandas的两大数据结构之——Series_第1张图片

1、声明Series对象

调用Series()构造函数,把要存放在Series对象中的数据以数组形式传入。

pandas的两大数据结构之——Series_第2张图片

Series的输出:左侧Index是一列标签,右侧是标签对应的元素
声明Series时,若不指定标签,pandas默认使用从0开始依次递增的数值作为标签。
然而,最好使用有意义的标签,用以区分和识别每个元素,因此,调用构造函数时,可以指定index选项,把存放有标签的数组赋给它,其中标签为字符串类型。

pandas的两大数据结构之——Series_第3张图片

如果想分别查看组成Series对象的两个数组,可像下面这样调用它的两个属性:index(索引)和values(元素)。

 2、选择内部元素

指定或者指定位于索引位置处的标签
   

选择多个元素的方法与NumPy相同

或者,使用元素对应的标签(放到数组中)

pandas的两大数据结构之——Series_第4张图片

 3、为元素赋值

用索引或标签选取元素后进行赋值

pandas的两大数据结构之——Series_第5张图片

 4、用NumPy数组或其他Series对象定义新Series对象

pandas的两大数据结构之——Series_第6张图片

pandas的两大数据结构之——Series_第7张图片

新Series对象中的元素不是原NumPy数组或Series对象元素的副本,而是对它们的引用如改变原有对象元素的值,新Series对象中这些元素也会发生改变。

5、筛选元素

如要获取Series对象中所有大于8的元素,可使用以下代码:

 6、Series对象运算和数学函数

适用于NumPy数组的运算符(+、-、*、/)或其他数学函数,也适用于Series对象

pandas的两大数据结构之——Series_第8张图片

 至于NumPy库的数学函数,必须指定它们的出处np,并把Series实例作为参数传入

pandas的两大数据结构之——Series_第9张图片

7、Series对象的组成元素

Series对象往往包含重复的元素,你很可能想知道里面都包含哪些元素,统计元素重复出现的次数或判断一个元素是否在Series中。
首先,声明一个包含多个重复元素的Series对象。

pandas的两大数据结构之——Series_第10张图片

 unique()函数:帮助弄清楚Series对象包含多少个不同的元素,其返回Series去重后的元素,顺序比较随意。

value_counts()函数:不仅返回各个不同的元素,还计算每个元素在Series中的出现次数。

pandas的两大数据结构之——Series_第11张图片

isin()函数:判断给定的一列元素是否包含在数据结构之中,其返回结果是布尔值,可用于筛选Series或DataFrame列中的数据

pandas的两大数据结构之——Series_第12张图片

你可能感兴趣的:(Python数据结构,python)