Pandas库Series基本知识

目录

1. 简介

2. 基础运用

 2.1 创建

 2.1.1数组方式创建 (data数组存放数据,index数组存放标签。)

 2.1.2.字典方式创建

 2.2 索引

2.2.1索引查找修改数据

2.2.2.切片

2.2.3.增删元素

2.2.4.append()函数添加元素

2.3 常用属性

 2.3.1常用属性表

 2.3.2 argmax()函数

 2.3.3 转列表


1. 简介

     Series 与DataFrame是pandas库中的核心数据类型。   Series是一维表格,每个元素带标签且有下标,兼具列表和字典的访问形式。其内部结构包括两个数组,一个放数据,一个放索引。

2. 基础运用

 2.1 创建

   2.1.1数组方式创建 (data数组存放数据,index数组存放标签。)

   2.1.2.字典方式创建

两种创建方式示例:

import pandas as pd
#数组方式创建ser1
ser1= pd.Series(data=[93,99,96,91,99,97],index=["张","杨","李","赵","彭","刘"])
#字典方式创建ser2
ser2=pd.Series({"张":93,"杨":99,"李":96,"赵":91,"彭":99,"刘":97})
print("ser1:\n", ser1)
print("ser2:\n", ser2)

输出结果为:

ser1:
 张    93
杨    99
李    96
赵    91
彭    99
刘    97

ser2:
 张    93
杨    99
李    96
赵    91
彭    99
刘    97

 2.2 索引

2.2.1索引查找修改数据

    Series表格中标签位置序号都可以作为索引进行查找和修改数据

示例:

#1索引查找修改数据
ser1["张"]=100
ser1[1]=100
print("ser1:\n", ser1)

输出结果为:

ser1:
 张    100
杨    100
李     96
赵     91
彭     99
刘     97

2.2.2.切片

   位置序号切片包含左端点不包含右端点。

   索引切片包含左右端点。

示例:

#2.切片
print(ser1["张":"李"])
print("***************")
print(ser1[3:-1])

输出结果为:

张    100
杨    100
李     96
***************
赵    91
彭    99

2.2.3.增删元素

    在Series添加元素可以直接用字典方式在表格末尾添加,删除可用pop()函数指定某元素的标签进行删除。

示例:

#3.增删元素
ser1["王"]=30
ser1.pop("张")
ser1.pop("赵")
print("ser1:\n", ser1)

输出结果为:

ser1:
 杨    100
李     96
彭     99
刘     97
王     30

2.2.4.append()函数添加元素

 使用append()函数添加元素可以在表格末尾增加若干元素(其本质为连接若干个系列对象)。

示例:

#4.append()函数添加元素
ser3=ser1.append(pd.Series(199,index=["yyy"]))
print("ser3:\n", ser1)

输出结果为:

ser3:
 杨    100
李     96
彭     99
刘     97
王     30

2.3 常用属性

  2.3.1常用属性表

median()
求所有数据的中位数
sum()
求所有数据的和
mean()
求所有数据的均值
var()
求所有数据的方差
std()
求所有数据的标准差
max()
求所有数据的最大
min()
求所有数据的最小
count()
计数

示例:

import pandas as pd
ser1= pd.Series(data=[93,99,96,91,99,97],index=["张","杨","李","赵","彭","刘"])

print(ser1.median())  # 求所有数据的中位数

print(ser1.sum()) # 求所有数据的和

print(ser1.mean()) # 求所有数据的均值

print(ser1.var())  # 求所有数据的方差

print(ser1.std()) # 求所有数据的标准差

print(ser1.max()) # 求所有数据的最大

print(ser1.min()) # 求所有数据的最小

print(ser1.count()) # 计数

输出结果:

96.5
575
95.83333333333333
10.566666666666666
3.2506409624359724
99
91
6

另  describe()可以获取以上所有描述性统计信息

print(ser1.describe())
print(ser1.describe()['count'])   #计数

2.3.2 argmax()函数

    argmax()函数输出最大元素的下标

print(ser1.argmax())

  2.3.3 转列表

     只含元素,不含标签。

l1=list(ser1)
print(l1)

你可能感兴趣的:(python数据处理,python,pandas,数据分析)