Python pandas,查改增删和描述分析DataFrame数据

查改增删DataFrame数据

DataFrame作为一种二维数据表结构,能够和数据库一样实现查改增删操作,如添加一行,添加一列,删除一列,修改某一列的值等。

创建一个数据表,并添加数据:

Python pandas,查改增删和描述分析DataFrame数据_第1张图片

修改行数据

Python pandas,查改增删和描述分析DataFrame数据_第2张图片

添加列数据 

Python pandas,查改增删和描述分析DataFrame数据_第3张图片

修改列数据

Python pandas,查改增删和描述分析DataFrame数据_第4张图片

 drop()函数删除某列或某行数据

语法:

DataFrame.drop(labels,axis=0,level=None,inplace=False,errors='raise')

参数:

  • labels:接收string或array。代表删除的行或列的标签。无默认
  • axis:接收0或1,0表示行,1表示列。默认为0
  • levels:接收int或者索引名。代表标签所在级别。默认为None
  • inplace:接收boolean。代表操作是否对原数据生效。默认为False

删除行

Python pandas,查改增删和描述分析DataFrame数据_第5张图片

删出多行

Python pandas,查改增删和描述分析DataFrame数据_第6张图片

删除列

Python pandas,查改增删和描述分析DataFrame数据_第7张图片

Python pandas,查改增删和描述分析DataFrame数据_第8张图片

DataFrame数据的基本查看方式:

Python pandas,查改增删和描述分析DataFrame数据_第9张图片

描述分析DataFrame数据

数值型特征的描述性统计——NumPy中的描述性统计函数

  • 数值型数据的描述性统计主要包括了计算数值型数据的完整情况、最小值、均值、中位数、最大值、四分位数、极差、标准差、方差、协方差和变异系数等。在NumPy库中一些常用的统计学函数如下表所示。
  • pandas库基于NumPy,自然也可以用这些函数对数据框进行描述性统计

函数名称

说明

函数名称

说明

np.min

最小值

np.max

最大值

np.mean

均值

np.ptp

极差

np.median

中位数

np.std

标准差

np.var

方差

np.cov

协方差

 

 

 

 

 

 

 

数值型特征的描述性统计—— pandas描述性统计方法

  • pandas还提供了更加便利的方法来计算均值 ,如detail['amounts'].mean()
  • pandas还提供了一个方法叫作describe,能够一次性得出数据框所有数值型特征的非空值数目、均值、四分位数、标准差。

方法名称

说明

方法名称

说明

min

最小值

max

最大值

mean

均值

ptp

极差

median

中位数

std

标准差

var

方差

cov

协方差

sem

标准误差

mode

众数

skew

样本偏度

kurt

样本峰度

quantile

四分位数

count

非空值数目

describe

描述统计

mad

平均绝对离差

 

 

 

 

 

 

 

 

 

python数据分析实例:

提取数据(已下载好),进行统计 计算小麦1931年、1932年的平均产量 绘制出对应的柱状图

import matplotlib.pyplot as plt
p=plt.figure(figsize=(4,5))   #设置画布
txt=pd.read_csv("C:/Users/ausu/tmp/barley2.csv")
DF_1931=txt[txt["Year"]==1931]  #取出1931年的数据
m_1931=DF_1931["Yield"].mean()
DF_1932=txt[txt["Year"]==1932]  #取出1932年的数据
m_1932=DF_1931["Yield"].mean()
plt.bar(["1931","1932"],[m_1931,m_1932])  #画直方图
plt.show()

结果:

Python pandas,查改增删和描述分析DataFrame数据_第10张图片

你可能感兴趣的:(Python数据分析和可视化,pandas统计分析基础,数据分析)