pandas(四) Series和DataFrame

上篇博文已经介绍了如何创建DataFrame,这篇博文主要来介绍如何访问DataFrame中的行和列以及增、删的相关操作。

文章目录

  • 访问列
    • 单个标签下标访问
    • 多个标签下标访问
  • 访问行
    • 通过位置切片访问行
    • 通过标签切片访问行
    • 通过布尔数组访问行
    • 通过query方法访问行
    • 通过head和tail方法访问行
  • 使用存取器
    • 使用存取器loc[]和iloc[]
    • 使用存取器at[]和iat[]
  • 增删
    • 行的增加
    • 行的删除
    • 列的增加
    • 列的删除
  • 更改标签

访问列

访问列的时候,不可以通过位置进行访问。

单个标签下标访问

data = {"province":pd.Series(["Henan","Hubei","Hunan","Guangdong","Sichuan"]),
        "year":pd.Series([2000,2020,2030,2040,2050]),
        "city":pd.Series(["Nanyang","Wuhan","Changsha","Zhuhai","Yaan"])
       }
frame = pd.DataFrame(data)
frame.index=["first", "second", "third", "forth", "fifth"]
frame
frame["province"]

Out:
pandas(四) Series和DataFrame_第1张图片
pandas(四) Series和DataFrame_第2张图片

多个标签下标访问

frame[["province","city"]]

Out:
pandas(四) Series和DataFrame_第3张图片

访问行

通过位置切片访问行

不包括结束行数据

frame[0:1]

Out:
在这里插入图片描述

通过标签切片访问行

包括结束行数据

frame["first":"second"]

Out:
pandas(四) Series和DataFrame_第4张图片

通过布尔数组访问行

frame[[True,False,False,False,False]]

Out:
在这里插入图片描述

通过query方法访问行

frame.query("year > 2030")

Out:
pandas(四) Series和DataFrame_第5张图片

frame.query("year > 2030 and year < 2050")

Out:
在这里插入图片描述

通过head和tail方法访问行

head(n) 返回前n行,n默认为5
tail(n) 返回后n行,n默认为5

frame.head(3)

Out:
pandas(四) Series和DataFrame_第6张图片

frame.tail(2)

Out:
pandas(四) Series和DataFrame_第7张图片

使用存取器

使用存取器loc[]和iloc[]

在这里插入图片描述
包括起始和结束数据

#n可以是单个行标签、多行标签数组(或列表)、行标签切片、布尔数组
#m可以是单个列标签、多列标签数组(或列表)、列标签切片、布尔数组
loc[n, m]

#n可以是单个行位置、多行位置数组(或列表)、行位置切片、布尔数组
#m可以是单个列位置、多列位置数组(或列表)、列位置切片、布尔数组
iloc[n, m]
frame.loc["first",["province","year"]]
frame.iloc[0,[0,1]]

Out:
pandas(四) Series和DataFrame_第8张图片

frame.loc["first","province":"year"]
frame.iloc[0,0:1]

Out:
pandas(四) Series和DataFrame_第9张图片

使用存取器at[]和iat[]

存取器at[]和iat[]可以访问数据框中的单个数据。

#n是行标签
#m是列标签
at[n, m]
#idx_n是行位置
#idx_m是列位置
iat[idx_n, idx_m]
frame.at["second","city"]
frame.iat[1,2]

Out:
在这里插入图片描述

增删

在对行进行增删的时候,不会改变原有的数据框,
在对列进行增删的时候,会改变原有的数据框。

行的增加

frame1 = pd.DataFrame({"province":["Shanxi"],"year":[1900],"city":["xian"]})
frame.append(frame1)

Out:
pandas(四) Series和DataFrame_第10张图片

行的删除

frame2 = frame.drop("fifth")
frame2

Out:
pandas(四) Series和DataFrame_第11张图片

列的增加

使用下面这种方法增加列时,只适用于没有index的数据框。否则,新增加的一列数据值为NaN

L = [["Henan","2000","Nanyang"],
     ["Hubei","2020","Wuhan"],
     ["Hunan","2030","Changsha"],
     ["Guangzhou","2040","Zhuhai"],
     ["Sichuan","2050","Yaan"]]
frame3 = pd.DataFrame(L,
                     columns=["province","year","city"])
frame3
frame3["number"] = pd.Series([0,1,2,3,4])
frame3

Out:
pandas(四) Series和DataFrame_第12张图片
pandas(四) Series和DataFrame_第13张图片

列的删除

1.del语句
2.pop方法,删除选择的列,并且返回该列。

del frame3["city"]
frame3

Out:
pandas(四) Series和DataFrame_第14张图片

frame3.pop("province")

Out:
pandas(四) Series和DataFrame_第15张图片

更改标签

frame3.rename(columns={"year":"年份"})

Out:
pandas(四) Series和DataFrame_第16张图片

frame3.rename({0:"one"})

Out:
pandas(四) Series和DataFrame_第17张图片

你可能感兴趣的:(python学习,数据分析)