机器学习1--Pandas 数据结构 - DataFrame

Pandas 数据结构 - DataFrame**

DataFrame 是一个表格型的数据结构。Pandas DataFrame 是一个二维的数组结构,类似二维数组。

DataFrame 构造方法如下:
pandas.DataFrame( data, index, columns, dtype, copy)

  • data:一组数据(ndarray、series, map, lists, dict 等类型)。
  • index:索引值,或者可以称为行标签。
  • columns:列标签,默认为 RangeIndex (0, 1, 2, …, n) 。
  • dtype:数据类型。
  • copy:拷贝数据,默认为 False。

1.用数组创建

import pandas as pd
data = [['Google',10],['Runoob',12],['Wiki',13]]
df = pd.DataFrame(data,columns=['Site','Age'])
print(df)

输出结果:
机器学习1--Pandas 数据结构 - DataFrame_第1张图片
设置行列索引

import pandas as pd

data = [['Google', 10, 'N'], ['Runoob', 12, 'Y'], ['Wiki', 13, 'N']]
df = pd.DataFrame(data, index=['A1', 'A2', 'A3'], columns=['Site', 'Age', 'AA'])
print(df)

机器学习1--Pandas 数据结构 - DataFrame_第2张图片
注意行列索引的数量要和数据的数量保持一致
2.以字典的形式创建

import pandas as pd
data = {'Site':['Google', 'Runoob', 'Wiki'], 'Age':[10, 12, 13]}
df = pd.DataFrame(data)
print (df)
import pandas as pd

data = [{'a': 1, 'b': 2},{'a': 5, 'b': 10, 'c': 20}]
df = pd.DataFrame(data)
print (df)

3.查找
3.1返回特定行

import pandas as pd

data = [['Google', 10, 'N'], ['Runoob', 12, 'Y'], ['Wiki', 13, 'N']]
df = pd.DataFrame(data, index=['A1', 'A2', 'A3'], columns=['Site', 'Age', 'AA'])
print(df.loc['A1'])
print(type(df.loc['A1']))

机器学习1--Pandas 数据结构 - DataFrame_第3张图片
利用loc查找对应的行索引返回对应行,注意如果规定了行索引就不能使用数字索引查找了。如:这里创建时规定了行索引为 index=[‘A1’, ‘A2’, ‘A3’],则只能通过 df.loc[‘A1’] 查找到第一行的信息,如输入df.loc[0]就会报错。
输出的行信息格式为 key-value的Series

3.2 查找表格中的特定值

print(df.loc['A1']['Age'])
print(type(df.loc['A1']['Age']))

在这里插入图片描述
还是用loc属性
学到这里发现DataFrame跟二维数组有很大的相似性,不同的是Data Frame可以给行列索引命名。

你可能感兴趣的:(机器学习,机器学习,数据结构,数据挖掘)