Pandas 数据结构 - DataFrame**
DataFrame 是一个表格型的数据结构。Pandas DataFrame 是一个二维的数组结构,类似二维数组。
DataFrame 构造方法如下:
pandas.DataFrame( data, index, columns, dtype, copy)
1.用数组创建
import pandas as pd
data = [['Google',10],['Runoob',12],['Wiki',13]]
df = pd.DataFrame(data,columns=['Site','Age'])
print(df)
import pandas as pd
data = [['Google', 10, 'N'], ['Runoob', 12, 'Y'], ['Wiki', 13, 'N']]
df = pd.DataFrame(data, index=['A1', 'A2', 'A3'], columns=['Site', 'Age', 'AA'])
print(df)
注意行列索引的数量要和数据的数量保持一致
2.以字典的形式创建
import pandas as pd
data = {'Site':['Google', 'Runoob', 'Wiki'], 'Age':[10, 12, 13]}
df = pd.DataFrame(data)
print (df)
import pandas as pd
data = [{'a': 1, 'b': 2},{'a': 5, 'b': 10, 'c': 20}]
df = pd.DataFrame(data)
print (df)
3.查找
3.1返回特定行
import pandas as pd
data = [['Google', 10, 'N'], ['Runoob', 12, 'Y'], ['Wiki', 13, 'N']]
df = pd.DataFrame(data, index=['A1', 'A2', 'A3'], columns=['Site', 'Age', 'AA'])
print(df.loc['A1'])
print(type(df.loc['A1']))
利用loc查找对应的行索引返回对应行,注意如果规定了行索引就不能使用数字索引查找了。如:这里创建时规定了行索引为 index=[‘A1’, ‘A2’, ‘A3’],则只能通过 df.loc[‘A1’] 查找到第一行的信息,如输入df.loc[0]就会报错。
输出的行信息格式为 key-value的Series
3.2 查找表格中的特定值
print(df.loc['A1']['Age'])
print(type(df.loc['A1']['Age']))
还是用loc属性
学到这里发现DataFrame跟二维数组有很大的相似性,不同的是Data Frame可以给行列索引命名。