Pandas是基于NumPy 的一种工具,是Python的一个数据分析包,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。
如果你需要处理一个叫学生成绩的Excel数据,首先需要把Excel的数据引用到pandas中,然后格式化输出所有数据。
import pandas as pd
names=pd.read_excel(‘学生成绩.xlsx’)
data=name.values
print(“学生成绩:\n{0}”.format(data))
如果学成成绩表格中有多个表单,可以根据表单名同时获取多个
names=pd.read_excel(‘学生成绩.xlsx’,sheet_name=[’一年级’,’二年级’,’三年级’])
也可以通过表单的索引来同时获取
names=pd.read_excel(‘学生成绩.xlsx’,sheet_name=[0,1,2])
还可以混合获取多个
names=pd.read_excel(‘学生成绩.xlsx’,sheet_name=[‘一年级’,2])
还可以获取表单的指定的多行
name=pd.read_excel(‘学生成绩.xlsx’)
data=name.ix[0,1,2].values
print(“学生成绩是:\n{0}”.format(data))
还可以获取指定的行指定的列的值
data=name.ix[[0,1],[‘学生姓名’,’语文成绩’,’数学成绩’]].values
还可以获取指定列的所有值
data=name.ix[:,[‘学生姓名’,’语文成绩’,’数学成绩’]].values
还可以获取行号
num=name.index.values
还可以获取列的名字
col=name.columns.values
这些数据还可以放在字典里,我们用for循环实现
name=pd.read_excel(‘学生成绩.xlsx’)
datas=[]
for i in name.index.values:
das=name.ix[i,[‘学生姓名’,’语文成绩’,’数学成绩’]].to_dict()
datas.append(das)
print(‘学生成绩是:{0}’.format(datas))