pandas处理excel表格

在使用过程中,如果出现not moudle XX 这种报错,是因为你没有安装相对应的模块,这时候需要安装一下

导包就统一写一下,使用的代码就不写了哈!!
import pandas as pd

DataFrame、set_index、to_excel

df = pd.DataFrame({'ID':[1,2,3],'Name':['Tim','Nick','Vic']})  # 数据帧
df = df.set_index(['ID'])  # 将ID设置索引,生成新的索引
# print(df)
df.to_excel('C:/Users/lenovo/Desktop/vue和axios/output.xlsx')  # 保存位置
print('Done!')

shape、columns、head、tail

# 需要安装xlrd  pip install xlrd
people = pd.read_excel('C:/Users/lenovo/Desktop/vue和axios/output.xlsx',header=1)  # header参数可用于处理从第几行开始读取,因为pands默认是从第一行读取
# print(people.shape)     # 查询excel有多少行,多少列    结果: (19923,6)  这种形式返回
# print(people.columns)   # 这个单词不会提示,算是一个小bug  查询每列的列名  结果: Index(['ID','Type','Title'],dtype='object')  这种形式返回
print(people.head(3))     # 查询前三条信息
print("=====================")
print(people.tail(2))     # 查询最后两条信息

read_excel

# 当没有列名时,我们可以
people = pd.read_excel('C:/Users/lenovo/Desktop/vue和axios/output.xlsx',header=None)  # header=None  读取时不要设置header
people.columns = ['ID','Name']
people.set_index('ID',inplace=True)  # 直接在dateframe 上改,不要生成新索引

# 当重新打开一个excel读取内容时,一般会自动生成索引列,如果我们知道是哪个列名是索引,就可以指定一下
df = pd.read_excel('C:/Users/lenovo/Desktop/vue和axios/output.xlsx',index_col='ID')

你可能感兴趣的:(数据分析)