需要安装xlrd和pandas和openpyxl
import pandas as pd
# 默认读取第一个表单
df = pd.read_excel('demo.xlsx')
data = df.head() # 默认读取前5行数据信息
print("获取到的数据:\n%s" % data)
import pandas as pd
# 指定读取那个表单
df = pd.read_excel('demo.xlsx', sheet_name='Sheet2')
data = df.head() # 默认读取前5行数据信息
print("获取到的数据:\n%s" % data)
import pandas as pd
# 通过表单索引指定读取表单
df = pd.read_excel('demo.xlsx', sheet_name=1)
# 同时采用多个表单
df = pd.read_excel('demo.xlsx', sheet_name=['Sheet1', 'Sheet2'])
df = pd.read_excel('demo.xlsx', sheet_name=[0,1])
data = df.values
print("获取到的数据:\n%s" % data)
1.读取指定的单行,数据会存在列表里面
import pandas as pd
df = pd.read_excel('demo.xlsx')
# 读取第一行数据,注意不含表头
data = df.loc[0].values
print("获取到的数据:\n%s" % data)
2.读取指定的多行,数据会存在嵌套的列表里面
import pandas as pd
df = pd.read_excel('demo.xlsx')
data = df.loc[[1,2]].values
print("获取到的数据:\n%s" % data)
3.读取指定的行列
import pandas as pd
df = pd.read_excel('demo.xlsx')
# 读取第1行第2列数据
data = df.iloc[1, 2]
print("获取到的数据:\n%s" % data)
4.读取指定的多行多列值
import pandas as pd
df = pd.read_excel('demo.xlsx')
# 读取第1\2行第2\3列数据
data = df.loc[[1, 2], ['name', 'data']].values
print("获取到的数据:\n%s" % data)
5.获取所有行的指定列
import pandas as pd
df = pd.read_excel('demo.xlsx')
# 读取第1\2行第2\3列数据
data = df.loc[:, ['name', 'data']].values
print("获取到的数据:\n%s" % data)
6.获取行号并打印输出
import pandas as pd
df = pd.read_excel('demo.xlsx')
print(df.index.values)
7.获取列名
import pandas as pd
df = pd.read_excel('demo.xlsx')
print(df.columns.values)
8.获取指定列的内容
import pandas as pd
df = pd.read_excel('demo.xlsx')
print(df['data'].values)
9.把数据转换为字典类型
import pandas as pd
df = pd.read_excel('demo.xlsx')
myList = []
for i in df.index.values:
rowData = df.loc[i, ['id', 'name', 'data']].to_dict()
print(rowData)
myList.append(rowData)
print(myList)
10.读取全部信息
import pandas as pd
df = pd.read_excel('demo.xlsx')
data = pd.DataFrame(df)
print(data)
11.从demo里读出数据,删除掉不符合要求的行,存入另一个excel
import pandas as pd
df = pd.read_excel('demo.xlsx')
data = pd.DataFrame(df)
for index, row in data.iterrows():
if row[1] != 'haha':
data = data.drop(index, axis=0)
print(data)
data.to_excel('test.xlsx', 'test', index=False)