python pandas模块操作execl

环境要求

需要安装xlrd和pandas和openpyxl

读取数据

import pandas as pd
# 默认读取第一个表单
df = pd.read_excel('demo.xlsx')
data = df.head()    # 默认读取前5行数据信息
print("获取到的数据:\n%s" % data)
import pandas as pd
# 指定读取那个表单
df = pd.read_excel('demo.xlsx', sheet_name='Sheet2')
data = df.head()    # 默认读取前5行数据信息
print("获取到的数据:\n%s" % data)
import pandas as pd
# 通过表单索引指定读取表单
df = pd.read_excel('demo.xlsx', sheet_name=1)
# 同时采用多个表单
df = pd.read_excel('demo.xlsx', sheet_name=['Sheet1', 'Sheet2'])
df = pd.read_excel('demo.xlsx', sheet_name=[0,1])
data = df.values
print("获取到的数据:\n%s" % data)

操作行列

1.读取指定的单行,数据会存在列表里面

import pandas as pd
df = pd.read_excel('demo.xlsx')
# 读取第一行数据,注意不含表头
data = df.loc[0].values
print("获取到的数据:\n%s" % data)

2.读取指定的多行,数据会存在嵌套的列表里面

import pandas as pd
df = pd.read_excel('demo.xlsx')
data = df.loc[[1,2]].values
print("获取到的数据:\n%s" % data)

3.读取指定的行列

import pandas as pd
df = pd.read_excel('demo.xlsx')
# 读取第1行第2列数据
data = df.iloc[1, 2]
print("获取到的数据:\n%s" % data)

4.读取指定的多行多列值

import pandas as pd
df = pd.read_excel('demo.xlsx')
# 读取第1\2行第2\3列数据
data = df.loc[[1, 2], ['name', 'data']].values
print("获取到的数据:\n%s" % data)

5.获取所有行的指定列

import pandas as pd
df = pd.read_excel('demo.xlsx')
# 读取第1\2行第2\3列数据
data = df.loc[:, ['name', 'data']].values
print("获取到的数据:\n%s" % data)

6.获取行号并打印输出

import pandas as pd
df = pd.read_excel('demo.xlsx')
print(df.index.values)

7.获取列名

import pandas as pd
df = pd.read_excel('demo.xlsx')
print(df.columns.values)

8.获取指定列的内容

import pandas as pd
df = pd.read_excel('demo.xlsx')
print(df['data'].values)

9.把数据转换为字典类型

import pandas as pd
df = pd.read_excel('demo.xlsx')
myList = []
for i in df.index.values:
    rowData = df.loc[i, ['id', 'name', 'data']].to_dict()
    print(rowData)
    myList.append(rowData)
print(myList)

10.读取全部信息

import pandas as pd
df = pd.read_excel('demo.xlsx')
data = pd.DataFrame(df)
print(data)

11.从demo里读出数据,删除掉不符合要求的行,存入另一个excel

import pandas as pd

df = pd.read_excel('demo.xlsx')
data = pd.DataFrame(df)

for index, row in data.iterrows():
    if row[1] != 'haha':
        data = data.drop(index, axis=0)
print(data)

data.to_excel('test.xlsx', 'test', index=False)

python pandas模块操作execl_第1张图片
python pandas模块操作execl_第2张图片

你可能感兴趣的:(python)