python pandas学习--操作excel

1、基础1

import pandas as pd

def readexcel(file):
    # df = pd.read_excel(file)  # 默认获取第一个sheet页
    df = pd.read_excel(file,sheet_name=1)#通过sheet页索引取数据
    # df = pd.read_excel(file,sheet_name='t')#通过sheet页name取数据
    data = df.head()  #获取表格前5行 ,不包括表头
    row_value = df.iloc[0].values
    row_values = df.iloc[[0,1]].values
    rows_value = df.iloc[:].values
    row_len = df.index.values
    sample_values = df.sample(2).values
    col_vales = df['路径'].values
    print('获取当前页的总行数:',row_len)
    print('获取第一行的数据(不计算表头):',row_value)
    print('获取第1,2行,的数据(不计算表头):',row_values)
    print('获取所有行,的数据(不计算表头):',rows_value)
    print('获取前5行的数据(不计算表头):',data)
    print('随机获取2行的数据(不计算表头):',sample_values )
    print('获取路径这行的数据(不计算表头):',col_vales)
if __name__ == '__main__':
    file = r'test.xls'
    readexcel(file)

2、基础2 每一行数据变成字典

import pandas as pd

def readexcel(file):
    df = pd.read_excel(file,sheet_name=1)#通过sheet页索引取数据
    for i in df.index.values:
        data1 = df.loc[i].to_dict()
        print(data1)

if __name__ == '__main__':
    file = r'test.xls'
    readexcel(file)

效果如下:
python pandas学习--操作excel_第1张图片
3、基础3 获取所有数据

import pandas as pd
import numpy as np

def readexcel(file):
    df = pd.read_excel(file,sheet_name=1)#通过sheet页索引取数据
    train_data = np.array(df)
    train_list = train_data.tolist()
    print('获取所有的行(不包括表头):\n',train_list)

if __name__ == '__main__':
    file = r'test.xls'
    readexcel(file)

4、基础4 读取某个单元格内容

import pandas as pd
def readexcel(file):
    df = pd.read_excel(file,sheet_name=1)#通过sheet页索引取数据
    data = df.iloc[0,1]#'读取第一行第二列的数据'
    print(data)
if __name__ == '__main__':
    file = r'test.xls'
    readexcel(file)

5、基础5 处理不是从第一列开始有数据的情况

import pandas as pd

def readexcel(file):
    df = pd.read_excel(file,sheet_name=2,header=11, usecols='G:H')#通过sheet页索引取数据
    data = df.head()
    print('读取第一行第二列的数据:\n',data)
if __name__ == '__main__':
    file = r'test.xls'
    readexcel(file)

如图表格:
python pandas学习--操作excel_第2张图片
5、基础5–分类统计

import pandas as pd

def readexcel(file):
    # df = pd.read_excel(file,sheet_name=2,header=11, usecols='G:H')#通过sheet页索引取数据
    df = pd.read_excel(file,sheet_name=1)#通过sheet页索引取数据
    data = df.groupby(['jpg大小']).count()
    print(data)

if __name__ == '__main__':
    file = r'test.xls'
    readexcel(file)

6、基础6 常用函数

import pandas as pd

def readexcel(file):
    # df = pd.read_excel(file,sheet_name=2,header=11, usecols='G:H')#通过sheet页索引取数据
    df = pd.read_excel(file,sheet_name=1)#通过sheet页索引取数据
    max_ = df.max()[2]
    min_ = df.min()[2]
    avg = df.mean()
    print('获取最大值:\n',max_)
    print('获取最小值:\n',min_)
    print('avg:\n',avg)

if __name__ == '__main__':
    file = r'test.xls'
    readexcel(file)

你可能感兴趣的:(学习,总结,python)