python数据处理篇

数据读取保存

read_excel 读取文件

  1. import panas as pd 先调用pandas
  2. df=pd.read_csv/excel(io,sheet_name,header,names) 数据读取
  • io 路径, sheet_name 可以是str, int, list 或 None类型, 默认值是0。
    • str类型 是直接指定工作表的名称
      • sheet_name=‘Test1’: 得到的是名为’Test1’的sheet的DataFrame类型的数据
    • int类型 是指定从0开始的工作表的索引, 所以sheelt_name默认值是0,即第一个工作表。
      • 例 sheet_name=0: 得到的是第1个sheet的DataFrame类型的数据,sheet_name=2: 得到的是第3个sheet
    • list类型 是多个索引或工作表名构成的list,指定多个工作表。
      • sheet_name=[0, 3, ‘Test5’]: 得到的是第1个,第4个和名为Test5 的工作表作为DataFrame
    • None类型, 访问所有的工作表
  • header 标题行 表头默认header=0 默认第一行 没有标题行使用header=None
  • names自定义表头,传递数组,一般配合header=None

ExcelFile

ExcelFile 与 read_excel 类似 但有差别 在使用多个sheet的时候 ExcelFile方便一些

  • excel=pd.ExcelFile(path)
  • excel.sheetnames 查看所有sheet名称
    df=excel.parse(sheet_name) 读取指定sheet表格

ExcelWriter

使用ExcelWriter()可以向同一个excel的不同sheet中写入对应的表格数据

  • writer=pd.ExcelWriter(path,mode=‘w’,engine) 创建一个writer对象
    path 路径
    mode 写入模式 可以是w和a 覆盖和追加
    engine 一般使用xlswriter和openpyxl两种engine即可,openpyxl更强大些,支持追加模式。
  • 存入多个sheet
    df1.to_excel(writer,sheet_name=sheet1)
    df2.to_excel(writer,sheet_name=sheet2)
    writer.save()
  • 可以配合with as
    with ExcelWriter(path) as writer:
    df1.to_excel(writer,sheet_name=sheet1)
    df2.to_excel(writer,sheet_name=sheet2)
  • 往已存在内容追加
    with ExcelWriter(“path_to_file.xlsx”,mode=‘a’,engine=‘openpyxl’) as writer:
    df.to_excel(writer,sheet_name=‘Sheet3’)

to_excel 文件保存

  1. df.to_excel(io,sheet_name,inex) 数据保存
  • io 路径,sheet_name 工作表名称
  • index 索引 默认true

你可能感兴趣的:(python,excel,开发语言)