pandas 处理excel文件数据

备注:本文记录的是第一次用此模块,只是记录而已,没有什么学习价值。

场景描述

今天从数据库中以CSV格式导出文件,发现以0开头的“基金代码”丢失了,是因为此列“单元格格式为“常规”分类,需要对丢失的0进行补全(基金代码为6位长度)


image.png

CSV文件本身就是文本格式的,需要先将此字段修改成“文本”类型,再保存为excle格式。因对excle本身操作不太熟练,想到学了python就要学以致用。
于是想到用pandas来进行处理。

需要用的模块

  • pandas ,这个模块因本人才接触,先不解释了,等有时间了再研究下。
  • 用pandas读取Excel文件时,会提示
    ImportError: No module named 'xlrd'
    该错误是因为Excel需要单独的模块支持,所以需要安装xlrd模块。
  • 数据保存到Excel文件中,使用
    df.to_csv('D:/PythonWorkSpace/TestData/test.xlsx')
    总是报错 Module Not Found Error: No module named 'openpyxl'
pip install pandas
pip install xlrd
pip install openpyxl

代码实现

import pandas as pd

data = pd.read_excel('净值100条数据.xlsx')
#   df是一个dataform对象,类似一个二维表格
df = pd.DataFrame(data)
df['基金代码'] = df['基金代码'].astype(str)
df['基金代码'] = df['基金代码'].apply(lambda x:x.zfill(6) if len(x)<6 else x)
df.to_excel("净值100条数据.xlsx", sheet_name="01", index=False, header=True)

处理结果

image.png

你可能感兴趣的:(pandas 处理excel文件数据)