绝对详细的xlsx表格转为csv文件过程 : D
# coding = utf-8
import os
import pandas as pd
import csv
from openpyxl import load_workbook
def get_filename(path_filename):
"""
获取文件所在文件夹路径、带拓展文件名、文件名、拓展名
:param path_filename: 带拓展完整路径
:return: 文件所在文件夹路径、带拓展文件名、文件名、拓展名
"""
(filepath, tempfilename) = os.path.split(path_filename)
(filename, extension) = os.path.splitext(tempfilename)
return filepath, tempfilename, filename, extension
def XLSX2CSV(data_filenamepath):
"""
转换 xlsx -> csv
:param data_filenamepath: xlsx 文件路径
:return: csv 文件路径
"""
filepath, tempfilename, filename, extension = get_filename(data_filenamepath)
# 读入xlsx表格,表格内有n个工作簿(worksheets),以下标0~n-1获取
sheet = load_workbook(data_filenamepath).worksheets[0]
# 取出表格内容转为列表形式,各项为包含元素的结构体
rows = list(sheet.rows)
# 用于保存csv列表
sheet_val = []
# 迭代读取所有的行,取出数值
for row in rows:
row_val = [col.value for col in row]
sheet_val.append(row_val)
# 例子中第1行为标签名,2~len为表格内容
print("excle表格转化csv", sheet_val[0])
# csv 文件结构 数据内容、标签
dt = pd.DataFrame(sheet_val[1:len(sheet_val)-1], columns=sheet_val[0])
save_dir = "【你存放csv文件的文件夹路径】"
# 若文件夹未创建,则生成文件夹(多层)
if not os.path.exists(save_dir):
os.makedirs(save_dir)
# 完整csv文件路径
CSVfilepath = os.path.join(save_dir, "【你的csv文件名】" + ".csv")
# 转为csv文件
dt.to_csv(CSVfilepath, index=0)
return CSVfilepath
其中标签名colums也可以自己自定义,例子中xlsx第一行正好是标签名。
colums格式即列表,标签名个数需与数据列数一致。
colums = ['标签名1', '标签名2', ...]