.xls和.xlsx使用的两种不同的模块:
python操作excel主要用到xlrd和xlwt这两个库,即xlrd是读excel,xlwt是写excel的库。
data = xlrd.open_workbook(filename)#文件名以及路径,如果路径或者文件名有中文给前面加一个 r
获取book(excel文件)中一个工作表
table = data.sheets()[0] #通过索引顺序获取
table = data.sheet_by_index(sheet_indx) #通过索引顺序获取
table = data.sheet_by_name(sheet_name) #通过名称获取
names = data.sheet_names() #返回book中所有工作表的名字
data.sheet_loaded(sheet_name or indx) # 检查某个sheet是否导入完毕
nrows = table.nrows # 获取该sheet中的行数,注:这里table.nrows后面不带()
table.row(rowx) # 返回由该行中所有的单元格对象组成的列表,这与tabel.raw()方法并没有区别
table.row_slice(rowx) # 返回由该行中所有的单元格对象组成的列表
table.row_types(rowx, start_colx=0, end_colx=None)# 返回由该行中所有单元格的数据类型组成的列表;
table.row_values(rowx, start_colx=0, end_colx=None) # 返回由该行中所有单元格的数据组成的列表
table.row_len(rowx) # 返回该行的有效单元格长度,即这一行有多少个数据
ncols = table.ncols # 获取列表的有效列数
table.col(colx, start_rowx=0, end_rowx=None) # 返回由该列中所有的单元格对象组成的列表
table.col_slice(colx, start_rowx=0, end_rowx=None) # 返回由该列中所有的单元格对象组成的列表
table.col_types(colx, start_rowx=0, end_rowx=None) # 返回由该列中所有单元格的数据类型组成的列表
table.col_values(colx, start_rowx=0, end_rowx=None) # 返回由该列中所有单元格的数据组成的列表
table.cell(rowx,colx) # 返回单元格对象
table.cell_type(rowx,colx) # 返回对应位置单元格中的数据类型
table.cell_value(rowx,colx) # 返回对应位置单元格中的数据
from openpyxl import Workbook
wb = Workbook() # 实例化
ws = wb.active # 激活 worksheet
from openpyxl import load_workbook
wb = load_workbook('data.xlsx')
# 方式一:数据可以直接分配到单元格中(可以输入公式)
ws['A1'] = 42
# 方式二:可以附加行,从第一列开始附加(从最下方空白处,最左开始)(可以输入多行)
ws.append([1, 2, 3])
# 方式三:Python 类型会被自动转换
ws['A3'] = datetime.datetime.now().strftime("%Y-%m-%d")
# 方式一:插入到最后(default)
ws1 = wb.create_sheet("Mysheet")
# 方式二:插入到最开始的位置
ws2 = wb.create_sheet("Mysheet", 0)
# sheet 名称可以作为 key 进行索引
ws3 = wb["new sheet"]
ws4 = wb.get_sheet_by_name("sheet1")
# 显示所有表名
wb.sheetnames
['Sheet2', 'New Title', 'Sheet1']
# 遍历所有表
for sheet in wb:
print(sheet.title)
# 方法一
cell = ws['A4']
# 方法二:row 行;column 列
cell = ws.cell(row=4, column=2, value=10)
wb.save('文件名称.xlsx')
# -*- coding: utf-8 -*-
from openpyxl import load_workbook
from openpyxl.utils import get_column_letter
class ExcelUtils:
def __init__(self, filename):
self.filename = filename
self.workbook = load_workbook(filename)
def read_cell(self, sheet, cell, encoding='utf-8'):
value = sheet[cell].value
if isinstance(value, str):
return value.encode(encoding).decode(encoding)
return value
def write_cell(self, sheet, cell, value):
sheet[cell].value = value
def save(self):
self.workbook.save(self.filename)
def create_sheet(self, sheet_name):
self.workbook.create_sheet(title=sheet_name)
def delete_sheet(self, sheet_name):
sheet = self.workbook[sheet_name]
self.workbook.remove(sheet)
def get_sheet_names(self):
return self.workbook.sheetnames
def get_row_count(self, sheet):
return sheet.max_row
def get_column_count(self, sheet):
return sheet.max_column
def get_column_letter(self, column_number):
return get_column_letter(column_number)
def get_sheet_by_index(self, index):
sheet_names = self.get_sheet_names()
if index < len(sheet_names):
sheet_name = sheet_names[index]
sheet = self.workbook[sheet_name]
return sheet
else:
return None
if __name__ == '__main__':
# 创建一个 ExcelUtils 实例
excel = ExcelUtils('data.xlsx')
# 获取工作表对象
sheet = excel.get_sheet_by_index(0) # 获取第一个工作表
if sheet:
# 读取单元格的值
value = excel.read_cell(sheet, 'A1',encoding='utf-8')
print(value)
else:
print("Sheet not found.")
要使用 Python 操作 Word 模板文件,可以使用 python-docx 库
from docx import Document
from docxtpl import DocxTemplate
class WordUtils:
def __init__(self, filename):
self.filename = filename
self.document = Document(filename)
self.template = DocxTemplate(filename)
def read_paragraph(self, paragraph_index):
paragraphs = self.document.paragraphs
if 0 <= paragraph_index < len(paragraphs):
return paragraphs[paragraph_index].text
else:
return None
def write_paragraph(self, paragraph_index, text):
paragraphs = self.document.paragraphs
if 0 <= paragraph_index < len(paragraphs):
paragraphs[paragraph_index].text = text
def read_table_cell(self, table_index, row_index, column_index):
tables = self.document.tables
if 0 <= table_index < len(tables):
table = tables[table_index]
if 0 <= row_index < len(table.rows) and 0 <= column_index < len(table.columns):
cell = table.cell(row_index, column_index)
return cell.text
return None
def write_table_cell(self, table_index, row_index, column_index, text):
tables = self.document.tables
if 0 <= table_index < len(tables):
table = tables[table_index]
if 0 <= row_index < len(table.rows) and 0 <= column_index < len(table.columns):
cell = table.cell(row_index, column_index)
cell.text = text
def render_template(self, context):
self.template.render(context)
def save(self, output_filename):
self.template.save(output_filename)
def save_document(self, output_filename):
self.document.save(output_filename)
if __name__ == '__main__':
# 创建一个 WordUtils 实例
word = WordUtils('template.docx')
# 读取段落内容
paragraph_text = word.read_paragraph(0)
print(paragraph_text)
# 写入段落内容
word.write_paragraph(0, 'Hello, world!')
# 读取表格单元格内容
cell_text = word.read_table_cell(0, 1, 1)
print(cell_text)
# 写入表格单元格内容
word.write_table_cell(0, 1, 1, 'New value')
# 渲染模板
context = {
'name': 'John Doe',
'age': 30,
'occupation': 'Engineer'
}
word.render_template(context)
# 保存渲染后的文档
word.save('output.docx')
# 保存原始文档(未渲染)
word.save_document('original.docx')
在示例中,我们使用 WordUtils 类加载 Word 模板文件并渲染模板。render_template 方法接受一个字典作为参数,其中包含模板中的变量和对应的值。然后,我们调用 save 方法将渲染后的文档保存到指定的输出文件中。根据需要修改模板文件的名称和输出文件的名称。
请确保已安装 docxtpl 库,可以使用 pip install docxtpl 命令进行安装。注意,docxtpl 是对 python-docx 的扩展,因此还需要确保 python-docx 库也已安装。