本文介绍了 Python 中的 docx 模块,该模块可以用来创建、修改和读取 Microsoft Word 文档(.docx 文件)。本文包括以下内容:
docx 模块是 Python 中用来处理 Microsoft Word 文档的第三方库。通过该模块,可以方便地创建、修改和读取 .docx 文档。docx 模块可以用于自动化生成文档、批量处理文档、将文档内容导入数据库等应用场景。
docx 模块的主要特点包括:
安装 docx 模块可以使用 pip 工具,具体命令为:
pip install python-docx
安装成功后,在 Python 中运行以下代码检查是否能够导入 docx 模块:
import docx
要创建一个新的 Word 文档,可以按照以下步骤:
下面是一个使用 docx 模块创建 Word 文档的示例代码:
import docx
# 新建文档对象
doc = docx.Document()
# 添加标题
doc.add_heading('Python 学习笔记', level=0)
# 添加章节标题
doc.add_heading('第一章:Python 基础', level=1)
# 添加段落
doc.add_paragraph('Python 是一门高级编程语言,易学易用。')
doc.add_paragraph('其语法简单明了,适合用于 Web 开发、数据分析等领域。')
# 添加表格
table = doc.add_table(rows=3, cols=3)
for i in range(3):
row = table.rows[i]
for j in range(3):
row.cells[j].text = f'({i+1}, {j+1})'
# 保存文档
doc.save('Sample.docx')
上面代码中,我们新建了一个 Document 类实例,并添加了标题、章节标题、段落和表格等内容。最后调用 save() 方法将文档保存到本地磁盘上。
运行上面的代码后,将会生成一个名为 Sample.docx 的 Word 文档,其中包含了标题、章节标题、段落和表格等内容。
要读取一个已有的 Word 文档,可以按照以下步骤:
下面是一个使用 docx 模块读取 Word 文档的示例代码:
import docx
# 打开文档
doc = docx.Document('Sample.docx')
# 打印文档中所有段落的文本内容
for para in doc.paragraphs:
print(para.text)
# 打印文档中所有表格的内容
for table in doc.tables:
for i, row in enumerate(table.rows):
row_text = [cell.text for cell in row.cells]
print(f'Table {i+1}: {"|".join(row_text)}')
# 关闭文档
doc.close()
上面代码中,我们使用 Document() 函数打开本地的 Sample.docx 文件,并访问了文档中的所有段落和表格。最后调用 close() 方法关闭了文档。
运行上面的代码后,将会输出文档中所有段落和表格的内容。
要修改一个已有的 Word 文档,可以使用 docx 模块提供的函数来修改文档中的元素,例如修改段落和表格中的文本、添加新元素、删除元素等。最后调用 save() 方法保存修改后的文档。
下面是一个使用 docx 模块修改 Word 文档的示例代码:
import docx
# 打开文档
doc = docx.Document('Sample.docx')
# 修改文档中的内容
doc.paragraphs[1].text = 'Python 是一门非常强大的编程语言。'
table = doc.tables[1]
table.add_row().cells[0].text = '(4, 1)'
# 保存修改后的文档
doc.save('Sample_new.docx')
# 关闭文档
doc.close()
上面代码中,我们打开了本地的 Sample.docx 文件,并将第二个段落的内容修改为“Python 是一门非常强大的编程语言。”,并向第二个表格中添加了一行。
最后,我们调用 save() 方法将修改后的文档保存到本地的 Sample_new.docx 文件中。
docx 模块是 Python 中用来处理 Microsoft Word 文档的第三方库,具有简单易用、功能强大、兼容性好等特点。本文介绍了使用 docx 模块创建、读取、修改和保存 Word 文档的相关内容。