python docx tables_python docx 使用总结

本文将总结之前在使用python-docx包处理 word 文档时的一些理解与经验。

安装与引入

安装

pip3 install python-docx

引入

# 基本引用 通过 Document 可以创建一个文档对象

from docx import Document

# 子对象引用,docx.shared 中包含诸如"字号","颜色","行间距"等常用模块

# 非必要,建议只在需要的时候进行引用

from docx.shared import Length, Pt, RGBColor

结构

python-docx将整个文章看做是一个Document对象 官方文档 - Document,其基本结构如下:

每个Document包含许多个代表“段落”的Paragraph对象,存放在document.paragraphs中。

每个Paragraph都有许多个代表"行内元素"的Run对象,存放在paragraph.runs中。

基本结构

在python-docx中,run是最基本的单位,每个run对象内的文本样式都是一致的,也就是说,在从docx文件生成文档对象时,python-docx会根据样式的变化来将文本切分为一个个的Run对象。

你也可以通过它来处理表格 官方文档 - 表格,基本结构如下:

python-docx将文章中所有的表格都存放在

你可能感兴趣的:(python,docx,tables)