Python中“from docx import Document“报错问题以及怎么提取.docx文档中所有的红色字体

1、Python中"from docx import Document"报错问题

Pycharm中,当我们输入"from docx import Document"报错问题。在Pycharm中,我们若是想要操作word文件,我们就必须要使用"from docx import Document"这个命令,但是当我们使用的时候,却会报错"ModuleNotFoundError: No module named 'Document'"的时候,就是在提醒我们没有这个库。这个时候我们应该怎么操作呢?

我们使用"window"键+"r"

Python中“from docx import Document“报错问题以及怎么提取.docx文档中所有的红色字体_第1张图片

输入"cmd",之后得到下面这个步骤,再使用"pip install python-docx"命令

Python中“from docx import Document“报错问题以及怎么提取.docx文档中所有的红色字体_第2张图片

安装完成之后就能够使用"Document"这个模块了

2、怎么输出"test.docx"文档中的所有红色字体

[题中Document模块中一些定义]

Document: 文档
Paragraph:段落
Run:文字块

[代码展示] 

from docx import Document
from docx.shared import RGBColor

# 使用"\\"是取消"\"的特殊作用,所以python会识别"\\"为"\"
# 这里边要放自己"test.docx"在电脑上的路径
doc = Document('F:\\Desktop\\test.docx')
for p in doc.paragraphs:
    for r in p.runs:
        #  红色的RGB值为(255, 0, 0)。下面这个命令是把字符块的的RGB值显示出来,并与红色的RGB进行匹配
        if r.font.color.rgb == RGBColor(255, 0, 0):
            print(r.text)

 [test.docx里边的内容]Python中“from docx import Document“报错问题以及怎么提取.docx文档中所有的红色字体_第3张图片

 [执行结果]

你可能感兴趣的:(python,python编程,RGB,Document,python操作word文档)