python json文件怎么变成docx_使用Python转换word文档到JSON

需求是有一堆这样的word文档,要转换成试题,供web界面使用。

#!/usr/bin/env python3

import docx

import re

import json

file = docx.Document("./2018《廉洁自律准则》知识竞赛试题及答案.docx")

list = []

val = None

for para in file.paragraphs:

v = para.text.split()

for line in v:

items = re.compile("\.").split(line)

if (re.match('\d', line)):

if len(items) > 1:

val = {'no': items[0]}

q = ''.join([str(x) for x in items[1:]])

key = re.search('(?<=(\(|())\s*[A-D]*', q)

if key != None:

val['k'] = key.group(0).lstrip()

val['q'] = re.sub('(?<=(\(|())\s*[A-D]*\s*', ' ', q)

list.append(val)

if (re.match('A', line)):

你可能感兴趣的:(python,json文件怎么变成docx)