python读取字体文件,转成xml并解析xml数据

# coding=utf-8
from fontTools.ttLib import TTFont

world = TTFont('898a472b.woff')
# 读取响应的映射关系
uni_list = world['cmap'].tables[0].ttFont.getGlyphOrder()  # 'cmap' 表示汉字对应的映射 为unicode编码
print(uni_list) # 按顺序拿到各个字符的unicode编码
unicode_list= [eval(r"u'\u" + uni[3:] + "'") for uni in uni_list[2:]]
unicode_list= [uni.encode('utf-8').decode('unicode-escape') for uni in unicode_list]
print('unicode_list = ', unicode_list)

font = TTFont('898a472b.woff')    # 打开文件
font.saveXML('898a472b.xml')    # 保存为xml文件

# 解析xml文件
from xml.etree import ElementTree as ET

tree = ET.parse('898a472b.xml')
root = tree.getroot()   # 一个Element对象
childs = root.getchildren()

for c in childs:
    for cc in c.getchildren():
        datas = {}
        datas[cc.tag] = cc.attrib
        print(datas, '\n\n\n')

你可能感兴趣的:(爬虫)