python 判断xml 文件的编码方式

实现方式:
使用 lxml 解析 XML 文件内容
代码如下:

from lxml import etree

def check_file_encoding_by_lxml(file):
    # 设置 parser  如果不设置含有 & 字符的文件报错:
    # XMLSyntaxError: xmlParseEntityRef: no name 。。。
    parser = etree.XMLParser(recover=True)
    tree = etree.parse(file, parser=parser)
    return tree.docinfo.encoding

参考:

How to read an xml file with & sign

Reading XML header encoding

你可能感兴趣的:(python 判断xml 文件的编码方式)