Python ElementTree 导出 xml 缺少 开头声明&【Pymssql】使用cursor.fetchall()获取执行结果时中文乱码

python 在调用ElementTree的write方法写入xml时,参数里增加 encoding=‘utf-8’ 以及 xml_declaration=True

et_root.write('filename.xml', encoding='utf-8', xml_declaration=True)

中文乱码问题:


Python的pymssql库连接SQL Sever,执行查询语句后,利用cursor.fetchall()方法获取执行结果的时候出现中文乱码,就像这样:

cursor.execute("select * from director where dno = '" + self.no.get()+"'")  
data = cursor.fetchall()

结果:
        汉字部分出现乱码,如图
        (‘1111111111’, 'Áõ¿¡ ', 20, 'ÄÐ ', '»úе2203 ', ‘1’, '1111111111 ')

出现中文乱码的原因可能是由于数据库中存储的字符集与Python解释器所使用的字符集不一致导致的。可以在连接数据库时,通过指定字符集来解决这个问题。

我之前设置的是charset="utf8",但仍然出现乱码,查完资料后改成了charset="cp936",就没有了乱码,具体如下:
        原来连接数据库的语句:

conn = pymssql.connect(host="localhost", port="1433", user=self.user, password=self.password,charset="utf8")

        修改后:

conn = pymssql.connect(host="localhost", port="1433", user=self.user, password=self.password,charset="cp936")

        再运行就会发现已无乱码。

拓展
数据库中存储的字符集是指用于表示和存储数据的一种编码方式。不同的字符集可以支持不同的语言和字符,例如UTF-8字符集可以支持中文、日文、韩文等亚洲语言,而ASCII字符集则只能支持英文字母和数字等字符。

CP936是一种中文字符集编码,也称为GBK编码。它是由中国国家标准委员会制定的一种汉字编码标准,用于将汉字转换为计算机能够识别的二进制代码。CP936编码支持简体中文、繁体中文和日文等多种语言,并且可以表示超过70,000个汉字和50,000个汉字拼音。

在Windows操作系统中,默认使用CP936编码来处理文本文件,因此如果你在Windows下编写或编辑文本文件时,需要确保文件的编码格式为CP936。


原文链接:https://blog.csdn.net/U202113837/article/details/131467728

你可能感兴趣的:(xml,python,sqlserver)