python实现中文和unicode转换

什么是Unicode?

Unicode(统一码、万国码、单一码)是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。

什么是字符串?

字符串或串(String)是由数字、字母、下划线组成的一串字符。一般记为 s=“a1a2···an”(n>=0)。它是编程语言中表示文本的数据类型。在程序设计中,字符串(string)为符号或数值的一个连续序列,如符号串(一串字符)或二进制数字串(一串二进制数字)。

普通字符串(在python中字符串默认使用unicode编码)

str = '你好'

unicode字符串,声明字符串用unicode编码

str = u'你好'

将中文转换为unicode

运行下面的代码:

str = '你好'
uni = str.encode('unicode-escape').decode()
print(uni)

输出:

\u4f60\u597d

将unicode转换为中文

方法一:运行下面的代码:

str = '\u4f60\u597d'
print(str)

输出:

你好

方法二:直接在python shell窗口输入:

'\u4f60\u597d'

输出:

'你好'

一段神秘的unicode……

'\u6211\u559c\u6b22\u4f60'

参考资料

unicode编码:https://www.cnblogs.com/IT-LearnHall/p/9426367.html
unicode和中文的转换:https://blog.csdn.net/qq_45290890/article/details/101672879
关于\u和\\u的区别:https://blog.csdn.net/Yellow_python/article/details/84579250

你可能感兴趣的:(#,Python)