Unicode(统一码、万国码、单一码)是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。
字符串或串(String)是由数字、字母、下划线组成的一串字符。一般记为 s=“a1a2···an”(n>=0)。它是编程语言中表示文本的数据类型。在程序设计中,字符串(string)为符号或数值的一个连续序列,如符号串(一串字符)或二进制数字串(一串二进制数字)。
普通字符串(在python中字符串默认使用unicode编码)
str = '你好'
unicode字符串,声明字符串用unicode编码
str = u'你好'
运行下面的代码:
str = '你好'
uni = str.encode('unicode-escape').decode()
print(uni)
输出:
\u4f60\u597d
方法一:运行下面的代码:
str = '\u4f60\u597d'
print(str)
输出:
你好
方法二:直接在python shell窗口输入:
'\u4f60\u597d'
输出:
'你好'
一段神秘的unicode……
'\u6211\u559c\u6b22\u4f60'
unicode编码:https://www.cnblogs.com/IT-LearnHall/p/9426367.html
unicode和中文的转换:https://blog.csdn.net/qq_45290890/article/details/101672879
关于\u和\\u的区别:https://blog.csdn.net/Yellow_python/article/details/84579250