23.讲讲对unicode, gbk, utf-8等的理解,python2.x是如何处理编码问题?
unicode编码:为了解决各个国家的语言的存储,引进的unicode码,包括UCS2,UCS4,UTF-8,UTF-7等gbk:和unicode不一样的编码方式,常用的为gbk-2312utf-8:UTF-8使用1-4个字节来存储单个字符,应该是目前最流行的字符集。Linux默认字符集就是UTF-8。既解决了大多数语言的编码方式,又避免了简单字符存储对空间的浪费python2.x需要在文件上方声