总结----文本文件的编码格式

常见的编码格式ascii,utf-8

一,ascii

计算机中只有256个ascii字符
一个ascii字符在内存空间中占用一个字节

python2.x默认使用此编码格式

若在2.x中使用中文,需要在python文件的首行加上如下格式,则python解释器便会以utf-8来处理此python文件,

-- coding:utf-8 --

若需要对中文进行遍历或者切片操作,还需要在中文字符前加上u
a1 = u'哈哈,你好'

二,utf-8

计算机中使用1-6个字节来表示一个utf-8字符,涵盖了地球上所有的文件
大多数中文会使用3个字节来表示
utf-8是unicode编码的一种

python3.x默认使用此编码格式,所以使用中文时,不需要再指定utf-8编码格式。

你可能感兴趣的:(python)