python-day04

ASCII码:只有英文和拉丁字符,一个字符占一个字节,8位

gb2312:只有6700个中文 1980年

gbk10:存了2万多个中文 1995年

gb18030:27000中文 2000年

utf-32:一个字符占4个字节

utf-16:一个字符占2个字节或2个字节以上

utf-8:英文用ASCII码存,一个中文占3个字节

gbk到unicode称为编码decode()  会把byte类型转成字符串

unicode到gbk称为解码encode()  会把数据转换成byte类型

打开文件

  f = open(文件位置,模式)

    'r'  读模式:只能读不能写。

    'w'  写模式:只能写不能读,且会将原先内容清除

    'a'  追加模式:只能写不能读,不会将原先内容清除

  f.close()  关闭文件,操作完文件一点要关闭文件

  f.write()  参数为内容,将内容写入文件

  f.read()  默认读取全文,参数为读取几个字符

  f.redline()  默认读取第一行,光标会移动到第一行最后,所以再用readline()会读取第二行

  f.readlines()  默认读取全文,且返回一个列表

  for i in f:

  print(f)    for内部将f对象做成一个迭代器,在内存中用一行去一行

  f.tell()  查看光标位置,一个中文3个字符,一个英文一个字符

  f.seek()  调整光标位置,参数为位置。

你可能感兴趣的:(python-day04)