Python 文件的使用

  1. 文件的理解

    • 文件是存储在辅助存储器上的数据序列
    • 文件是数据存储的一种形式
    • 文件展现形态:文本文件和二进制文件
      文件文件和二进制文件只是文件的展示方式。本质上,所有文件都是二进制形式存储,形式上,所有文件采用两种方式展示

    文本文件:

    • 由单一特定编码组成的文件,如UTF-8编码
    • 由于存在编码,也被看成是存储着的长字符串
    • 适用于例如:.txt文件、.py文件等

    二进制文件:

    • 直接由比特0和1组成,没有统一字符编码
    • 一般存在二进制0和1的组织结构,即文件格式
    • 适用于例如:.png文件、.avi文件等
  2. 文件的打开


    image.png

    image.png
打开模式 描述
'r' 只读模式,默认值,如果文件不存在,返回FileNotFoundError
'w' 覆盖写模式,文件不存在则创建,存在则完全覆盖
'x' 创建写模式,文件不存在则创建,存在则返回FileExistsError
'a' 追加写模式,文件不存在则创建,存在则在文件最后追加内容
'b' 二进制文件模式
't' 文本文件模式,默认值
'+' 与r/w/x/a一同使用,在原功能基础上增加同时读写功能
  1. 文件的 读取
    .read(size=-1)      读入全部内容,如果给出参数,读入前size长度
    s = f.read(2)          中国
    .readline(size=-1)  读入一行内容,如果给出参数,读入该行前size长度  
    .readlines(hint=-1) 读入文件所有行,以每行为元素形成 列表 如果给出参数,读入前hint行
    s = f.readlines()      ['中国是一个伟大的国家!']
    
    大文件 100GB 不要全部读入
    应该的做法是:读入部分 然后 处理,然后再读入部分 直到处理完毕
    txt = fo.read(2)
    while txt != "":
         #对txt进行处理
         txt = fo.read(2)
    
    读取文本文件时候,readline()比较好,因为文本文件的分行处理,较为常见
    一次读入,分行处理
    for line in fo.readlines():
        print(line)
    
    分行读入,逐行处理
    for line in fo:
        print(line)
    
  2. 文件写入
操作方法 描述
.write(s) 向文件写入一个字符串或字节流
.writelines(lines) 将一个元素全为字符串的列表写入文件 ls = ["中国", "法国", "美国"] f.writelines(ls)
.seek(offset) 改变当前文件操作指针的位置,offset含义如下:0 – 文件开头; 1 – 当前位置; 2 – 文件结尾 f.seek(0) #回到文件开头
  1. seek()


    image.png

    image.png

你可能感兴趣的:(Python 文件的使用)