Python中文本处理read(),readline(),readlines(),linecache()区别与用法

1. read([size])

read([size])方法从文件当前位置起读取size个字节,若无参数size,则表示读取至文件结束为止,它范围为字符串对象
1、读取整个文件,返回的是一个字符串,字符串包括文件中的所有内容。
2、若想要将每一行数据分离,即需要对每一行数据进行操作,此方法无效。
3、若内存不足无法使用此方法。

with open('test.txt', 'r', encoding='UTF-8') as f1:
    results = f1.read()    # 读取数据
    print(results)

2.readline()

从字面意思可以看出,该方法每次读出一行内容,所以,读取时占用内存小,比较适合大文件,该方法返回一个字符串对象。
1、每次读取下一行文件。
2、可将每一行数据分离。
3、主要使用场景是当内存不足时,使用readline()可以每次读取一行数据,只需要很少的内存。

with open('test.txt', 'r', encoding='UTF-8') as f2:
    line = f2.readline()    # 读取第一行
    while line is not None and line != '':
        print(line)
        line = f2.readline()    # 读取下一行

3.readlines()

读取整个文件所有行,保存在一个列表(list)变量中,每行作为一个元素,但读取大文件会比较占内存。
1、一次性读取所有行文件。
2、可将每一行数据分离,从代码中可以看出,若需要对每一行数据进行处理,可以对readlines()求得的结果进行遍历。
3、若内存不足无法使用此方法。

with open('test.txt', 'r', encoding='UTF-8') as f3:
    lines = f3.readlines()    # 接收数据
    for line in lines:     # 遍历数据
        print(line)

4.linecache()

当然,有特殊需求还可以用linecache模块,比如你要输出某个文件的第n行:

# 输出第2行
text = linecache.getline(‘test.txt’,2)
print text,

你可能感兴趣的:(Python)