Python 专题四 文件基础知识

前面讲述了函数、语句和字符串的基础知识,该篇文章主要讲述文件的基础知识(与其他语言非常类似).

一. 文件的基本操作

文件是指存储在外部介质(如磁盘)上数据的集合.文件的操作流程为:

打开文件(读方式\写方式)->读写文件(read\readline\readlines\write\writelines)->关闭文件

1.打开文件

调用函数open打开文件,其函数格式为:

file_obj=open(filename[, mode[, buffering]]) 返回一个文件对象(file object)

  ― filename文件名(唯一强制参数)

    ・原始字符串 r'c:\temp\test.txt'

    ・转移字符串 'c:\\temp\\test.txt'

  ― mode文件模式

    ・r 读模式

    ・w 写模式

    ・a 追加模式(写在上次后面)

    ・+ 读/写模式(没有文件即创建,可添加到其他模式中使用)

    ・b 二进制模式(可添加到其他模式中使用)

  ― buffering缓冲(可选参数)

    ・参数=0或False 输入输出I/O是无缓冲的,所有读写操作针对硬盘

    ・参数=1或True 输入输出I/O是有缓冲的,内存替代硬盘

    ・参数>1数字代表缓冲区的大小,单位字节.-1或负数代表使用默认缓冲区大小

注意:当处理二进制文件如声音剪辑或图像时使用'b'二进制模式,可以'rb'读取一个二进制文件.

2.关闭文件

应该牢记使用close方法关闭文件,因为Python可能会缓存(出于效率考虑把数据临时存储某处)写入数据,如果程序突然崩溃,数据根本不会被写入文件,为安全起见,在使用完文件后关闭.如果想确保文件被关闭,应该使用try/finally语句,并且在finally子句中调用close方法.如:

 #Open your file
  try:
    #Write data to your file
  finally:
   file.close()

3.读写文件

调用函数write方法向文件中写入数据,其函数格式为:

file_obj.write(string) 参数string会被追加到文件中已存部分后面

file_obj.writelines(sequence_of_strings) 仅传递一个参数,列表[ ] 元组() 字典{}

注意:实用字典时字符串的顺序出现是随机的.

#使用write()写文件 
file_obj=open('test.txt','w') 
str1='hello\n' 
str2='world\n' 
str3='python' 
file_obj.write(str1) 
file_obj.write(str2) 
file_obj.write(str3) 
file_obj.close() 
#使用writelines()写文件 
file_obj=open('test.txt','w') 
str1='hello\n' 
str2='world\n' 
str3='python' 
file_obj.writelines([str1,str2,str3]) 
file_obj.close() 
#输出 本地test.txt文件 
hello 
word 
python 

调用函数read方法读取数据,其函数格式为:var=file_obj.read(),其中read全部读取,返回string;readline读取一行,返回string;readlines读取文件所有行,返回a list of string.例:

#使用read 
print 'Use the read' 
file_obj=open('test.txt','r') 
s=file_obj.read() 
print s 
file_obj.close 
#使用readline 
print 'Use the readline' 
file_obj=open('test.txt','r') 
line1=file_obj.readline() 
line1=line1.rstrip('\n') 
print 'l1 ',line1 
line2=file_obj.readline() 
line2=line2.rstrip('\n') 
print 'l2 ',line2 
line3=file_obj.readline() 
line3=line3.rstrip('\n') 
print 'l3 ',line3 
file_obj.close 
#使用readlines 
print 'Use the readlines' 
file_obj=open('test.txt','r') 
li=file_obj.readlines() 
print li 
file_obj.close 

输出内容如下:

Use the read 
hello 
world 
python 
Use the readline 
l1 hello 
l2 world 
l3 python 
Use the readlines 
['hello\n', 'world\n', 'python'] 

可以发现在使用readline()函数时它返回的结果是'hello\n'字符串,需要使用rstrip去除'\n',否则print输出时总空一行.同时写入文件时使用格式化写入比较方便,如s="xxx%dyyy%s\n"%(28,'csdn').

#格式化写入 
fd=open('format.txt','w') 
head="%-8s%-10s%-10s\n"%('Id','Name','Record') 
fd.write(head) 
item1="%-8d%-10s%-10.2f\n"%(10001,'Eastmount',78.9) 
fd.write(item1) 
item2="%-8d%-10s%-10.2f\n"%(10002,'CSDN',89.1234) 
fd.write(item2) 
fd.close() 
#输出 
Id  Name  Record  
10001 Eastmount 78.90  
10002 CSDN  89.12 

二. 文件与循环

前面介绍了文件的基本操作和使用方法,但是文件操作通常会与循环联系起来,下面介绍while循环和for循环实现文件操作.代码如下:

#使用while循环 
fr=open('test.txt','r') 
str=fr.readline() 
str=str.rstrip('\n') 
while str!="": 
 print str 
 str=fr.readline() 
 str=str.rstrip('\n') 
else: 
 print 'End While' 
fr.close 
#使用for循环 
rfile=open('test.txt','r') 
for s in rfile: 
 s=s.rstrip('\n') 
 print s 
print 'End for' 
rfile.close() 

其中for调用迭代器iterator,迭代器提供一种方法顺序访问一个聚合对象中的各个元素,它相当于通过Iter函数获取对象的迭代器,再通过next函数(该方法调用时不需要任何参数)获取下一个值.for可以遍历iterator_obj包括List\String\Tuple\Dict\File.如:

 s='www.csdn.NET'
  si=iter(s)   #生成迭代器
  print si.next() #调用next依次获取元素,最后迭代器没有返回值时引发StopIteration异常

三. 总结

该篇文章主要讲述了Python文件基础知识,包括文件的打开、读写、关闭操作、使用循环读写文件及迭代器的知识.希望对大家有所帮助,如果有错误或不足之处,还请海涵!

以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,同时也希望多多支持脚本之家!

你可能感兴趣的:(Python 专题四 文件基础知识)