一般来说,我们打开一个文件需要做的操作三步
打开 --> 操作 --> 关闭
open() 方法:
Python open() 方法用于打开一个文件,并返回文件对象,在对文件进行处理过程都需要使用到这个函数,如果该文件无法被打开,会抛出 OSError。
注意:
使用 open() 方法一定要保证关闭文件对象,即调用 close() 方法。
open() 函数常用形式是接收两个参数:文件名(file)和模式(mode)。
mode参数常用的有
模式 | 描述 |
---|---|
t | 文本模式 (默认)。 |
x | 写模式,新建一个文件,如果该文件已存在则会报错。 |
b | 二进制模式。 |
+ | 打开一个文件进行更新(可读可写)。 |
r | 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。 |
rb | 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。 |
r+ | 打开一个文件用于读写。文件指针将会放在文件的开头。 |
rb+ | 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。 |
w | 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。 |
wb | 以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。 |
w+ | 打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。 |
wb+ | 以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。 |
a | 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 |
ab | 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 |
a+ | 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。 |
ab+ | 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。 |
默认为文本模式,如果要以二进制模式打开,加上 b 。
简单示例:
f = open('/tmp/passwd','r+') ##以r+模式打开/tmp/passwd
print(f.tell()) #查看当前指针所在的位置
f.write('python')
print(f.tell())
content = f.read()
print(content)
f.close()
执行结果:
0
6
:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
......... ##此处省略
可以看到写入的python并没有显示出来
是因为指针位置的问题
解决方法:
将指针移动到指定位置即可(在下面会提到)
文件读取操作
f = open('/tmp/passwd','rb+')
print(f.read()) ##直接打印出来
print(f.readline()) ##打印第一行
print(f.readlines())
#readlines():读取文件内容,返回一个列表,列表的元素分别为文件行内容
==我们的shell中有查看文件前几行的命令:head -c 4 /etc/passwd==
print(f.read(4)) #读取文件前4个字符
print(f.readline(),end='')
print(f.readlines(),end='')
print([line.strip() for line in f.readlines()])
f.close()
默认情况下读取文件的所有内容,小文件可以直接用read读取,如果 是大文件(文件大小>内存大小),不能通过read一次性读取所有内容
文件的写入操作
f.write('hello')
f.writelines(['a','b']) #将列表里的每个元素写入文件
print(f.tell())
print(f.read(3)) #从指针位置起读取3个字符
print(f.tell())
移动文件指针
简单示例:
f.seek(-1,2)
print(f.read())
print(f.tell())
f.close()
执行结果:
b'\n'
2330
seek方法 -移动指针
seek的第一个参数是偏移量:>0,表示向右移动,<0表示向左移动
seek的第二个参数是:
0:移动指针到文件开头
1:不移动指针
2:移动指针到末尾
非纯文本文件读取
f1 = open('hello.png',mode='rb')
content = f1.read()
f1.close()
f2 = open('111.jpg',mode='wb')
f2.write(content)
f2.close()
小练习:
题目:
生成100个MAC地址并写入文件中,MAC地址前6位(16进制)为01-AF-3B
01-AF-3B
01-AF-3B-xx
01-AF-3B-xx-xx
01-AF-3B-xx-xx-xx
import string
import random
def create_mac():
mac = '01-AF-3B'
for i in range(3):
n = random.sample(string.hexdigits,2)
sn = '-' + ''.join(n).upper()
mac += sn
return mac
with open('mac.txt','w+') as f:
for i in range(100):
mac = create_mac()
print(mac)
f.write(mac+'\n')
上下文管理器
打开文件的方式(二)
with open('/tmp/passwd') as f:
#使用这种文件的打开方式更加简单了,同时可以避免忘记关闭文件的情况
print(f.read())
同时打开两个文件
with open('/tmp/passwd') as f1,\
open('/tmp/passwd1','w+') as f2:
#将第一个文件的内容写入第二个文件中
f2.write(f1.read())
#移动指针到文件最开始
f2.seek(0)
#读取文件内容
print(f2.read())
练习:
题目:
创建文件data.txt,文件共100000行,每行存放一个1~100之间的整数
import random
f = open('data.txt','w+')
for i in range(100000):
f.write(str(random.randint(1,100)) + '\n')
f.seek(0)
print(f.read())
f.close()
import os
from os.path import exists,splitext,join
1.返回操作系统类型值:posix,表示linux操作系统,如果是nt,是windows操作系统
print(os.name)
2.操作系统的详细信息
info = os.uname()
print(info)
print(info.sysname)
print(info.nodename)
3.系统环境变量
print(os.environ)
4.通过key值获取环境变量对应的value值
print(os.environ.get(‘PATH’))
5.判断是否为绝对路径
print(os.path.isabs(’/tmp/westos’))
print(os.path.isabs(‘data.txt’))
6.生成绝对路径
print(os.path.abspath(‘hello.png’))
print(os.path.join(’/home/kiosk’,‘hello.png’))
print(os.path.join(os.path.abspath(’.’),‘hello.jpg’))
7.获取目录名或文件名
filename = ‘/home/kiosk/PycharmProjects/20190316/day07/hello.png’
print(os.path.basename(filename))
print(os.path.dirname(filename))
8.创建目录/删除目录
os.mkdir(‘img’)
os.makedirs(‘img/jpg/png’)
os.rmdir(‘img’)
9.创建文件/删除文件
os.mknod(‘aa.txt’)
os.remove(‘aa.txt’)
10.文件重命名
os.rename(‘data.txt’,‘data1.txt’)
11.判断文件或者目录是否存在
print(os.path.exists(‘data1.txt’))
12.分离后缀名和文件名
print(os.path.splitext(‘hello.png’))
13.将目录名和文件名分离
print(os.path.split(’/tmp/hello/python.jpg’))
题目一:
- 在当前目录新建目录img, 里面包含100个文件, 100个文件名各不相同(X4G5.png)
- 将当前img目录所有以.png结尾的后缀名改为.jpg.
import os
from os.path import exists,splitext,join
import random
import string
def gen_code(len=4):
#随机生成4位验证码
li = random.sample(string.ascii_letters + string.digits,len)
#将列表元素拼接为字符串
return ''.join(li)
def create_files():
#随机生成100个验证码
li = [gen_code() for i in range(100)]
os.mkdir('img')
for name in li:
os.mknod('img/' + name + '.png')
# create_files()
def modify_suffix(dirname,old_suffix,new_suffix):
"""
:param dirname: 要操作的目录
:param old_suffix: 之前的后缀名
:param new_suffix: 新的后缀名
:return:
"""
if os.path.exists(dirname):
#找出所有以old_suffix结尾的文件名
pngfile = filter(lambda filename:filename.endswith(old_suffix),os.listdir(dirname))
#将文件名和后缀分开
basefiles = [os.path.splitext(filename)[0] for filename in pngfile]
#文件重命名
for filename in basefiles:
oldname = os.path.join(dirname,filename+old_suffix)
newname = os.path.join(dirname,filename+new_suffix)
os.rename(oldname,newname)
print('%s重命名为%s成功' %(oldname,newname))
else:
print('%s不存在,无法操作...' %dirname)
modify_suffix('dir','.jpg','.png')
题目二:
- 生成一个大文件ips.txt,要求1200行, 每行随机为172.25.254.0/24段的ip;
- 读取ips.txt文件统计这个文件中ip出现频率排前10的ip;
import random
def create_ip_file(filename):
ip =['172.25.254.' + str(i) for i in range(0,255)]
print(random.sample(ip,1))
# print(ip)
with open(filename,'a+') as f:
for count in range(1200):
f.write(random.sample(ip,1)[0] + '\n')
# create_ip_file('ips.txt')
def sorted_by_ip(filename,count=10):
ips_dict = dict()
with open(filename) as f:
for ip in f:
if ip in ips_dict:
ips_dict[ip] += 1
else:
ips_dict[ip] = 1
sorted_ip = sorted(ips_dict.items(),key=lambda x:x[1],reverse=True)[:count]
return sorted_ip
print(sorted_by_ip('ips.txt'))