一、StringIO和BytesIO
数据读写不一定是文件,也可以在内存中读写
python在内存读写是用StringIO和BytesIO
from io import StringIO
f = open( r'c:\users\ljs\desktop\123.txt', 'r+', encoding = 'utf8', errors = 'ignore')
f = StringIO() #打开内存
f.write('hello') #写进内存
f.write(' ')
f.write('world!')
print(f.getvalue()) #用于获取写入内存的str
#输出:
# C:\Users\ljs\Desktop>python stringio.py
# hello world!
我们也可以用一个str初始化StringIO,然后再读取
f2 = StringIO('hello!\nhi!\ngoodbye!')
while True:
s = f2.readline()
if s == '':
break
print(s.strip()) #去除首尾空格
#输出:
# C:\Users\ljs\Desktop>python stringio.py
# hello world!
# hello!
# hi!
# goodbye!
StringIO只能操作str,想要在内存读写bytes得用BytesIO
from io import BytesIO
b = BytesIO() #打开内存
b.write('中文'.encode('utf8')) #写入的str而是经过utf8编码后的的bytes,因为BytesIO只允许传入bytes
print(b.getvalue())
#输出:
# C:\Users\ljs\Desktop>python stringio.py
# hello world!
# hello!
# hi!
# goodbye!
# b'\xe4\xb8\xad\xe6\x96\x87'
同样也可以用一个bytes初始化BytesIO,然后读取
f2 = BytesIO(b'\xe4\xb8\xad\xe6\x96\x87')
print(f2.read().decode('utf8')) #用decode把bytes转换为str
#输出:
# C:\Users\ljs\Desktop>python stringio.py
# hello world!
# hello!
# hi!
# goodbye!
# b'\xe4\xb8\xad\xe6\x96\x87'
# 中文
小结:
1、StringIO和BytesIO是在内存中操作str和bytes的方法,使得和读写文件具有一致的接口。
2、StringIO有什么用,当你需要对你获取的数据进行操作,但是你不想把数据写到本地硬盘上就可以用StringIO
二、操作文件和目录
我们已经可以用py在文件,内存中读写数据了,如果我们要操作的是文件,目录,py可以实现吗?
答案是可以的,py内置的os模块和os.path模块可以直接调用操作系统提供的接口函数。我们平常的操作也是通过调用这些接口。
- 查看当前目录的绝对路径
>>> import os.path
>>> os.path.abspath('.')
'C:\\Users\\ljs\\Desktop'
>>>
- 在某个目录下创建一个新目录,首先把新目录的完整路径表示出来
>>> os.path.join('C:\\Users\\ljs\\Desktop','abc')
'C:\\Users\\ljs\\Desktop\\abc'
- 然后创建一个目录
>>> os.mkdir('C:\\Users\\ljs\\Desktop\\abc')
#这时我们在桌面就可以看到一个abc文件夹
- 删除abc文件夹
>>> os.rmdir('C:\\Users\\ljs\\Desktop\\abc')
#这时桌面已经没有了abc文件夹
- 把两个路径合成一个时,通过os.path.join(),不要用字符串
拆分路径时,也不要直接拆字符串,要通过os.path.split()函数
>>> os.path.split('C:\\Users\\ljs\\Desktop\\abc')
('C:\\Users\\ljs\\Desktop', 'abc')
- 我们的abc文件在上面已经删掉,所以合并、拆分路径的函数并不要求目录和文件要真实存在,它们只对字符串进行操作。
- 对目录进行重命名,这个就要求这个文件必须存在
>>> os.rename('123.txt','123.py')
#删除文件
>>> os.remove('123.py')
- os模块中没有复制文件夹的函数,原因是复制文件并非由操作系统提供的系统调用。理论上讲,我们通过上一节的读写文件可以完成文件复制,只不过要多写很多代码。
f = open(r'c:\users\ljs\desktop\123.py','r',encoding='utf8',errors='ignore') #打开被复制的文件
aim = f.read()
print('要复制的内容:%s' %aim)
f2 = open(r'c:\users\ljs\desktop\c123.py','w',encoding='utf8',errors='ignore') #打开要复制的文件,不存在就创建
f2.write(aim) #这时候桌面上就有了一个文件c123.py
- 幸运的是shutil模块提供了copyfile()的函数,你还可以在shutil模块中找到很多实用函数,它们可以看做是os模块的补充。
from shutil import copyfile
#把从c123.py的内容复制到cc123.py,cc123原先是不存在的
copyfile(r'c:\users\ljs\desktop\c123.py',r'c:\users\ljs\desktop\cc123.py')
- 最后看看如何利用Python的特性来过滤文件。比如我们要列出当前目录下的所有目录,只需要一行代码:
import os
list1 = [x for x in os.listdir('.') if os.path.isdir(x)]
print(list1)
#输出:
# ['api', 'java学习笔记', 'shop', 'spring学习笔记', 'ssh', '__pycache__', '新建文件夹', '杂', '电子', '软件工程']
#列出所有.py文件
list2 = [x for x in os.listdir('.') if os.path.isfile(x) and os.path.splitext(x)[1] == '.py']
print(list2)
#输出:
# ['123.py', 'c123.py', 'cc123.py', 'copy.py', 'dir.py', 'field.py', 'hello.py', 'is_odd.py', 'student.py', '__stots__.py']
练习:
编写一个程序,能在当前目录以及当前目录的所有子目录下查找文件名包含指定字符串的文件,并打印出相对路径。
from datetime import datetime
import os
pwd = os.path.abspath('.')
print(' Size Last Modified Name')
print('------------------------------------------------')
for f in os.listdir(pwd):
fsize = os.path.getsize(f)
mtime = datetime.fromtimestamp(os.path.getmtime(f)).strftime('%Y-%m-%d %H:%M')
flag = '/' if os.path.isdir(f) else ''
print('%10d %s %s%s' % (fsize, mtime, f, flag))
# 输出:
# C:\Users\ljs\Desktop\新建文件夹\io编程>python do_dir.py
# Size Last Modified Name
# ------------------------------------------------
# 1211 2018-03-14 00:06 copy.py
# 1379 2018-03-13 23:36 dir.py
# 9 2018-03-14 18:42 do_dir
# 415 2018-03-14 18:45 do_dir.py
# 2796 2018-03-13 16:53 io.py
# 854 2018-03-13 18:09 io2.py
# 1798 2018-03-13 23:05 stringio.py
# C:\Users\ljs\Desktop\新建文件夹\io编程>
最后推荐一首歌,Bomb Digga Woo