我们经常会遇到这种场景,我们得任务是并发的,但是我们依赖的配置文件确是共用的。
而python对文件的写入却又往往不是原子性的。比如我们常用open函数,是先读取文件再写入文件,在关闭文件。
如果此时有多个文件同时操作同一个文件则是十分危险的。比如现在有如下的场景。
class Work1(Thread):
def __init__(self, path, num):
super().__init__()
self.path = path
self.num = num
def run(self) -> None:
with open(self.path, "r") as work1_r:
num = work1_r.read()
with open(self.path, "w") as work1_f:
num = int(num) + self.num
work1_f.write(str(num))
我们现在有一项计算需求,就是将文件中的数值加上某一个值。
if __name__ == '__main__':
write_path = "log.txt"
with open(write_path, 'w') as f:
f.write('0')
works = []
for i in range(10):
work = Work1(write_path, 5)
work.start()
works.append(work)
for j in works:
j.join()
with open(write_path, "r") as f_r:
print(f_r.read())
我们来看下打印的结果。
我们惊奇的发现,报的错为空字符串,所以int失败。那么为什么会这样呢,正如我们刚才所说,python的open函数并不是原子性的。所以在一个线程读取时,可能另一个线程正在写入。
而我们写入的方式却又是w
也就是覆盖写入,那么此时的一刻可能文件是空的。那么如何解决这种文件写入不安全的情况呢。其实也非常简单。
我们刚才说我们得写入不是原子性的,那么我们写的时候加把锁,其他线程不进行去读就可以了。
from threading import Thread
lock = Lock()
def run(self) -> None:
with lock:
with open(self.path, "r") as work1_r:
num = work1_r.read()
with open(self.path, "w") as work1_f:
num = int(num) + self.num
work1_f.write(str(num))
我们来看下打印结果
50
我们再改变一下测试一下
for i in range(10):
work = Work1(write_path, i)
work.start()
works.append(work)
45
结果也符合我们心中的预期
我们题目中保证并发中写入安全。但是其实我们得多线程不是真正的并发而是时间片轮转,但是这个并不影响我们此次测试的目的。
当然实现文件安写入安全有许多方法。本文中提到的只是一种方法。