python中的pickle模块提供了一个简单的持久化功能。可以将对象以文件的形式存放在磁盘上。
我觉得,pickle就像是Java中 “将类可序列化” 一样,只有将类implement Serializable,该类的对象才能够正确的存储在磁盘上。
参考为什么要序列化
不序列化时,对象存储所存在的问题:
比如:我要将对象写入一个磁盘文件而后再将其读出来会有什么问题吗?别急,其中一个最大的问题就是对象引用!
举个例子来说:假如我有两个类,分别是A和B,B类中含有一个指向A类对象的引用,现在我们对两个类进行实例化{ A a = new A(); B b = new B(); }。
这时在内存中实际上分配了两个空间,一个存储对象a,一个存储对象b。
接下来我们想将它们写入到磁盘的一个文件中去,就在写入文件时出现了问题!因为对象b包含对对象a的引用,所以系统会自动的将a的数据复制一份到b中,这样的话当我们从文件中恢复对象时(也就是重新加载到内存中)时,内存分配了三个空间,而对象a同时在内存中存在两份,想一想后果吧,如果我想修改对象a的数据的话,那不是还要搜索它的每一份拷贝来达到对象数据的一致性,这不是我们所希望的!
序列化的解决方案:
1.保存到磁盘的所有对象都获得一个序列号(1, 2, 3等等)
2.当要保存一个对象时,先检查该对象是否被保存了
3.如果以前保存过,只需写入"与已经保存的具有序列号x的对象相同"的标记,否则,保存该对象通过以上的步骤序列化机制解决了对象引用的问题!
pickle将对象保存到文件里,所以肯定要有一个文件才行
import pickle
dict1 = {'name': 'flyme', 'age': '22', 'hobby': 'sleep', 'kinsfole': ['father', 'mother']}
with open('testfile', 'wb') as file:
pickle.dump(dict1, file)
import pickle
with open('testfile', 'rb') as file:
dict1 = pickle.load(file)
print(dict1)