.npy文件存储的字典转为json文件

首先,如果你的数据需要经常打开浏览的话,请不要把文件存成这个格式!!!

npy文件的格式是存储成二进制格式的,应该是比较适合存储数值型的文件。并且你不能像csv那样即时地打开修改(读取只能用numpy),所以适合存储那种重要的,怕误操作会影响里面内容的数据。我想,可能神经网络训好的权重用它来存储时比较合适的。

但是,有一点是可以肯定的,它一定不适合存储文字信息(不是说嵌入的向量),就是像你现在读的话,不适合不适合不适合。

转换代码如下:用到了numpy和json模块

import json
import numpy as np

# 路径
npy_path = "xxx.npy"
json_path = "xxx.json"

# 读取
file = np.load(npy_path, allow_pickle = True)
# print("转换前:", file.dtype)        # 查看数据类型

# 转为list
file = file.tolist()
# print("转换后", file.dtype)         # 间接查看数据类型

# 存为json
with open (json_path, "w", encoding = "utf-8") as new_file:
    new_file.write(json.dumps(file, indent = 2, ensure_ascii=False))

来做一些说明,并指出一些关键点:

第一步:读取np.load,没有什么特殊的地方。

第二步:tolist,很重要,不能省略这一步,直接暴力转存为json的话会有下图这种问题: 

 我们来查看前后的数据类型发生了什么变化,这一句之前是object,应该是narray的object,转换后,虽然这句查看代码报错,但是发现是dict。应该是成了。 

 第三步:很普通的存为json,需要注意的是 encoding = "utf-8" 这个不能省。

______________________________________更新___________________________________

一个更简单的办法,读成字典后再保存就好了。

import json
import numpy as np

# 路径
npy_path = "xxx.npy"
json_path = "xxx.json"

# 读取
file = np.load(npy_path, allow_pickle = True).item()
# print("转换前:", file.dtype)        # 查看数据类型

# 存为json
with open (json_path, "w", encoding = "utf-8") as new_file:
    new_file.write(json.dumps(file, indent = 2, ensure_ascii=False))

你可能感兴趣的:(python模块学习,json,python,开发语言)