netCDF文件的scale_factor和add_offset

我使用python的netCDF4读取数据,发现数据集存在scale_factor和add_offset,但是我读取的数据应该是Unpacking data,也就是转换后的实际数据,不需要再处理,因为数据压缩是通过偏移和缩放之后将浮点数转化为整数,为了验证正确性,我通过下列代码验证:

from netCDF4 import Dataset

filename = r'geopotential.nc'
data = Dataset(filename)
print(data['z'].set_auto_maskandscale(True)) # 设置缩放和掩膜数组开启,默认就是开启,这句话可省略
print(data['z'][:]) # data1

print(data['z'].set_auto_maskandscale(False)) # 设置缩放和掩膜数组关闭
print(data['z'][:]) # 关闭后打印数据,得出的数据全部为整数
#将关闭后的数据应用缩放和偏移转换
print(data['z'][:]*data['z'].scale_factor+data['z'].add_offset) # data2
# 可以发现关闭data1和data2完全一致

'''
思路应该是这样:
采集到原始数据,然后为了节省存储空间,保证存储的数据精度,采取以下策略转换数据;
min:整个数据集的最小值, max:整个数据集的最大值, n:转化为多少个二进制数的整数,取决于你数据的范围,我这个数据集是16进制度
def compute_scale_and_offset(min, max, n):
    # stretch/compress data to the available packed range
    scale_factor = (max - min) / (2 ** n - 1)
    # translate the range to be symmetric about zero
    add_offset = min + 2 ** (n - 1) * scale_factor
    return (scale_factor, add_offset)
'''
def compute_scale_and_offset(min, max, n):
    # stretch/compress data to the available packed range
    scale_factor = (max - min) / (2 ** n - 1)
    # translate the range to be symmetric about zero
    add_offset = min + 2 ** (n - 1) * scale_factor
    return (scale_factor, add_offset)
# 我调用上述函数计算了偏移和缩放值:
import numpy as np
print(compute_scale_and_offset(np.array(data['z'][:]).min(),np.array(data['z'][:]).max(),16))
#得到的结果和我读取的ERA5文件中的scale_factor, add_offset一致。

总之,使用netCDF模块读取的数据无须再进行处理。

ref:

[1] https://blog.csdn.net/BeautyGao/article/details/50608428?utm_source=blogxgwz5

[2] http://james.hiebert.name/blog/work/2015/04/18/NetCDF-Scale-Factors.html

你可能感兴趣的:(python,气象数据,ECMWF)