使用python的netCDF4库读取.nc文件 和 创建.nc文件

使用python netCDF4库读取.nc文件 和 创建.nc文件

1. 介绍
.nc(network Common Data Format)文件是气象上常用的数据格式,python上读取.nc使用较多的库为netCDF4这个库,下面将介绍这个库的具体方法。

安装很简单:

pip install netCDF4

.nc文件介绍参考链接:https://blog.csdn.net/wildand/article/details/88899718

2. .nc文件的读取

#导入nc库
import netCDF4 as nc

filename = '2017-06-15_2017-06-17.nc'   # .nc文件名
f = nc.Dataset(filename)   #读取.nc文件,传入f中。此时f包含了该.nc文件的全部信息

#step1: 查看.nc文件的全部变量,及该变量的全部信息(维度大小,单位等)

all_vars = f.variables.keys()   #获取所有变量名称
print(len(all_vars))  #长度为18

all_vars_info = f.variables.items()  #获取所有变量信息
print(type(all_vars_info))   #输出为: odict_items 。这里将其转化为 list列表
print(len(all_vars_info))   #长度为18
all_vars_info = list(all_vars_info)  #此时每个变量的信息为其中一个列表

如图:包含经纬度、时间、等变量名称
在这里插入图片描述
看看 all_vars_info的前两个变量的信息,如下,显示了 shape unit name float32 fillvalue等信息
使用python的netCDF4库读取.nc文件 和 创建.nc文件_第1张图片
#step2: 查看.nc文件的单个变量,及该变量的全部信息(维度大小,单位等)
如果对某个变量感兴趣(已知变量名),想查看这个变量的信息,获取这个变量的数据,方法如下:

#我们要查看  ’u‘的信息
var = 'u'
var_info = f.variables[var]   #获取变量信息
var_data = f[var][:]   #获取变量的数据
print(var_info)
print(var_data.shape)  

#很方便转化为array数组
print(type(var_data))    #  .nc文件的变量数组都为Masked array
var_data = np.array(var_data)  #转化为np.array数组
  

输出如下:
使用python的netCDF4库读取.nc文件 和 创建.nc文件_第2张图片
#step3: 列表形式记录所有变量信息

###最直接的办法,获取每个变量的缩写名字,标准名字(long_name),units和shape大小。这样很方便后续操作
all_vars_name = []
all_vars_long_name = []
all_vars_units = []
all_vars_shape = []

for key in f1.variables.keys():
    
    all_vars_name.append(key)
    all_vars_long_name.append(f1.variables[key].long_name)
    all_vars_units.append(f1.variables[key].units)
    all_vars_shape.append(f1.variables[key].shape)

结果如下:
使用python的netCDF4库读取.nc文件 和 创建.nc文件_第3张图片

#做成表格
a_vars_info = pd.DataFrame(all_vars_name,columns = ['name'])
a_vars_info['long_name'] = all_vars_long_name
a_vars_info['units'] = all_vars_units
a_vars_info['shape'] = all_vars_shape

使用python的netCDF4库读取.nc文件 和 创建.nc文件_第4张图片

**注意:**完成上述操作之后,记得关掉该文件

f.close()  #关闭文件。如果文件关闭后,再使用f.variabels.items()等操作是行不通的。

3. nc文件的创建

#step1: 创建一个文件

f_w = nc.Dataset('hecheng.nc','w',format = 'NETCDF4')   #创建一个格式为.nc的,名字为 ‘hecheng.nc’的文件

#step2: 写入一些基本的信息

.nc文件的里面的每个变量都有维度信息,比如,上面的 var=‘u’,维度为 1237161*177。这里面的各个维度,并不是随便定义的,是与基础的变量信息相关的。
如[12,37,161,177] = [time,level,latitude,longitude],第一个维度为时间信息,依次为 垂直层信息,纬度、经度信息。
所以,我们要先写入一些基本的信息:时间,垂直层,纬度,经度

#time纬度为12。注意,第2个参数 表示维度,但是必须是 integer整型,也就是只能创建一个基础单一维度信息。
#如果后面要创建一个变量维度>1,则必须由前面的单一维度组合而来。后面会介绍。

#确定基础变量的维度信息。相对与坐标系的各个轴(x,y,z)
f_w.createDimension('time',12)  
f_w.createDimension('level',37) 
f_w.createDimension('lat',161)   
f_w.createDimension('lon',177)  

##创建变量。参数依次为:‘变量名称’,‘数据类型’,‘基础维度信息’
f_w.createVariable('time',np.int,('time'))  
f_w.createVariable('level',np.int,('level'))  
f_w.createVariable('lat',np.float32,('lat'))  
f_w.createVariable('lon',np.float32,('lon'))

#写入变量time的数据。维度必须与定义的一致。
time = np.array([0,6,12,18,0,6,12,18,0,6,12,18])
f_w.variables['time'][:] = time  

#新创建一个多维度变量,并写入数据,
f_w.createVariable( 'u', np.float32, ('time','level','lat','lon'))
var_data = np.ones(shape=(12,37,161,177), dtype = np.float32)
f_w.variables[var][:] = var_data 

关闭文件

f_w.close()

还可以写入fill_value等信息
在这里插入图片描述
使用python的netCDF4库读取.nc文件 和 创建.nc文件_第5张图片
按照上述方式创建完成后,用一些可视化软件打开,结果如上图。

#step3: 创建群组

如上图,所以变量都是平行的位置,如果变量特别多,将相同类型的变量放进同一个group中,会更加方便。
来看一个示例:

f_w = nc.Dataset('haha4.nc','w',format = 'NETCDF4')

f_w.createDimension('time',12)
f_w.createDimension('level',37)
f_w.createDimension('lat',161)  
f_w.createDimension('lon',177)

f_w.createVariable('time',np.int,('time'))
f_w.createVariable('level',np.int,('level'))
f_w.createVariable('lat',np.float32,('lat'))
f_w.createVariable('lon',np.float32,('lon'))

time = np.array([0,6,12,18,0,6,12,18,0,6,12,18])

f_w.variables['time'][:] = time
f_w.variables['level'][:] = level

f_w.createVariable( 'q', np.float32, ('time','level','lat','lon'))
var_data = np.ones(shape=(12,37,161,177), dtype = np.float32)
f_w.variables['q'][:] = var_data 

#创建一个群组,名字为'wind'
group1 = f_w.createGroup('wind') 

group1.createVariable( 'u', np.float32, ('time','level','lat','lon'))
var_data = np.ones(shape=(12,37,161,177), dtype = np.float32)
group1.variables['u'][:] = var_data 

group1.createVariable( 'v', np.float32, ('time','level','lat','lon'))
var_data = np.zeros(shape=(12,37,161,177), dtype = np.float32)
group1.variables['v'][:] = var_data 

group1.close  # 关闭群组, 注意,这里没有括号

f_w.close()

创建结果如下:
使用python的netCDF4库读取.nc文件 和 创建.nc文件_第6张图片
看,group的信息出来了

**#step4:查看带有group的.nc文件的信息 **

f1 = nc.Dataset('haha5.nc')
vars = f1.variables.keys()  #odict_keys(['time', 'level', 'lat', 'lon', 'q'])  看不到groups信息
#通过以下命令
group_name = f1.groups.keys()  #获取组名,输出为:odict_keys(['wind'])

使用如下命令都能看到group内的变量的信息。
使用python的netCDF4库读取.nc文件 和 创建.nc文件_第7张图片

#获取group内的变量的数据
group_var_data = f1['wind']['u'][:]  
print(group_var_data.shape)  #(12, 37, 161, 177)

4. 总结

气象上常用除了.nc文件外,还有 hdf文件,这两者格式都差不多,但是我更爱.hdf格式文件
后面有机会再介绍.hdf文件的读写操作。

你可能感兴趣的:(大气科学,python,基础,python)