简单介绍nc文件的读写操作,以及实现输入nc文件和坐标范围,输出一个新的nc文件的功能
python3.8.13
netcdf4 1.5.7 py38h3de5c98_1
numpy 1.23.1 py38h7a0a035_0
导入netCDF4和np包
import netCDF4 as nc
import numpy as np
# 打开文件
dataset = nc.Dataset(r'H:\test.nc')
# 维度
print('1. Dimensions: ',dataset.dimensions)
# 变量
print('2. Variables: ',dataset.variables.keys())
# 全局属性 ncattrs获取name getncattr获取value
print('3. Global attribute\'s names: ',
dataset.ncattrs(),
'\n4. Global attribute\'s values: ',
[dataset.getncattr(i) for i in dataset.ncattrs()])
# 以下为输出结果,有三个维度,分别是'depth','lat','lon',十三个变量'depth', 'lat', 'lon', 'time', 'tau', 'water_u', 'water_u_bottom', 'water_v', 'water_v_bottom', 'water_temp', 'water_temp_bottom', 'salinity', 'salinity_bottom', 'surf_el'
#1. Dimensions: {'depth': : name = 'depth', size = 40, 'lat': : name = 'lat', size = 1501, 'lon': : name = 'lon', size = 1191}
#2. Variables: dict_keys(['depth', 'lat', 'lon', 'time', 'tau', 'water_u', 'water_u_bottom', 'water_v', 'water_v_bottom', 'water_temp', 'water_temp_bottom', 'salinity', 'salinity_bottom', 'surf_el'])
#3. Global attribute's names: ['classification_level', 'distribution_statement', 'downgrade_date', 'classification_authority', 'institution', 'source', 'history', 'field_type', 'Conventions']
#4. Global attribute's values: ['UNCLASSIFIED', 'Approved for public release. Distribution unlimited.', 'not applicable', 'not applicable', 'Naval Oceanographic Office', 'HYCOM archive file', 'archv2ncdf3z', 'instantaneous', 'CF-1.6 NAVO_netcdf_v1.1']
单个变量
water_temp = dataset.variables['water_temp'][:]
print(water_temp.shape)
# 输出
#(40, 1501, 1191)
所有变量
# 访问所有变量
for name in dataset.variables.keys():
data = dataset.variables[name][:]
print(data.shape)
# 输出
#(40,)
#(1501,)
#(1191,)
#()
#()
#(40, 1501, 1191)
#(1501, 1191)
#(40, 1501, 1191)
#(1501, 1191)
#(40, 1501, 1191)
#(1501, 1191)
#(40, 1501, 1191)
#(1501, 1191)
#(1501, 1191)
for name in dataset.variables.keys():
# 根据名称获取变量
var = dataset.variables[name]
for attr in var.ncattrs():
# 属性名,属性值
print(attr,var.getncattr(attr))
# 结果太长就不列出来了
最后关闭文件
dataset.close()
# 创建一个新的数据集
newdataset = nc.Dataset(r'H:\testout.nc','w')
# 创建维度 维度名,维度长度(默认None)
newdataset.createDimension('lat',10)
newdataset.createDimension('lon',10)
# 创建变量 变量名,数据类型(numpy中的数据类型),维度(如果不给维度,则变量是标量)
lat = newdataset.createVariable('lat',np.float32,('lat'))
lon = newdataset.createVariable('lon',np.float32,('lon'))
water_temp = newdataset.createVariable('water_temp',np.float32,('lat','lon'))
# 给变量赋值
lat[:] = np.arange(10)
lon[:] = np.arange(10)
water_temp[:] = np.arange(10 * 10).reshape(10,10)
newdataset.close()
导入包
import netCDF4 as nc
import numpy as np
打开已有的nc文件,并且读取出全局属性,变量名称,维度信息
filename = r'H:\test.nc'
dataset = nc.Dataset(filename)
# 定义需要的经纬度范围
extent = [18.,27.,121.,135.]
# 全局属性存入global_attrs_dict中
global_attrs = dataset.ncattrs()
global_attrs_dict = {}
for attr in global_attrs:
print(attr,dataset.getncattr(attr))
global_attrs_dict[attr] = dataset.getncattr(attr)
# 根据经纬度大小,获取索引范围x1,x2,y1,y2
old_lat = dataset.variables['lat'][:]
old_lon = dataset.variables['lon'][:]
x1 = np.searchsorted(old_lat,extent[0]) + 1
x2 = np.searchsorted(old_lat,extent[1])
y1 = np.searchsorted(old_lon,extent[2]) + 1
y2 = np.searchsorted(old_lon,extent[3])
# 新的经纬度
new_lat = old_lat[x1:x2]
new_lon = old_lon[y1:y2]
# 获取维度信息
dims = dataset.dimensions
# 获取变量名列表
variables_list = list(dataset.variables.keys())
新建nc文件,写入维度,全局属性,变量属性以及数据
# 新建一个nc文件
newfilename = r'H:\output.nc'
newdataset = nc.Dataset(newfilename,'w')
# 创建维度
for item in dims.items():
size = item[1].size
if item[1].name == 'lat':
size = len(new_lat)
if item[1].name == 'lon':
size = len(new_lon)
newdataset.createDimension(item[1].name, size)
# 设置新nc文件的全局属性
newdataset.setncatts(global_attrs_dict)
# 写入裁剪后的数据
for varname in variables_list:
print('current variable: %s' % varname)
var = dataset.variables[varname]
# 创建变量
newdataset.createVariable(varname,var.dtype,var.dimensions)
# 获取变量属性
var_attr_dict = {}
for attr in var.ncattrs():
var_attr_dict[attr] = var.getncattr(attr)
newvar = newdataset.variables[varname]
# 写入变量属性
newvar.setncatts(var_attr_dict)
# 获取维度信息
dims_name_list = list(newvar.dimensions)
# 若有经度或维度,则需要进行截取
if 'lon' in dims_name_list or 'lat' in dims_name_list:
# 1维数据
if len(dims_name_list) == 1:
if 'lon' in dims_name_list:
newvar[:] = var[:][y1:y2]
elif 'lat' in dims_name_list:
newvar[:] = var[:][x1:x2]
# 2维数据
elif len(dims_name_list) == 2:
newvar[:] = var[:][x1:x2,y1:y2]
# 3维数据
elif len(dims_name_list) == 3:
newvar[:] = var[:][:,x1:x2,y1:y2]
else:
# 数据中只有三维及以下数据,因此不处理超过三维的数据
raise ValueError('variable %s\'s dimension > 3.' %varname)
# 无经纬度,不需要截取数据
else:
newvar[:] = var[:]
# 关闭文件
newdataset.close()
dataset.close()
参考
netCDF4 API 文档