观察文件发现这些文件名有一定的重复,重复的地方我们可以用字符串表示,不一样的地方可以用通配符(*)表示。
##拼接文件名
str1='RSS_SMAP_SSS_L2C_r'
str2='*'#r26259_
str3='_FNL_V04.0.nc'
str4='*'
因为文件中有部分是年月日(20200101)组成,所有这里需要加入一个循环处理。
以后遇到由年月日组成的文件名同样可以处理,同时,由于每一年的每个2月时间会有不同(闰年),所以需要导入一个模块:calendar。具体使用条件可以自己在:bing上搜索:python calendar
import calendar
下面就是对于年月日写循环了
for year in range(2020,2021):#这里只展示2020年
for month in range(1,13):#表示12个月
for day in range(1,calendar.monthrange(year,month)[1]+1):#表示每个月的天数
同时,如果不确定是否成功,可以先用golb.glob 模糊查询一下,导入glob模块:
import glob
加入文件的路径,拼接的文件名
path='G:\\'#文件路径,一般需要两个\,别问为什么,不用可能报错
for year in range(2020,2021):
for month in range(1,2):
# for day in range(1,calendar.monthrange(year,month)[1]+1):
for day in range(1,3):
#我的文件放在01号文件夹下面,所以拼接的时候加入了:'%02.0f'%month+'\\'
fn='%02.0f'%month+'\\'+str1+str2+'_'+'%04.0f'%year+'%02.0f'%month+'%02.0f'%day+\
'T'+str4+'_'+str4+str3
f=glob.glob(path+fn) #这里需要绝对路径
查询之后会得到一个list,既你所拥有的所以文件。之后就可以进行其他循环处理啦~~~
举个例子,我这个是nc文件,之后对于每一个nc文件进行循环处理即可:
别忘了导入模块:import netCDF4 as nc
for file in f:
f1 =nc.Dataset(file,'r')
# print(f1)
lat = `f1.variables['cellat'][:].data`
lon = f1.variables['cellon'][:].data
time = f1.variables['time'][:].data
那就顺便讲一下nc文件的读取方式吧!
读取nc文件的办法很多,我这里使用的是nc.Dataset(file,'r')
file就是文件名,字符串(str)的格式,如 ‘20200101.nc’
你可以将其付给一个变量,并打印出来print(f1)
,查找你要输出的数据。
之后f1.variables['你要的数据名称'][:].data
全部的代码如下:
import calendar
import glob
import netCDF4 as nc
str1='RSS_SMAP_SSS_L2C_r'
str2='*'
str3='_FNL_V04.0.nc'
str4='*'
path='G:\\'#文件路径
for year in range(2020,2021):
for month in range(1,13):
for day in range(1,calendar.monthrange(year,month)[1]+1):
fn='%02.0f'%month+'\\'+str1+str2+'_'+'%04.0f'%year+'%02.0f'%month+'%02.0f'%day+\
'T'+str4+'_'+str4+str3
f=glob.glob(path+fn)
for file in f:
f1 =nc.Dataset(file,'r')
# print(f1)
lat = f1.variables['cellat'][:].data
lon = f1.variables['cellon'][:].data
一个努力学习python的海洋小白
水平有限,欢迎指正!!!
欢迎评论、收藏。