python 批量处理nc文件-字符串拼接文件,有规律文件名

python 批量处理nc文件-字符串拼接文件,有规律文件名


有文件如下:
python 批量处理nc文件-字符串拼接文件,有规律文件名_第1张图片

观察文件发现这些文件名有一定的重复,重复的地方我们可以用字符串表示,不一样的地方可以用通配符(*)表示。

##拼接文件名

str1='RSS_SMAP_SSS_L2C_r'
str2='*'#r26259_
str3='_FNL_V04.0.nc'
str4='*'

因为文件中有部分是年月日(20200101)组成,所有这里需要加入一个循环处理。
以后遇到由年月日组成的文件名同样可以处理,同时,由于每一年的每个2月时间会有不同(闰年),所以需要导入一个模块:calendar。具体使用条件可以自己在:bing上搜索:python calendar

import calendar

下面就是对于年月日写循环了

for year in range(2020,2021):#这里只展示2020年
    
    for month in range(1,13):#表示12个月
    
        for day in range(1,calendar.monthrange(year,month)[1]+1):#表示每个月的天数
        
      

同时,如果不确定是否成功,可以先用golb.glob 模糊查询一下,导入glob模块:

import glob

加入文件的路径,拼接的文件名

path='G:\\'#文件路径,一般需要两个\,别问为什么,不用可能报错
for year in range(2020,2021):
    
    for month in range(1,2):
        # for day in range(1,calendar.monthrange(year,month)[1]+1):
        for day in range(1,3):
            
#我的文件放在01号文件夹下面,所以拼接的时候加入了:'%02.0f'%month+'\\'
            fn='%02.0f'%month+'\\'+str1+str2+'_'+'%04.0f'%year+'%02.0f'%month+'%02.0f'%day+\
                'T'+str4+'_'+str4+str3      
            f=glob.glob(path+fn)  #这里需要绝对路径        
            

查询之后会得到一个list,既你所拥有的所以文件。之后就可以进行其他循环处理啦~~~
举个例子,我这个是nc文件,之后对于每一个nc文件进行循环处理即可:
别忘了导入模块:import netCDF4 as nc

for file in f:
     f1 =nc.Dataset(file,'r') 
      # print(f1)
      lat = `f1.variables['cellat'][:].data`
      lon = f1.variables['cellon'][:].data
      time = f1.variables['time'][:].data

那就顺便讲一下nc文件的读取方式吧!

读取nc文件的办法很多,我这里使用的是nc.Dataset(file,'r')file就是文件名,字符串(str)的格式,如 ‘20200101.nc’
你可以将其付给一个变量,并打印出来print(f1),查找你要输出的数据。
之后f1.variables['你要的数据名称'][:].data

全部的代码如下:

import calendar
import glob
import netCDF4 as nc

str1='RSS_SMAP_SSS_L2C_r'
str2='*'
str3='_FNL_V04.0.nc'
str4='*'
path='G:\\'#文件路径
for year in range(2020,2021):
    
    for month in range(1,13):
        for day in range(1,calendar.monthrange(year,month)[1]+1):          
            fn='%02.0f'%month+'\\'+str1+str2+'_'+'%04.0f'%year+'%02.0f'%month+'%02.0f'%day+\
                'T'+str4+'_'+str4+str3      
            f=glob.glob(path+fn)     
                   
            for file in f:
                f1 =nc.Dataset(file,'r') 
                # print(f1)
                lat = f1.variables['cellat'][:].data
                lon = f1.variables['cellon'][:].data

                                一个努力学习python的海洋小白
                                水平有限,欢迎指正!!!
                                欢迎评论、收藏。

你可能感兴趣的:(python-海洋数据处理,python)