Giser@lin

Python处理基本气象要素日值数据

文章目录

- 前言
- 数据介绍
- 处理思路
- - 预处理
  - 处理过程
  - 处理后
- 数据处理
- - 构建分类函数
  - 构建核心处理函数
  - 数据的再加工(月度、年度)
- 处理成果
- 完整代码
- 总结

前言

这篇博客是纪念自己第一次处理水文领域的数据，可能处理方式上有点生疏，甚至有些不当的地方，但实实在在是自己摸索出来的一种方法，后面我会把伪批量化的源码也开源出来，希望能够帮助那些跟我一样在这方面刚入门的小白。

数据介绍

本次实验用到的数据是来自 中国国家级地面气象站基本气象要素日值数据集(V3.0)，包含了中国基本气象站、基准气候站、一般气象站在内的主要2474个站点1951年1月至最新本站气压、气温、降水量、蒸发量、相对湿度、风向风速、日照时数和0cm地温要素的日值数据。
因为我主要需要用到的是降水量，所以就选取了降水量的数据集来处理，其他的气象要素数据方法也是类似的，换汤不换药。

1级目录	文件名
PRS	SURF_CLI_CHN_MUL_DAY-PRS-10004-YYYYMM.TXT（本站气压）
TEM	SURF_CLI_CHN_MUL_DAY-TEM-12001-YYYYMM.TXT（气温）
RHU	SURF_CLI_CHN_MUL_DAY-RHU-13003-YYYYMM.TXT（相对湿度）
PRE	SURF_CLI_CHN_MUL_DAY-PRE-13011-YYYYMM.TXT（降水）
EVP	SURF_CLI_CHN_MUL_DAY-EVP-13240-YYYYMM.TXT（蒸发）
WIN	SURF_CLI_CHN_MUL_DAY-WIN-11002-YYYYMM.TXT（风向风速）
SSD	SURF_CLI_CHN_MUL_DAY-SSD-14032-YYYYMM.TXT（日照）
GST	SURF_CLI_CHN_MUL_DAY-GST-12030-0cm-YYYYMM.TXT(0cm地温)

处理思路

预处理

从数据命名的介绍中，我们可以知道每个TXT文件的命名都包含了类型、年份、月份等信息，如果我们一次性读取所有的TXT(1951~2015年)进来，一方面会增加系统运行的负担，另一方面处理完的分类也是一个问题，所以不如按照文件命名里的时间信息先对文件进行一个预分类，通过建立各个年份的文件夹对不同年份的数据进行存放，这里我准备用一个分类函数来实现这个预处理。

处理过程

从文本数据包含的数据来看，首先我们需要把每一列的含义弄清楚，尤为注意每一列数据的单位。
筛选出核心数据列，每个文本数据都包含13列数据，但并非全部列都是我们关心的，例如质量控制码、非核心的统计指标，这些均可以筛选去掉，增加数据的可读性。
通过检查每个站点的信息，包括站号、经纬度、高程、日期等信息，发现这些基本信息都很齐全，因此我们可以用这几列来进行分组、聚合等操作，不用担心被缺失值或异常值所困扰，但值得注意的是每一年甚至每个月的站点都会有增加或者减少的现象。

处理后

这里主要指处理完之后数据的存放位置和存放形式。
最后的输出结果有day,month,year三个文件夹，分别存储了处理好的日值、月值、年度累计降水数据。

数据处理

构建分类函数

在构建函数之前，导入处理需要的一些库，第一次用python的朋友记得先安装一下~

#导入所需的库
import os  #操作系统路径、文件等常用的库
import shutil #能够将文件移动到指定路径下的库
import pandas as pd #科学计算届的老熟人
import numpy as np  # pandas的好基友

为了实现对数据进行存放，这里起码需要一个参数，即待处理数据所在的路径，因此我在这里构建参数为路径的函数：

def Classify(path):
    #设置数据集的路径，告诉python我们要对哪里的数据进行分类，chdir--change dir改变路径的缩写
	os.chdir(path)
	# getcwd -- get work dir 得到工作路径，就是查看一下当前的工作路径
	os.getcwd() 
    # os.listdir()可以读取路径下的所有数据，并且保存成列表形式
    Total_File = os.listdir(path)
    # 取出命名中的年份信息 即i[-10:-6],用这个特征来进行分年份存放对应的文件
    for i in Total_File:
        year = i[-10:-6]
        #将当前文件夹路径与对应年份相黏贴，构成每个年份文件夹的完整路径
        year_Path = path+'\\'+year
         #检查当前文件下有没有对应年份的文件夹，若没有的话即创建
        if not os.path.exists(year_Path):
            os.mkdir(year_Path)
        #如果已经存在对应年份的文件夹，则根据文件的年份信息进行分类
        if(year == year_Path[-4:]):
            # shutil.move(源文件，指定路径):递归移动一个文件
            shutil.move(i,year_Path)

运行完上面的代码之后，你会发现原本统一存放的文本数据变成了下面这个样子,这样就证明创建并分类成功了，但需要注意的地方是，上面的代码os.mkdir(year_Path)是在文件夹不存在的情况下才会创建，如果已经存在了相应的文件夹，再次运行的时候就会报错提示你已经有该文件了。

后面的话当然是读取指定年份下文件夹里的数据啦，事不宜迟，直接开搞！

构建核心处理函数

为了尽可能地方便后面进行批量化操作，我们可以设置一个参数year，通过改变这个year来读取不同年份的文件夹，当然，还需要包含读取路径和最后文件的保存路径这两个必要的参数啦~毕竟路径这东西因人而异嘛

def ChinaDayPRE(path,year,out):
    """
    path:读取的文件夹路径
    year:需要处理的年份
    out:需要保存的文件路径
    """
    os.chdir(out)
    if not os.path.exists('day'):
        os.mkdir('day')
    if not os.path.exists('month'):
        os.mkdir('month')
    if not os.path.exists('year'):
        os.mkdir('year')

其次，在每个年份的文件夹里，我们可以看出这里有十二个文本文件，每个文件对应不同的月份。参考了一些博主的处理方法后，我觉得用pandas库将每个月的数据都读取成DataFrame格式，并用一个列表存储这十二个月份的数据框，事不宜迟，来看看怎么实现！

    # 读取某个年份的文件夹进行单年份数据处理
    file_Path = path +'\\'+str(year)
    l = os.listdir(file_Path)
    # 设置一个列表来存放当前年份的十二个月份数据
    Day_list = []
    for y in range(len(l)):
        file = file_Path+'\\'+l[y]
        #将数据添加进列表中
        col = ['站号','纬度','经度','测量海拔','年','月','日','20-8时降水量','8-20降水量',
                   '20-20累计降水量','20-8时降水量控制码','8-20时降水量控制码','20-20时累计降水量控制码']
        Day_list.append(pd.read_csv(file,sep='\s+',names= col))

通过上面的函数就将十二个月份的数据框存在了Day_list的列表中，后面就是对每个月份中的数据进行数据清洗，这里先不要着急格式转换、列筛选等，因为从帮助文档里面我们可以知道，每份表里都有质量控制的列，并且也有每一列的含义，这个务必先弄清楚。从下面的资料可以知道，我们只需要筛选出质量控制码为0的行即可。我相信可疑或者未进行过质量控制的数据你用着也不放心

质量控制码	含义
0	数据正确
1	数据可疑
8	数据缺失或无观测任务
9	未进行质量控制

根据描述文件的介绍，数据里的第10列为累计降水量，第13列为质量控制码，因此我们可以针对第十三列进行筛选，针对第十列来进行累积计算

# 根据第十三列的质量控制码，筛选出正确的数据,索引从0开始
for i in range(len(year_list)):
    year_list[i] = year_list[i][year_list[i]['20-20时累计降水量控制码'].isin([0])]
# 检查累计降水量该列是否全为正确数据
for i in range(len(year_list)):
    if year_list[i]['20-20时累计降水量控制码'].max() == 0:
        flag = True
print(flag)

筛选出正确的数据后，我们就可以大胆地进行异常值处理和格式转换等操作了。下面进行异常值处理和经纬度的处理，这里面有两个需要注意的地方，一个是32766表示数据缺失，我们可以用-999来标识；另一个是原始数据的经纬度单位为度、分，即4539表示45°39′的意思，而我们一般需要将它转成度的形式，即45°+39/60 = 45.65°，这里我看的一些博客里并没有注意到这点。

异常值处理

代码	含义
32700	表示降水"微量"
32XXX	XXX 为纯雾露霜
31XXX	XXX 为雨和雪的总量
30XXX	XXX 为雪量(仅包括雨夹雪，雪暴）

经纬度处理

序号	中文名	数据类型	单位
1	区站号	Number(5)
2	纬度	Number(5)	（度、分）
3	经度	Number(6)	（度、分）
4	观测场拔海高度	Number(7)	0.1米

    # 异常值和经纬度处理
    # 备份一份数据，保存异常值处理之前的list
    Day_process = Day_list
    # 写一个度分秒转换的函数
    def dfToDu(data):
            D = data.astype(int)
            F = (data - D)*100/60
            F = round(F,2)
            data = D+F
            return data
    for i in range(len(Day_process)):
        Day_process[i].loc[Day_process[i]['20-20累计降水量'] == 32766,'20-20累计降水量'] = -999
        Day_process[i].loc[Day_process[i]['20-20累计降水量'] == 32700,'20-20累计降水量'] = 0
        Day_process[i].loc[(Day_process[i]['20-20累计降水量'] >= 30000) & (Day_process[i]['20-20累计降水量'] < 31000),'20-20累计降水量']= Day_process[i]['20-20累计降水量']-30000
        Day_process[i].loc[(Day_process[i]['20-20累计降水量'] >= 31000) & (Day_process[i]['20-20累计降水量'] < 32000),'20-20累计降水量'] = Day_process[i]['20-20累计降水量']-31000
        Day_process[i].loc[(Day_process[i]['20-20累计降水量'] >= 32000) & (Day_process[i]['20-20累计降水量'] < 33000),'20-20累计降水量'] = Day_process[i]['20-20累计降水量']-32000
        Day_process[i]['20-20累计降水量'] = Day_process[i]['20-20累计降水量']*0.1
        #经纬度处理
        # 经纬度除以100后，小数前两位是度，可以用i取整的方法提取出来，小数后两位是分，可以乘回100得到正常的值
        Day_process[i]['经度'] = Day_process[i]['经度']*0.01
        Day_process[i]['纬度'] = Day_process[i]['纬度']*0.01
       	#对经纬度进行单位转换
        Day_process[i]['经度'] = dfToDu(Day_process[i]['经度'])
        Day_process[i]['纬度'] = dfToDu(Day_process[i]['纬度'])

上文提到并非所有的列都有重要的价值，因此下一步我们就要筛选出核心的列并进行导出。

	# 去除一些冗余的列，保留站点的信息和累计降水量
    daily = Day_process[0][['站号','纬度','经度','测量海拔','年','月','日','20-20累计降水量']]
    for i in range(1,12):
       daily = pd.concat([daily,Day_process[i][['站号','纬度','经度','测量海拔','年','月','日','20-20累计降水量']]],join='inner',axis = 0)
    #导出路径设置
    OutDaily = out+'/day/'+str(year)+'_day.csv'
    # 日值降水量数据
    daily.to_csv(OutDaily,encoding='gbk',index = False)

让我们来看看处理完的日值数据！

数据的再加工(月度、年度)

其实正常而言经过上述的处理已经得到一份干净的数据了，但科研人除了需要用到日值的数据，还有可能需要用到月度、年度的累计降水数据，因此我们可以稍微再做一点加工，用日值数据进行分组和聚合操作，得到对应的加工数据。

 # 处理成月累计数据
    month_data = daily.groupby(['站号','月']).agg({'20-20累计降水量':np.sum,'年':np.mean,'测量海拔':np.mean,'纬度':np.mean,'经度':np.mean})
    #导出月度累计数据
    OutMonth = out+'/month/'+str(year)+'_month.csv'
    month_data.to_csv(OutMonth,encoding='gbk')

    #年度数据合成
    year_data=month_data.groupby(['站号']).agg({'20-20累计降水量':np.sum,'年':np.mean,'测量海拔':np.mean,'纬度':np.mean,'经度':np.mean})
    #导出年度数据
    OutYear = out + '/year/'+str(year)+'_year.csv'
    year_data.to_csv(OutYear,encoding='gbk')

处理成果

处理完之后，我们可以看到指定路径下多了三个文件夹，分别存储日值、月度和年度的数据。

完整代码

# 导入所需的库
import os
import shutil
import pandas as pd
import numpy as np

def Classify(path):
    #设置当前的工作路径
    os.chdir(path)
    os.getcwd()
    Total_File = os.listdir(path)
    # 取出命名中的年份信息 即i[-10:-6],用这个特征来进行分年份存放对应的文件
    for i in Total_File:
        year = i[-10:-6]
        #将当前文件夹路径与对应年份相黏贴，构成每个年份文件夹的完整路径
        year_Path = path+'\\'+year
         #检查当前文件下有没有对应年份的文件夹，若没有的话即创建
        if not os.path.exists(year_Path):
            os.mkdir(year_Path)
        #如果已经存在对应年份的文件夹，则根据文件的年份信息进行分类
        if(year == year_Path[-4:]):
            # shutil.move(源文件，指定路径):递归移动一个文件
            shutil.move(i,year_Path)

def ChinaDayPRE(path,year,out):
    """
    path:读取的文件夹路径
    year:需要处理的年份
    out:需要保存的文件路径
    """
    os.chdir(out)
    if not os.path.exists('day'):
        os.mkdir('day')
    if not os.path.exists('month'):
        os.mkdir('month')
    if not os.path.exists('year'):
        os.mkdir('year')
    # 读取某个年份的文件夹进行单年份数据处理
    file_Path = path +'\\'+str(year)
    l = os.listdir(file_Path)
    # 设置一个列表来存放当前年份的十二个月份数据
    Day_list = []
    for y in range(len(l)):
        file = file_Path+'\\'+l[y]
        #将数据添加进列表中
        col = ['站号','纬度','经度','测量海拔','年','月','日','20-8时降水量','8-20降水量',
                   '20-20累计降水量','20-8时降水量控制码','8-20时降水量控制码','20-20时累计降水量控制码']
        Day_list.append(pd.read_csv(file,sep='\s+',names= col))

    # 根据第十一列的质量控制码，筛选出正确的数据,索引从0开始
    for i in range(len(Day_list)):
        Day_list[i] = Day_list[i][Day_list[i]['20-20时累计降水量控制码'].isin([0])]
    # 检查累计降水量该列是否全为正确数据
    for i in range(len(Day_list)):
        if Day_list[i]['20-20时累计降水量控制码'].max() == 0:
            flag = True
#     print(flag)

    # 异常值和经纬度处理
    # 备份一份数据，保存异常值处理之前的list
    Day_process = Day_list
    # 写一个转换函数
    def dfToDu(data):
            D = data.astype(int)
            F = (data - D)*100/60
            F = round(F,2)
            data = D+F
            return data
    for i in range(len(Day_process)):
        Day_process[i].loc[Day_process[i]['20-20累计降水量'] == 32766,'20-20累计降水量'] = -999
        Day_process[i].loc[Day_process[i]['20-20累计降水量'] == 32700,'20-20累计降水量'] = 0
        Day_process[i].loc[(Day_process[i]['20-20累计降水量'] >= 30000) & (Day_process[i]['20-20累计降水量'] < 31000),'20-20累计降水量']= Day_process[i]['20-20累计降水量']-30000
        Day_process[i].loc[(Day_process[i]['20-20累计降水量'] >= 31000) & (Day_process[i]['20-20累计降水量'] < 32000),'20-20累计降水量'] = Day_process[i]['20-20累计降水量']-31000
        Day_process[i].loc[(Day_process[i]['20-20累计降水量'] >= 32000) & (Day_process[i]['20-20累计降水量'] < 33000),'20-20累计降水量'] = Day_process[i]['20-20累计降水量']-32000
        Day_process[i]['20-20累计降水量'] = Day_process[i]['20-20累计降水量']*0.1
        #经纬度处理
        # 经纬度除以100后，小数前两位是度，可以用i取整的方法提取出来，小数后两位是分，可以乘回100得到正常的值
        Day_process[i]['经度'] = Day_process[i]['经度']*0.01
        Day_process[i]['纬度'] = Day_process[i]['纬度']*0.01
        Day_process[i]['经度'] = dfToDu(Day_process[i]['经度'])
        Day_process[i]['纬度'] = dfToDu(Day_process[i]['纬度'])

    # 去除一些冗余的列，保留站点的信息和累计降水量
    daily = Day_process[0][['站号','纬度','经度','测量海拔','年','月','日','20-20累计降水量']]
    for i in range(1,12):
       daily = pd.concat([daily,Day_process[i][['站号','纬度','经度','测量海拔','年','月','日','20-20累计降水量']]],join='inner',axis = 0)
    # 日值降水量数据
    OutDaily = out+'/day/'+str(year)+'_day.csv'
    daily.to_csv(OutDaily,encoding='gbk',index = False) 

    # 处理成月累计数据
    month_data = daily.groupby(['站号','月']).agg({'20-20累计降水量':np.sum,'年':np.mean,'测量海拔':np.mean,'纬度':np.mean,'经度':np.mean})
    #导出月度累计数据
    OutMonth = out+'/month/'+str(year)+'_month.csv'
    month_data.to_csv(OutMonth,encoding='gbk')

    #年度数据合成
    year_data=month_data.groupby(['站号']).agg({'20-20累计降水量':np.sum,'年':np.mean,'测量海拔':np.mean,'纬度':np.mean,'经度':np.mean})
    #导出年度数据
    OutYear = out + '/year/'+str(year)+'_year.csv'
    year_data.to_csv(OutYear,encoding='gbk')    

#修改为数据集的文件夹
path = r'D:\New Desktop\SURF_CLI_CHN_MUL_DAY_V3.0\SURF_CLI_CHN_MUL_DAY_V3.0\datasets\PRE'
#修改输出的文件路径
outpath = 'D:/New Desktop'
#先对未处理的数据进行分类
Classify(path)
#分类后对所有年份进行批量处理
for year in range(1951,2016):
    ChinaDayPRE(path,year,outpath)
print('Successful!')

总结

从处理难度来看，处理起来不是很费劲，主要原因是数据的质量较高，缺失数据的数量较少，其次每种特征值都有详细的说明。
从处理方式来看，上述的分类-再分年份处理并非是唯一解，其实也可以统一处理再分类，哪种效率更高目前还不知道。另外，除了按照年份进行分类，还可以处理成每个站点一份表格，这样对于观测一个站点的长时间序列降水变化而言会更为方便。
从方法的可拓展性上来看，有些地方例如列名、异常值的列数都是被写死的，虽然针对降水量这份数据而言是方便的，但其他类型的数据估计会有不同，这样看拓展性会大打折扣。

借鉴文章：
1. 1951-2020年中国地面气候资料日值降水数据集提取
2. python处理日值气象数据

Python 并行新思路：不移除 GIL 的多核并发之道清水白石008 python Python题库 python 服务器开发语言
Python并行新思路：不移除GIL的多核并发之道引言大家好，我是[您的名字]，一位在Python领域深耕多年的软件专家。今天，我们来探讨一个Python开发者经常面临的挑战：全局解释器锁(GIL)以及如何在它的限制下，充分利用多核CPU的并行计算能力。GIL，这个Python语言的“老朋友”，长期以来一直备受争议。它确保了在CPython解释器中，同一时刻只有一个线程执行Python字节码。这简
2021-2-21晨间日记客归呀
今天是什么日子起床：8.30就寝：12.00天气：晴心情：充满阳光纪念日：第一天加入任务清单昨日完成的任务，最重要的三件事：写小说3000字，剪视频，和亲人聊天改进：小说字数字数加，视频录制习惯养成：每天坚持写小说周目标·完成进度百分之七十学习·信息·阅读做题，头条文章阅读健康·饮食·锻炼每天一瓶牛奶人际·家人·朋友和家人朋友聊天，教亲朋好友一些手机操作工作·思考写随笔最美好的三件事1.每天进步2
雨天日更、学习与提升，生字游戏
首先应该注明，致自己，说成小心眼最合适，因文化成度低有些文字的词语难易运用好，所以才有如此的霞小的心思，说自私不为过只是想找个提升自己满足心理的需求，致自己安慰一翻。艺多不压身、是有意还是无意进入写的提升之门。应该说无意事实是有意的，只能说好心之人常善有，介绍进入了这个写的程序。经过看到写群里的人于事才发现、自己走进一辉煌时代年青人群里，这是他们年青人的摇蓝梦想之地，但我也仿佛佣有了一个青年人的梦
python学智能算法（二十四）|SVM-最优化几何距离的理解
引言前序学习过程中，已经对几何距离的概念有了认知，学习链接为：几何距离这里先来回忆几何距离δ的定义：δ=min⁡i=1...myi(w∥w∥⋅xi+b∥w∥)\delta=\min_{i=1...m}y_{i}(\frac{w}{\left\|w\right\|}\cdotx_{i}+\frac{b}{\left\|w\right\|})δ=i=1...mminyi(∥w∥w⋅xi+∥w∥b)对上
一次奖励慢时光慢慢闪光
下午第第节课做正式作业本上的作业。做作业之前先把上一次作业的情况说了一下，重点表扬加分的孩子，请他们站起来，让大家为他们鼓掌。理由是，上一次作业是在家里写的，能在不在老师监督下认真的同学都是很对自己严格要求的，真正自律的孩子，一来奖励自律，二来鼓励下一次在家里做作业要向这些孩子学习，偶尔正式作业本上的作业在学校里完不成，带回家做容易写字潦草，应付任务，通过奖励能激励不认真的孩子。奖励方式采取随机抽
链路两段不同网段怎么通信_eNSP小实验：不同网段直连接口如何互通？ weixin_39662263 链路两段不同网段怎么通信
小实验：不同网段直连接口如何互通？1.当两个路由器不同网段的直连接口封装的链路层协议为PPP协议时：由于在PPP链路协商时彼此可以学习到对方的IP地址，并且自动将对端不在同一个网段的主机路由加到直连路由表中。故只要双方在接口配置了IP地址就可彼此ping通。AR1配置：#sysnameAR1#interfacePos4/0/0link-protocolpppipaddress100.1.1.125
树莓派i2c通信C语言,基于I2C的STM32与树莓派通信茶话股经树莓派i2c通信C语言
传统的串口通信会丢失数据，不可靠，故采用I2C(同步串行总线)通信。树莓派上使用python脚本，后期将使用c或java重写，目前没有需求。树莓派作主机(Master)，stm32作从机(Slave)。特别需要注意的是，I2C的通信虽然只需要两根线就能通信，但是需要第三根线接地GND(提供判断低电位的能力)，否则不能正常识别stm32从机使用ArduinoIDE编程以下是STM32的代码：#inc
每日复盘分享 Collue
3-90/Day47/有效学习，从每日复盘分享开始【2021.9.4团队管理篇】开好月度启动会的方法【一】收获新知一、公司要开月度启动会的原因1、因为上月目标完成，大家的心力、体力都有些疲惫；大家的状态有所回落。然而每个月的目标又都很高，所以要开启动会议，正式宣布战役的开启，让大家进入战斗状态。2、一个公司是否有效率取决于管理者是否有效率，管理者是否有效率，取决于管理者有没有良好的工作习惯。每个月
有效快速记忆五十音方法和技巧蓝色的枕头12
日语学习之五十音图记忆法：日语发音以五十音图为基础，一定学好五十音图，通过文章内教授的一些记忆法，知道日语是怎样发音，才能学好日语。日语发音以五十音图为基础，比中文的拼音还要重要，一定学好五十音图，才知道日语是怎样发音。日语小知识①先是竖着记=（*称为行）あaかkaさsaたなはまやらわんいiきkiしxiうuくkuすsiえeiけkeiせseiおouこkoそsou②竖着记好后，衡着记（*称为段）あaか
华为OD机试2025C卷 - 计算三叉搜索树的高度 (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD机试2025C卷华为OD2025C卷华为OD机考2025C卷
计算三叉搜索树的高度华为OD机试真题目录点击查看:华为OD机试2025C卷真题题库目录｜机考题库+算法考点详解华为OD机试2025C卷100分题型题目描述定义构造三叉搜索树规则如下：每个节点都存有一个数，当插入一个新的数时，从根节点向下寻找，直到找到一个合适的空节点插入。查找的规则是：如果数小于节点的数减去500，则将数插入节点的左子树如果数大于节点的数加上500，则将数插入节点的右子树否则，将数
华为OD面试手撕真题 - 字符串解码 (C++ & Python & JAVA & JS & GO) 无限码力华为OD面试手撕代码真题合集华为od 面试手撕真题华为OD面试手撕真题
题目描述给定一个经过编码的字符串，返回它解码后的字符串。编码规则为:k[encoded_string]，表示其中方括号内部的encoded_string正好重复k次。注意k保证为正整数。你可以认为输入字符串总是有效的；输入字符串中没有额外的空格，且输入的方括号总是符合格式要求的。此外，你可以认为原始数据不包含数字，所有的数字只表示重复的次数k，例如不会出现像3a或2[4]的输入。示例1输入：s="
支持向量机SVM 李昊哲小课 sklearn 人工智能机器学习支持向量机算法机器学习 sklearn 人工智能数据挖掘
支持向量机SVM一、支持向量机算法支持向量机（SupportVectorMachine，SVM）是一种用于分类和回归分析的机器学习算法。分类场景举例（更容易理解）假设现在有一个二维平面上散落着一些点，这些点分为两类，一类是红色的圆形点，另一类是蓝色的方形点。我们的任务就是找到一条直线，能够把这两类点尽可能准确地分开。支持向量机算法做的事情就和这个类似。算法核心思想它不是随便找一条能分开两类数据的直
《随园诗话》学习与译注意趣与刺点
卷六八十三原文前朝番禺黎美周，少年玉貌，在扬州赋《黄牡丹》诗。某宗伯品为第一人，呼为“牡丹状元花主人”。郑超宗，故豪士也，用锦舆歌吹，拥“状元”游廿四桥。士女观者如堵。还归粤中，郊迎者千人。美周被锦袍，坐画舫，选珠娘之丽者，排列两行，如天女之拥神仙。相传：有明三百年真状元，无此貌，亦无此荣也。其诗十章，虽整齐华赡，亦无甚意思。惟“窥浴转愁金照眼，割盟须记赭留衣”一联，稍切“黄”字。后美周终不第，陈
DeepSeek部署指南：从入门到精通 wujj_whut 热门应用 c++DeepSeek 嵌入式实时数据库
DeepSeek部署指南：从入门到精通引言在人工智能和深度学习领域，模型的部署是一个至关重要的环节。DeepSeek作为一款强大的深度学习框架，其部署过程不仅关系到模型的性能表现，还直接影响到实际应用的效果。本文将详细介绍DeepSeek的部署流程，涵盖从环境配置到实际应用的各个方面，旨在帮助读者全面掌握DeepSeek的部署技巧。一、DeepSeek简介DeepSeek是一款开源的深度学习框架，
我的约会麦花魔法花园
01不美好可以变得美好。早上4点起床，对我来说是一场约会。我对每天的这个时间起床，有点忐忑，有点盼望又有点害怕，这种感觉让我上瘾。刚开始四点起床的时候，自己是下了一点功夫的。几个闹钟的提醒，身体对时间的不适应，导致间歇性的疲劳。起床的时候，总是会赖床，而且就算醒了，也不是很清醒，总想回去睡回笼觉，看书学习的时候老是会打瞌睡，八点到公司，一定要趁着同事没有来睡一觉才行。现在每天清晨，四点起床对我已是
8月计划和目标张小龙灬
1，减肥，永恒不变的话题！这次少定点一个月12斤好不好！1-7，3斤8-14，3斤15-21，3斤22-31，3斤同时8.9.10.11.12，5个月不违规！2，跑步加听书！跑步一个月100公里，每次跑步听的书，当天通过回忆，做日更输出出来！100公里最少20天，20本书！1-7，25公里，5本8-14，25公里，5本15-21，25公里，5本22-31，25公里，5本3，学习颜色！8.3-8.7
Python编程：从入门到实践 YC运维 Python_study python 学习开发语言
这是基于《Python编程：从入门到实践》这本书以一个初学者的视角去学习而记录的笔记，浓缩了精华的部分以及分享了一些我自己的见解。做这个既是为了让自己边学边记录也是为了保留自己的问题去和小伙伴一起谈论。一，python是什么以及核心作用Python是一种高级、解释型、面向对象的编程语言，由荷兰人GuidovanRossum于1989年圣诞节期间创建，第一个公开发行版发行于1991年。它的设计哲学强
雷锋精神代代传 Kilig遇
今年的3月5日是第59个“学雷锋纪念日”，回顾学习雷锋一路走来，一心一意跟党走、全心全意为人民服务为核心的雷锋精神已深入中国人的骨髓，为一代代中国人崇敬、追随。雷锋是一座不朽的精神丰碑。新时代是奋斗者的时代，传承雷锋精神，是新时代奋斗者应执守的奉献追求。雷锋精神，人人可学；奉献爱心，处处可为。习近平总书记曾将新时代雷锋精神的核心概括为：信念的能量、大爱的胸怀、忘我的精神、进取的锐气。雷锋精神内涵丰
日精进第104天七田阳光晓蓓
敬爱的黄校长，亲爱的老师们：大家晚上好！我是寿光七田阳光的霍晓蓓，今天是2018.12.25日，我的日精进行动第104天，给大家分享我今天的进步。1、比学习：今天学习了《给孩子的未来脑计划》2、比改变：积极的状态迎接每一天。3、比付出：努力做好每一件事。4、比谦卑：换位思考，多为别人考虑，学习别人的优点。5、比感恩：感恩黄姐给予的学习机会和平台。6、比坚持：坚持学习！坚持晨练！坚持日精进！
VR 火化设备仿真系统具备哪些优势？
VR火化设备仿真系统，是融合了当下前沿的VR(虚拟现实)技术，精心打造出的一套针对火化设备的模拟演示与学习系统。它借助先进的3D建模技术，对火化设备进行1：1的高精度还原建模，无论是设备外观的每一处细节，还是内部复杂的构造，都能逼真呈现。(一)培训革命：随时随地沉浸式学习VR火化设备仿真系统给传统培训模式带来了颠覆性的变革。以往，培训往往受限于特定的时间和场地，工作人员必须在火化场规定的时间内，跟
【人工智能之深度学习】1. 深度学习基石：神经元模型与感知机的数学本质（附代码实现与收敛性证明） AI_DL_CODE 人工智能之深度学习人工智能深度学习神经元模型感知机赫布法则深度学习基础线性可分
摘要：作为深度学习的基础单元，神经元模型与感知机承载着从生物智能到人工神经网络的桥梁作用。本文从生物神经元的工作机制出发，系统剖析数学建模过程：详解赫布法则的权重更新原理（Δwi=η·xi·y），推导McCulloch-Pitts神经元模型的数学表达（y=Θ(∑wixi−b)），重点证明感知机在linear可分情况下的收敛性——通过Novikoff定理严格推导迭代次数上界，揭示间隔γ对收敛速度的影
Python打卡day6 描述性统计荣582 python学习打卡 python 开发语言机器学习
@疏锦行针对其他特征绘制单特征图和特征和标签的关系图，并且试图观察出一些有意思的结论单特征可视化importmatplotlib.pyplotaspltimportseabornassnsimportpandasaspd#读取数据，这里假设数据文件名为data.csv，你需要根据实际情况修改文件名data=pd.read_csv('data.csv')#连续变量可视化示例plt.figure(fi
唐人一首绝美山水诗，从题目美到结尾，字美句美，意境更美！慢慢趣说
对很多中国人而言，起一个好名字，非常重要。它不仅蕴含着很好的寓意，表达了人们对幸福生活的向往，还会在社交活动中留给别人一个美好的第一印象。试想，一个叫“叶丽”的人和一个叫“叶婉婉”的人，哪一个会在你的脑海中留下深刻印象？其实，一个好“名字”对人很重要，对其他事物也很重要，就比如中国的古典诗歌。对此，我想大家在学习中国古典诗词的时候，一定深有体会。中国古典诗词浩如烟海，灿若星辰，就像一个个风姿各异的
如何做好拼多多运营老虎讲运营
之前听过一个段子，说的是互联网公司各个岗位的最终归宿，比如产品经理最终是滴滴司机，程序员最终是小卖铺老板，而运营的最终归宿是微商。当然这只是一个段子，不要当真，但是从侧面也反映出了职场老人的焦虑感，都说有个35岁现象，你在职场年龄过了35就没啥优势了，轮体力，学习能力，反应能力都赶不上年轻人，唯一比年轻人有优势的可能只有资历了。但是资历在互联网公司不值钱，你又不是厨师、医生、律师，你是年龄越大越贬
刺猬的优雅唐妮儿
选自花瓣网极容易因为别人的情绪影响自己的情绪。尽管表面可能云淡风轻。“真正的自由，则是我们放弃我们对他人的要求和期望，放弃对外在形式的依赖和需索。”尽量在摒弃不重要人的影响，也在渐渐习惯这种逃离后的怡然自得和轻松。但偶尔也在想，什么才是重要的？一些轻易就在乎的，一些已被自己定义为应该在乎的。但是，任何人都该有自己的骄傲和余地。能理解对方，但也在学习提醒自己，该重视自己的骄傲和余地。如果心绪太容易因
打卡Day12 HAhhhiu python学习打卡 python 机器学习
@浙大疏锦行知识点：遗传算法：来源于自然界中的生物进化和基因遗传思想：模拟生物进化过程，通过“选择（保留优秀解）、交叉（组合解的特征）、变异（引入新特征）”迭代优化我想培养出一只超级泰迪犬？该怎么办呢？首先，我有一群泰迪犬，但是小泰迪们的各种基因不同，形态各色，我只想要一只高大、卷毛和聪明的泰迪。（这是初始解的集合，也是案例学习代码中，我们所设定的随机森林中的一堆的参数范围）接着，我开始挑选符合上
2021勇气读书会——《学习的逻辑》打卡（第二百零八天）于杰雄
这是我参加勇气读书会打卡第二百零八天我阅读的书籍：《学习的逻辑》出发日期：2021.1.1期待的收获：立足现在，创造未来，让自己的教学能力更上一层楼。一句标语：千里之行，始于足下。小想法：相信明天会更好，我们会战胜困难，迈向更美好的未来。不要放弃每一天的学习，让自己充实起来，加油！勇气读书会，永不散场。结构化思维能够帮助我们对文章进行清晰定位，提高我们的阅读效率。——摘自《学习的逻辑》作者：叶修读
深度学习在环境感知中的应用：案例与代码实现
让机器学会“看”世界：深度学习如何赋能环境感知？关键词深度学习|环境感知|计算机视觉|传感器融合|语义分割|目标检测|自动驾驶摘要环境感知是机器与外界互动的“眼睛和耳朵”——从自动驾驶汽车识别行人，到智能机器人避开障碍物，再到城市监控系统检测异常，所有智能系统都需要先“理解”环境，才能做出决策。传统环境感知方法依赖手工特征提取，难以应对复杂场景；而深度学习通过数据驱动的方式，让机器从大量数据中自动
Java学习第五十八部分——设计模式慕y274 java 学习设计模式
目录一、概述提要二、创建型模式——解决“如何创建对象”的问题1.单例模式(Singleton)2.工厂方法模式(FactoryMethod)3.解释器模式(Interpreter)4.建造者模式(Builder)5.原型模式(Prototype)三、结构型模式——解决“如何组合类和对象”的问题1.适配器模式(Adapter)2.桥接模式(Bridge)3.组合模式(Composite)4.装饰器模
事务注解可能失效的几种可能原因 ℡余晖^ 黑马点评项目相关问题和笔记 java jvm 开发语言
在黑马点评项目的学习过程中，我遇到了事务失效的问题，其中提到了事务失效的可能原因，本文就来简单了解一下事务实现的可能原因是什么。Spring事务的生效机制、自调用失效原因及常见失效场景，可从以下维度详细解析：一、Spring如何确保事务生效？Spring事务的核心实现依赖AOP（面向切面编程）和动态代理，其核心流程如下：1.代理对象的生成Spring通过@Transactional注解标记需要事务
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">