气象数据集说明文档(SURF_CLI_CHN_MUL_DAY)

1.数据集信息

数据集中文名称:中国地面气候资料日值数据集(V3.0)

数据集代码:SURF_CLI_CHN_MUL_DAY

数据集版本:V3.0

数据集建立时间:20120804

2.数据来源:数据集中1951-2010年数据基于地面基础气象资料建设项目归档的"1951-2010年中国国家级地面站数据更正后的月报数据文件(A0/A1/A)基础资料集"研制。2011年1月-2012年5月数据基于各省上报到国家气象信息中心的地面月报数据文件(A文件)研制。2012年6-7月数据基于国家气象信息中心实时库数据研制。实时库中该部分数据来自实时上传的地面自动站逐小时数据文件(Z文件)及日值数据文件。

3.数据集实体


3.1.数据集实体内容说明


3.1.1.数据集实体文件名称:


数据文件命名由数据集代码(SURF_CLI_CHN_MUL_DAY)、要素代码(XXX)、项目代码(XXXXX)、年份标识(YYYY)和月份标识(MM)组成。其中,SURF表示地面气象资料,CLI表示地面气候资料,CHN表示中国,MUL表示多要素,DAY表示日值数据。


XXX-XXXXX说明:PRS-10004表示本站气压,TEM-12001表示气温,RHU-13003表示相对湿度,PRE-13011表示降水,EVP-13240表示蒸发,WIN-11002表示风向风速,SSD-14032表示日照,GST-12030-0cm表示0cm地温。

文件命名为:


1. 本站气压:SURF_CLI_CHN_MUL_DAY-PRS-10004-YYYYMM.TXT


2. 气温:SURF_CLI_CHN_MUL_DAY-TEM-12001-YYYYMM.TXT


3. 相对湿度:SURF_CLI_CHN_MUL_DAY-RHU-13003-YYYYMM.TXT


4. 降水:SURF_CLI_CHN_MUL_DAY-PRE-13011-YYYYMM.TXT


5. 蒸发:SURF_CLI_CHN_MUL_DAY-EVP-13240-YYYYMM.TXT


6. 风向风速:SURF_CLI_CHN_MUL_DAY-WIN-11002-YYYYMM.TXT


7. 日照:SURF_CLI_CHN_MUL_DAY-SSD-14032-YYYYMM.TXT


8. 0cm地温:SURF_CLI_CHN_MUL_DAY-GST-12030-0cm-YYYYMM.TXT


3.1.2.数据集实体文件的内容描述:文件格式,见"documents"目录下的格式说明文件SURF_CLI_CHN_MUL_DAY_FORMAT.doc。

3.1.3.特征值说明:


台站海拔高度 +100000 当台站海拔高度为估测值时,在估测数据基础上加100000


各要素项 32766 数据缺测或无观测任务


气压日极值 +20000 气压极值取自定时值,在原值上加20000


日最小相对湿度 +300 最小相对湿度取自定时值,在原值上加300 风速 +1000 当风速超过仪器测量上限时,在上限数据基础上加1000 风向 1-17 用数字表示风向方位,17表示静风


+100 当表示风向为八风向时,在原值上加100


90X 风向出现X个时,风向数据用个数X表示


95X 风向至少出现X个时,风向数据用个数X表示


降水量 32700 表示降水"微量"


32XXX XXX为纯雾露霜


31XXX XXX为雨和雪的总量


30XXX XXX为雪量(仅包括雨夹雪,雪暴)


蒸发量 32700 表示蒸发器结冰


+1000 蒸发器中注入的水全部蒸发,在注入的水量数据基础上加1000 0cm地温 +10000 实际温度(零上)超仪器上限刻度,在上限数据基础上加10000


-10000 实际温度(零下)超仪器下限刻度,在下限数据基础上减10000


3.2.数据存储信息


3.2.1.存储格式和读取:文件格式见"documents"目录下的格式说明文件SURF_CLI_CHN_MUL_DAY_FORMAT.doc。


3.2.2.数据集在介质中的放置


存储介质及数量:DVD光盘,8张。


存储目录结构:


1)datasets:存放数据集实体文件。共5912个文件。


SURF_CLI_CHN_MUL_DAY-XXX-XXXXX-YYYYMM.TXT。下设PRS、TEM、VAP、RHU、PRE、EVP、WIN、SSD、GST八个子目录,分别存放本站气压、气温、相对湿度、降水量、蒸发量、风、日照、0厘米地温日数据的数据集实体。


2)description:存放数据集说明文档。


3)documents:存放数据集台站信息文件、格式说明文件。


4)metadata:存放元数据文档。


数据总量:7.63GB


3.3.时间属性


时间范围:


起始时间:19510101


终止时间:最新


时间分辨率:日值


3.4.空间属性


3.4.1.地理范围


地理范围描述:中国


最西经度:75°11'E


最东经度:132°58'E


最北纬度:53°29'N


最南纬度:16°32'N


3.4.2.台站信息:见"documents"目录下"数据集台站信息"文件。


3.4.3.空间分辨率:中国地面824个国家级基准、基本站。


3.4.4.垂直范围:无


3.4.5.投影方式:无


3.5.观测仪器:按"地面气象观测规范"的要求进行观测,详见"地面气象观测规范"的相关内容。


3.6.数据处理方法:


日平均值统计方法


由上文中地面气象月报数据文件或实时库中提取得到的各要素逐日4次定时(02:00、


08:00、14:00、20:00)观测数据统计日平均值,统计规定如下:


① 日平均气温、相对湿度、0cm地温均为4次定时观测值的平均值;


② 一般情况下,日平均本站气压、日平均风速均由4次定时观测值平均得到,但当三次人工观测站在未配自记仪器的情况下,由08:00、14:00、20:00定时观测值平均得到; ③ 按上述①②规定统计日平均值时,当参加统计的某定时值缺测,则相应要素日平均值缺测处理。


3.7.数据质量状况


3.7.1质量控制方法:


在本次数据集制作过程中,对所有要素观测数据均给出了质量信息--质量控制码。质量控制码的规定及含义


质量控制码 含义


0 数据正确


1 数据可疑


2 数据错误


8 数据缺测或无观测任务


9 数据未进行质量控制


数据集中2011年1月-2012年5月所有要素项日极值数据、累计量数据的质量控制码为同期地面月报数据文件中的省级质控码,由地面气象月报数据文件三级质量控制业务系统中的省级质量控制业务给出;日平均值数据的质量控制码取自月报文件中相应定时数据的最大质控码。2012年6-7月日极值数据及累计量数据的质量控制码为实时上传的自动站小时数据文件、日数据文件中的台站质控结果,由台站质控软件自动标注给出;日平均值数据的质量控制码取自实时库中相应定时数据的最大质控码。1951-2010年所有要素项日数据质量控制码为数据集产品制作过程中,进行如下质量控制后的结果:


① 气候界限值或允许值检查;


② 台站极值检查;


③ 定时值、日平均值与日极值间内部一致性检查;


④ 时间一致性检查;


⑤ 空间一致性检查;


⑥ 人工核查与更正。


在对1951-2010年数据集产品制作过程中,对上述①-⑤自动检测出的疑误数据普遍进行了人工核查,对核查后明确为错误的数据进行了纠正,明确为正确的数据其质量控制码改为"0",无法明确质量信息的数据保留自动检测结果。


3.7.2质量状况:数据经过质量控制后,1951-2010年各要素数据的质量及完整性相对于以往发布的地面同类数据产品明显提高,各要素项数据的实有率普遍在99%以上,数据的正确率均接近100%。


3.8.数据完整性:数据完整。见附加文件"数据集台站信息"中有关资料说明。


4.引用文献:


中央气象局. 地面气象观测规范. 气象出版社, 1979。


国家气象中心. 全国地面气候资料(1961-1990)统计方法. 内部文献, 1990。 中国气象局预测减灾司. 常规气象资料信息化模式文本汇编. 气象出版社, 2001。 中国气象局. 地面气象观测规范. 气象出版社, 2003


中国气象局. 气象要素分类与编码(QX/T 133-2011). 气象出版社, 2011。 中国气象局. 气象数据归档格式 地面(QX/T 119-2010). 气象出版社, 2010。


中国气象局. 气象数据集核心元数据(QX/T 39-2005). 气象出版社, 2005。 中国气象局. 气象数据集说明文档格式标准(送审稿). 2012。


5.数据集制作及技术支持


5.1.数据集制作人


姓名:


任芝花、邹凤玲、余予、王国安(1951-2010年数据集制作者) 张志富、范邵华(2011年1月-2012年5月数据集制作者) 张志强、孙超(2012年6月至今数据集制作者

你可能感兴趣的:(数据挖掘)