郑光宗

气象业务数据格式的介绍

一．Net-CDF数据格式

1.1 Net-CDF概述
NetCDF全称为network Common Data Format，中文译法为“网络通用数据格式”，对程序员来说，它和zip、jpeg、bmp文件格式类似，都是一种文件格式的标准。netcdf文件开始的目的是用于存储气象科学中的数据，现在已经成为许多数据采集软件的生成文件的格式。
从数学上来说，netcdf存储的数据就是一个多自变量的单值函数。用公式来说f(x,y,z,...)=value, 函数的自变量x,y,z等在netcdf中叫做维(dimension)或坐标轴(axix),函数值value在netcdf中叫做变量(Variables).而自变量和函数值在物理学上的一些性质，比如计量单位(量纲)、物理学名称等等，在netcdf中就叫属性(Attributes).

1.2 Net-CDF的下载

netcdf的是官方网站为http://www.unidata.ucar.edu/software/netcdf/
在本文中，我们主要讨论在windows平台上使用netcdf软件库。我们将要从这个网站上
下载如下资源
⑴netcdf的源代码，目前的地址为

ftp://ftp.unidata.ucar.edu/pub/netcdf/netcdf-4/netcdf-beta.tar.gz
⑵netcdf的在windows平台预编译好的dll，地址为
ftp://ftp.unidata.ucar.edu/pub/netcdf/contrib/win32/netcdf-3.6.1-win32.zip

解压后里面有如下东西:
  netcdf.dll  为编译好的dll
  ncgen.exe  为生成netcdf文件的工具
  ncdump.exe 为读取netcdf文件的工具
  netcdf.lib 和 netcdf.exp在编程时会用到，后面会讲。

⑶netcdf的相关文档，包括

①netcdf的用户手册，下载地址为http://www.unidata.ucar.edu/software/netcdf/docs/netcdf.pdf
②netcdf的入门教程, 下载地址为

http://www.unidata.ucar.edu/software/netcdf/docs/netcdf-tutorial.pdf
③netcdf的c接口api手册,下载地址为http://www.unidata.ucar.edu/software/netcdf/docs/netcdf-c.pdf
下面我们来看netcdf文件的具体内容。

1.3 Net-CDF文件的内容

一个netcdf文件的结构包括以下对象：
变量(Variables)
  变量对应着真实的物理数据。比如我们家里的电表，每个时刻显示的读数表示用户的到该时刻的耗电量。这个读数值就可以用netcdf里的变量来表示。它是一个以时间为自变量（或者说自变量个数为一维）的单值函数。再比如在气象学中要作出一个气压图，就是“东经xx度，北纬yy度的点的大气压值为多少帕”，这是一个二维单值函数，两维分别是经度和纬度。函数值为大气压。
  从上面的例子可以看出，netcdf中的变量就是一个N维数组，数组的维数就是实际问题中的自变量个数，数组的值就是观测得到的物理值。变量（数组值）在netcdf中的存储类型有六种，ascii字符(char) ,字节(byte), 短整型(short), 整型(int), 浮点(float), 双精度(double). 显然这些类型和c中的类型一致，搞C的朋友应该很快就能明白。
2、维(dimension)
  一个维对应着函数中的某个自变量，或者说函数图象中的一个坐标轴，在线性代数中就是一个N维向量的一个分量（这也是维这个名称的由来）。在netcdf中，一个维具有一个名字和范围（或者说长度，也就是数学上所说的定义域，可以是离散的点集合或者连续的区间）。在netcdf中,维的长度基本都是有限的，最多只能有一个具有无限长度的维。
3、属性(Attribute)
  属性对变量值和维的具体物理含义的注释或者说解释。因为变量和维在netcdf中都只是无量纲的数字，要想让人们明白这些数字的具体含义，就得靠属性这个对象了。
  在netcdf中，属性由一个属性名和一个属性值（一般为字符串）组成。比如，在某个cdl文件(cdl文件的具体格式在下一节中讲述)中有这样的代码段temperature:units = "celsius" ;
前面的temperature是一个已经定义好的变量（Variable），即温度，冒号后面的units就是属性名，表示物理单位，=后面的就是units这个属性的值，为“celsius” ，即摄氏度，整个一行代码的意思就是温度这个物理量的单位为celsius，很好理解。

1.4 CDL结构

CDL全称为network Common data form Description Language，它是用来描述netcdf文件
的结构的一种语法格式。它包括前面所说的三种netcdf对象(变量、维、属性)的具体定义。
看一个具体例子（这个例子cdl文件是从netcdf教程中的2.1 节The simple xy Example摘出来的）:

netcdf simple_xy {
dimensions:
x = 6 ;
y = 12 ;
variables:
int data(x, y) ;
data:
data =
0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11,
12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23,
24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35,
36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47,
48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59,
60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71 ;
}

上面的代码定义了一个符合netcdf格式的结构simple_xy。

这个结构包括三个部分
1、维的定义，以dimensions:关键字开头

dimensions:x = 6 ;y = 12 ;

定义了两个轴（或者说两维），名字分别为x和y,x轴的长度(准确的说是坐标点的个数)为6， y轴的长度为12。

2、变量的定义:以variables:开头

variables:int data(x, y);
定义了一个以x轴和y轴为自变量的函数data，数学公式就是f(x,y)=data;
注意维出现的顺序是有序的，它决定data段中的具体赋值结果.
3、数据的定义，以data:开头

data:
data =
0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11,

12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23,
24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35,
36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47,
48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59,
60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71 ;
这个段数据用数学的函数公式f(x,y)=data来看，
x=0,y=0时，data = 0;

x=0,y=1时，data = 1;
x=5,y=11是，data=71;

要注意的是:
1、赋值顺序：
我们给出的是c格式的cdl文件，因此这里的赋值顺序和c语言中的一致，也就是通常所说的“行式赋值”，而fortran语言中则是“列式赋值”，因此在fortran格式的cdl文件中，data段的数值顺序和这里正好行列互换。
2、自变量的默认取值和坐标变量
如果只给出维的长度，那么维的值默认从0开始，然后自动加1，到(长度-1)停止，很多情况下我们要自己给出每个点的坐标值，这时就需要用到netcdf里的坐标变量"coordinate varibles"：增加一个和只和维相关的一元函数（自变量）并给出它的取值范围。
比如下面的cdl文件（摘自netcdf教程中的2.2 The sfc pres temp Example）

netcdf sfc_pres_temp {
dimensions:
latitude = 6 ;          //纬度轴
longitude = 12 ;      //经度轴
variables:
float latitude(latitude) ;      //坐标变量，存储具体纬度
latitude:units = "degrees_north" ;
float longitude(longitude) ;  //坐标变量，存储具体纬度
longitude:units = "degrees_east" ;
float pressure(latitude, longitude) ;    //某个点（经度和纬度的交点）的大气压值
pressure:units = "hPa" ;                 //大气压的单位为
float temperature(latitude, longitude) ; //某个点（经度和纬度的交点）的温度值
temperature:units = "celsius" ;         //温度的单位为
data:
latitude = 25, 30, 35, 40, 45, 50 ;
longitude = -125, -120, -115, -110, -105, -100, -95, -90, -85, -80, -75, -70 ;
pressure =
900, 906, 912, 918, 924, 930, 936, 942, 948, 954, 960, 966,
901, 907, 913, 919, 925, 931, 937, 943, 949, 955, 961, 967,
902, 908, 914, 920, 926, 932, 938, 944, 950, 956, 962, 968,
903, 909, 915, 921, 927, 933, 939, 945, 951, 957, 963, 969,
904, 910, 916, 922, 928, 934, 940, 946, 952, 958, 964, 970,
905, 911, 917, 923, 929, 935, 941, 947, 953, 959, 965, 971 ;
temperature =
9, 10.5, 12, 13.5, 15, 16.5, 18, 19.5, 21, 22.5, 24, 25.5,
9.25, 10.75, 12.25, 13.75, 15.25, 16.75, 18.25, 19.75, 21.25, 22.75, 24.25, 25.75,
9.5, 11, 12.5, 14, 15.5, 17, 18.5, 20, 21.5, 23, 24.5, 26,
9.75, 11.25, 12.75, 14.25, 15.75, 17.25, 18.75, 20.25, 21.75, 23.25, 24.75,26.25,
10, 11.5, 13, 14.5, 16, 17.5, 19, 20.5, 22, 23.5, 25, 26.5,
10.25, 11.75, 13.25, 14.75, 16.25, 17.75, 19.25, 20.75, 22.25, 23.75,25.25

对于上面的数据，就是
latitude = 25，longitude = -125时，pressure = 900，temperature = 9;
latitude = 25，longitude = -120时，pressure = 906，temperature = 10.5;
以此类推。

1.5 Net-CDF文件的读写

“学以致用” ，前面讲的都是netcdf的基本知识，都是为了本节的核心问题——读写netcdf格式的文件做铺垫之用，下面我们就来看看如何建立一个netcdf格式文件，以及如何再读出它的内容。

1、在命令行下读写netcdf文件
  ⑴建立一个simple_xy.cdl文件，内容就是上一节“CDL结构”中的第一个例子。
  ⑵用ncgen.exe工具（下载地址见前面的第二节）建立netcdf文件
  ①将ncgen所在目录加到系统path变量中或者直接将ncgen.exe拷到simple_xy.cdl所在目录下

  ②执行ncgen -o simple_xy.nc simple_xy.cdl生成netcdf格式文件simple_xy.nc
  ⑶生成的simple_xy.nc是一个二进制文件，要想从这个文件中还原出数据信息，就要用ncdump工具
    ①将ncdump所在目录加到系统path变量中或者直接将ncdump.exe拷到simple_xy.nc所在目录下
    ②在命令行下执行ncdump simple_xy.nc，这时屏幕的输出和simple_xy.cdl内容完全一样。说明我们的文件读写操作都是正确的。

2、编程读写netcdf文件(C语言读写)
  前面我们知道如何手工去建立和读取netcdf文件，下面我们来看看如何在程序中用代码实现netcdf文件的建立和分析。我的编程环境为win2000+vc6.0 并安装了vc sp6补丁包。例子代码选自netcdf教程中的2.1节The simple_xy Example
⑴将netcdf的源代码解压。我们将用到里面的libsrc/netcdf.h头文件
⑵在vc6中建立一个空的win32控制台项目.名字为SimpleXyWrite，这个项目用来建立netcdf文件
⑶把如下文件拷贝到项目目录中

  ①netcdf源代码中的libsrc/netcdf.h头文件
  ②netcdf源代码中的examples/C/simple_xy_wr.c文件，并改名为simple_xy_wr.cpp
  ③netcdf预编译包中的netcdf.dll文件和 netcdf.lib文件
⑷把netcdf.h文件和simple_xy_wr.cpp加入到项目的文件列表中

（具体菜单操作project->add to project->files）
⑸把netcdf.lib加入到项目的lib列表中
（具体菜单操作project->add to project->settings->Link->object/library modules）
⑹编译并运行这个项目，会在项目目录下生成一个simple_xy.nc文件，其内容和我们手工生成的文件内容完全一样。

simple_xy_wr.c文件是建立netcdf文件的c代码，而examples/C/simple_xy_rd.c文件则是分析netcdf文件的代码，读者可以用和刚才类似的步骤在vc6中编译这个文件。运行时把把刚才生成的simple_xy.nc拷贝到项目的目录下，如果文件格式没错误，会提示*** SUCCESS reading example file simple_xy.nc!然后退出。

3、用ncgen命令自动生成c代码：给定了simple_xy.cdl文件后，可以用
ncgen -c simple_xy.cdl
命令直接在屏幕上输出c代码.不过，这个办法只限于cdl的数据比较简单时才可以采用。对于真正的项目，是需要我们自己去编写代码的。

1.6关于Net-CDF的总结

总体来说，netcdf的核心内容就是通过cdl描述文法来建立一个netcdf格式文件。抓住了这一点，如果继续深入看netcdf的其他资料时，应该就没什么太大的难度了。

----------------- 资料来源：作者：laomai http://blog.csdn.net/laomai

二．Grib数据格式

2.1 Grib数据格式概述

GRIB码是世界气象组织(WMO)建议并通过的一种二进制比特流代码,它适用于表示数值天气分析和预报的格点场产品。GRIB码具有与计算机无关的特点,采用压缩数据表示形式，压缩率一般在50%以上，因而利用GRIB码能加快数据传输速度，减少存储空间，因为GRIB码是压缩的二进制代码。现行的GRIB 码版本有GRIB1 和GRIB2 两种格式，GRIB2较之GRIB1具有加大优点而被广泛使用。如：表示多维数据、模块性结构、支持多种压缩方式、IEEE标准浮点表示法等。

在现行气象业务中,所使用的气象资料编码主要有以下两种:字符编码和表格驱动码编码。字符编码简单直观,但是由于种类格式繁多复杂、适应性差,而且对于每一种资料格式都要有相应的编解码工作,且解码复杂、工作量大,不能很好地满足不断增长的气象数据格式的需求。表格驱动码具有较强的自我描述、灵活和扩展性、数据压缩功能、编解码程序的简化和可作为标准格式直接存档等特点,由于气象数据种类不断增多,对数量和质量的要求越来越高,而字符编码的局限性使得字符编码不能很好地满足这样的需求。世界气象组织(WMO) 建议逐渐由字符格式编码向表格驱动码编码进行过渡,并制定了过渡计划。WMO推荐使用的表格驱动编码为气象数据通用格式(BUFR :Binary Universal FoRm) 、用于数据表示和字符格式(CREX:Character Representation form for data EXchange) 和二进制格点加工数据( GRIB :GRIdded Binary) 。

2.2 GRIB1

2.2.1 GRIB1 编码格式

一份GRIB1 编码资料分为6 段:

0 段: 指示段

1 段: 产品定义段

2 段: (网格描述段)

3 段: (位图段)

4 段: 二进制数据段

5 段: 7777

代码的开始和结束分别在0 段和5 段,由4 个8 位组的国际电报字符5 号码GRIB 表示开始和7777 表示结束。0 段是指示段,还包含整个资料的长度和GRIB 码版本号。1 段是产品定义段,内容包含段长、编码的分析或预报产品的标识符。2 段网格描述段,是可选段,内容包含该段段长以及网格的几何形状。虽然该段是可选段, 但强烈要求GRIB1 资料都应编发该段。3 段位图段,也是可选段,内容包含段长和数据位图,每个格点一位,按照顺序存放,比特位的取值指明对应格点上的数据是否被省略(0 :省略;1 :未省略) 。4 段数据段内容包含段长和数据值。

2.2.2 模板概念

GRIB1 开始使用模板概念。模板是一个数据实体的标准格式的描述。在GRIB1 中,1 段和2 段使用了模板。1 段仅使用不变的一个标准模板,2 段可以选取描述网格类型的标准模板中的一个来使用。模板中元数据或参数的取值列在模板所指引的码表中。

2.2.3 GRIB1的缺陷

GRIB1 被广泛用于NWP 产品,或是WAFS 产品。但是ICAO(国际民用航空组织) 在使用GRIB1来分发WAFS 产品时遇到阻碍,因为GRIB1 在传输或存档某些产品时还有缺陷。

(1) 表示数据的局限性,这是由GRIB 1 的结构所决定的。在GRIB1 中只能使用一个产品定义模板和网格描述模板,所以它只允许传输在一个格点某一个层上的一个场。

(2) 缺乏对谱数据的支持和对图像的有限支持,GRIB1 这方面的不足关键是因为数据压缩方式

还比较少。GRIB1 仅支持对格点数据的简单压缩、二级压缩和对球谐函数的简单压缩、复杂压缩。

(3) 不能对一些新的产品进行处理,例如集合预报系统的产品、长期预报产品和气候预测产品,还有槽脊图,因为GRIB1 没有表示相应产品的模板。因此需要开发GRIB 的第2 个版本,经过几年的开发和两年的试验以及合法性测试,WMO 批准了GRIB2 作为WMO 的可操作的表驱码。

2.3 GRIB2

2.3.1 GRIB2编码格式

一份GRIB2 编码资料分为9 段:
0 段: 指示段  --0 段指示段包含GRIB、学科、GRIB 码版本号、资料长度;
1 段: 标识段  --1 段标识段内容包含段长、段号,应用于GRIB 资料中全部加工数据的特征;
2 段: (本地使用段) --2 段包含段长、段号,由编报中心附加的本地使用的信息;
3 段: 网格定义段 --3 段网格定义段含有段长、段号、网格面和面内数据的几何形状定义;
4 段: 产品定义段 --4 段产品定义段内容包括段长、段号、数据的性质描述;
5 段: 数据表示段 --5 段数据表示段内容有段长、段号、数据值表示法描述;
6 段: 位图段     --6 段位图段内容含有段长、段号,以及指示每个格点上的数据是否存在;
7 段: 数据段     --7 段数据段内容是段长、段号、数据值;
8 段: 7777       --8 段结束段只含有“7777”4 个字符。

2.3.2 GRIB2的优势

(1) 表示多维数据

GRIB2 能传输多个网格场数据,GRIB2 也能描述在时间和空间方面的多维网格数据。在GRIB2中若是3 段到7 段循环,即允许在一个GRIB2 资料中包含多个格点场、多个产品、多个参数数据(如果本地使用段需要定义,2 段到7 段也可循环) 。如果需要在同一个格点场传送多个产品参数,就可以重复4 段到7 段。

(2) 更具模块性的结构

GRIB2 广泛使用模板,3 段使用网格定义模板,4 段使用产品定义模板,5 段使用数据表示模板。网格定义模板包含等距圆柱面(正方形平面) 、墨托卡、极射赤面投影、兰伯特正形、高斯经纬度、球谐函数系数、空间观察的透视和正射、基于二十面体的三角形、赤道方位角的等距投影、在水平面上有相等间隔点的剖面、在水平面上有相等间隔点的槽脊图以及时间剖面等类型的网格。产品定义模板包含分析预报、单项集合预报、概率预报、导出预报、百分比预

报、雷达产品、卫星产品等产品类型。数据表示模板包含的内容在下文的(3) 中介绍。在GRIB2 中,模板、码表管理更清晰,他们都根据所在的段来进行编号,而且根据功能和方向的不同进行分离。这些丰富的模板使得GRIB2 可以对一些新的产品进行编码,例如集合预报系统的产品,长期预报、气候预测、集合海浪预报或者交通模型、剖面段和槽脊类型图。GRIB2 能够展现目前可用的新产品,而且为扩展和增加提供方便的途径。GRIB2 的结构比GRIB1 更加体现了模块化和面向对象性。GRIB2 更具灵活性和可扩展性。在GRIB2 中,当需要传输一个新的参数或者新的数据类型时,新的元素只需要添加到新的表中去,这样就充分体现了灵活性。无需开发新的软件,处理过程和流程是固定的,只要扩充表就可以,这使得当新产品或者新参数需要增加时软件维护更加容易,充分体现了可扩展性。

(3) 更多的压缩方式

GRIB2 提供更多的压缩方式,特别是对谱数据和图像数据的支持(体现在数据表示模板) ,包含格点数据的简单压缩、复杂压缩和空间差分压缩方式,还有谱数据的简单压缩方式和对球谐函数数据的复杂压缩。最重要的是还采用了图像压缩方式(JPEG2000 和 PNG 压缩算法,这两种数据表示模板到2006 年本文发稿时已经包含在正式文档中) 。这两种压缩算法不仅能够提供对图像数据的支持,例如雷达产品和卫星产品,而且其他格点数据也可以使用它们来对格点数据进行压缩,以获得理想的精度。

(4) IEEE 标准浮点表示法

在GRIB2 中有一些数值是采用了IEEE 标准浮点数表示法。单精度浮点数用4 个8 位组表示:seeeeeee emmmmmmm mmmmmmmm mmmmmmmm 其中:s 为符号位,0 为正,1 为负;e…e :有偏指数,用8 个比特表示;m…m:尾数,但不包含第1个比特位;其数值由表1 给出。

表1 IEEE浮点表示法

数的存储是从高序列的8位组开始,符号位是第1个8位组的第1位,尾数的低序列位是第4个8位组的最后一位(第8位)。

2.3.3 GRIB2 解码

在了解了GRIB2 资料的结构后,我们着手做了GRIB2 的解码工作,自行编写了解码软件,目前已能解开GRIB2 的示例文件,以后还需进一步完善。在做解码工作时,有几个重点的问题值得探讨。

(1) 对字节的处理

由于GRIB2 资料都是由一些8 位组(字节) 构成的,所以在解码获得数据时就是对这些8 位组字节的处理。

①根据长度不同:各段的属性值或者模板中的要素值有的占1 个字节,有的占2 个或4 个字节,甚

至占8 个字节,所以要根据该值所占的字节个数来分别处理,同时要注意所选用的数据类型的表示范围。

②根据正负不同:在GRIB2 资料中,有些值是负值,负值通过最高位置1 来表示。

③ IEEE 标准表示的浮点数、位图和数据段数据。对这两种数据的处理都要处理到字节中的位。对于IEEE 标准表示的浮点数,需要从4 字节中获得1 个比特的符号位,8 个比特的有偏指数以及23个比特的尾数。数据段每个压缩值所占的比特数在5 段的数据表示模板中表示,若所占的比特数不是8 的倍数,则也需要处理到字节中的位,而且需要按顺序取出每个压缩值的比特位然后得到相应的值。位图段中的位图如果编发的话则指示每个格点上的数据是否存在,每个格点对应一个比特,存在时比特值为1 ,不存在时比特值为0 。

(2) 对结构的处理

解码程序一定要能处理GRIB2 资料中27 段、37 段、47 段可以重复的情况。特别需要注意的是在重复的段序列中,应包含该序列的所有段,并按照上述段号循序排列,不重复的段在再定义之前一直有效。所以在循环出现的地方,需要正确定位数据段所对应的产品定义段和格点定义段。

(3) 使用图像压缩方式的GRIB2 资料的解码

如果GRIB2 资料采用的是图像压缩方式进行编码,因为压缩算法比较复杂,在编解码的时候就需要专门的软件包来对数据进行处理,例如JasPer。

2.4 小结

由于目前模板的数量比较大,在解码过程中如何管理模板以及必要的码表是值得探讨的问题。GRIB2 的编码工作也是下一步的工作计划。GRIB2包含的模板很丰富,如何准确地使用好这些模板,特别是一些新增模板,使其能发挥它的优越性,在业务中获得很好的应用是编码工作需要进一步探索和研究的内容。

三．HDF5 数据格式

3.1 HDF5简介

HDF(分层数据格式)是用于存储和分发科学数据的一种自我描述、多对象文件格式。HDF是由美国国家超级计算应用中心（NCSA）创建的，为了满足各种领域研究需求而研制的一种能高效存储和分发科学数据的新型数据格式。该数据格式有别于以往常规资料所用到的二进制文件、ASCII文件，它提供了一种总体目录结构, 采用了二叉树的方式建立文件内容的“索引”，能够通过“索引”直接从嵌套的文件中快速获得信息，并且可以将不同类型的数据源存于一个文件中,同时这些数据源又可以同时包含其数据信息和其他相关信息。

3.2 HDF5的数据类型

HDF提供6种基本数据类型：光栅图像（Raster Image），调色板（Palette），科学数据集（Scientific Data Set），注解（Annotation），虚拟数据（Vdata）和虚拟组（Vgroup）,这些数据结构，方便了我们对于信息的提取。例如，当我们打开一个HDF图像文件时，除了可以读取图像信息以外，还可以很容易的查取其地理定位，轨道参数，图像噪声等各种信息参数。HDF可以表示出科学数据存储和分布的许多必要条件。

HDF5是用于存储科学数据的一种文件格式和库文件。它被设计并实现满足科学数据存储不断增加和数据处理不断变化的需求，为了充分利用当今计算机系统的能力和特点，克服HDF4.x的不足。HDF5有一个强大和灵活的数据模块，支持管理的文件大于2GB(HDF4.x管理文件的极限)，并且还支持并行I/O，设计时考虑了安全线程问题。

3.3 HDF5文件组织

一个HDF5文件就是由两种基本数据对象(groups and datasets)，分别是组(Group)和数据集（Dataset），同时有其它的辅助对象类型，即数据类型(Datatype）、数据空间(Dataspace)和数据属性（Attribute）,存放多种科学数据的容器。其中，组可以看作一个容器，包含任意数量的其它组和数据集。在HDF5的逻辑结构里，整个文件作为一个Root组存在，所有内容均为Root组的成员。

HDF5 group:包含0个或者多个HDF5对象以及支持元数据(metadata)的一个群组结构。

HDF5 dataset：数据元素的一个多维数组以及支持元数据(metadata)。

任何HDF5的群组或数据集或许都有一个对应的属性列表。HDF5属性是一个用户自定义的HDF5结构，能为HDF5对象提供附加信息。使用群组和数据集时再许多方面类似于使用UNIX的目录和文件。HDF5文件里的对象经常通过他的绝对路径来引用。

3.4 HDF5文件逻辑结构

3.5 HDF的特性列表

(1)自述性：对于一个HDF文件里的每一个数据对象，有关于该数据的综合信息（元数据）。在没有任何外部信息的情况下，HDF允许应用程序解释HDF文件的结构和内容。

(2)通用性：许多数据类型都可以被嵌入在一个HDF文件里。例如，通过使用合适的HDF数据结构，符号、数字和图形数据可以同时存储在一个HDF文件里。

(3)灵活性：HDF允许用户把相关的数据对象组合在一起，放到一个分层结构中，向数据对象添加描述和标签。它还允许用户把科学数据放到多个HDF文件里。

(4)扩展性：HDF极易容纳将来新增加的数据模式，容易与其他标准格式兼容。

(5)跨平台性：HDF是一个与平台无关的文件格式。HDF文件无需任何转换就可以在不同平台上使用。

3.6 HDF/Net-CDF的局限

有效的分析大量科学数据常常需要一种方法来快速搜索并选择我们需要的部分数据基于特定搜索条件，但是针对HDF/Net-CDF文件格式，目前没有有效的查询机制来进行高效的查询，因此其本身的查询效率比较低。

关于Query的解决方案：使用Fast Query技术,由LBNL(美国劳伦斯伯克利国家实验室)组织提出并研发，基于FastBit Indexing Technology(位图快速索引技术)和PyTable的数据查询技术，底层采用的是Bitmap Index(位图索引)的数据结构。FastBit技术生成压缩位图索引,加快搜索HDF5数据集,可以把这些数据集放在一个HDF5文件中存储，与其他索引方案相比,压缩位图索引紧凑,非常适合查询多维数据甚至任意复杂的范围条件的组合。FastBit索引技术已经被供应商引入一些商业数据库系统例如Sybase,IBM和Oracle中，FastBit 也被整合到HDF5文件格式中，集成系统命名HDF5-FastQuery，但是目前还没有公开发行。

科学数据面临问题的解决方案：HDF5/Net-CDF + Fast Query可以解决以上问题。

Bitmap Index的数据结构:

四．NCEP/NCAR数据格式

4.1 NCEP简介

继美国环境预报中心(NCEP)和国家大气研究中心(NCAR)联合推出月平均再分析资料（1949-01）和日平均再分析资料（1958-01-01）后，最近又正式对外发布逐6h再分析资料集（1958-01-01T00），这为研究天气尺度和中尺度系统变化过程提供了良好的条件，并能为中尺度数值模式及区域气候模式提供初始场和侧边界条件。

该资料以netCDF(netware Common Data Form)的形式存储，通常可用COLA发展的自由软件GrADS或PMEL发展的可视化自由软件FERRET和RSI提供的商用软件包IDL进行操作处理，逐6h再分析资料集包括7个基本气象要素，根据变量名逐年生成独立文件。气温、位势高度、纬向风和经向风文件容量均为521Mb/a（17层）；相对湿度和比湿文件容量均为245Mb/a(8层）；垂自速度文件容量为367Mb/a（12层）。因此全部42年7要素逐6h再分析资料需要124Gb的介质存储，资料量极其庞大。中心近期已获得1969、1980、1991和1998年完整的资料集（注：这些年份是在近30年来长江流域4个降水正异常年份），它们分别存放在4个8mm磁带上和24个光盘上，其中98A表示1998年A盘即1998年气温，同样91A表示1991年A盘即1991年气温，依次类推.

4.2 NCEP再分析资料介绍

(1) 格点资料（GRIB格式）
数据内容:采用NCEP的实时格点资料，(1.0X1.0或2.5X2.5)网格，4月16日前的数据为16层，4月16日以后的数据为26层，主要的变量包括：TMP、HGT、UGRD、VGRD、RH、VVEL等。
文件名的组织方法:文件以gribyyyymmddhh格式来存放，其中yyyy为4位的年，mm为2位
的月，dd为2位的日期，hh为2位的时次。grib.big目录用来存放(1.0X1.0)网格数据wgrib目录用来存放(2.5X2.5)网格数据。
2)站点资料（BUFR格式）
数据内容:包括全球的地面，高空，卫星观测报
文件的组织方法:文件以bufryyyymmddhh格式来存放，其中yyyy为4位的年，mm为2位
的月，dd为2位的日期，hh为2位的时次wbufr目录用来存放台站数据。

很多在数据资料的一个网站http://www.cdc.noaa.gov/PublicData/ 对各种资料有比较详细的解释说明，也可以免费下载。http://dss.ucar.edu/datasets/ds083.2/从1999年到现在都有，需要先注册。大气所ftp的/data/backup/wgrib.big/下载。

你可能感兴趣的:(HDF5,netcdf,Grib,NCEP/NCAR,气象业务数据格式)

关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
Redis系列：Geo 类型赋能亿级地图位置计算 Ly768768 redis bootstrap 数据库
1前言我们在篇深刻理解高性能Redis的本质的时候就介绍过Redis的几种基本数据结构，它是基于不同业务场景而设计的：动态字符串(REDIS_STRING)：整数(REDIS_ENCODING_INT)、字符串(REDIS_ENCODING_RAW)双端列表(REDIS_ENCODING_LINKEDLIST)压缩列表(REDIS_ENCODING_ZIPLIST)跳跃表(REDIS_ENCODI
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
2019-03-24 李飞720
姓名：李飞企业名称：临沂鑫道食品有限公司组别373期利他1组日精进打卡第338天】【知~学习】1、阿米巴经营一段2、活用人才1段3、活法、一段【行~实践】一、修身：读书、抽烟减量、俯卧撑个跑步3公里二、齐家、劝说老爸与姑姑和好三、建功、业务洽谈【经典名句分享】1、依据原理原则追求事物的本质，以“作为人，何谓正确”进行判断2、经营者必须为员工物质和精神两方面的幸福殚精竭虑，倾尽全力，必须超脱私心，让
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
06选课支付模块之基于消息队列发送支付通知消息 echo 云清学成在线 java rabbitmq 消息队列支付通知学成在线
消息队列发送支付通知消息需求分析订单服务作为通用服务，在订单支付成功后需要将支付结果异步通知给其他对接的微服务，微服务收到支付结果根据订单的类型去更新自己的业务数据技术方案使用消息队列进行异步通知需要保证消息的可靠性即生产端将消息成功通知到服务端：消息发送到交换机-->由交换机发送到队列-->消费者监听队列，收到消息进行处理，参考文章02-使用Docker安装RabbitMQ-CSDN博客生产者确
“元宇宙”带不动Meta？基本业务已“后院起火”！小扎举步维艰！链科天下
由于宏观经济疲软、市场动荡，“放缓”已经成为美国科技股的主线逻辑，曾风光无限的科技巨头Meta也开始一路下行、举步维艰。据彭博社报道，Meta已宣布计划裁员并重组团队以削减预算，这是该公司2004年成立以来首次大幅削减预算。此次裁员或受到业绩低迷的影响，Q2财报显示Meta业绩远不及预期，上市以来营收同比出现首次下滑，净利连续三季度下降。扎克伯格表示，“希望经济能够稳定下来，但从目前的情况来看并非
【Python搞定车载自动化测试】——Python实现车载以太网DoIP刷写（含Python源码）疯狂的机器人 Python搞定车载自动化 python DoIP UDS ISO 14229 1SO 13400 Bootloader tcp/ip
系列文章目录【Python搞定车载自动化测试】系列文章目录汇总文章目录系列文章目录前言一、环境搭建1.软件环境2.硬件环境二、目录结构三、源码展示1.DoIP诊断基础函数方法2.DoIP诊断业务函数方法3.27服务安全解锁4.DoIP自动化刷写四、测试日志1.测试日志五、完整源码链接前言随着智能电动汽车行业的发展，汽车=智能终端+四个轮子，各家车企都推出了各自的OTA升级方案，本章节主要介绍如何使
日更第120天-顺其自然，为所当为飞翔001
在教培业务萎缩之后，新东方前不久宣布转型带货，初期人气寥寥，直播间也就几千人观看，近日，新东方的“东方甄选”因英语老师双语直播带货爆火，直播间人数过万，6月10日，新东方在线股价暴涨近40%，单日成交额突破1000万元，累计近400万人观看了直播。当晚俞敏洪来到直播间，和老师们一起直播带货。俞敏洪称，这是新东方老师们非常关键的转型，他们老师转型做带货主播，受到了大家的关注和部分的肯定，感谢各位网友
华为云分布式缓存服务DCS 8月新特性发布华为云PaaS服务小智华为云分布式缓存
分布式缓存服务（DistributedCacheService，简称DCS）是华为云提供的一款兼容Redis的高速内存数据处理引擎，为您提供即开即用、安全可靠、弹性扩容、便捷管理的在线分布式缓存能力，满足用户高并发及数据快速访问的业务诉求。此次为大家带来DCS8月的特性更新内容，一起来看看吧！
浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
129/365 给宝贝的第23封信：《道德经》第四章：道冲珍珠能量站
亲爱的宝贝：今天周六，我在外学习，听几位创业讲师讲授创业的相关知识，一天共4个老师讲解了7个小时。之前线上培训了40个小时，听了这么多，我还是觉得只是窥见皮毛。可见任何一个领域，都可以深入下去，有无穷无尽的细节值得研究。但是任何一件事，也可以用一句话总结。比如“道可道，非常道”创业，我理解的核心是：创立一个业务，通过调配资源，满足用户的需要。至于创立什么样的业务？调配哪些资源？满足用户什么需要？如
程序员架构师主要是做什么_程序员架构师：职责、技能与挑战绿色小猪
免费备考资料（2024年11月软考）：历年试题+视频课合集+电子讲义点击领取>>>免费刷题：2024年11月软考备考刷题点此进入>>>程序员架构师的角色定位在软件开发领域，程序员架构师是一个至关重要的角色。他们不仅需要深入理解业务需求，还要将其转化为技术上的解决方案。程序员架构师是项目中的技术领航者，负责制定和维护软件系统的整体架构，确保系统的可扩展性、可维护性和性能。他们的工作涉及从概念化到实现
Redis:缓存击穿我的程序快快跑啊缓存 redis java
缓存击穿(热点key)：部分key(被高并发访问且缓存重建业务复杂的)失效,无数请求会直接到数据库，造成巨大压力1.互斥锁：可以保证强一致性线程一：未命中之后，获取互斥锁，再查询数据库重建缓存，写入缓存，释放锁线程二：查询未命中，未获得锁(已由线程一获得)，等待一会，缓存命中互斥锁实现方式：redis中setnxkeyvalue:改变对应key的value,仅当value不存在时执行，以此来实现互
2020年最新程序员职业发展路线指南，超详细！编程流川枫 11 编程语言程序员互联网 IT 职业
【文章来源微信公众号：每天学编程】01、程序员的特性技术出身的职场人特性很明显，与做市场、业务出身的职场人区别尤其明显。IT行业中常见的一些职场角色：老板、项目经理、产品经理、需求分析师、设计师、开发工程师、运维工程师等。开发工程师具有如下特征：1、逻辑思维清晰、严谨和细腻；但是有时不容易转弯，有些程序员容易较劲、钻牛角尖。2、性格偏内向、不善于沟通、表达和交际；但是在网络聊天工具上，有些显为幽默
设计好了产品组合，获客没你想得那么难老姜观察
放眼望去，财富管理公司的综合服务已经成为大势所趋。所谓的综合服务，其实就是财富管理公司的产品组合逐渐丰富和完善。然而，在对客户进行综合服务的过程中，财富管理公司常常会面对各种问题。例如：如何评估公司是否应当开展一项服务或者产品？如何定义一项服务（产品）的考核指标？如何配置资源投入不同的产品线？以保险为例，财富管理公司经常需要考虑的问题有：我是否要导入保险业务？如何考核这项业务的发展？我应该投入多少
现在做什么副业比较赚钱？现在副业干什么挣钱？手机聊天员赚钱平台
什么副业适合晚上下班？现在很多人白天正常工作，晚上做副业，不仅可以打发无聊的时间，还可以提高收入！有些人的副业收入可能比主营业务收入高！给大家推荐一个陪聊赚米项目叭，正规陪聊项目，网易云旗下大平台，无任何费用，下方有微信二维码，可扫码了解，也可点击链接，联系我们了解：https://www.jianshu.com/p/a8b7493d9f71我长期从事人力资源工作，也认识很多下班后从事副业的人。有
「鲸灵」获数千万美元B+轮融资，旗下日日团打造团购电商新时代想想再说可以吗
小编获悉，社交电商鲸灵集团（以下简称鲸灵）已完成数千万美元B+轮融资，由启明创投领投，IDG资本联合领投，老股东跟投。鲸灵刚于7月完成数亿元B轮融资，由腾讯领投，IDG资本、险峰长青、元璟资本跟投。据小编了解，鲸灵旗下的日日团业务单日交易额已突破100万元。鲸灵创始人&CEO邬强强（花名：鬼谷）曾在阿里巴巴任职9年，曾任聚划算事业部总经理、淘宝开放平台创始人。针对本轮融资，邬强强告诉小编：“社交电
如何建设数据中台（五）——数据汇集—打破企业数据孤岛 weixin_47088026 学习记录和总结中台数据中台程序人生经验分享
数据汇集——打破企业数据孤岛要构建企业级数据中台，第一步就是将企业内部各个业务系统的数据实现互通互联，打破数据孤岛，主要通过数据汇聚和交换来实现。企业采集的数据可以是线上采集、线下数据采集、互联网数据采集、内部数据采集等。线上数据采集主要载体分为互联网和移动互联网两种，对应有系统平台、网页、H5、小程序、App等，可以采用前端或后端埋点方式采集数据。线下数据采集主要是通过硬件来采集，例如：WiFi
分布式锁和spring事务管理暴躁的鱼锁及事务分布式 spring java
最近开发一个小程序遇到一个需求需要实现分布式事务管理业务需求用户在使用小程序的过程中可以查看景点，对景点地区或者城市标记是否想去，那么需要统计一个地点被标记的人数，以及记录某个用户对某个地点是否标记为想去，用两个表存储数据，一个地点表记录改地点被标记的次数，一个用户意向表记录某个用户对某个地点是否标记为想去。由于可能有多个用户同时标记一个地点，每个用户在前端点击想去按钮之后，后台接收到请求，从数据
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
raksmart洛杉矶云服务器全面解析 rak部落服务器 raksmart洛杉矶云服务器
RAKsmart洛杉矶云服务器是一种高性能的云计算解决方案，专为满足不同业务需求而设计。以下是对RAKsmart洛杉矶云服务器的具体介绍，rak小编为您整理发布raksmart洛杉矶云服务器全面解析。1.线路选择：RAKsmart洛杉矶云服务器提供多种网络线路选项，包括大陆优化线路和CN2ONLY线路。这些线路能够提供更稳定和快速的连接速度，特别适合需要高效数据传输和低延迟的业务环境。2.性能表现
职业生涯路上，停下来调整步伐是必要的～～【19/100】墨妈翔爹
决定离辞的时候，我都没能想明白我当时是理智的作出决定，还是仅仅因为被焦虑所干扰而作出的逃避性的选择。不记得是哪天，跟朋友聊了一下当下的工作现状，和今后各自的职业规划和发展前景。然后发现自己经毕业出来7年了，却依然还处于职业生涯的底层，在我们这个小县城里领着两三千的工资，而朋友已经后来居上仅仅用了三年时间就完成了弯道超车(前四年一直在醉心于创业)，不论是工作业务能力还是薪水都已经远远的超过了我。在备
Python怎么判断两个字符串是否相等？老男孩IT教育 python 开发语言
在Python语言中，字符串是一种十分常见的数据类型，在很多业务场景下，我们需要判断两个字符串是否相等，这也是一个非常基础的操作，那么该如何实现呢?以下是详细的内容：Python中判断两个字符串是否相等有两种方法：直接比较和使用字符串方法。1、直接比较在Python中，我们可以使用==运算符来比较两个字符串是否相等。例如：str1='hello'str2='world'ifstr1==str2:p
世界上最厉害的人：婚庆老板王家二少2
我有一段做婚礼主持人的生涯。很多人都说，婚礼主持人都是在耍嘴皮子，其实，这是对婚庆人的误解。婚礼要求很严格，一个个环节巧妙勾连，容不得半点马虎。主持人只是负责仪式，相对轻松。婚礼最繁忙的当属婚庆公司老板。我的师哥师弟都是婚庆公司老板，他们一说起业务，就是滔滔不绝，击中要点。最令我赞叹的是师哥师弟们的借的功力。婚庆行业有一句行话，只有婚庆公司老板是自己的，言外之意，所有的婚庆道具，创意都是借来的。道
[面试高频问题]关于多线程的单例模式朱玥玥要每天学习 java 单例模式开发语言
单例模式什么是设计模式?设计模式可以看做为框架或者是围棋中的”棋谱”,红方当头炮,黑方马来跳.根据一些固定的套路下,能保证局势不会吃亏.在日常的程序设计中,往往有许多业务场景,根据这些场景,大佬们总结出了一些固定的套路.按照这个套路来实现代码,也不会吃亏.什么是单例模式,保证某类在程序中只有一个实例,而不会创建多份实例.单例模式具体的实现方式:可分为”懒汉模式”,”饿汉模式”.饿汉模式类加载的同时
算法笔试-编程练习-好题-05 Glen 997 大厂校招-编程集训算法动态规划双指针
【题目类型：动规+双指针】题目内容有N个基站采用链式组网，按照从左到右编码为1到N编号。已知定义“业务”概念为三元组(基站起始编号，基站结束编号，利润)，意味着需要占据基站起始编号到基站结束编号的所有基站，打通信号流，可以获得对应利润。现在外部存在多个“业务"需求待接纳，但基站使用具有排他性，也就是说一旦某一个业务占据某个基站，其他业务不可以再使用此基站。那么接纳哪些业务需求，可以使得利润最大化?
复盘赵建庄
行动后反思，AAR（AfterActionReview），是知识管理的一种工具，起源于美国陆军的作战方法，强调在每次行动后进行及时反思、总结和改进。《复盘》一书其实就是这种方法的具体应用，名字不同，然而实质相同。相比AAR这样的说法，复盘更简洁，容易被国人接受，而且，书中给出了非常详细的步骤，有较强的指导意义和实战性，AAR的六步法，说的比较简单，有人可以悟，结合实际业务演变出各种变化，大多数人可
华为云分布式缓存服务DCS与开源服务差异对比 hcinfo_18 redis使用华为云 Redis5.0 分布式缓存服务 Redis客户端
分布式缓存服务DCS提供单机、主备、集群等丰富的实例类型，满足用户高读写性能及快速数据访问的业务诉求。支持丰富的实例管理操作，帮助用户省去运维烦恼。用户可以聚焦于业务逻辑本身，而无需过多考虑部署、监控、扩容、安全、故障恢复等方面的问题。DCS基于开源Redis、Memcached向用户提供一定程度定制化的缓存服务，因此，除了拥有开源服务缓存数据库的优秀特性，DCS提供更多实用功能。一、与开源Red
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那