GeoMesa Java API-写入与查询数据

1 写入数据

GeoMesa作为空间大数据处理框架,本身是不存储数据的。数据存储依赖于底层的分布式数据库,如HBase,Accumulo等。GeoMesa为了同时支持多种数据库,提供了一个抽象的接口,屏蔽不同数据库操作方法的差异,使用户用一种统一的方式存储和查询数据。来看下面这GeoMesa存储架构图:

sampleIngestArch.png

从这张图中可以看出,无论采用何种方式写入数据,我们都不需要直接操作数据库,而只需按照GeoTools或GeoMesa的接口,规范好要存储的数据,提交给GeoMesa处理即可。GeoMesa会自动为我们完成创建元数据、创建索引、存储数据等一系列过程。

GeoTools 是英国利兹大学(University of Leeds)的James Macgll 从1996 年开始研发的一个操作和显示地图的开源Java 代码库,提供了一系列符合规范的操作地理空间数据的方法,可以用它来实现一个地理信息系统。GeoTools库在开发时执行OGC规范。

GeoTools提供了许多用于表示地理空间数据的接口,可以用他们来定义需要存储的数据:

DataStore

DataStore是数据的核心访问模型,存储了数据集的名称、数据结构与类型、数据访问源等信息,类似一种数据元信息的存储集合,用于定义和描述数据的基本信息。

SimpleFeatureType

SimpleFeatureType即简单要素类型,用于定义数据类型,类似SQL语句中create table时定义表字段时所指定的信息。常用一种特殊格式的字符串表示,如:

tpList:String,startTime:Date:default=true,startPoint:Point:srid=4326:default=true

创建SimpleFeatureType时,需要使用GeoMesa提供的org.locationtech.geomesa.utils.interop.SimpleFeatureTypes类,而不是直接使用Geotools的DataUtilities创建,目的是为了支持更多的数据类型。

sft = SimpleFeatureTypes.createType(getTypeName(), attributes.toString());

SimpleFeatureType在DataStore中被称为Schema,使用dataStore.createSchema(sft)函数在DataStore中创建Schema。

SimpleFeature

SimpleFeature即简单要素,用于定义具体的数据。可以使用Geotools提供的SimpleFeatureBuilder类创建,只需要按照先前定义的SimpleFeatureType,依次传入相应类型的数据,最后设置Feature的ID即可,如:

SimpleFeatureBuilder builder = new SimpleFeatureBuilder(getSimpleFeatureType());
builder.set("tpList", ptListString);
builder.set("startTime", new Date(Long.valueOf(startTime)*1000));
builder.set("startPoint", "POINT (" + startPointY + " " + startPointX + ")");
SimpleFeature feature = builder.buildFeature(id);

其中,空间数据可以用WKT(well-known-text)格式的字符串来表示。

写入

创建好SimpleFeature后,就可以开始向数据库中写入数据了。
使用Geotools提供的FeatureWriter执行写入操作,具体代码如下:

FeatureWriter writer = datastore.getFeatureWriterAppend(sft.getTypeName(), Transaction.AUTO_COMMIT)
for (SimpleFeature feature : features) {
    SimpleFeature toWrite = writer.next();
    // copy attributes
    toWrite.setAttributes(feature.getAttributes());
    // if you want to set the feature ID, you have to cast to an implementation class
    // and add the USE_PROVIDED_FID hint to the user data
     ((FeatureIdImpl) toWrite.getIdentifier()).setID(feature.getID());
     toWrite.getUserData().put(Hints.USE_PROVIDED_FID, Boolean.TRUE);

    // make sure to copy the user data, if there is any
    toWrite.getUserData().putAll(feature.getUserData());

    // write the feature
    writer.write();
}

完整代码:官方教程

2 查询数据

GeoMesa同样使用了GeoTools工具,作为查询操作的接口,查询时的过程图如下:

sampleQueryArch.png

使用GeoTools进行查询的基本流程如下:
① 获取要查询的要素名称,即写入时SimpleFeatureType的Name
② 对想要查询的字段,编写相应的查询条件,并创建Filter类型的对象
③ 创建Query对象,将上一步中所有查询条件加入其中
④ 执行查询,获得查询结果

其中,查询条件可以使用GeoTools提供的CQL(GeoTools’ Contextual Query Language)或ECQL语句编写,并直接转换为Filter对象,例如:

Filter result = CQL.toFilter("ATTR1 < 10 AND ATTR2 < 2 OR ATTR3 > 10" );
Filter result = CQL.toFilter( "ATTR1 AFTER 2006-11-30T01:30:00Z/2006-12-31T01:30:00Z" );
Filter result = CQL.toFilter( "CONTAINS(ATTR1, POINT(1 2))" );
Filter result = CQL.toFilter( "BBOX(ATTR1, 10,20,30,40)" );
Filter result = CQL.toFilter( "DWITHIN(ATTR1, POINT(1 2), 10, kilometers)" );

完整CQL教程:官方文档

执行查询时,使用FeatureReader完成查询操作,代码如下:

List queryFeatureList = new ArrayList<>();
FeatureReader reader = datastore.getFeatureReader(query, Transaction.AUTO_COMMIT) 
int n = 0;
while(reader.hasNext()){
    SimpleFeature feature=reader.next();
    queryFeatureList.add(feature);
    n++;
}
System.out.println();
System.out.println("Returned"+n+"totalfeatures");

完整代码:官方教程

几个常用查询条件

设置最大返回条目:

Query query = new Query(typeName, ECQL.toFilter(queryCQL));
query.setMaxFeatures(Integer.parseInt(maxView));

设置排序:

Query query = new Query(typeName, ECQL.toFilter(queryCQL));
FilterFactoryImpl ff = new FilterFactoryImpl();
query.setSortBy(new SortBy[]{new SortByImpl(ff.property("startTime"), SortOrder.ASCENDING)});

统计查询-查总数

Query query = new Query(typeName);
query.getHints().put(QueryHints.STATS_STRING(), "Count()");

聚合查询-GroupBy,查每个分组的总数

Query query = new Query(typeName);
query.getHints().put(QueryHints.STATS_STRING(), "GroupBy(\"carID\",Count())");

统计查询-查最大最小值

Query query = new Query(typeName);
query.getHints().put(QueryHints.STATS_STRING(), "MinMax(\"startTime\")");

更多类型的统计/聚合查询:官方文档

你可能感兴趣的:(GeoMesa Java API-写入与查询数据)