yoylee_web

JanusGraph -- 索引详解（janusgraph index）

原文链接： https://docs.janusgraph.org/latest/index.html

Overview

Janusgraph Index --> graph index && vertex-centric index

graph index --> composite index && mixed index 、全图索引

composite index : 索引列全使用并且等值匹配、不需要后端索引存储、支持唯一性、排序在内存中成本高
mixed index ：索引列任何字段都可以触发索引、范围查询、全文检索、地理检索等、需要后端索引存储支持、不支持唯一性、排序有索引效率高无索引也在内存中排

vertex-centric index --> janusgraph默认为每个属性添加该索引，组合索引满足最做匹配原则可使用，便于查询节点的边（节点存在很多边的情况下）

一：Extending JanusGraph Server

JanusGraph支持两种类型的索引：graph index和vertex-centric index。graph index常用于根据属性查询Vertex或Edge的场景；vertex index在图遍历场景非常高效，尤其是当Vertex有很多Edge的情况下。

二：Graph Index

Graph Index是整个图上的全局索引结构，用户可以通过属性高效查询Vertex或Edge。如下面的代码：

g.V().has('name','hercules')
g.E().has('reason', textContains('loves'))

上面的例子即为根据属性查找Vertex或Edge的实例，如果没有设置索引，上述的操作将会导致全表扫描，对大图来说是不可接受的。

JanusGraph支持两种不同的Graph Index，Composite index和Mixed Index，Compostie非常高效和快速，但只能应用对某特定的，预定义的属性key组合进行相等查询。Mixed index可用在查询任何index key的组合上并支持多条件查询，除了相等条件要依赖于后端索引存储。

这两种类型的Index都是通过JanusGraph的management操作的：

JanusGraphManagement.buildIndex(String,Class）

//此操作只是获取IndexBuilder对象，之后再由该对象通过 addKey()、buildMixedIndex()\buildCompositeIndex()\buildEdgeIndex() 创建索引

第一个参数是index的名称，第二个参数是要索引的类（如Vertex.class），name必须唯一。如果是在同一事务中新增的属性key所构成Index将会即刻生效，否则需要运行一个reindex proceudre来同步索引和数据，直到同步完成，否则索引不可用。推荐在初始化schema时同时定义索引。

注意：如果没有建索引，会进行全表扫面，此时性能非常低，可以通过配置force-index参数禁止全表扫描。

1：Composite Index

Comosite index通过一个或多个固定的key组合来获取Vertex Key或Edge，也即查询条件是在Index中固定的。

// 在graph中有事务执行时绝不能创建索引（否则可能导致死锁）

graph.tx().rollback()

mgmt = graph.openManagement()

name = mgmt.getPropertyKey('name')

age = mgmt.getPropertyKey('age')

// 构建根据name查询vertex的组合索引

mgmt.buildIndex('byNameComposite',Vertex.class).addKey(name).buildCompositeIndex()

// 构建根据name和age查询vertex的组合索引

mgmt.buildIndex('byNameAndAgeComposite',Vertex.class).addKey(name).addKey(age).buildCompositeIndex()

mgmt.commit()

//等待索引生效

mgmt.awaitGraphIndexStatus(graph,'byNameComposite').call()

mgmt.awaitGraphIndexStatus(graph,'byNameAndAgeComposite').call()

//对已有数据重新索引

mgmt = graph.openManagement()

mgmt.updateIndex(mgmt.getGraphIndex("byNameComposite"),SchemaAction.REINDEX).get()

mgmt.updateIndex(mgmt.getGraphIndex("byNameAndAgeComposite"),SchemaAction.REINDEX).get()

mgmt.commit()

需要注意的是，Composite index需要在查询条件完全匹配(必须该索引中所有字段全部用上才可以触发索引)的情况下才能触发，如上面代码，g.V().has('name', 'hercules')和g.V().has('age',30).has('name','hercules')都是可以触发索引的，但g.V().has('age',30)则不行，因并未对age建索引。g.V().has('name','hercules').has('age',inside(20,50))也不可以，因只支持精确匹配，不支持范围查询。

Index Uniqueness

Composite Index也可以作为图的属性唯一约束使用，如果composite graph index被设置为unique()，则只能存在最多一个对应的属性组合。

graph.tx().rollback()//Never create new indexes while a transaction is active

mgmt = graph.openManagement()

name = mgmt.getPropertyKey('name')

mgmt.buildIndex('byNameUnique',Vertex.class).addKey(name).unique().buildCompositeIndex()

mgmt.commit()

//Wait for the index to become available

mgmt.awaitGraphIndexStatus(graph,'byNameUnique').call()

//Reindex the existing data

mgmt = graph.openManagement()

mgmt.updateIndex(mgmt.getGraphIndex("byNameUnique"),SchemaAction.REINDEX).get()

mgmt.commit()

注意：对于设置为最终一致性的后端存储，index的一致性必须被设置为允许锁定。

2：Mixed Index

Mixed Index支持通过其中的 任意key的组合 查询Vertex或者Edge。Mix Index使用上更加灵活，而且支持范围查询等（不仅包含相等）；从另外一方面说，Mixed index效率要比Composite Index低。

与Composite key不同，Mixed Index需要配置索引后端，JanusGraph可以在一次安装中支持多个索引后端，而且每个索引后端必须使用JanusGraph中配置唯一标识：称为indexing backend name。

graph.tx().rollback()//Never create new indexes while a transaction is active

mgmt = graph.openManagement()

name = mgmt.getPropertyKey('name')

age = mgmt.getPropertyKey('age')

mgmt.buildIndex('nameAndAge',Vertex.class).addKey(name).addKey(age).buildMixedIndex("search")

mgmt.commit()

//Wait for the index to become available

mgmt.awaitGraphIndexStatus(graph,'nameAndAge').call()

//Reindex the existing data

mgmt = graph.openManagement()

mgmt.updateIndex(mgmt.getGraphIndex("nameAndAge"),SchemaAction.REINDEX).get()

mgmt.commit()

上面的代码建立了一个名为nameAndAge的索引，该索引使用name和age属性构成，并设定其索引后端为"search"，对应到配置文件中为：index.serarch.backend，如果叫solrsearch，则需要增加：index.solrsearch.backend配置。

下面展示了如果使用text search作为默认的搜索行为：

mgmt.buildIndex('nameAndAge',Vertex.class).addKey(name,Mapping.TEXT.getParameter()).addKey(age,Mapping.TEXT.getParameter()).buildMixedIndex("search")

更加详细的使用参考：Charpter21, Index Parameter and Full-Test Search

在使用上，支持范围查询和索引中任何组合查询（索引中任何字段组合都可以触发该索引），而不仅局限于“相等”查询方式：

g.V().has('name', textContains('hercules')).has('age', inside(20,50))

g.V().has('name', textContains('hercules'))

g.V().has('age', lt(50))

Mixed Index支持全文检索，范围检索，地理检索和其他方式，参考Chapter20, Search Predicates and Data Types。

注意：不像composite index，mixed index不支持唯一性。

Adding Property Keys

可以向已经存在的mixed index中新增属性，之后就可以在查询条件中使用了。

//Never create new indexes while a transaction is activegraph.tx().rollback()

mgmt = graph.openManagement()

//创建一个新的属性

location = mgmt.makePropertyKey('location').dataType(Geoshape.class).make()

nameAndAge = mgmt.getGraphIndex('nameAndAge')

//修改索引mgmt.addIndexKey(nameAndAge, location)

mgmt.commit()

//Wait for the index to become available

mgmt.awaitGraphIndexStatus(graph,'nameAndAge').call()

//Reindex the existing data

mgmt = graph.openManagement()

mgmt.updateIndex(mgmt.getGraphIndex("nameAndAge"),SchemaAction.REINDEX).get()

mgmt.commit()

如果索引是在同意事务中创建的，则在该事务中马上可以使用。如果该属性Key已经被使用，需要执行reindex procedure来保证索引中包含了所有数据，知道该过程执行完毕，否则不能使用。

Mapping Parameters

当向mixed index增加新的property key时（无论通过何种方式创建），可以指定一组参数来设置property value在后端的存储方式。参考mapping paramters overview章节。

3：Ordering

图查询的集合返回顺序可由order().by()指定，该方法包含了两个参数：

排序依据的属性名称
升降序，incr和decr

如：

g.V().has('name', textContains('hercules')).order().by('age', decr).limit(10)

返回了name属性中包含‘hercules’且以'age'降序返回的10条数据。

使用Order时需要注意：

composite graph index原生不支持对返回结果排序，数据会被先加载到内存中再进行排序，对于大数据集合来讲成本非常高
mixed graph index本身支持排序返回，但排序中要使用的property key需要提前被加到mix index中去，如果要排序的property key不是index的一部分，将会导致整个数据集合加载到内存。

4：Label Constraint

有些情况下，我们不想对图中具有某一label的所有Vertex或Edge进行索引，例如，我们只想对有GOD标签的节点进行索引，此时我们可以使用indexOnly方法表示只索引具有某一Label的Vertex和Edge。如下：

//Never create new indexes while a transaction is activegraph.tx().rollback()

mgmt = graph.openManagement()

name = mgmt.getPropertyKey('name')

god = mgmt.getVertexLabel('god')

//只索引有god这一label的顶点

mgmt.buildIndex('byNameAndLabel',Vertex.class).addKey(name).indexOnly(god).buildCompositeIndex()

mgmt.commit()

//Wait for the index to become available

mgmt.awaitGraphIndexStatus(graph,'byNameAndLabel').call()

//Reindex the existing data

mgmt = graph.openManagement()

mgmt.updateIndex(mgmt.getGraphIndex("byNameAndLabel"),SchemaAction.REINDEX).get()

mgmt.commit()

label约束对mix index也是类似的，当一个有label约束的composite index被设置为唯一时，唯一约束只应用于具有此label的vertex或edge属性上。

5：Composite Index 和 Mixed Index对比

1. comosite key应用于确切的匹配场景，composite key不需要外部索引系统且通常具有更好的性能。

作为一个例外，如果要精确匹配的值数量很小（如12个月份）或一个元素与图中很多的元素有关联，此时应使用mix index。

2. 对取范围、全文检索、位置查询这样的应用场景，应该使用mix index，而且使用mixed index可以提供order().by()的性能。

三：Vertex-centric Indexs

Vertex-centric index（顶点中心索引）是为每个vertex建立的本地索引结构，在大型graph中，每个vertex有数千条Edge，在这些vertex中遍历效率将会非常低（需要在内存中过滤符合要求的Edge）。Vertex-centric index可以通过使用本地索引结构加速遍历效率，组合索引只支持最左匹配原则

如：

h = g.V().has('name','hercules').next()

g.V(h).outE('battled').has('time', inside(10,20)).inV()

如果没有vertex-centric index，则需要便利所有的batteled边并找出记录，在边的数量庞大时效率非常低。

建立一个vertex-centric index可以加速查询：

//Never create new indexes while a transaction is activegraph.tx().rollback()

mgmt = graph.openManagement()

//找到一个property key

time = mgmt.getPropertyKey('time')

// 找到一个label

battled = mgmt.getEdgeLabel('battled')

// 创建vertex-centric index

mgmt.buildEdgeIndex(battled,'battlesByTime',Direction.BOTH,Order.decr, time)

mgmt.commit()

//Wait for the index to become available

mgmt.awaitGraphIndexStatus(graph,'battlesByTime').call()

//Reindex the existing data

mgmt = graph.openManagement()

mgmt.updateIndex(mgmt.getGraphIndex("battlesByTime"),SchemaAction.REINDEX).get()

mgmt.commit()

上面的代码对battled边根据time以降序建立了双向索引。buildEdgeIndex()方法中的第一个参数是要索引的Edge的Label，第二个参数是index的名称，第三个参数是边的方向，BOTH意味着可以使用IN/OUT，如果只设置为某一方向，可以减少一半的存储和维护成本。最后两个参数是index的排序方向，以及要索引的property key，property key可以是多个，order默认为升序（Order.ASC）。

graph.tx().rollback()//Never create new indexes while a transaction is active

mgmt = graph.openManagement()

time = mgmt.getPropertyKey('time')

rating = mgmt.makePropertyKey('rating').dataType(Double.class).make()

battled = mgmt.getEdgeLabel('battled')

mgmt.buildEdgeIndex(battled,'battlesByRatingAndTime',Direction.OUT,Order.decr, rating, time)

mgmt.commit()

//Wait for the index to become available

mgmt.awaitRelationIndexStatus(graph,'battlesByRatingAndTime','battled').call()

//Reindex the existing data

mgmt = graph.openManagement()

mgmt.updateIndex(mgmt.getRelationIndex(battled,'battlesByRatingAndTime'),SchemaAction.REINDEX).get()

mgmt.commit()

上面的代码建立了battlesByRatingAndTime索引，并以rating和time构成，需要注意构成索引的property key的顺序非常重要，查询时只能根据propety key定义的顺序查询。（最左匹配原则）

h = g.V().has('name','hercules').next()

g.V(h).outE('battled').property('rating',5.0)//Add some rating properties

1： g.V(h).outE('battled').has('rating', gt(3.0)).inV()

2： g.V(h).outE('battled').has('rating',5.0).has('time', inside(10,50)).inV()

3： g.V(h).outE('battled').has('time', inside(10,50)).inV()

对上面部分的代码，只有查询1,2是可以使用索引的，查询3使用time查询无法匹配先根据rating再根据time的index构造顺序。可以对一个label创建多个不同的索引来支持不同的遍历。JanusGraph自动选择最有效的索引，Vertex-centric仅支持相等和range/interval约束。

注意：在vertex-centirc中使用的property key必须是显式定义的且未确定的class类型（不是Object.class）才能支持排序。如果数据类型浮点型，必须使用JanusGraph的Decimal或Precision数据类型。

根据在同一事务中新建的label所创建的索引可以即刻生效，如果edge正在被使用，则需要运行reindex程序，直到该程序运行结束，否则该索引无法使用。

注意：JanusGraph自动为每个edge label的每个property key建立了vertex-centric label（是否建立了组合vertex-centric索引？），因此即使有数千个边也能高效查询。

Vertex-centric label无法加速不受约束的遍历（在所有边中遍历），这种遍历随着边的增加会变的更慢，通常这些遍历可以作为受约束遍历重写来提高性能。

四：Ordering Traversals

下面的查询使用了local和limit方法获取了遍历过程的排序子集。local（）表示只对前面元素的每一个元素进行分别操作，比如排序，是对每个节点的元素排序，不是对所有节点的所有元素排序！

h = g.V().has('name','hercules').next()

g.V(h).local(outE('battled').order().by('time', decr).limit(10)).inV().values('name')

g.V(h).local(outE('battled').has('rating',5.0).order().by('time', decr).limit(10)).values('place')

如果排序字段和排序方向与vertex-centric index一致的话，上面的查询非常高效。

第一个查询是要找到赫拉克勒斯最近战斗过的10个怪兽的名字。第二个查询是最近10次获得5星战斗的地点。在这2个查询例子中，都限定了查询结果的返回数量。

这类查询中心顶点索引也会起作用，如果排序key和定义的中心顶点索引键的排序顺序一致，battlesByTime这个索引将会对第一个查询起作用，battlesByRatingAndTime这个索引将会对第二个查询起作用。注意，battlesByRatingAndTime索引将不会对第一个查询生效，因为rating的相等查询只会对第二个查询起作用。

注意：vertex 排序查询时JanusGraph对Gremlin的扩展，要使用该功需要一段冗长的语句，而且需要_()步骤将JanusGraph转换为Gremlin管道

如果转载此博文，请附上本文链接，谢谢合作~ ：https://blog.csdn.net/csdn___lyy

如果感觉这篇文章对你有帮助，就"点赞 "或者“关注”博主，您的喜欢和关注将是我前进的最大动力！=.=

主流图数据库Neo4j的知识大全，全网最新埠渝23 数据库
1.主流图数据库对比对比了3个主流开源图数据库：Neo4j/JanusGraph和HugeGraph的一些特性，共比较了30多个指标，包括生态、功能、性能、工具链等维度。2.Cypher基本语法2.1类型Cypher支持的数据类型有：数值型、字符型、布尔型、节点、关系、路径、映射（map）和列表（list）。2.2表达式2.2.1Case表达式2.2.1.1简单的case表达式计算表达式的值，然后
在 Spark 数据导入中的一些实践细节 NebulaGraph
best-practices-import-data-spark-nebula-graph本文由合合信息大数据团队柳佳浩撰写1.前言图谱业务随着时间的推移愈发的复杂化，逐渐体现出了性能上的瓶颈：单机不足以支持更大的图谱。然而，从性能上来看，Neo4j的原生图存储有着不可替代的性能优势，这一点是之前调研的JanusGraph、Dgraph等都难以逾越的鸿沟。即使JanusGraph在OLAP上面非常
【9】知识存储铁盒薄荷糖知识图谱实战6+3天知识图谱
一、图数据库neo4jNeo4j是一个高性能的,NOSQL图形数据库，它将结构化数据存储在网络上而不是表中。它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎。单节点的服务器可承载上亿级的节点和关系，单节点性能不够时也可进行分布式集群部署。Neo4j有自己的后端存储，不必如同JanusGraph等一样还要依赖另外的数据库存储。Neo4j在每个节点中存储了每个边的指针，因而遍历时效
JanusGraph简介娃娃学软件
JanusGraph的优点JanusGraph支持对大图(单机往往难以处理的大图)进行实时的分析和遍历。主要有以下优点：JanusGraph可以通过扩展集群中的机器数量来进行弹性的扩展，从而能够实现对非常大的图数据处理。JanusGraph支持对图的高并发处理以及事务处理，并且能力能够随着机器的扩展而弹性扩展。JanusGraph支持Hadoop框架，并能够利用Hadoop对图进行大批量的处理和分
图结构选型：Gephi 、 Cytoscape # ArangoDB、OrientDB、JanusGraph；弃nebula因其explorer收费； ssh X11Forward ziix 服务器 linux 运维
图结构选型图可视化工具图结构可视化、分析（开源、完全免费、重型PC软件）：Gephi、Cytoscape还有另外三个等待确定：Graphexp、KeyLines、Linkurious支持以上图可视化工具的图数据库图数据库（开源、完全免费、支持可视化工具Gephi或Cytoscape）：ArangoDB、OrientDB、JanusGraph丢弃的：弃Neo4j，因此专业版收费；弃AmazonNep
在CentOS7下基础neo4j搭建 King_Frank
对于neo4j也是个小白，在搭建过程中查了很多资料，将可以解决问题的文章链接引用在本文中。如出现侵权，请即时联系，我将文章进行删除。本次主要是想免费分享给大家的是neo4j的包。1、版本注意点测试通过是CentOS8+neo4j-community-3.5.6-unix.tar.gz与jdk-8u161-linux-x64.tar.gz2、neo4j、JanusGraph、hugugraph的对比
JanusGraph HBase存储结构娃娃学软件
目的JanusGraph是目前使用率较高的开源图数据库。它的架构如下图：JanusGraph架构从图上我们可以看到JanusGraph具备如下特点：1.提供OLTP图遍历查询功能。2.提供OLAP图计算分析功能。3.图存储数据的事务管理。4.可以兼容多种三方存储(Cassandra,HBase等)。5.可以兼容多种三方索引(Elasticsearch,Solr等)。JanusGraphHBase存
2018-11-23 graph图数据库概览,经过一个星期的Demo终于看懂了这篇文章 Albert陈凯
20180818图数据库概览20180818图数据库概览朱金华朱金华1.总体趋势KnowledgeBaseofRelationalandNoSQLDatabaseManagementSystemsdb-engines.com根据DB-Engines的数据库DB-Engines排名，图数据库一骑绝尘，图数据库2018-8的最新排名如下Neo4j仍是最流行的图数据库，图中JanusGraph的排名并不
JanusGraph---Transaction Log zlcook
事务日志记录事务日志tx=graph.buildTransaction().logIdentifier('addedPerson').start()u=tx.addVertex(label,'human')u.property('name','proteros')u.property('age',36)tx.commit()添加事务日志，使用addedPerson标识。事务中改变都会被记录到用户日
GitHub Action + ACK，图解Janusgraph系列-并发安全 m0_60707579 程序员 github rust python 后端
开箱即用：GitHubAction是SaaS化托管服务，可通过申明指定在GitHubVM或者容器内部执行任务，保障业务高峰时期的弹性扩容。同时，也支持添加您自主托管在云上或者IDC的机器来执行任务，定制任务执行的环境。灵活便捷：支持Linux、macOS、Windows多平台，虚拟机及容器运行环境。支持Node.js、Python、Java、Ruby、PHP、Go、Rust、.NET等多语言和框架
Apache Atlas数据治理开源项目源代码解析 tomalun 大数据数据治理元数据管理大数据
ApacheAtlas版本号：2.0.0从官方网站下载ApacheAtlas2.0.0版本源代码，用开发工具（如IntelliJIDEA）打开。根目录结构一、3party-licenses第三方组件许可，可以看出Atlas主要用到的第三方技术组件，绝大部分是前端技术组件，janusgraph和titan是图数据库组件，JanusGraph是Titan的继承者，老版本用的是Titan，新版本是用的J
janusGraph gremlin 命令小记 yeah青没素
命令从两方面记录，一个是graph浏览相关命令，一个是graphManagement相关。0.1打开图graphgraph=JanusGraphFactory.open('conf/gremlin-server/janusgraph-hbase-es.properties');//参数是配置文件路径，具体配置可参考官方文档（配置存储后端，如hbase）。1.1打开Managementmgmt=gr
Chapter 9. ConfiguredGraphFactory 水他
server能被配置ConfiguredGraphFactory。ConfiguredGraphFactory是一个图的访问点，类似于JanusGraphFactory。这些factories提供方法动态管理图。9.1总览JanusGraphFactory是一个提供访问点到你的图的class，通过你每次访问图提供一个配置object。ConfiguredGraphFactory提供是一个提供访问点
janusgraph 完整使用测试，定义vertex、edge，插入数据，更改schema，变更数据，及验证水他
完整过程1.观察数据，并开发一个初始化schema拿到数据集观察样例数据指定模型2.在janus里定义schema3.importdataand遍历图去确定数据模型的缺点4.在janus修改schema5.变更数据适配新schema6.确认数据模型可以回答我们的业务问题1.数据模型原始数据样例数据抽象字段：concertpieceorchestracomposerconductorsoloist合
janusGraph踩坑记录 yeah青没素
PS：希望可以帮助大家踩坑，如果大家知道文中待回答的问题答案，欢迎留言，我会尽快试验并更新，为大家服务。一问题：使用jar包连接JanusGraph会挂掉，报连不上远程主机。回答：待回答二问题：查询节点或节点数量时出现WARNorg.janusgraph.graphdb.transaction.StandardJanusGraphTx-Queryrequiresiteratingoverallve
janusgraph 默认server使用手记水他
启动server（withCassandra/ES）janusgraph-0.3.0-hadoop2bin/janusgraph.shstartForkingCassandra...Running`nodetoolstatusthrift`.OK(returnedexitstatus0andprintedstring"running").ForkingElasticsearch...Connect
知识图谱—知识存储—neo4j基本命令知然xu 知识图谱
neo4j是高性能的NoSQL图数据库，是目前使用率最高的图数据库，它拥有活跃的社区，而且系统本身的查询效率高，但唯一的不足就是不支持准分布式，相反，OrientDB和JanusGraph支持分布式，通常来讲对于10亿节点一下规模的图谱来说Neo4j已经足够了。一、Neo4j的安装首先需要到点击打开链接下载neo4j，由于我的主机是ubutun故下载的是linux版本的neo4j终端命令跳到目录n
TinkerPop SDK连接JanusGraph配置 cg_Amaz1ng java spring spring boot Gremlin 图数据库
importstaticorg.apache.tinkerpop.gremlin.driver.ser.GraphBinaryMessageSerializerV1.TOKEN_SERIALIZE_RESULT_TO_STRING;importjava.util.HashMap;importjava.util.Map;importorg.apache.tinkerpop.gremlin.drive
删库跑路 yeah青没素
neo4j:MATCH(n)OPTIONALMATCH(n)-[r]-()DELETEn,res：curl-XDELETEhttp://localhost:9200/*JanusGraph:graph.close()JanusGraphFactory.drop(graph)
JanusGraph基于Spark on yarn 的OLAP wq3435
使用JanusGraph的OLAP记录本文主要描述在windows的idea中使用JanusGraph的sparkonyarn任务分析，主要用于学习和交流。环境配置：19个RegionServer组成的HBase集群。每个节点由7块磁盘组成每个节点2个物理CPU，逻辑CPU核数40核对于普通的查询例如：g.V().count()对于图库中点数量少的情况可以使用，对于量大的请款已经无法满足，不是慢而
B.Index 01.Indexing for Better Performance 索引提高janusgraph性能水他
索引优化性能janusgraph支持两种不同的索引方式来加速query过程：graphindexes和vertex-centricindexes。大多数graphquery启动一个指定属性的遍历检索顶点和边的集合，graphindexes在大图中让这些指定属性的全局检索更有效率。vertex-centricindexes加速graph中遍历需求，特别是遍历的顶点有非常多事件边的场景。GraphIn
业界内主流图数据库调研 Timmer丿数据库 neo4j
调研结果数据库Neo4jTigerGraphOrientDBJanusGraph存储原生图（高）原生图（高）非图，空间浪费比较严重非图查询CypherGSQLSqlGramiln分布式支持Ha不支持分布式存储支持(企业级可扩展)支持支持，依赖Cassandra，Hbase等索引依赖es等，和大数据系统结合紧密，维护成本高节点数亿级亿级亿级亿级费用单机免费，集群10万美元一年（仅供参考）付费免费免费
数据库介绍-图数据库 zzz_979 数据库
文章目录图数据库Neo4jAmazonNeptuneJanusGraphTigerGraphArangoDB知识图谱图数据库图数据库源起欧拉和图理论，也可称为面向/基于图的数据库，对应的英文是GraphDatabase。图数据库的基本含义是以“图”这种数据结构存储和查询数据，而不是存储图片的数据库。它的数据模型主要是以节点和关系（边）来体现，也可处理键值对。它的优点是快速解决复杂的关系问题。图具有
HBase作为JanusGraph图数据库存储娃娃学软件
目的JanusGraph作为一个分布式的图数据库，支持很多的数据库作为它的图数据存储介质。这里将介绍运用HBase作为JanusGraph的存储数据库。JanusGraph&HBase优点能够很好的和ApacheHadoop生态圈进行融合。对强一致性有很好的支持。通过机器的扩容能够使得存储得到线性的扩展。严格的读写事务控制。运行状态参数可以通过JMX导出。都具备Apache2许可证。配置在配置文件
JanusGraph基础6：ConfiguredGraphFactory配置工厂凌冰_lonny
可以将JanusGraphServer配置为使用ConfiguredGraphFactory。ConfiguredGraphFactory是对图形的访问点，类似于JanusGraphFactory。这些图工厂提供了用于动态管理服务器上托管的图的方法。总览JanusGraphFactory类提供了一个图的访问点，每次你访问图的时候它会创建一个配置好的对象。ConfiguredGraphFactory
BIGO 的数据管理与应用实践数据库知识图谱
本文首发于NebulaGraphCommunity公众号本文整理自BIGO在nMeetp上的主题分享，主要介绍BIGO过去一年在数据管理建设方面的理解和探索。而BIGO数据管理的核心重点在于元数据平台的建设，用以支撑上层数据管理和建设应用，包括数据地图、数据建模、数据治理和权限管理等等。本文主要围绕以下五个方向展开：OneMeta基础建设；图引擎：Nebula替换JanusGraph数据资产平台应
图数据库选型对比 shinelord明大数据数据库大数据
1、简介属性图数据库，简称图数据库。图数据库完全和知识图谱契合，从底层的存储模型到支持的查询语言，甚至相关的概念都完全匹配。它们就是天造地设的一对，图数据库是知识图谱存储的首选。2、常见的图数据库常见的图数据库包括：JanusGraph、Neo4j、Dgraph、NebulaGraph、HugeGraph、OrientDB、ArangoDB、TigerGraph等。下面列举，主流和推荐的几款图数据
janusgraph安装部署苏苏JS
1.安装和部署1.下载janusgraph-0.3.2-hadoop2包，上传到/opt目录下，之后解压sudounzip~/janusgraph-0.3.2-hadoop2.zip2.进入目录，因为es不能用root启动，故要创建新用户，用新用户启动es；（1）cd/janusgraph-0.3.2-hadoop2(2)创建elsearch用户组及elsearch用户groupaddelsear
使用gremlin语句为janusgraph添加CompositeIndex索引 yeah青没素
janusGraph图中添加索引可以很大幅度地提高检索图的速度。建议在新建schema时就为属性建立索引，否则，如果图中有旧数据，再建立索引的话就需要为该索引执行重新索引操作。菌子试着做了几次，都没有成功，索引状态一直是installed无法装变为可用状态。关于索引的生命周期可以看下面的图片。在janusgraph中，如果没有添加索引的话，查询节点g.V().has('id','001a5a67-
（一）atlas源码：源码架构 1994_老叶
基本信息AparcheAtlas是Hadoop数据治理与元数据框架，对元数据进行采集分类，提供高效的查询，还支持血缘关系的查询代码模块介绍根据架构图，我们从下至上介绍，我个人主要类比三层模型数据库层（有点像DAO层）由上面的图我们知道atlas数据存储模块使用的图数据库--janusgraph,而下图中graphdb的代码模块就是atlas对于这部分的封装,首先需要知道的一点，在这个模块，我个人觉
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &