CYZERO

15个nosql数据库

1、MongoDB

介绍

MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。主要解决的是海量数据的访问效率问题，为WEB应用提供可扩展的高性能数据存储解决方案。当数据量达到50GB以上的时候，MongoDB的数据库访问速度是MySQL的10倍以上。MongoDB的并发读写效率不是特别出色，根据官方提供的性能测试表明，大约每秒可以处理0.5万~1.5万次读写请求。MongoDB还自带了一个出色的分布式文件系统GridFS，可以支持海量的数据存储。

MongoDB也有一个Ruby的项目MongoMapper，是模仿Merb的DataMapper编写的MongoDB接口，使用起来非常简单，几乎和DataMapper一模一样，功能非常强大。

MongoDB是一个介于关系数据库和非关系数据库之间的产品，是非关系数据库当中功能最丰富，最像关系数据库的。他支持的数据结构非常松散，是类似json的bjson格式，因此可以存储比较复杂的数据类型。Mongo最大的特点是他支持的查询语言非常强大，其语法有点类似于面向对象的查询语言，几乎可以实现类似关系数据库单表查询的绝大部分功能，而且还支持对数据建立索引。

所谓“面向集合”（Collenction-Orented），意思是数据被分组存储在数据集中，被称为一个集合（Collenction)。每个集合在数据库中都有一个唯一的标识名，并且可以包含无限数目的文档。集合的概念类似关系型数据库（RDBMS）里的表（table），不同的是它不需要定义任何模式（schema)。
模式自由（schema-free)，意味着对于存储在mongodb数据库中的文件，我们不需要知道它的任何结构定义。如果需要的话，你完全可以把不同结构的文件存储在同一个数据库里。
存储在集合中的文档，被存储为键-值对的形式。键用于唯一标识一个文档，为字符串类型，而值则可以是各中复杂的文件类型。我们称这种存储形式为BSON（Binary Serialized dOcument Format）。

MongoDB服务端可运行在Linux、Windows或OS X平台，支持32位和64位应用，默认端口为27017。推荐运行在64位平台，因为MongoDB在32位模式运行时支持的最大文件尺寸为2GB。

MongoDB把数据存储在文件中（默认路径为：/data/db），为提高效率使用内存映射文件进行管理。

特性

它的特点是高性能、易部署、易使用，存储数据非常方便。主要功能特性有：

面向集合存储，易存储对象类型的数据。
模式自由。
支持动态查询。　　
支持完全索引，包含内部对象。　　
支持查询。　　
支持复制和故障恢复。　　
使用高效的二进制数据存储，包括大型对象（如视频等）。　　
自动处理碎片，以支持云计算层次的扩展性。　　
支持RUBY，PYTHON，JAVA，C++，PHP,C#等多种语言。　　
文件存储格式为BSON（一种JSON的扩展）。　　
可通过网络访问。

官方网站

http://www.mongodb.org/

2、CouchDB

介绍

Apache CouchDB 是一个面向文档的数据库管理系统。它提供以 JSON 作为数据格式的 REST 接口来对其进行操作，并可以通过视图来操纵文档的组织和呈现。 CouchDB 是 Apache 基金会的顶级开源项目。

CouchDB是用Erlang开发的面向文档的数据库系统，其数据存储方式类似Lucene的Index文件格式。CouchDB最大的意义在于它是一个面向Web应用的新一代存储系统，事实上，CouchDB的口号就是：下一代的Web应用存储系统。

特性

主要功能特性有：

CouchDB是分布式的数据库，他可以把存储系统分布到n台物理的节点上面，并且很好的协调和同步节点之间的数据读写一致性。这当然也得以于Erlang无与伦比的并发特性才能做到。对于基于web的大规模应用文档应用，然的分布式可以让它不必像传统的关系数据库那样分库拆表，在应用代码层进行大量的改动。
CouchDB是面向文档的数据库，存储半结构化的数据，比较类似lucene的index结构，特别适合存储文档，因此很适合CMS，电话本，地址本等应用，在这些应用场合，文档数据库要比关系数据库更加方便，性能更好。　
CouchDB支持REST API，可以让用户使用JavaScript来操作CouchDB数据库，也可以用JavaScript编写查询语句，我们可以想像一下，用AJAX技术结合CouchDB开发出来的CMS系统会是多么的简单和方便。其实CouchDB只是Erlang应用的冰山一角，在最近几年，基于Erlang的应用也得到的蓬勃的发展，特别是在基于web的大规模，分布式应用领域，几乎都是Erlang的优势项目。

官方网站

http://couchdb.apache.org/

3、Hbase

介绍

HBase是一个分布式的、面向列的开源数据库，该技术来源于Chang et al所撰写的Google论文“Bigtable：一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统（File System）所提供的分布式数据存储一样，HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库.另一个不同的是HBase基于列的而不是基于行的模式。

HBase – Hadoop Database，是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。　　HBase是Google Bigtable的开源实现，类似Google Bigtable利用GFS作为其文件存储系统，HBase利用Hadoop HDFS作为其文件存储系统；Google运行MapReduce来处理Bigtable中的海量数据，HBase同样利用Hadoop MapReduce来处理HBase中的海量数据；Google Bigtable利用 Chubby作为协同服务，HBase利用Zookeeper作为对应。

HBase访问接口

Native Java API，最常规和高效的访问方式，适合Hadoop MapReduce Job并行批处理HBase表数据
HBase Shell，HBase的命令行工具，最简单的接口，适合HBase管理使用
Thrift Gateway，利用Thrift序列化技术，支持C++，PHP，Python等多种语言，适合其他异构系统在线访问HBase表数据
REST Gateway，支持REST 风格的Http API访问HBase, 解除了语言限制
Pig，可以使用Pig Latin流式编程语言来操作HBase中的数据，和Hive类似，本质最终也是编译成MapReduce Job来处理HBase表数据，适合做数据统计
Hive，当前Hive的Release版本尚没有加入对HBase的支持，但在下一个版本Hive 0.7.0中将会支持HBase，可以使用类似SQL语言来访问HBase

特性

主要功能特性有：

支持数十亿行X上百万列

采用分布式架构 Map/reduce

对实时查询进行优化

高性能 Thrift网关

通过在server端扫描及过滤实现对查询操作预判

支持 XML, Protobuf, 和binary的HTTP

基于 Jruby（ JIRB）的shell

对配置改变和较小的升级都会重新回滚

不会出现单点故障

堪比MySQL的随机访问性能

官方网站

http://hbase.apache.org/

4、cassandra

介绍

Cassandra是一个混合型的非关系的数据库，类似于Google的BigTable。其主要功能比Dynomite（分布式的Key-Value存储系统）更丰富，但支持度却不如文档存储MongoDB（介于关系数据库和非关系数据库之间的开源产品，是非关系数据库当中功能最丰富，最像关系数据库的。支持的数据结构非常松散，是类似json的bjson格式，因此可以存储比较复杂的数据类型。）Cassandra最初由Facebook开发，后转变成了开源项目。它是一个网络社交云计算方面理想的数据库。以Amazon专有的完全分布式的Dynamo为基础，结合了Google BigTable基于列族（Column Family）的数据模型。P2P去中心化的存储。很多方面都可以称之为Dynamo 2.0。

特性

和其他数据库比较，有几个突出特点：

模式灵活：使用Cassandra，像文档存储，你不必提前解决记录中的字段。你可以在系统运行时随意的添加或移除字段。这是一个惊人的效率提升，特别是在大型部署上。
真正的可扩展性：Cassandra是纯粹意义上的水平扩展。为给集群添加更多容量，可以指向另一台电脑。你不必重启任何进程，改变应用查询，或手动迁移任何数据。
多数据中心识别：你可以调整你的节点布局来避免某一个数据中心起火，一个备用的数据中心将至少有每条记录的完全复制。

一些使Cassandra提高竞争力的其他功能：

范围查询：如果你不喜欢全部的键值查询，则可以设置键的范围来查询。
列表数据结构：在混合模式可以将超级列添加到5维。对于每个用户的索引，这是非常方便的。
分布式写操作：有可以在任何地方任何时间集中读或写任何数据。并且不会有任何单点失败。

官方网站

http://cassandra.apache.org/

5、Hypertable

介绍

Hypertable是一个开源、高性能、可伸缩的数据库，它采用与Google的Bigtable相似的模型。在过去数年中，Google为在 PC集群上运行的可伸缩计算基础设施设计建造了三个关键部分。第一个关键的基础设施是Google File System（GFS），这是一个高可用的文件系统，提供了一个全局的命名空间。它通过跨机器（和跨机架）的文件数据复制来达到高可用性，并因此免受传统文件存储系统无法避免的许多失败的影响，比如电源、内存和网络端口等失败。第二个基础设施是名为Map-Reduce的计算框架，它与GFS紧密协作，帮助处理收集到的海量数据。第三个基础设施是Bigtable，它是传统数据库的替代。Bigtable让你可以通过一些主键来组织海量数据，并实现高效的查询。Hypertable是Bigtable的一个开源实现，并且根据我们的想法进行了一些改进。

特性

主要功能特点：

负载均衡的处理

版本控制和一致性

可靠性

分布为多个节点

官方网站

http://hypertable.org/

6、Redis

介绍

redis是一个key-value存储系统。和Memcached类似，它支持存储的value类型相对更多，包括string(字符串)、list(链表)、set(集合)和zset(有序集合)。这些数据类型都支持push/pop、add/remove及取交集并集和差集及更丰富的操作，而且这些操作都是原子性的。在此基础上，redis支持各种不同方式的排序。与memcached一样，为了保证效率，数据都是缓存在内存中。区别的是redis会周期性的把更新的数据写入磁盘或者把修改操作写入追加的记录文件，并且在此基础上实现了master-slave(主从)同步。

性能测试结果：

SET操作每秒钟 110000 次，GET操作每秒钟 81000 次，服务器配置如下：

Linux 2.6, Xeon X3320 2.5Ghz.

stackoverflow 网站使用 Redis 做为缓存服务器。

特点

主要功能特点：

安全性

主从复制

运行异常快

支持 sets（同时也支持 union/diff/inter）

支持列表（同时也支持队列；阻塞式 pop操作）

支持哈希表（带有多个域的对象）

支持排序 sets（高得分表，适用于范围查询）

Redis支持事务

支持将数据设置成过期数据（类似快速缓冲区设计）

Pub/Sub允许用户实现消息机制

官方网站

http://redis.io/

7、Tokyo Cabinet/Tokyo Tyant

介绍

Tokyo Cabinet（TC）和Tokyo Tyrant（TT）的开发者是日本人Mikio Hirabayashi，主要用于日本最大的SNS网站mixi.jp。TC出现的时间最早，现在已经是一个非常成熟的项目，也是Key-Value数据库领域最大的热点，现在广泛应用于网站。TC是一个高性能的存储引擎，而TT提供了多线程高并发服务器，性能也非常出色，每秒可以处理4万~5万次读写操作。

TC除了支持Key-Value存储之外，还支持Hashtable数据类型，因此很像一个简单的数据库表，并且还支持基于Column的条件查询、分页查询和排序功能，基本上相当于支持单表的基础查询功能，所以可以简单地替代关系数据库的很多操作，这也是TC受到大家欢迎的主要原因之一。有一个Ruby项目miyazakiresistance将TT的Hashtable的操作封装成和ActiveRecord一样的操作，用起来非常高效。

特性

TC/TT在Mixi的实际应用当中，存储了2000万条以上的数据，同时支撑了上万个并发连接，是一个久经考验的项目。TC在保证了极高的并发读写性能的同时，还具有可靠的数据持久化机制，同时还支持类似关系数据库表结构的Hashtable以及简单的条件、分页和排序操作，是一个很优越的NoSQL数据库。

TC的主要缺点是，在数据量达到上亿级别以后，并发写数据性能会大幅度下降，开发人员发现在TC里面插入1.6亿条2KB~20KB数据的时候，写入性能开始急剧下降。即当数据量达到上亿条的时候，TC性能便开始大幅度下降，从TC作者自己提供的Mixi数据来看，至少上千万条数据量的时候还没有遇到这么明显的写入性能瓶颈。

官方网站

http://fallabs.com/tokyocabinet/

8、Flare

介绍

TC是日本第一大SNS网站mixi.jp开发的，而Flare是日本第二大SNS网站green.jp开发的。简单地说，Flare就是给TC添加了scale（可扩展）功能。它替换了TT部分，自己另外给TC写了网络服务器。Flare的主要特点就是支持scale能力，它在网络服务端之前添加了一个Node Server，用来管理后端的多个服务器节点，因此可以动态添加数据库服务节点、删除服务器节点，也支持Failover。如果你的使用场景必须让TC可以scale，那么可以考虑Flare。

flare唯一的缺点就是他只支持memcached协议，因此当你使用flare的时候，就不能使用TC的table数据结构了，只能使用TC的key-value数据结构存储。

特性

没找到相关的介绍。

官方网站

http://flare.prefuse.org/

9、Berkeley DB

介绍

Berkeley DB (DB)是一个高性能的，嵌入数据库编程库，和C语言，C++，Java，Perl，Python，PHP，Tcl以及其他很多语言都有绑定。Berkeley DB可以保存任意类型的键/值对，而且可以为一个键保存多个数据。Berkeley DB可以支持数千的并发线程同时操作数据库，支持最大256TB的数据，广泛用于各种操作系统包括大多数Unix类操作系统和Windows操作系统以及实时操作系统。

Berkeley DB最初开发的目的是以新的HASH访问算法来代替旧的hsearch函数和大量的dbm实现（如AT&T的dbm，Berkeley的 ndbm，GNU项目的gdbm），Berkeley DB的第一个发行版在1991年出现，当时还包含了B+树数据访问算法。在1992年，BSD UNIX第4.4发行版中包含了Berkeley DB1.85版。基本上认为这是Berkeley DB的第一个正式版。在1996年中期，Sleepycat软件公司成立，提供对Berkeley DB的商业支持。在这以后，Berkeley DB得到了广泛的应用，成为一款独树一帜的嵌入式数据库系统。2006年Sleepycat公司被Oracle 公司收购，Berkeley DB成为Oracle数据库家族的一员，Sleepycat原有开发者继续在Oracle开发Berkeley DB，Oracle继续原来的授权方式并且加大了对Berkeley DB的开发力度，继续提升了Berkeley DB在软件行业的声誉。Berkeley DB的当前最新发行版本是4.7.25。

特性

主要特点：

访问速度快

省硬盘空间

官方网站

http://www.oracle.com/us/products/database/overview/index.html?origref=http://www.oschina.net/p/berkeley+db

10、memcachedb

介绍

MemcacheDB是一个分布式、key-value形式的持久存储系统。它不是一个缓存组件，而是一个基于对象存取的、可靠的、快速的持久存储引擎。协议跟memcache一致（不完整），所以很多memcached客户端都可以跟它连接。MemcacheDB采用Berkeley DB作为持久存储组件，故很多Berkeley DB的特性的他都支持。

特性

写速度：从本地服务器通过memcache客户端（libmemcache）set2亿条16字节长的key，10字节长的Value的记录，耗时 16572秒，平均速度12000条记录/秒。　　

读速度：从本地服务器通过memcache客户端（libmemcache）get100万条16字节长的key，10字节长的Value的记录，耗时103秒，平均速度10000条记录/秒。　　·支持的memcache命令

官方网站

http://memcachedb.org/

11、Memlink

介绍

Memlink 是天涯社区开发的一个高性能、持久化、分布式的Key-list/queue数据引擎。正如名称中的memlink所示，所有数据都建构在内存中，保证了系统的高性能 (大约是redis几倍)，同时使用了redo-log技术保证数据的持久化。Memlink还支持主从复制、读写分离、List过滤操作等功能。

与Memcached不同的是，它的value是一个list/queue。并且提供了诸如持久化，分布式的功能。听起来有点像Redis，但它号称比Redis更好，在很多Redis做得还不好的地方进行了改进和完善。提供的客户端开发包包括 c,python,php,java 四种语言。

特性

特点：

内存数据引擎，性能极为高效
List块链结构，精简内存，优化查找效率
Node数据项可定义，支持多种过滤操作
支持redo-log，数据持久化，非Cache模式
分布式，主从同步

官方网站

http://code.google.com/p/memlink/

12、db4o

介绍

“利用表格存储对象，就像是将汽车开回家，然后拆成零件放进车库里，早晨可以再把汽车装配起来。但是人们不禁要问，这是不是泊车的最有效的方法呢。” – Esther Dyson 　　db4o 是一个开源的纯面向对象数据库引擎，对于 Java 与 .NET 开发者来说都是一个简单易用的对象持久化工具，使用简单。同时，db4o 已经被第三方验证为具有优秀性能的面向对象数据库，下面的基准测试图对 db4o 和一些传统的持久方案进行了比较。db4o 在这次比较中排名第二，仅仅落后于JDBC。通过图 1 的基准测试结果，值得我们细细品味的是采用 Hibernate/HSQLDB 的方案和 JDBC/HSQLDB 的方案在性能方面有着显著差距，这也证实了业界对 Hibernate 的担忧。而 db4o 的优异性能，让我们相信：更 OO 并不一定会牺牲性能。

同时，db4o 的一个特点就是无需 DBA 的管理，占用资源很小，这很适合嵌入式应用以及 Cache 应用，所以自从 db4o 发布以来，迅速吸引了大批用户将 db4o 用于各种各样的嵌入式系统，包括流动软件、医疗设备和实时控制系统。　　db4o 由来自加州硅谷的开源数据库公司 db4objects 开发并负责商业运营和支持。db4o 是基于 GPL 协议。db4objects 于 2004 年在 CEO Christof Wittig 的领导下组成，资金背景包括 Mark Leslie 、 Veritas 软件公司 CEO 、 Vinod Khosla （ Sun 公司创始人之一）、 Sun 公司 CEO 在内的硅谷高层投资人组成。毫无疑问，今天 db4objects 公司是硅谷炙手可热的技术创新者之一。

特性

db4o 的目标是提供一个功能强大的，适合嵌入的数据库引擎，可以工作在设备，移动产品，桌面以及服务器等各种平台。主要特性如下：　　开源模式。与其他 ODBMS 不同，db4o 为开源软件，通过开源社区的力量驱动开发 db4o 产品。　　原生数据库。db4o 是 100% 原生的面向对象数据库，直接使用编程语言来操作数据库。程序员无需进行 OR 映射来存储对象，大大节省了程序员在存储数据的开发时间。　　高性能。下图为 db4o 官方公布的基准测试数据，db4o 比采用 Hibernate/MySQL 方案在某些测试线路上速度高出 44 倍之多！并且安装简单，仅仅需要 400Kb 左右的 .jar 或 .dll 库文件。在接下来的系列文章中，我们将只关注在 Java 平台的应用，但是实际上 db4o 毫无疑问会很好地在 .NET平台工作。

图：官方测试数据

易嵌入。使用 db4o 仅需引入 400 多 k 的 jar 文件或是 dll 文件，内存消耗极小。　　零管理。使用 db4o 无需 DBA，实现零管理。　　支持多种平台。db4o 支持从 Java 1.1 到 Java 5.0，此外还支持 .NET 、 CompactFramework 、 Mono 等 .NET 平台，也可以运行在 CDC 、 PersonalProfile 、 Symbian 、 Savaje 以及 Zaurus 这种支持反射的 J2ME 方言环境中，还可以运行在 CLDC 、 MIDP 、 RIM/Blackberry 、 Palm OS 这种不支持反射的 J2ME 环境中。　　或许开发者会问，如果现有的应用环境已经有了关系型数据库怎么办？没关系，db4o 的 dRS（db4o Replication System）可实现 db4o 与关系型数据库的双向同步（复制），如图 3 。 dRS 是基于 Hibernate 开发，目前的版本是 1.0 ，并运行在 Java 1.2 或更高版本平台上，基于 dRS 可实现 db4o 到 Hibernate/RDBMS 、 db4o 到 db4o 以及 Hibernate/RDBMS 到 Hibernate/RDBMS 的双向复制。dRS 模型如图

图：DRS模型

官方网站

http://www.db4o.com/china/

13、Versant

介绍

Versant Object Database (V/OD) 提供强大的数据管理，面向 C++, Java or .NET 的对象模型，支持大并发和大规模数据集合。

Versant对象数据库是一个对象数据库管理系统(ODBMS：Object Database Management System)。它主要被用在复杂的、分布式的和异构的环境中，用来减少开发量和提高性能。尤其当程序是使用Java和（或）C＋＋语言编写的时候，尤其有用。

它是一个完整的，电子基础设施软件，简化了事务的构建和部署的分布式应用程序。

作为一个卓越的数据库产品，Versant ODBMS在设计时的目标就是为了满足客户在异类处理平台和企业级信息系统中对于高性能、可量测性、可靠性和兼容性方面的需求。

Versant对象数据库已经在为企业业务应用提供可靠性、完整性和高性能方面获得了建树，Versant ODBMS所表现出的高效的多线程架构、internal parallelism 、平稳的Client－Server结构和高效的查询优化，都体现了其非常卓越的性能和可扩展性。

Versant对象数据库包括Versant ODBMS，C++和Java语言接口，XML工具包和异步复制框架。

特性

一、强有力的优势

Versant Object Database8.0，适用于应用环境中包含复杂对象模型的数据库，其设计目标是能够处理这些应用经常需要的导航式访问，无缝的数据分发，和企业级的规模。

对于很多应用程序而言，最具挑战性的方面是控制业务模型本身的内在复杂性。电信基础设施，交通运输网络，仿真，金融工具以及其它领域的复杂性必须得到支持，而且这种支持复杂性的方式还要能够随着环境和需求变化而不断地改进应用程序。这些应用程序的重点是领域和这些领域的逻辑。复杂的设计应当以对象模型为基础。将技术需求例如持久性（和SQL）与领域模型混合在一起的架构会带来灾难性的后果。

Versant对象数据库使您可以使用那些只含有域行为信息的对象，而不用考虑持久性。同时，Versant对象数据库还能提供跨多个数据库的无缝的数据分发，高并发性，细粒度锁，顶级性能，以及通过复制和其它技术提供的高可用性。现代Java中的对象关系映射工具已经简化了很多映射的问题，但是它们还不能提供Versant所能提供的无缝数据分发的功能和高性能。

二、主要特性

C++、Java及.NET 的透明对象持久

支持对象持久标准，如JDO

跨多数据库的无缝数据分发

企业级的高可用性选项

动态模式更新

管理工作量少（或不需要）

端到端的对象支持架构

细粒度并发控制

多线程，多会话

支持国际字符集

高速数据采集

三、优势

对象层次结构的快速存储、检索和浏览

性能高于关系型数据库10 倍以上

减少开发时间

四、8.0的新特性

增强的多核线性扩展能力

增强的数据库管理工具（监控、数据库检查、数据重组）

支持基于LINQ的.NET绑定机制

支持.NET和JDO应用的FTS基于“Black Box”工具的数据库活动记录与分析

五、Versant对象数据库特性

动态模式更新

Versant支持缓慢模式更新，这意味着当被使用时，对象才会从旧的模式转为新的模式，就不需要映射了。所有这些都支持数据库模式的更新与敏捷开发。

跨多数据库的无缝数据分发

客户端与一个或多个数据库进行无缝交互。单个的数据库无缝地联合在一起，使您能够给数据分区，提高读写能力，增大总体的数据库的大小。这些数据库上的数据分发是透明的。它们被结合在一起形成一个

无缝的数据库，提供巨大的可扩展性。

并发控制

对象级锁确保只有在两个应用程序试图更新同一对象时才会有冲突的发生，这与基于页的锁机制不同。基于页的锁机制可能会导致并发热点的假象。

透明的C++对象持久性

C++对象，STL类，标准C++集合如字典，映射，映射的映射，诸如此类，以原样保存在数据库中。状态变化在后台被自动追踪。当相关的事务提交后，所有的变化将会被自动发送到数据库。因此就能形成一种非常自然的，低干扰的编程风格，这样，就能实现应用程序的快速开发，同时当需求发生变化时，应用程序就能够灵活地修改。

透明的Java对象持久性

V/OD的JVI & JDO 2.0 API 提供了透明的简单对象（POJO）的持久性，包括 Java 2 持久类，接口，以及任何用户定义的类。状态变化

在后台被自动追踪。事务提交后，自动把所有变化写入数据库。因此，对于托管和非托管部署，您都能获得轻量级的编程风格。

可完全嵌入Versant 可以被嵌入到应用程序中，数据库规模可以达到TB 级别。

并且可以自主运行，不需要任何管理。

六、企业级的特性

对象端到端

对象端到端意味着你的应用对象存在于客户端，网络上，以及数据库中。与关系型数据库不同的是，对象在内存中和数据库中的表示之间不需要任何映射或转换。

应用的客户端缓存透明地缓存对象以提高速度。数据库支持对象，它能执行查询，建立索引，使应用能够平衡它和数据库间的进程执行。XA的支持使与其它事务数据源协调成为可能。

七、V/OD 8数据库体系架构

高可用性

通过在线进行数据库管理实现数据库的高可用性。

容错服务器

容错服务器选项可以在Versant数据库的硬件或是软件出现故障的时候，自动进行失效转移和数据恢复。容错服务器使用的是在两个数据库实例之间进行同步复制，一旦出现故障，容错服务器也会支持透明重同步。

异步数据复制

异步数据复制选项支持多个对象服务器之间的主从异步复制和点对点异步复制。可以使用异步数据复制将数据复制到一个分布式恢复站点或者将数据在多个本地的对象数据库之间进行复制，以提高性能和可靠性。

高可用性备份

高可用性数据备份选项使Versant可以使用EMC Symmetrix或其它企业级存储系统的磁盘镜像的特性，来对很大的数据卷进行在线备份，同时又不会影响到可用性。

在线再组织

Versant 数据库再组织选项为了会删除大量对象的应用而设计的。它使用户能够收回数据库中未使用的空间，同时使数据库保持正常运作，增加可用空间，改善数据库的性能。

八、为什么要使用Versant面向对象数据库？

通过缩短研发时间来加速上市

对象关系映射代码可能占用了你的应用的40%或更多。有了Versant面向对象数据库，映射代码就不再需要了。

极大地提高了性能和数据吞吐能力

当应用中涉及到复杂的内存对象模式，尤其是关联访问时，对象数据库要比映射到关系数据库表现得更好。例如，当应用程序需要从对象数据库里检索一个对象时，只要执行单条查询即可找到该对象。当映射到一个关系数据库时，如果对象包含多对多关联，那么就必须通过一个或多个连接才能检索到关联表中的数据。使用了对象数据库，对于一般复杂性的对象的检索，速度则提高了三倍，对于复杂性很高的对象的检索，例如多对多关联，搜索的速度则提高了三十倍。而对于集合的集合和递归联系，检索的速度有可能提高五十倍。

根据需求的变化，快速改进应用

今天，商业进程、结构和应用要求的变化的速度使得适应变化的能力变得极为重要。对象关系映射和其它适用于刚性存储结构的方法，让变化变得困难。而Versant对象数据库极大的提升了你的应用满足当前和未来的商业需求的能力。

投资回报率

当用户遇到了复杂的对象模型和大的数据集，对象数据库就是首选的解决方案。对象数据库主要的优点在于，它能够缩小代码的规模，降低研发成本，缩短上市的时间，减少或根本没有管理的要求以及降低购置硬件和服务器软件许可证的成本。性能上的优势还可以大大降低高负载动作应用所消耗的成本。大型的关系数据库成本高非常昂贵，还需要昂贵的硬件支持

官方网站

http://www.versant.com/index.aspx

14、Neo4j

介绍

Neo4j是一个嵌入式，基于磁盘的，支持完整事务的Java持久化引擎，它在图像中而不是表中存储数据。Neo4j提供了大规模可扩展性，在一台机器上可以处理数十亿节点/关系/属性的图像，可以扩展到多台机器并行运行。相对于关系数据库来说，图形数据库善于处理大量复杂、互连接、低结构化的数据，这些数据变化迅速，需要频繁的查询——在关系数据库中，这些查询会导致大量的表连接，因此会产生性能上的问题。Neo4j重点解决了拥有大量连接的传统RDBMS在查询时出现的性能衰退问题。通过围绕图形进行数据建模，Neo4j会以相同的速度遍历节点与边，其遍历速度与构成图形的数据量没有任何关系。此外，Neo4j还提供了非常快的图形算法、推荐系统和OLAP风格的分析，而这一切在目前的RDBMS系统中都是无法实现的。

Neo是一个网络——面向网络的数据库——也就是说，它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎，但是它将结构化数据存储在网络上而不是表中。网络（从数学角度叫做图）是一个灵活的数据结构，可以应用更加敏捷和快速的开发模式。

你可以把Neo看作是一个高性能的图引擎，该引擎具有成熟和健壮的数据库的所有特性。程序员工作在一个面向对象的、灵活的网络结构下而不是严格、静态的表中——但是他们可以享受到具备完全的事务特性、企业级的数据库的所有好处。

由于使用了“面向网络的数据库”，人们对Neo充满了好奇。在该模型中，以“节点空间”来表达领域数据——相对于传统的模型表、行和列来说，节点空间是很多节点、关系和属性（键值对）构成的网络。关系是第一级对象，可以由属性来注解，而属性则表明了节点交互的上下文。网络模型完美的匹配了本质上就是继承关系的问题域，例如语义Web应用。Neo的创建者发现继承和结构化数据并不适合传统的关系数据库模型：

　　1.对象关系的不匹配使得把面向对象的“圆的对象”挤到面向关系的“方的表”中是那么的困难和费劲，而这一切是可以避免的。

　　2.关系模型静态、刚性、不灵活的本质使得改变schemas以满足不断变化的业务需求是非常困难的。由于同样的原因，当开发小组想应用敏捷软件开发时，数据库经常拖后腿。

　　3.关系模型很不适合表达半结构化的数据——而业界的分析家和研究者都认为半结构化数据是信息管理中的下一个重头戏。

　　4.网络是一种非常高效的数据存储结构。人脑是一个巨大的网络，万维网也同样构造成网状，这些都不是巧合。关系模型可以表达面向网络的数据，但是在遍历网络并抽取信息的能力上关系模型是非常弱的。

虽然Neo是一个比较新的开源项目，但它已经在具有1亿多个节点、关系和属性的产品中得到了应用，并且能满足企业的健壮性和性能的需求：

完全支持JTA和JTS、2PC分布式ACID事务、可配置的隔离级别和大规模、可测试的事务恢复。这些不仅仅是口头上的承诺：Neo已经应用在高请求的24/7环境下超过3年了。它是成熟、健壮的，完全达到了部署的门槛。

特性

Neo4j是一个用Java实现、完全兼容ACID的图形数据库。数据以一种针对图形网络进行过优化的格式保存在磁盘上。Neo4j的内核是一种极快的图形引擎，具有数据库产品期望的所有特性，如恢复、两阶段提交、符合XA等。

Neo4j既可作为无需任何管理开销的内嵌数据库使用；也可以作为单独的服务器使用，在这种使用场景下，它提供了广泛使用的REST接口，能够方便地集成到基于PHP、.NET和JavaScript的环境里。但本文的重点主要在于讨论Neo4j的直接使用。

Neo4j的典型数据特征：

•数据结构不是必须的，甚至可以完全没有，这可以简化模式变更和延迟数据迁移。

•可以方便建模常见的复杂领域数据集，如CMS里的访问控制可被建模成细粒度的访问控制表，类对象数据库的用例、TripleStores以及其他例子。

•典型使用的领域如语义网和RDF、LinkedData、GIS、基因分析、社交网络数据建模、深度推荐算法以及其他领域。

围绕内核，Neo4j提供了一组可选的组件。其中有支持通过元模型构造图形结构、SAIL - 一种SparQL兼容的RDF TripleStore实现或一组公共图形算法的实现。

高性能？

要给出确切的性能基准数据很难，因为它们跟底层的硬件、使用的数据集和其他因素关联很大。自适应规模的Neo4j无需任何额外的工作便可以处理包含数十亿节点、关系和属性的图。它的读性能可以很轻松地实现每毫秒（大约每秒1-2百万遍历步骤）遍历2000关系，这完全是事务性的，每个线程都有热缓存。使用最短路径计算，Neo4j在处理包含数千个节点的小型图时，甚至比MySQL快1000倍，随着图规模的增加，差距也越来越大。

这其中的原因在于，在Neo4j里，图遍历执行的速度是常数，跟图的规模大小无关。不象在RDBMS里常见的联结操作那样，这里不涉及降低性能的集合操作。Neo4j以一种延迟风格遍历图 - 节点和关系只有在结果迭代器需要访问它们的时候才会被遍历并返回，对于大规模深度遍历而言，这极大地提高了性能。

写速度跟文件系统的查找时间和硬件有很大关系。Ext3文件系统和SSD磁盘是不错的组合，这会导致每秒大约100,000写事务操作。

官方网站

http://neo4j.org/

15、BaseX

介绍

BaseX 是一个XML数据库，用来存储紧缩的XML数据，提供了高效的 XPath 和 XQuery 的实现，还包括一个前端操作界面。

特性

BaseX一个比较显著地优点是有了GUI，界面中有查询窗口，可采用XQuery查询相关数据库中的XML文件；也有能够动态展示xml文件层次和节点关系的图。但我感觉也就这点好处了，编程时和GUI无关了。

和Xindice相比，BaseX更能支持大型XML文档的存储，而Xindice对大型xml没有很好的支持，为管理中小型文档的集合而设计。

BaseX 是一个XML数据库，用来存储紧缩的XML数据，提供了高效的 XPath 和 XQuery 的实现，还包括一个前端操作界面。

官方网站

http://basex.org/

你可能感兴趣的:(15个nosql数据库)

如何用Ipa Guard等工具为iOS App实现源码级别之外的代码混淆与资源保护策略 2501_91590906 http udp https websocket 网络安全网络协议 tcp/ip
在iOS应用开发领域，代码安全性始终是一个绕不开的话题。无论是团队规模庞大的商业公司，还是独立开发者，一旦产品上线到AppStore，ipa文件都可能成为逆向工程的目标。而逆向带来的，不仅是知识产权的泄露，还可能引发更严重的安全问题，例如数据接口被破解、付费逻辑被绕过等。针对这些痛点，不少开发者开始引入代码混淆与资源保护工具，以提高应用的抗破解能力。在这一领域，IpaGuard提供了一种相对独特且
【HarmonyOS NEXT】设备显示白屏 syswarning happended in XXX
【HarmonyOSNEXT】设备显示白屏syswarninghappendedinXXX一、问题背景：运行启动鸿蒙应用项目，设备显示白屏，IDE左下角提示syswarninghappendedinXXX设备名。点击JumptoLog提示如下：Deviceinfo:HUAWEIMate60ProBuildinfo:ALN-AL005.0.0.115(SP6C00E11)Fingerprint:15
Golang基础笔记七之指针，值类型和引用类型后端go指针引用
本文首发于公众号：Hunter后端原文链接：Golang基础笔记七之指针，值类型和引用类型本篇笔记介绍Golang里的指针，值类型与引用类型相关的概念，以下是本篇笔记目录：指针值类型与引用类型内存逃逸减少内存逃逸的几种方案1、指针在计算机内存中，每个变量都存储在特定的内存地址上，而指针是一种特殊的变量，它存储的是一个变量的内存地址。我们可以通过指针访问变量的内存地址，也可以通过指针访问或修改这个变
中小团队零成本搭建PHP任务管理系统：4大核心工具实测推荐 php
引言在现代软件开发和团队协作中，高效的任务管理系统是提升生产力的核心要素。PHP作为全球最受欢迎的服务器端编程语言之一，凭借其成熟的生态系统、丰富的框架选择和强大的社区支持，成为构建任务管理系统的理想选择。一个优秀的PHP任务管理系统不仅能够实现任务的全生命周期管理，还能通过智能化的功能提升团队协作效率，降低项目管理成本。构建这样一个系统需要考虑多个层面：从底层的数据库设计到前端的用户体验，从安全
ffmpeg下载地址珊珊而川 ffmpeg
你已经通过pipinstallffmpeg安装了一个名为ffmpeg的Python包，但这并不等于你真正安装了系统级别的FFmpeg可执行程序，而roop的代码是通过调用系统的ffmpeg命令行工具来处理视频的。问题分析你遇到的报错：[ROOP.CORE]ffmpegisnotinstalled.说明roop在运行时检查系统中是否能调用ffmpeg，而不是是否安装了Python包ffmpeg。✅解
Python实现语音识别功能，只需3个步骤！
调用科大讯飞语音听写，使用Python实现语音识别，将实时语音转换为文字。首先在官网下载了关于语音听写的SDK，然后在文件夹内新建了两个.py文件，分别是get_audio.py和iat_demo.py，并且新建了一个存放录音的文件夹audios，文件夹内存放录音文件input.wav，我的整个文件目录如下：asr_SDK(文件名)├─Readme.html├─audios│└─input.wav
图论基础知识深度优先（Depth First Search, 简称DFS），广度优先（Breathe First Search, 简称BFS） mmaerd Leetcode刷题学习记录深度优先图论宽度优先机考
图论基础知识学习记录自代码随想录dfs与bfs区别dfs是沿着一个方向去搜，不到黄河不回头，直到搜不下去了，再换方向（换方向的过程就涉及到了回溯）。bfs是先把本节点所连接的所有节点遍历一遍，走到下一个节点的时候，再把连接节点的所有节点遍历一遍，搜索方向更像是广度，四面八方的搜索过程。深度优先搜索理论（DepthFirstSearch,简称DFS）搜索方向，是认准一个方向搜，直到碰壁之后再换方向换
四阶数独——深度优先搜索dfs 我爱工作&工作love我 c++深度优先算法
文章目录四阶数独例题讲解深度优先dfs搜索知识点算法思想应用代码框架四阶数独例题讲解题目描述这里讨论一种简化的数独——四阶数独。给出一个4×4的格子，每个格子只能填写1到4之间的整数，要求每行、每列和四等分更小的正方形部分都刚好由1到4组成。求总共有多少种不同的数独？输出结果：288思路常规思路就是根据格子序号挨个设置数如果每次都是从第一个开始设置，暴力枚举，一个格子四种选择，16个格子所以就有4
数据结构——图的遍历之深度优先遍历（DFS算法）_全世界最可爱的王小帅_CSDN博客全世界最可爱的王小帅数据结构图论算法 cpp c#
数据结构——图的遍历之深度优先遍历图的遍历一般分为深度优先遍历和广度优先遍历下面我们要说的是深度优先遍历**（DFS算法）**1，我们首先选择一个顶点作为起始点，假设我们选择顶点v作为起始点，首先访问v，然后找v的邻接点，访问v的一个还未被访问过邻接点w1,2，再以w1为起始点，然后去找w1的邻接点，访问w1的一个还未被访问过的邻接点w2，再以w2作为起始点继续往下访问…3，如果我们访问到一个顶点
代码随想录|图论|07岛屿的最大面积 Paper Clouds 算法深度优先图论数据结构 c++
leetcode:100.岛屿的最大面积题目题目描述给定一个由1（陆地）和0（水）组成的矩阵，计算岛屿的最大面积。岛屿面积的计算方式为组成岛屿的陆地的总数。岛屿由水平方向或垂直方向上相邻的陆地连接而成，并且四周都是水域。你可以假设矩阵外均被水包围。输入描述第一行包含两个整数N,M，表示矩阵的行数和列数。后续N行，每行包含M个数字，数字为1或者0，表示岛屿的单元格。输出描述输出一个整数，表示岛屿的最
【Go】入门Go应该怎么学 CodeWithMe Go golang 开发语言后端
Go语言学习路线图一、为什么学Go？简洁、直观，容易上手，语法像C又比C简洁天然支持并发（goroutine+channel）编译速度快、跨平台强、部署简单（一个二进制）在云原生（K8s）、微服务、工具链开发领域非常受欢迎拥有丰富的标准库与成熟的社区二、学习阶段与资源第一阶段：Go基础语法&核心概念内容：变量、常量、类型流程控制（if、for、switch）数组、切片、map、字符串函数、返回值、
顺序队列和链式队列高斯林.神犇数据结构
一，队列上次讲到栈的插入删除在一端进行，那么这次我们要讲的队列是插入删除分别在两端进行，我们可以定义两个标识分别为插入标识(front)和删除标识(rear)。在我们的循环队列中队满和队空都会使得rear==front，可以有很多代码逻辑来实现队满和队空的区分，比如我们可以定义一个flag变量，当rear因为入栈操作使得两者相等就可以变为1，因为出栈操作使得两者相等就可以变为0。但是由于多了一个变
从零开始：Python实现语音识别的完整教程_副本 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 python 语音识别开发语言 ai
从零开始：Python实现语音识别的完整教程关键词：Python、语音识别、语音转文本、音频处理、机器学习、深度学习、自然语言处理摘要：本文将带你从零开始学习如何使用Python实现语音识别功能。我们将从基础概念讲起，逐步深入到实际代码实现，涵盖音频处理、特征提取、模型训练等关键环节，最终构建一个完整的语音识别系统。无论你是初学者还是有一定经验的开发者，都能从本教程中获得实用的知识和技能。背景介绍
代码随想录：图论| 岛屿数量王鹏程_ 深度优先算法岛屿数量图论
题目链接：99.岛屿数量题目描述：给定一个由1（陆地）和0（水）组成的矩阵，你需要计算岛屿的数量。岛屿由水平方向或垂直方向上相邻的陆地连接而成，并且四周都是水域。你可以假设矩阵外均被水包围。输入描述：第一行包含两个整数N,M，表示矩阵的行数和列数。后续N行，每行包含M个数字，数字为1或者0。输出描述：输出一个整数，表示岛屿的数量。如果不存在岛屿，则输出0。输入示例：4511000110000010
爬虫实战之图片及人物信息爬取 nightunderblackcat Python进阶爬虫 python
爬虫对于许多Python初学者来说都是一个好玩有趣的技能,但大多数人都是从网上得来的经验,会认为学习爬虫是件很难的事,像处理反爬机制以及反反爬,总是让人望而却步,今天我们来进行爬虫实操,需要注意爬虫本身并不违法,但恶意爬取文件将会涉及相关法律,为避免不必要的纠纷,本文采取一个不存在的网站进行演示,本文适合Python初学者以及爬虫初学者学习,博主是大一.所以讲的话和相关技能并不特别专业,望大家谅解
MyBatis Plus 常用注解需要重新演唱 web java mybatis java 数据库
MyBatisPlus是一个基于MyBatis的增强工具，旨在简化开发过程，提高开发效率。它提供了许多实用的功能，如代码生成器、分页插件、条件构造器等，使得开发者可以更专注于业务逻辑的实现，而不必过多关注MyBatis的配置和SQL编写。MyBatisPlus常用注解MyBatisPlus提供了丰富的注解，用于简化实体类和数据库表之间的映射关系。以下是一些常用的注解：1.@TableName用于指
如何配置远程服务器 hai_zwh 服务器电脑配置维修专栏服务器运维
最近组内为了项目新购买了一个算力不错的装有ubuntu20.04系统的主机，本人尝试用此主机搭建一个供多人使用的服务器平台，网上看了很多教程说法不一而且很复杂，经过尝试后，本人探索出了一种较为简单的方法去配置远程服务器(这里以服务器主机为ubuntu系统作为例子)。1.首先，确定你的ubuntu系统的源进行了更新，如果没有更新，打开终端输入以下命令行：sudoaptupdate这里选择sudoap
Linux 云服务器配置多网卡详解（附策略路由配置方法）Linux 云服务器多网卡配置、策略路由、IPRoute2、VPC私有网络代码简单说运维教程服务器 linux 网络
Linux云服务器配置多网卡详解（附策略路由配置方法）标签：Linux云服务器、多网卡配置、策略路由、IPRoute2、VPC私有网络前段时间项目上线遇到一个场景，需要给一台云服务器绑定多块网卡，让不同的业务走不同的内网通道，既要安全又要稳定。最开始我以为只是加块网卡那么简单，实际操作才发现，配置完还要配策略路由，不然根本ping不通，服务也收不到请求。为了让大家少走弯路，我把完整过程整理成这篇文
ICPC/CCPC 2024 超闻逸事游记 c++
2024.8.252024.8.252024.8.25组队由我SUNCHAOYI和两位大佬oahgnail,Erusel组成。【说句闲话，由于组队有点匆忙，我和Erusel愣是花了一下午从新生群中的强省一个个人肉搜索找到的队友。】好了，队名还是要乱搞的，于是就有了：中文队名：仚屳屲冚(xiaˉnxiaˉnwaˉkaˇn)英文队名：Supercalifragilisticexpialidocious
导师要求一天完成综述，我7分钟搞定——打造一个全本地DeepResearch助手小洛~·~ 人工智能深度学习 chatgpt gpt AI写作
1.项目背景LocalDeepResearcher是一个本地化运行的AI研究助手，旨在通过结合大语言模型（LLM）和搜索工具，实现自动化深度研究并生成结构化报告。该项目由LangChainAI开发，支持本地模型（例如通过Ollama运行的deepseek-r1:7b）和云端模型（例如Claude、GPT），并集成了多种搜索引擎（如Tavily、DuckDuckGo）。其本地优先的设计确保了数据隐私
【LangGraph 】“工作流”的核心就是围绕一个共享的 `State` 等风来不如迎风去 AI入门与实战 langgraph
是的。LangGraph里“工作流”的核心就是围绕一个共享的State（也常被命名为AgentState或者类似的TypedDict/Pydantic模型）来组织的：State本质上是整个流程的“快照”，所有跨节点需要保留或传递的数据，都必须定义在这个结构里。LangGraph在执行节点（node）时，会把当前的State传入该节点，节点内部可以读写它，然后再返回一个新的（或被修改过的）State
Unity引擎开发：VR渲染技术_（19）.VR项目实例开发 chenlz2007 虚拟现实游戏2 unity vr lucene 游戏引擎 json 全文检索
VR项目实例开发在本节中，我们将通过一个具体的虚拟现实项目实例，详细介绍如何在Unity引擎中实现VR渲染技术。我们将从项目的基本设置开始，逐步讲解如何创建VR场景、配置相机、添加交互元素、优化性能等方面的内容。通过本节的学习，您将能够掌握在Unity中开发VR项目的基本流程和技术要点。1.项目基本设置1.1创建新的VR项目首先，打开UnityHub并创建一个新的项目。选择“3D”模板，然后在项目
七天学完十大机器学习经典算法-05.从投票到分类：K近邻(KNN)算法完全指南
接上一篇《七天学完十大机器学习经典算法-04.随机森林：群众智慧的机器学习实践》想象一下，你搬进了一个新小区。想知道这个小区整体氛围如何？最直接的方法就是看看你最近的几家邻居是什么样的人——如果邻居们都很安静、整洁，小区大概率不错；如果邻居们深夜喧哗、环境杂乱，你可能就得重新考虑了。K近邻（K-NearestNeighbors,KNN）算法的核心思想，就如同这个观察邻居的过程。它是机器学习中最直观
AI测试方法二狗子82 ai 功能测试测试用例 AIGC
1.创建高质量的测试数据集为了验证标签的准确性，需要构建一个丰富的测试数据集。该数据集应包括多种场景和风格的输入文本：正常对话、非正式对话、含有拼写错误或语法问题的文本等。包括模棱两可或复杂情境的文本，看看模型是否能正确分类。确保数据集中有足够的标签种类分布，这样可以测试模型是否能应对不同类别的文本内容。2.多轮对话的上下文跟踪对于涉及多轮对话或长文本的情况，模型需要正确理解整个对话的上下文。例如
docker安装nginx并配置ssl证书，代理宿主机服务 Blueeyedboy521 开发工具 nginx ssl docker
目录1、拉取镜像2、创建映射目录3、先启动一个nginx容器用于cp对应的文件夹类型，用于后期挂载使用4、映射容器文件5、停止当前nginx容器，并删除7、拷贝ssl证书8、配置nginx.conf9、运行10、进入容器11、查看日志12、代理宿主机服务查看宿主机在docker中的ip配置docker上安装的nginx1、拉取镜像dockerpullnginx2、创建映射目录#首先，创建目录ngi
Redis 持久化之 AOF 策略
1.什么是AOFAOF是appendonlyfile，AOF文件中记录了每次的操作指令，在启动Redis时，会将AOF文件中的数据读取出来以恢复数据。2.开启AOFRedis默认关闭AOF，可以通过将Redis配置文件中的appendonly设置为yes，这样就开启了AOF，此时RDB就会关闭，只能使用AOF和RDB中的一个。3.AOF的工作流程用户执行指令后，会将该指令写入到AOF缓冲区（aof
信息抽取数据集全景分析：分类体系、技术演进与挑战_DEEPSEEK 致Great 分类数据挖掘人工智能
信息抽取数据集全景分析：分类体系、技术演进与挑战摘要信息抽取（IE）作为自然语言处理的核心任务，是构建知识图谱、支持智能问答等应用的基础。近年来，随着深度学习技术的发展和大规模预训练模型的兴起，IE数据集呈现爆发式增长，其分析与评估对模型研发和领域迁移至关重要。本文基于对158个主流IE数据集的系统性梳理，首次提出“信息提取与命名实体识别数据集分类体系”。该体系涵盖8大类别（命名实体识别、关系提取
自然语言处理之文本生成：Recurrent Neural Networks (RNN)：序列模型与语言模型 zhubeibei168 自然语言处理自然语言处理 rnn 语言模型人工智能机器翻译生成对抗网络
自然语言处理之文本生成：RecurrentNeuralNetworks(RNN)：序列模型与语言模型自然语言处理简介NLP的基本概念自然语言处理（NaturalLanguageProcessing，简称NLP）是人工智能领域的一个重要分支&#
鸿蒙OpenHarmony【slot插槽】自定义组件我爱一条柴ya 鸿蒙开发日记 harmonyos 鸿蒙鸿蒙系统开发语言
默认插槽自定义组件中通过slot标签来承载父组件中定义的内容，使用slot标签可以更加灵活的控制自定义组件的内容元素，使用方式如下：下面使用父组件定义的内容引用该自定义组件方式如下：父组件中定义的内容具名插槽当自定义组件中需要使用多个插槽时，可通过对插槽命名的方式进行区分，当填充插槽内容时，通过声明插槽名称，将内容加到对应的插槽中。下面使用父组件定义的内容引用该自定义组件方式如下：插入第二个插槽中
Android Gantt View 安卓实现项目甘特图 netkiller-BG7NYT Android 手札 android 甘特图
需要做一个项目管理工具，其中使用到了甘特图。发现全网甘特图解决方案比较少，于是自动动手丰衣足食。前面我用Python和Node.js前端都做过，这次仅仅是移植到Android上面。其实甘特图非常简单，开发也不难，如果我专职去做，能做出一个非常棒产品。我写这个只是消遣，玩玩，闲的蛋痛，所以不怎么上心，就搞成下面这德行吧。仅仅供大家学习，参考。那天心情好了，完善一下。屏幕布局文件
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring