Gabriel8304

NewSQL数据库VoltDB特性简介

转自：

https://blog.csdn.net/dc_726/article/details/41909719

https://blog.csdn.net/jxchinaren/article/details/38394217

VoltDB是一个革命性的新型数据库产品，被称作NewSQL数据库。它基于H-Store，号称比当前数据库产品的吞吐量高45倍，同时又具有很高的扩展性。它的特性主要有以下几点：

Ø 高吞吐、低延迟：通过内存计算，存储过程和串行数据访问实现。

Ø 可扩展性：自动分区和复制，保证性能和可扩展性。

Ø 高可用性：同步的多主复制(在VoltDB中叫K-safety)。

Ø 持久化：数据库快照与命令日志(command log)的创新技术组合。

1 高吞吐、低延迟

VoltDB能够提供高吞吐、低延迟的SQL操作，总体来说，它是通过内存计算避免磁盘阻塞(disk stall)，通过存储过程避免用户阻塞(user stall)，通过集群结点内的数据访问串行化，避免传统数据库锁、缓冲管理的开销。此外，VoltDB并不是纯Java开发，其SQL执行引擎是C++写成的，所以并不受GC暂停的影响。

Ø 内存计算：使VoltDB在事务执行期间无需等待磁盘加载，避免磁盘I/O开销。充分利用了现代服务器上庞大的内存，将吞吐量最大化。

Ø 存储过程：避免应用与数据库之间的多次通信开销，每个事务被定义成一个存储过程，因此事务只需一次通信往返。然而，VoltDB并不是只支持存储过程，从1.1版本开始已经能够支持来自JDBC、SQL命令行、HTTP/JSON、原生C++/PHP/C#/Node.js等等客户端的SQL查询。唯一的限制就是：VoltDB总是自动提交模式，不支持手动控制事务。

Ø 数据访问串行化：传统数据库在前面两种阻塞等待的情况下，会切换执行其他事务，因此会导致很大的锁(latching and locking)开销。而一个VoltDB数据库由许多内存计算引擎组成(叫做partition分区)，每个分区都是数据和相关处理过程的集合。VoltDB在集群内自动分发数据创建分区，每个分区内都是单线程的，从而避免了传统数据库对并发控制的开销。

Ø C++执行引擎：VoltDB使用原生C++代码进行表数据的内存分配和SQL的执行，之所以核心不使用Java就是避免将表数据这种长时间存活的数据放置到JVM堆上，同时对内存使用进行更细粒度的控制。此外，像静态的部署相关和schema相关的数据，尽管是在Java中管理，但也使用DirectByteBuffer分配到堆外内存。所以其实JVM堆只是用来分配事务相关的一些存活期很短的数据，这对于GC来说是合适的负载。

如果某个事务只涉及一个单一分区内的数据，则其处理流程如下图所示：

2 扩展性架构

从架构上看，VoltDB属于shared nothing架构，因此可以很容易地实现扩展，可以通过增加已存在结点的容量和性能实现垂直扩展，通过动态增加新结点实现水平扩展，而在这个过程中不需要修改任何数据库schema和应用程序代码。

同时，VoltDB不仅支持表分区，还支持表复制。对于大表，可以通过分区来提高性能。对于频繁读取的小表，可以通过复制来减少join。

这与分布式缓存GemFire中的mirrored region和partitioned region的概念很像。在GemFire这，mirrored region包含全量数据，而partitioned region只包含分区数据。但不同的是，VoltDB是根据表的特点选择复制或分区，而GemFire则通过mirrored region将其他分区数据抓取到一起形成全量的数据镜像。

如果一个事务涉及多个分区的数据访问，那么其处理流程如下图所示。一个结点会充当协调者(coordinator)，负责分发任务给其他结点，并收集结果，完成任务。

3 高可用性

不像传统RDBMS产品依赖第三方的HA解决方案，VoltDB提供三种HA能力：K-safety，网络故障检测，存活结点重连(rejoin)。

3.1 K-safety

当配置成K-safety时，VoltDB会自动地复制数据库分区，K表示副本的个数。例如K=0时表示没有副本，所以任何一个结点的故障都会导致整个数据库集群的停止服务。当K=1时表示有1个副本，即一共2份拷贝。要注意的是：VoltDB中的副本是可以读写的，而不是传统的主从复制关系。

关于数据同步问题的解决，任何发生在复制分区上的操作都会发送给各个拷贝的结点去执行，来保证一致性。如果其中一个结点失败，那么数据库会继续发送这个操作给失败的结点。因此在这一点上VoltDB与传统数据库有很大不同，不存在多主(multi-master)情况下的数据同步冲突问题。所以K-safety也叫做同步多主复制。

3.2 网络故障检测

当网络发生故障时，VoltDB的结点彼此之间被物理隔离开，而认为对方已经发生故障。那么K-safety机制会使这两侧的结点继续分别提供服务。如果不及时检测到的话，这种“分离的大脑”(split brain)会导致严重的数据同步问题。因此，VoltDB会自动检测网络故障，立即评估出那一侧结点应该继续服务，并快照另一侧的结点数据后停掉服务。当网络故障解决时，可以直接使用下面将介绍到的存活结点重连技术将结点重新加入到集群中。

3.3 存活结点重连

离线的VoltDB结点可以通过rejoin操作重新加入到集群中。具体过程是：首先从兄弟结点获得一份数据拷贝，当追赶上兄弟结点时，此存活结点就可以回到正常状态，接受任务了。

4 持久化

尽管VoltDB的HA能够降低当机概率，但故障还是偶尔会发生，而且DBA有时也要定期地停机维护。因此，VoltDB提供了高性能的快照和命令日志(command log)来支持各种持久化需求。对于日志，VoltDB支持同步和异步，以及刷新到磁盘的时间间隔等配置。

那command log与传统的WAL(write-ahead log)有什么区别呢？(待深入研究)

总结

但这样也不代表VoltDB是万能的，其设计和特性决定了其应用场景，VoltDB比较适合高频率请求、短事务的应用，像金融、零售、Web2.0等，以及流式数据应用，像推荐引擎、实时广告平台、点击流处理、欺诈交易检测等。

参考资料

1 VoltDB Technical Overview

2 Using VoltDB

3 Debunking Myths about the VoltDB in-memory database

4 Impact of Java Garbage Collection on in-memory databases

5 Command logging vs. Write-ahead Logging

****************************************************************************************

VoltDB内存数据库的十大FAQ

1. VoltDB是什么？

->VoltDB是一家新型关系型分布式内存数据库管理系统，以解决OLTP为初衷，正在不断增加处理OLAP，提供BI的功能。VoltDB与传统数据库（如DB2，Oracle，MySQL等）最大的不同点就是，VoltDB把全部数据放在内存里，并且可以scale out，运行在一个集群上，集群上的每个节点都可以执行部分数据处理任务。

VoltDB官网：http://voltdb.com/

2. VoltDB支持SQL吗？支持Transaction吗？

-> VoltDB支持大多数SQL语句，目前还在不断增加对SQL的支持。VoltDB的单个SQL语句和Stored procedure都支持Transaction的所有ACID属性，是一个完完全全的支持事务处理的系统。这点与key-value等系统等是有很大区别的。

VoltDB还支持JDBC，ODBC（soon）等接口，客户端也支持语言C#，C++，Erlang，Go，Java，JSON，Node.js，PHP，Python，Ruby等。

3. VoltDB适用于什么类型的应用？

->大数据领域可以分两类：a）数据总量大，b）单个数据元小，但数据产生快，有大量高并发。VoltDB主要是来解决Big Data下面Fast Data的问题，同时也在增加处理大数据量的能力。因此，VoltDB更加适合OLTP类型的应用，可以有效提高数据库高并发下的系统吞吐量，常见的应用有几类：a）需要实时交互的大型多人在线游戏，b）在线广告业务，c）移动电信通讯业务，d）银行或股票交易系统，e）在线商城（如淘宝，京东等），f）网络实时监控或传感器应用等

换句话讲，任何需要strong consistency的高并发业务，都是VoltDB最擅长的。同时实时交互的BI和OLAP也是VoltDB很不错的领域。当然如果你的数据规模是PB以上级别的OLAP话，就目前而言，那还是选择基于Hadoop的分析系统比较合适。

4. VoltDB数据库性是用什么语言写的？

VoltDB使用的语言大致分两种，底层引擎是C/C++，上层的SQL语义处理，并发管理，分布式集群等任务都是Java。另外，还有些工具使用Python，JS等做的。

底层Engine的任务包括：数据存储，内存管理及SQL具体执行的数据处理

5. VoltDB数据库性能到底怎么样？

VoltDB的吞吐量很高，尤其是单位节点的吞吐量，应该是市面上数据库系统最高的了。单台家用笔记本上，也能跑出7,8万TPS（transactions per second）。根据不同的笔记本性能，吞吐量也略有差别。

这里推荐两篇关于VoltDB性能的文章：

a）http://www.csdn.net/article/2013-04-11/2814850-877000-tps-with-erlang-and-voltdb ：这是一家游戏公司Eonblast Corporation的CEO自己用Erlang客户端测VoltDB性能的博文，文中测试吞吐量的结果为：87.7万的TPS，完成了350万的QPS。

b）http://voltdb.com/blog/voltdb-in-memory-database-achieves-best-in-class-results-running-in-the-cloud-on-the-ycsb-benchmark-3/：文中对比了YCSB benchmark在云端的测量数据，结论是：VoltDB系统吞吐量可以根据集群的节点数线性增长，Workload B用12个节点跑出72.4万的TPS。要知道12年的MySQL和Cassandra在相似的机器上才跑出不到18万的TPS，现在的VoltDB跑Key-Value的应用，性能是当时他们的4倍之多。

C）https://www.sgi.com/pdfs/4238.pdf：SGI公司对VoltDB性能做了测试：10个节点能跑出120万的TPS，30个节点跑出了337万的TPS。

6. VoltDB是内存数据库，数据会不会容易丢失？如何实现高可用性？

数据库中数据的安全，一定是最为关键的问题。作为内存数据库，VoltDB有很多种科技手段来保证数据的可靠性。VoltDB已有不上金融领域的商业应用，这已经证明了内存数据库VoltDB在数据可靠性上是没问题的。

K-safety：VoltDB的数据是分区的，设定K-safety（即同步的分区拷贝数量）参数，可以确保整个集群的稳定性。如果K设置为1，每个分区都在集群内有一个拷贝，如果有一台机器当机了，整个VoltDB集群可以正常运行。

Snapshot（快照）：用户可以根据应用设置snapshot的周期，VoltDB可以对数据做snapshot，然后将其写入Disk，数据就永久性的存在了。如果意外当机，VoltDB可以根据磁盘上已有的snapshot文件，进行数据恢复操作。恢复数据速度很快，我自己测试的60多G的数据，完成恢复需要2分钟左右。

Command Logging（命令日志）：这个功能是VoltDB特有的，和Snapshot一起使用，记录了保存两次snapshot之间所有写（write）操作的日志，是为了确保不会有任何transaction丢失。读操作（read）不改变数据，所以不被记录。

Database Replication：这个是传统数据库已经有的功能了，就是在另一个地方，做一个完全一摸一样的数据拷贝，如果主集群不工作了（如集体断电），立刻讲服务切换到附属集群上去，通常附属集群要设立在一个物理范围上不同的地区。

以上内容有免费的网上学习视频，会英语的同学强烈推荐：http://voltdb.com/resources/volt-university/tutorials/section-1-6/

7. VoltDB是分布式数据库，有哪些特点？

VoltDB分布式内存数据库的性能，没两台机器之间不共享任何内存和数据，可以完全看做独立的两台机器，而只是用网络连接在一起。VoltDB的性能可以线性增长，支持动态添加节点，节点自动恢复等功能。

动态添加节点：不同业务可能会有自己的高峰期，打个比方，如果不满足现在3台机器的性能（吞吐量），可以动态增加节点，提高数据库服务器处理的性能。

节点自动恢复：如果集群中一台机器当机，K-safety参数设置大于或等于1，VoltDB依然可以正常运行。之后，等该机器维修好之后（当然也可换一台新机器），可以动态再添加到集群当中来。

8. 谁在使用VoltDB？VoltDB的客户有哪些？

VoltDB的客户数量在400多个，合作伙伴也有30个左右，其中包括惠普HP，雅虎这样的大型IT公司。业务范围也大多是之前提到的VoltDB比较擅长的领域，涉及fast data和高并发的应用。具体情况可以参考链接：

http://voltdb.com/about/customers/

http://voltdb.com/partners/voltdb-partners/

9. VoltDB是否开源？有哪些资料参考和学习？

VoltDB有开源版本，免费试用。同时也有商业版，包含有更多功能。下载需要到官网亲自下载，例如数据恢复，command logging等功能是需要需要商业版的，商业版本有30天免费试用的。如果你是开发人员，希望研读源代码或者为VoltDB做贡献，GitHub的Wiki页面上也有如何设置Java eclipse，进行开发。

开源版本下载地址：https://github.com/VoltDB/voltdb/releases，

开源代码在GitHub上：https://github.com/VoltDB/voltdb。

VoltDB免费在线视频学习课程（会英文的同学，强烈推荐学习）：http://voltdb.com/resources/volt-university/tutorials/

VoltDB的JIRA系统：https://issues.voltdb.com/

VoltDB的社区论坛：https://forum.voltdb.com/

VoltDB的支持邮箱：有任何疑问都可以发到此邮箱 support at voltdb.com

10. VoltDB商业版本费用如何？

具体的收费规则，我不是很清楚，但我可以确定，一定比传统大型数据库Oracle，SQL Server，DB2啥的便宜好多，比起SAP HANA也要便宜好多好多。

具体情况可以发邮件到support at voltdb.com询问，一定有人会回复相关问题。

数据库类型 juhanishen 数据库 nosql mongodb
数据库按照维度不同，有不同分法，我们今天来按照不同维度来对数据库进行归类。1.数据量和事务型数据库SQL，关系型数据库，带有事务性，但处理的数据不能太庞大。比如MySQL，Postgre,OracleNoSQL，大数据数据库，没有事务特性。比如MongoDB，Couchbase，CassandraNewSQL,大数据数据库，同时带有事务性。比如VoltDB，TiDB2.数据库按行分类数据是以行，一
缓存数据库Redis----VoltDB 对比 java456
缓存数据库比较.jpg参考资料：https://db-engines.com/en/system/Redis%3BVoltDB
Volt Active Data介绍数据库工业物联网5g
介绍VoltActiveData截至今日，VoltDB不再是VoltDB，我们是VoltActiveData。这是一个经过了多次内部讨论、深夜的领悟、清晨的咖啡，以及一两场辩论，由来已久的名称修改。总结来说：我们意识到，我们需要更改名称以反映公司自2009年成立以来的发展，以及实时数据市场本身如何随着5G、物联网和机器学习等新的变化而发展（并在持续发展中）。不，这不是一个新产品或一个技术支点的发布
架构解密从分布式到微服务：深入理解网络，NIO stone_tmp Java
NIO我们知道，分布式系统的基础是网络。因此，网络编程是分布式软件工程师和架构师的必备技能之一，而且随着当前大数据和实时计算技术的兴起，高性能RPC架构与网络编程技术再次成为焦点。不管是RPC领域的ZeroCIce、Thrift,还是经典分布式框架Actor模型中的Akka,或者实时流领域的Storm、Spark、Flink，又或者开源分布式数据库中的Mycat、VoltDB，这些高大上产品的底层
为什么拥有云原生数据平台对电信公司很重要？
VoltDB最近被添加到Linux基金会子公司——云原生计算基金会CloudNativeComputingFoundation（CNCF）中，该基金会致力于构建可持续的云生态系统。作为云原生技术的忠实拥趸，我们对这个消息感到非常兴奋。CNCF维护了交互式景观地图，详细介绍了构成云原生生态系统的所有技术提供商。现在，您可以在CNCF图表上的数据库部分找到VoltDB-和PostgreSQL、Couc
HPE的通信技术集团将如何加速电信5G的普及和应用？数据库电信5g
1、导读2月，惠普企业（HPE）成立了新的企业通信技术集团（CTG），以帮助电信公司和企业充分把握5G带来的机遇。这对于寄希望解锁5G全部价值的组织意味着什么？作为HPE的合作伙伴，VoltDB对此感到非常兴奋。HPECTG是业内最广泛的电信合作伙伴组织之一，涵盖基础设施、软件和服务。因此，HPE现在具有独特的地位，可帮助电信公司实现基础设施和产品的现代化，从而在5G时代保持发展和竞争的优势。在此
VoltDB让Kafka支持复杂数据流驱动的实时业务决策
01简介VoltDB是一个高速决策引擎，为必须在数毫秒内做出响应的应用程序提供基础架构支持，适用场景包括BSS（策略和收费）、预防欺诈、客户价值管理（即个性化）和实时工业自动化等等，那些通过实时决策可以增加收入或减少损失的场景。这些应用程序通常需要VoltDB运行在一个多样化和异构计算的软件生态里，它需要与各种技术集成对接，包括ApacheKafka。实际上，Kafka已然成为企业消息队列的首选中
VoltDB让Kafka支持复杂数据流驱动的实时业务决策
01简介VoltDB是一个高速决策引擎，为必须在数毫秒内做出响应的应用程序提供基础架构支持，适用场景包括BSS（策略和收费）、预防欺诈、客户价值管理（即个性化）和实时工业自动化等等，那些通过实时决策可以增加收入或减少损失的场景。这些应用程序通常需要VoltDB运行在一个多样化和异构计算的软件生态里，它需要与各种技术集成对接，包括ApacheKafka。实际上，Kafka已然成为企业消息队列的首选中
2020 总结 | VoltDB的亮点，你了解多少？数据库物联网电信
2020年，VoltDB变得更易于维护，更易于二次开发，更易于集成到业务的数据流管道中。最新的长期支持版本（LTS）V9.3，让生产环境中使用VoltDB也更加放心。公共云和私有云中更易于维护VoltDBV10引入了VoltDBKubernetesOperator模块、Helm图表和Prometheus代理。部署和运行VoltDB集群，并依靠Kubernetes编排技术，让实例的部署、运行、维护比
VoltDB成功入选CNCF Landscape云原生数据库全景图
近日，VoltDB正式入选CNCFLandscape（可能是目前其中唯一的关系型分布式内存数据库）。此次VoltDB进入CNCFLandscape，意味着VoltDB正式成为了CNCF认可的构建云原生最佳实践中的一环。云原生计算基金会（CNCF,CloudNativeComputingFoundation）致力于云原生技术的普及和可持续发展。CNCFLandscape是CNCF中的一个重要项目，在
2020 总结 | VoltDB的亮点，你了解多少？数据库物联网电信
2020年，VoltDB变得更易于维护，更易于二次开发，更易于集成到业务的数据流管道中。最新的长期支持版本（LTS）V9.3，让生产环境中使用VoltDB也更加放心。公共云和私有云中更易于维护VoltDBV10引入了VoltDBKubernetesOperator模块、Helm图表和Prometheus代理。部署和运行VoltDB集群，并依靠Kubernetes编排技术，让实例的部署、运行、维护比
VoltDB成功入选CNCF Landscape云原生数据库全景图
近日，VoltDB正式入选CNCFLandscape（可能是目前其中唯一的关系型分布式内存数据库）。此次VoltDB进入CNCFLandscape，意味着VoltDB正式成为了CNCF认可的构建云原生最佳实践中的一环。云原生计算基金会（CNCF,CloudNativeComputingFoundation）致力于云原生技术的普及和可持续发展。CNCFLandscape是CNCF中的一个重要项目，在
物化视图如何快速完成数据聚合操作？ VoltDB 数据库数据分析 5g 视图
SQL在过去十年逐渐走向没落，如今春风吹又生，SQL正在复苏。随着应用程序变得越来越复杂，数据驱动的应用场景越来越多，人们慢慢意识到需要一种数据处理语言。而SQL作为一种用于处理结构化数据的机制，它的有效性大家有目共睹。在此篇文章中，我们将讨论VoltDB如何实现物化视图，以及为什么VoltDB的物化视图非常迅速。01物化视图和普通视图有什么区别？一般而言，这里会有两种视图：普通视图和物化视图。V
物化视图如何快速完成数据聚合操作？ VoltDB 数据库数据分析 5g 视图
SQL在过去十年逐渐走向没落，如今春风吹又生，SQL正在复苏。随着应用程序变得越来越复杂，数据驱动的应用场景越来越多，人们慢慢意识到需要一种数据处理语言。而SQL作为一种用于处理结构化数据的机制，它的有效性大家有目共睹。在此篇文章中，我们将讨论VoltDB如何实现物化视图，以及为什么VoltDB的物化视图非常迅速。01物化视图和普通视图有什么区别？一般而言，这里会有两种视图：普通视图和物化视图。V
5G革命：如何让「数据」实现最大性能？ VoltDB 数据库数据分析物联网 5g
壹早在2000年代中期，H-Store第一次在M.I.T.被我们提出来，VoltDB是H-Store的商业化产品，它表示结构相似的数据会被连续存放到一起。在本文的后续描述中，我们将使用V-H来缩写。V-H的设计（始于2004年）强调了在每秒可观的低延迟（以毫秒为单位）的情况下，以每秒大规模事务（TPS）的方式实现最大性能。这样做的理由是，随着更快的辅助存储（例如SSD和NVRAM）的出现，基于磁盘
300万运算/秒：VoltDB在电信行业基准测试上可线性扩展性能 VoltDB 5g 物联网电信数据分析
01总体概述VoltDB受到全球电信软件解决方案提供商的信赖，后者将其作为首选内存数据库来驱动他们部署在全球100多家运营商处的任务关键型应用。VoltDB受到青睐的原因在于其性能和功能不仅能够解决当前挑战，而且还能支持业内各种系统的快速发展。我们的下述基准测试展示了VoltDB的性能如何满足或超越电信系统的要求，展示了VoltDB具备的驱动诸如5G之类的行业革命所需要的高性能、低延迟和线性扩展。
Amdocs收购OPENET：关于5G应用落地的思考 VoltDB 物联网 5g 数据分析数据库
今年8月，全球通讯和媒体领导者之一Amdocs收购了Openet。在VoltDB，听到这个消息，我们感到非常高兴和自豪！在过去的7年里，我们一直是Openet解决方案的基础数据平台。尽管许多供应商仍在努力使5G正常进行，但Openet迈出了大胆的一步来构建5G的需求，并已通过新业务收购来获取收益。毫不妥协的5GOpenet创始人兼首席技术官JoeHogan在宣布这项合作的新闻中表示：“在这振奋人心
5G应用的实时决策 VoltDB 物联网 5g 数据分析
背景概述尽管近几年很多供应商在不断重申着他们对VoltDB持续输出的专业认可，VoltDB也随着技术发展在不断增加一些流行技术词汇，但是真正让大家了解某个技术产品持续演进的特性，单单依靠增加几个技术名词还是远远不够。仅靠名词的罗列，没有具体细节的描述，只会加剧信息的混乱程度，让技术决策者的决策过程更加复杂。就VoltDB而言，最突出的例子是在5G环境中对“实时”的使用和误用。在5G走进现实之前，V
5G革命：如何让「数据」实现最大性能？ VoltDB 数据库数据分析物联网 5g
壹早在2000年代中期，H-Store第一次在M.I.T.被我们提出来，VoltDB是H-Store的商业化产品，它表示结构相似的数据会被连续存放到一起。在本文的后续描述中，我们将使用V-H来缩写。V-H的设计（始于2004年）强调了在每秒可观的低延迟（以毫秒为单位）的情况下，以每秒大规模事务（TPS）的方式实现最大性能。这样做的理由是，随着更快的辅助存储（例如SSD和NVRAM）的出现，基于磁盘
5G革命：如何让「数据」实现最大性能？ VoltDB_China 行业洞察案例分析数据库数据分析 5g voltdb
壹早在2000年代中期，H-Store第一次在M.I.T.被我们提出来，VoltDB是H-Store的商业化产品，它表示结构相似的数据会被连续存放到一起。在本文的后续描述中，我们将使用V-H来缩写。V-H的设计（始于2004年）强调了在每秒可观的低延迟（以毫秒为单位）的情况下，以每秒大规模事务（TPS）的方式实现最大性能。这样做的理由是，随着更快的辅助存储（例如SSD和NVRAM）的出现，基于磁盘
MySQL/HandlerSocket和VoltDB：NoSQL的竞争者原文链接 SQL MySQL 数据库
一般认为NoSQL数据库在性能方面要优于传统的SQL数据库。但是有两个SQL的解决方案宣布：对于大型系统的高可扩展性需求，SQL仍然是可行的解决方案！这两个SQL解决方案分别是MySQL加NoSQL层插件和支持SQL的VoltDB数据库。MySQL+HandlerSocketYoshinoriMatsunobu是Sun/Oracle的前雇员，从事MySQL的研发工作，目前是DeNA的首席数据库和基
[DB] NoSQL, MariaDB ciedecem DB
1.NoSQLandNewSQL面向未来的存储架构方向探讨。HBase,MongoDB,Redis,CouchBase,Cassandra等NoSQL技术，MySQL高可用技术、Drizzle、MariaDB，PostgreSQL，Oracle、DB2、SQLServer的高可用技术，VoltDB等NewSQL；http://memcached.org/2.大数据技术架构涵盖数据挖掘与分析、机器学
简单介绍一下HBase、Cassandra、Voldemort、Redis、VoltDB、MySQL zgmzyr database
1.简介：HBase–HadoopDatabase，是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用HBase技术可在廉价PCServer上搭建起大规模结构化存储集群2.HBase和RDBMS的关系RDBMS(RelationDabaBaseManagementSystem-关系数据库):由关系模型构成的数据库就是关系数据库。关系数据库由包含数据记录的多个数据表组成，用户可在有相关数据
快数据与大数据的结合(VoltDB + Hadoop) 老白号数据库系统
VoltDB提供了实时摄取数据与分析的能力(FastData)，Hadoop作为大数据分析的平台(BigData)。两个处理系统的结合使用是即使FastData与BigData的结合，也是联机事务处理系统(OLTP)和联机分析处理系统OLAP两种不同应用的结合。现总结如下表：System(系统)Data(数据)处理类型VoltDBFastData(快数据)OLTP(联合事务处理系统)HadoopB
VoltDB内存数据库的十大FAQ 老白号数据库系统
1.VoltDB是什么？->VoltDB是一家新型关系型分布式内存数据库管理系统，以解决OLTP为初衷，正在不断增加处理OLAP，提供BI的功能。VoltDB与传统数据库（如DB2，Oracle，MySQL等）最大的不同点就是，VoltDB把全部数据放在内存里，并且可以scaleout，运行在一个集群上，集群上的每个节点都可以执行部分数据处理任务。VoltDB官网：http://voltdb.co
nosql数据库学习总结 bcbobo21cn 转载大数据数据库
大数据时代的数据库选择：SQL还是NoSQL？执行大数据项目的企业面对的关键决策之一是使用哪个数据库，SQL还是NoSQL?SQL有着骄人的业绩，庞大的安装基础;而NoSQL正在获得可观的收益，且有很多支持者。我们来看看两位专家对这个问题的看法一、专家简介VoltDB公司首席技术官RyanBetts表示，SQL已经赢得了大型企业的广泛部署，大数据是它可以支持的另一个领域。Couchbase公司首席
voltdb简介_VoltDB简介 cusi77914 数据库大数据 python linux mysql
在过去的几年中，出现了一种新型的数据库管理系统，称为NoSQL。这些数据存储库旨在克服尝试扩展传统关系数据库以处理某些应用程序必须处理的数据负载（例如，亚马逊）的困难。这种可伸缩性需要付出一定的代价：NoSQL系统通常不符合ACID（原子性，一致性，隔离性和耐用性）；它们最终是一致的，从广义上讲意味着给定一定的时间，所有对数据的更新最终将在系统中传播。对于某些类型的应用程序，这是不希望的。用于在线
Oracle、NoSQL和NewSQL 数据库技术对比（一） cnsvvkq36640219
本文作者：约翰·瑞恩-瑞银集团数据仓库解决方案架构师目录世界已经变了.1哪些变了？.2问题是什么？.3性能与可用性和耐久性................3一致性与可用性...................4灵活性与可扩展性..................5ACID与最终一致性................6重新设想OLTP数据库.7世上无难事！.8NewSQL数据库技术.9VoltDB.
MySQL/HandlerSocket和VoltDB：NoSQL的竞争者 cpongo4'"\?;@
一般认为NoSQL数据库在性能方面要优于传统的SQL数据库。但是有两个SQL的解决方案宣布：对于大型系统的高可扩展性需求，SQL仍然是可行的解决方案！这两个SQL解决方案分别是MySQL加NoSQL层插件和支持SQL的VoltDB数据库。\MySQL+HandlerSocket\YoshinoriMatsunobu是Sun/Oracle的前雇员，从事MySQL的研发工作，目前是DeNA的首席数据库
SQL 和 NoSql 谁更适合大数据？大数据在说话
执行大数据[注]项目的企业面对的关键决策之一是使用哪个数据库，SQL还是NoSQL?SQL有着骄人的业绩，庞大的安装基础;而NoSQL正在获得可观的收益，且有很多支持者。科多大数据和你们来看看两位专家对这个问题的看法。专家·VoltDB公司首席技术官RyanBetts表示，SQL已经赢得了大型企业的广泛部署，大数据是它可以支持的另一个领域。·Couchbase公司首席执行官BobWiederhol
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源